次世代Hadoopストレージ:BlueField-3とCSALによるパフォーマンスと回復力

概要:従来のHadoopストレージは、最新のビッグデータワークロードにおいては、パフォーマンスとリソース効率の問題が避けられません。このポスターでは、3ウェイレプリケーション、イレージャーコーディング(EC)、RAIDによる卓越したスループット、CPUオーバーヘッドの削減、堅牢なデータ保護を実現し、スケーラブルで安全なデータ管理を確保する、BlueField-3およびSolidigm CSALソフトウェア搭載のソリューションを紹介しています。   

ポスター全体は、こちらをご覧ください。 

セクション1

BlueField-3およびSolidigm CSALを使用したHadoopストレージアーキテクチャー

従来のHadoopストレージアーキテクチャーとBluefield-3 + CSAL Hadoopアーキテクチャーの比較 図1. 従来のHadoopストレージアーキテクチャーとBluefield-3 + CSAL Hadoopアーキテクチャーの比較

BlueField-3 + CSALソリューションを採用することで、3層のHadoopストレージアーキテクチャーに再構築し、次のような利点をもたらしています。          

  1. BlueField-3のハードウェアコンピューティングリソースを活用することにより、SolidigmのCSALソフトウェアは、EC、RAID、複数コピーなど、さまざまなデータ保護バックアップメカニズムに対応しています。        
  2. 元のアーキテクチャであるサーバー3層 + スイッチ2層を、サーバー2層 + スイッチ1層に圧縮し、保存データの読み取り/書き込みレイテンシーを大幅に短縮しています。        
  3. ストレージ関連のコンピューティングリソースをBlueField-3にオフロードすることで、CPU コンピューティングリソースが節約され、CPUは効果的にHadoop計算に集中できるようになっています。         

セクション2

従来の3レプリカ 

従来の3レプリカストレージアーキテクチャーと、BlueField-3 + CSALストレージアーキテクチャーの比較 図2. 従来の3レプリカ

高い信頼性:3つのコピーでフォールトトレランスを確保しています。 

レプリケーションの連鎖:データがシーケンシャルにDatanodesを流れるため、レイテンシーが増大します。  

ACKによるオーバーヘッド:マルチステップの確認応答により、複雑性とレイテンシーが増大します。 

BlueField-3+ CSALを採用したアクティブ/バックアップアーキテクチャー   

BlueField-3+ CSALを採用したアクティブ/バックアップアーキテクチャー 図3. BlueField-3+CSALアクティブ/バックアップアーキテクチャー

簡素化されたワークフロー:1つのBlueField-3の内部でデータを直接レプリケーション      

パフォーマンスの向上:東西方向のトラフィックなし、レプリケーションステップの減少、低レイテンシー。          

ハイパフォーマンスシナリオ向けに最適化:レイテンシーに影響を受けやすいワークロードに最適。       

Datanode障害が発生した場合にバックアップノードへの迅速なフェイルオーバーを有効にするには、追加の管理プレーンメカニズムが必要です。                    

セクション3

エコシステム

トレーニングデータセットと新しいデータを使用する推論モデルからなるトレーニングフレームワーク。
データユーザー
データレイクエンジン
データレイクストレージ 図4. トレーニングおよび推論モデルのエコシステム

セクション4

パフォーマンスおよびCPUに関する比較 

  • パフォーマンスが3%向上
  • CPUリソース使用率20%
4kシーケンシャル書き込みと4kランダム書き込みにおけるスループットとCPUの比較(LVM対BlueField-3 + CSAL)。 図5. スループットおよびCPUに関する比較(LVM対BlueField-3 + CSAL)
  LVM(MiB/s) BlueField-3+CSAL(MiB/s) 
 4K シーケンシャル書き込み 2333 7697
 4K ランダム読み取り 6863 18712

表1. LVMとBlueField-3 + CSALのスループットの比較 

 

  LVM(コア) BlueField-3+CSAL (コア)
 4K シーケンシャル書き込み 6 1
 4K ランダム読み取り 5 1

表2. LVMとBlueField-3 + CSALのCPU使用率

 

セクション5

 

CSAL RAID5F と MDRAIDの比較

 CSAL RAID5FとMDRAIDの比較(単位:KIOPS) 図6. CSAL RAID5FとMDRAID – IOPSの比較
CSAL RAID5FとMDRAIDの比較(単位:GiB/s) 図7. CSAL RAID5FとMDRAID – スループットの比較

CSALは、機能豊富で堅牢かつQLCフレンドリーなRAIDソリューションを提供し、高密度な高性能デプロイメントを可能にします。         

1. RMWオーバーヘッドなし  

2. 書き込み ホール 対策 を組み込み

3. 複数のコアにまたがってスケーリング  

4. ジャーナル付きMDRAIDと比べて4倍〜20倍のパフォーマンス

5. SSDの耐久性の向上

セクション6

TCO 分析

ソリューションA:BlueField-3 + CSALとソリューションBの比較:LVM Datanode

ソリューションA:BlueField-3 + CSALとソリューションBの比較:LVM DatanodeのCAPEXとTCOの比較 図8. ソリューションA:BlueField-3 + CSALとソリューションBの比較:LVM DatanodeのCAPEXとTCOの比較

ソリューションA(BlueField-3 + CSAL)は、コンピューティングノード上のサーバーを再利用し、ストレージ関連の計算をBlueField-3にオフロードすることにより、ソリューションBと比べてデータセンターのスペースと電力を節約します。             

図に示されている3ノードの例では、ソリューションAはTCO CAPEXを50%以上削減しています。     

DPUネイティブの柔軟なストレージアーキテクチャについては、こちらをご覧ください


著者について 

Wayne Gaoは、Solidigmのプリンシパルエンジニア兼ストレージソリューションアーキテクトです。 Solidigmのクラウドストレージ高速化レイヤー(CSAL)に、初期開発から商用リリースまで携わってきました。  Wayneはストレージ開発者として20年以上の経験があり、米国で4件の特許を出願/取得しており、公開されている EuroSys 論文の著者でもあります。

Li Boは、Solidigmのシニアストレージ ソリューション アーキテクト です。複数の企業で20年以上システム設計と開発に携わった経験があり、ネットワークおよびストレージソリューションのパフォーマンス最適化を専門としています。  近年は、不揮発性ストレージ技術の業界全体への普及に力を注いでいます。

Mariusz Barczak は、 Solidigm のプリンシパルエンジニアです。ストレージソフトウェアとストレージソリューションにおけるイノベーションで13年以上の経験があります。特に、キャッシュソリューション、ソフトウェア定義ストレージ、仮想化、ストレージ解析を専門としています。Mariuszは多数の特許を保有しており、オープンソースコミュニティで積極的に活動しています。        彼は現在、Solidigm のCloud Storage Acceleration Layer(CSAL)チームの指揮に注力しています。このチームは、効率的で耐久性のあるストレージを提供する目的で、 Solidigm SLC SSDを Solidigm QLC SSDなどの他のストレージコンポーネントと組み合わせた混合メディアソリューションを提供しています。