概要:従来のHadoopストレージは、最新のビッグデータワークロードにおいては、パフォーマンスとリソース効率の問題が避けられません。このポスターでは、3ウェイレプリケーション、イレージャーコーディング(EC)、RAIDによる卓越したスループット、CPUオーバーヘッドの削減、堅牢なデータ保護を実現し、スケーラブルで安全なデータ管理を確保する、BlueField-3およびSolidigm CSALソフトウェア搭載のソリューションを紹介しています。
ポスター全体は、こちらをご覧ください。
BlueField-3 + CSALソリューションを採用することで、3層のHadoopストレージアーキテクチャーに再構築し、次のような利点をもたらしています。
高い信頼性:3つのコピーでフォールトトレランスを確保しています。
レプリケーションの連鎖:データがシーケンシャルにDatanodesを流れるため、レイテンシーが増大します。
ACKによるオーバーヘッド:マルチステップの確認応答により、複雑性とレイテンシーが増大します。
簡素化されたワークフロー:1つのBlueField-3の内部でデータを直接レプリケーション
パフォーマンスの向上:東西方向のトラフィックなし、レプリケーションステップの減少、低レイテンシー。
ハイパフォーマンスシナリオ向けに最適化:レイテンシーに影響を受けやすいワークロードに最適。
Datanode障害が発生した場合にバックアップノードへの迅速なフェイルオーバーを有効にするには、追加の管理プレーンメカニズムが必要です。
| LVM(MiB/s) | BlueField-3+CSAL(MiB/s) | |
| 4K シーケンシャル書き込み | 2333 | 7697 |
| 4K ランダム読み取り | 6863 | 18712 |
表1. LVMとBlueField-3 + CSALのスループットの比較
| LVM(コア) | BlueField-3+CSAL (コア) | |
| 4K シーケンシャル書き込み | 6 | 1 |
| 4K ランダム読み取り | 5 | 1 |
表2. LVMとBlueField-3 + CSALのCPU使用率
CSALは、機能豊富で堅牢かつQLCフレンドリーなRAIDソリューションを提供し、高密度な高性能デプロイメントを可能にします。
1. RMWオーバーヘッドなし
2. 書き込み ホール 対策 を組み込み
3. 複数のコアにまたがってスケーリング
4. ジャーナル付きMDRAIDと比べて4倍〜20倍のパフォーマンス
5. SSDの耐久性の向上
ソリューションA(BlueField-3 + CSAL)は、コンピューティングノード上のサーバーを再利用し、ストレージ関連の計算をBlueField-3にオフロードすることにより、ソリューションBと比べてデータセンターのスペースと電力を節約します。
図に示されている3ノードの例では、ソリューションAはTCO CAPEXを50%以上削減しています。
Wayne Gaoは、Solidigmのプリンシパルエンジニア兼ストレージソリューションアーキテクトです。 Solidigmのクラウドストレージ高速化レイヤー(CSAL)に、初期開発から商用リリースまで携わってきました。 Wayneはストレージ開発者として20年以上の経験があり、米国で4件の特許を出願/取得しており、公開されている EuroSys 論文の著者でもあります。
Li Boは、Solidigmのシニアストレージ ソリューション アーキテクト です。複数の企業で20年以上システム設計と開発に携わった経験があり、ネットワークおよびストレージソリューションのパフォーマンス最適化を専門としています。 近年は、不揮発性ストレージ技術の業界全体への普及に力を注いでいます。
Mariusz Barczak は、 Solidigm のプリンシパルエンジニアです。ストレージソフトウェアとストレージソリューションにおけるイノベーションで13年以上の経験があります。特に、キャッシュソリューション、ソフトウェア定義ストレージ、仮想化、ストレージ解析を専門としています。Mariuszは多数の特許を保有しており、オープンソースコミュニティで積極的に活動しています。 彼は現在、Solidigm のCloud Storage Acceleration Layer(CSAL)チームの指揮に注力しています。このチームは、効率的で耐久性のあるストレージを提供する目的で、 Solidigm SLC SSDを Solidigm QLC SSDなどの他のストレージコンポーネントと組み合わせた混合メディアソリューションを提供しています。