AlluxioとSolidigmがAIワークロード向けの高度なキャッシングソリューションを共同開発

概要

AIキャッシングソリューションの世界的リーダーであるAlluxioは、GPUベースAIワークロード向けに最速のキャッシュを提供しています。その拡張可能なアーキテクチャーは、数万ノードをサポートし、ストレージ帯域幅の消費を大幅に削減します。世界中で大規模言語モデル(LLM)の成功要因は、主にAIストレージの課題解決に向けたAlluxioの最先端のアプローチにあります。

「SolidigmはAlluxioと提携し、優れた分散型AIキャッシングソリューションを提供しています。SolidigmのD5-P5336を読み取りキャッシュとして、D7-PS1010をAlluxioの最小オーバーヘッドソリューションによるチェックポイント書き込みに使用することで、大規模なAIワークロードに対して、コストとパフォーマンスの最適な組み合わせをお客様にご提供できます。このソリューションを最適化し、Solidigm D7-PS1010 Gen5 TLC SSDの書き込み帯域幅とSolidigm D5-P5336 Gen4 QLCの読み取り帯域幅を最大限に活用しながら、TLCおよびQLC SSDの書き込み増幅率を1.02で維持しました。弊社は、お客様のAIニーズに応えるため、コストとパフォーマンスを最適化し、オーバーヘッドを最小限に抑えたソリューションを引き続き提供していきたいと考えています。」とSolidigm戦略企画・マーケティング担当の上級副社長グレッグ・マトソン氏は述べています。

Alluxio DORAキャッシュアーキテクチャーの主な利点

Solidigm QLC SSDとAlluxio DORAキャッシュアーキテクチャーの利点 図1. Alluxio DORAキャッシュアーキテクチャー

DORA(Decentralized Object Repository Architectureの略)はAlluxioの次世代アーキテクチャーです。DORAは分散キャッシングストレージシステムとして、低レイテンシ、高スループット、コスト削減を実現しながら、AIワークロード向けの高性能データアクセスレイヤーを提供することを目指しています。DORAは、分散型ストレージとメタデータ管理を活用することで、より高いパフォーマンスと利便性を実現し、プラグイン可能なデータセキュリティとガバナンスを提供することで、よりスケーラブルで効率的な大規模データアクセス管理を可能にします。

DORAのアーキテクチャー目標

  1. スケーラビリティ:スケーラビリティはDORAにとって最優先事項であり、AIトレーニングなどのデータ集約型アプリケーションの需要に応えるため、数十億のファイルをサポートする必要があります。
  2. 高可用性:DORAのアーキテクチャーは、高可用性を念頭に設計されており、99.99%の稼働率とマスターレベルでの単一障害点に対する保護機能を備えています。
  3. パフォーマンス:パフォーマンスもDORAの重要な目標であり、AIワークロードにおけるモデルのトレーニングやモデルの提供の速度、GPUの利用率を優先しています。

このアーキテクチャーは、サービスレジストリ、スケジューラ、クライアント、ワーカーの4つの主要コンポーネントで構成されています。これらのコンポーネントは、サービスディスカバリー、分散負荷スケジューリング、データストレージなどのタスクを管理し、システム全体の最適なパフォーマンスを維持します。

NVMeストレージ関連の技術的ハイライト

1. Page Data StoreはSSDの最大のパフォーマンスを活用し、最高の書き込み増幅率(WAF)と耐久性を維持することができる

DORAは、キャッシュストレージに実戦でテスト済みのページストアモジュールを使用しており、大容量ファイルに対する小規模から中規模の読み取りリクエストのよりきめ細かいキャッシングを可能にします。この信頼性の高いページストア技術は、MetaのPresto、Uber、TikTokなどのアプリケーションで実証済みです。DORAのきめ細かいキャッシングにより、読み取り増幅は150分の1に削減され、ファイル位置の読み取りパフォーマンスは最大15倍に向上しました。

Page Data Storeは、ジャーナルファイルシステムを活用し、固定サイズの大型チャンクファイルで2つのレベルのディレクトリにデータを整理します。すべての書き込みはこれらのチャンクファイルに追加されるため、その中のオブジェクトが削除対象としてマークされた場合、ファイル自体は不要になった時点で削除されます。この設計により、PCIe 5.0 TLC SSDでも最適なパフォーマンスが確保され、SSDの耐久性を最大限に高めるSSD書き込み増幅率(WAF)が1に維持されます。

例えば、QLC SSDでAlluxioの読み取りキャッシュを使用する場合、ストレージエンジンは内部またはガベージコレクションWAFを発生させることなくQLCの耐久性を最大限に活用し、QLC NVMe SSDの効率的な動作を保証します。

Alluxio DORAキャッシュアーキテクチャーにおけるSolidigm QLC SSDのエンジニア視点とエンドユーザー視点 図2. エンジニアとエンドユーザーの視点の違い

2. 分散型メタデータストア

DORAは、メタデータが常にアクセス可能で利用可能であることを保証するため、メタデータをすべてのワーカーに配布します。メタデータへのアクセスを最適化するために、DORAはメタデータエントリに対して2段階のキャッシュシステムを利用しています。キャッシュの第一段階はインメモリキャッシュであり、これはメタデータエントリをメモリに保存します。このキャッシュには、有効期限を設定するための最大容量とタイム・トゥ・ライブ(TTL)設定が用意されています。2番目のキャッシュレベルは永続キャッシュで、RocksDBを使用してメタデータエントリをディスクに保存します。永続キャッシュは、利用可能なディスク容量に応じて無制限に拡張でき、また、TTLベースのキャッシュ削除を使用することで、アクティブな同期や無効化を回避します。保存されたメタデータは、ページストアと同様に、完全なUFSパスによってハッシュ化されます。

インメモリと永続キャッシュの組み合わせにより、メタデータが容易に利用可能でアクセス可能であることを保証すると同時に、システムリソースの効率的な利用も可能になります。メタデータの分散化により、メタデータが主にマスターノードによって管理されるアーキテクチャーにおけるボトルネックを回避できます。DORAワーカーあたり最大3,000万から5,000万のファイルを保存できるため、このシステムは数十億のファイルを扱う大規模なデータ集約型アプリケーションをサポートできます。

Solidigmでは、インメモリメタデータ設計とRocksDBの組み合わせが最適なメタデータストレージソリューションを提供することを検証しました。この設計は、PCIe 4.0 QLC SSD(読み取り速度7GB/秒、書き込み速度3GB/秒)とPCIe 5.0 TLC SSD(読み取り速度および書き込み速度14.5GB/秒)の読み取り速度と書き込み速度を最大限に活用しています。さらに、RocksDBはスキップリストベースの書き込みバッファを使用することで、多数の小さな書き込みをより大きな、連続した2MBの書き込みに統合します。これで効率性が高くなり、SSD WAFを最小限に抑えて、SSDの耐久性をさらに向上できます。

性能テスト:Solidigm™とAlluxio
D7-PS1010とD5-P5336

テスト構成

ストレージサーバー―Intel Gen5
OS Fedora Linux 40(サーバー版)
カーネル 6.8.5-301.fc40.x86_64 
プロセッサー・モデル

インテル(R) Xeon(R) 6740E

2 x sockets @2.4GHz, 96 cores/per socket 

NUMAノード 2
DRAM搭載 256GB(16x16GB DDR4 3200MT/s)
巨大ページサイズ 2048 kB
ドライブの概要

2x Gen5 TLC Solidigm D7-PS1010 8TB

FW改訂:G70YG030

PCIe Gen5x4

2x Gen4 QLC Solidigm D5-P5336 60T

FIO 3.37または最新バージョン
Alluxio AIバージョン
AlluxioロードインジェストキャッシュSSD ./bin/alluxio job load --path file:///mnt/qlc/alluxio/data --submit
Alluxioヒューズ読み取りfio

fio -engine=libaio -bs=256K --rw=read -group_reporting -directory=/mnt/fuse/fusedir/test1/multiple_files -name=read_test -direct=1 -numjobs=16 --nrfiles=1 -openfiles=1 -size=16G  --alloc-size 1024000

fio -engine=libaio -bs=1024K --rw=read -group_reporting -directory=/mnt/8Greadfuse/alluxiofuse/local -name=wayne_read_test -direct=1 -numjobs=128 --nrfiles=1 -openfiles=1 -size=4G --alloc-size 1024000 --readonly

ファイルシステム XFS

最近、IntelのGen5 BNCストレージサーバーにSolidigm D7-PS1010とD5-P5336 SSDを搭載した実験で、Alluxioは高速データ取り込みと読み取り性能、特にGPUスケーリングにおけるその能力を実証しました。主な成果には以下が含まれます:

  • キャッシュ読込み効率:Alluxioキャッシュエンジンは、PCIe 5.0 TLC SSDへの書き込み中に、UFS QLCストレージの最大読み取り帯域幅を効果的に最大まで引き上げました。
  • ヒューズ読み取りテスト:AlluxioのFUSE(Filesystem in Userspace)フレームワークは、PCIe 5.0 SSDの読み取り帯域幅をほぼ飽和させ、NVMe SSDのキャッシュヒット処理時のオーバーヘッドを最小限に抑えることが実証されました。

Alluxioストレージエンジンのパワーをアピールするために、迅速な展開が可能なシングルノードのテスト環境を構築しました。Alluxioの最大の強みは、GPUで拡張でき、南北ストレージ帯域幅のオーバーヘッドを大幅に削減できるホスト側の分散レプリケートキャッシュを活用する能力にあることに注目することが大切になります。シングルノードのセットアップでも、特に高性能NVMe SSDと組み合わせた場合、Alluxioは卓越した効率性を発揮します。このテストでは、キャッシュをPCIe 5.0 TLCまたはPCIe 4.0 QLCのいずれかで構成し、その下位のファイルストア(UFS)にはPCIe 4.0 QLCを使用しています。

Alluxio負荷テスト キャッシュSSD書き込み帯域幅(MB/秒) UFS読み取り帯域幅(MB/秒) キャッシュSSD WAF
Solidigm D7-PS1010 6823 6923 1.02
Solidigm D5-P5336 3341 3613 1.02

重要なポイント

1. Alluxioのキャッシュロードエンジンは非常に効率的で、UFS QLCの最大読み取り帯域幅を最大限に活用し、PCIe 5.0 TLCキャッシュSSDにデータをインポートすることができます。UFSが10GB/秒の読み取り帯域幅をサポートしている場合でも、AlluxioはSolidigm D7-PS1010の9.3GB/秒の書き込み帯域幅を簡単に飽和させることができます。

2. XFSジャーナルファイルシステムを基盤とするAlluxioのページキャッシュストレージエンジンは、Solidigm Alluxio FIOエミュレータを使用して厳格にテストされており、長寿命です。結果は、TLCまたはQLC SSDの使用の有無に関係なく、AlluxioはWAF 1.02を達成していることを示しています。この理想に近いWAF 1は、SSDのパフォーマンスと耐久性を最大限に引き出し、エンドユーザーに最適な結果をもたらします。

AlluxioのFUSEテスト キャッシュSSD読み取り帯域幅(GB/秒)
UFS読み取り帯域幅(GB/s)
Solidigm D7-PS1010 14.8 0

FUSEの読み込みオーバーヘッドは最小限です。SSDキャッシュで100%のキャッシュヒットを記録し、DRAMページキャッシュをバイパスしてFUSEの読み取りを行う場合、FUSEフレームワークは単一のPCIe 5.0 SSDの読み取り帯域幅をほぼ飽和状態にし、14.8GB/秒に達します。

Solidigm 61.44TB D5-P5536連続書き込みPBW 5年平均利用 書き込み帯域幅サポート
213 50% 2900MB/s

高密度キャッシュソリューションをお求めのお客様には、Solidigmの61.44TB QLC SSDが理想的な選択肢です。AlluxioのストレージエンジンはWAFとの親和性が高く、書き込みが最小限で読み取り負荷の高いキャッシュとして優れており、QLCは読み取りキャッシュパスに最適です。Alluxioの効率的な設計により、シーケンシャル書き込みPBWに基づいて213PBのQLCキャッシュデバイスの耐久性を推定することができ、Solidigmは最大213ペタバイトのデータ書き込みをサポートしていることになります。5年間の使用率が50%という高い基準を満たす場合でも、QLCの書き込み帯域幅2900MB/sはそのままサポートされ、ほぼ最大値に達しています。さらに、QLCはSSDあたり最大6GB/秒のランダム読み取り帯域幅を提供し、非常にコスト効率の高いAlluxio AIキャッシュシステムの構築を可能にします。

Solidigm SSDがAlluxioにどのように最適なストレージを提供するのか

読み取りキャッシュの場合、Solidigm D5-P5336 61.44TB QLC SSDは、優れたパフォーマンスとスケーラビリティを提供します。PCIe 5.0 Solidigm D7-PS1010は、チェックポイント書き込みにおいて、世界トップクラスの書き込み性能を実現します。

Alluxioエンジニアリング担当の副社長スアン・ドゥー氏は、「Solidigmチームと緊密に協力し、Solidigm SSDおよびNVMeドライブでAlluxioの分散型キャッシュ技術を実行した場合のパフォーマンス上の利点を検証しました。このコラボレーションを通して、Alluxioをさらに最適化し、Solidigmドライブを活用して大規模なAIワークロードのI/Oスループットを最大化することができました。」と述べています。

大規模なAIモデルの構築、トレーニング、展開を行うお客様のために高性能で費用対効果の高いソリューションを共同で提供できるよう、今後も継続的にSolidigmと提携していくことを楽しみにしています

   Xuan Du(スアン・ドゥー)
   Alluxioのエンジニアリング担当副社長

AlluxioとSolidigmの提携を通じ、Solidigm TLCとQLC SSDの両方によりAlluxioのサービスを大幅に強化し、運用コストを削減することが実証されました。また、Solidigmでは、Alluxio専任のカスタマーケアチームを配備して優れたサポートを提供したことで、品質と信頼性の基準が引き上げられています。


著者紹介

Wayne Gao(ウェイン・ガオ)は、Solidigmのストレージ・ソリューション・アーキテクトにおけるプリンシパル・エンジニアです。彼は、Solidigm社のクラウドストレージ高速化レイヤー(CSAL)の草創期から商業リリースまで携わってきました。ウェインは20年以上のストレージ開発経験を持ち、米国で4件の特許出願/取得実績があり、EuroSysの論文の著者でもあります。

Yi Wang(イ・ワング)は、Solidigmのフィールド・アプリケーション・エンジニアです。Solidigm入社前は、インテル、Cloudera、NCRで技術職を歴任しました。彼は「Cisco Certified Network Professional」、「Microsoft Certified・Solutions Expert」、「Cloudera Data Platform Administrator」の認定を受けています。

Jie Chen(ジェ・チェン)はSolidigmのテクニカルマーケティングアーキテクトであり、特にデータ配置モードとストレージAIにおいて、クラウド顧客向けのエコシステム実現を担当しています。Solidigm入社前は、アプリケーションエンジニア、品質信頼性、製品開発エンジニア、各種フラッシュメモリおよび永続性メモリ製品のプログラムマネージャーなど、さまざまな技術的役割を担っていました。

免責条項

すべての製品計画、ロードマップ、仕様、および製品説明は、予告なく変更されることがあります。

本資料に記載した内容はすべて、明示されているか否かにかかわらず、いかなる保証も行うものではありません。ここにいう保証には、商品適格性、特定目的への適合性、および非侵害性の黙示の保証、ならびに履行の過程、取引の過程、または取引での使用から生じるあらゆる保証を含みますが、これらに限定されるわけではありません。
 
本書で説明されている製品には、「エラッタ」と呼ばれる設計上の不具合が含まれている可能性があり、公表されている仕様とは異なる動作をする場合があります。現在確認済みのエラッタについては、Solidigmまでお問い合わせください。
 
製品をご注文される前に最新の仕様をご希望の場合は、Solidigmの担当者または販売代理店にお問い合わせください。
 
本書、本書で参照されている文書、またはその他のSolidigm文献のコピーをご要望の場合は、Solidigmの担当者にお問い合わせください。
  
記載されているすべての製品、コンピューターシステム、日付、および数値は、現在の予想に基づくものであり、予告なく変更されることがあります。

Solidigm製品は、予告なく仕様や説明が変更されることがあります。設計者は、「留保」または「未定義」と記されているものについて、機能または指示の欠損や特徴に依拠してはいけないものとします。Solidigmは、将来の定義のためにこれらを保持し、これらを将来の変更により生じた矛盾や非互換性については一切の責任を負いません。この情報は予告なく変更されることがあります。この情報だけに基づいて設計を最終的なものとしないでください。

テストでは、特定のシステムでの個々のテストにおけるコンポーネントの性能を文書化しています。ハードウェア、ソフトウェア、システム構成などの違いにより、実際の性能は掲載された性能テストや評価とは異なる場合があります。購入を検討される場合は、ほかの情報も参考にして、パフォーマンスを総合的に評価することをお勧めします。

性能の測定結果は構成情報に記載された日付時点のテストに基づいています。また、現在公開中のすべてのセキュリティー・アップデートが適用されているとは限りません。詳細については、公開されている構成情報を参照してください。絶対的なセキュリティを提供できる製品またはコンポーネントはありません。
 
SolidigmまたはIntelの最適化、SolidigmまたはIntelコンパイラまたはその他の製品では、SolidigmまたはIntel以外の製品では同等の最適化されたパフォーマンスが得られない場合があります。SolidigmまたはIntelのテクノロジーでは、有効化されたハードウェア、ソフトウェア、またはサービスのアクティベーションが必要となる場合があります。
 
実際のコストと結果は状況によって異なる場合があります。
 
Solidigmは、サードパーティーのデータについて管理や監査を行っていません。ほかの情報も参考にしてデータの正確さを評価してください。
 
一部の結果はSolidigm社内の分析、アーキテクチャーシミュレーション、モデリングを使用して評価またはシミュレートされたものであり、情報提供のみを目的としています。システムのハードウェア、ソフトウェア、構成などの違いにより、実際の性能は掲載された性能テストや評価とは異なる場合があります。

この文書に記載されている結果は予備的なものであり、情報提供のみを目的としています。これらの価値観や主張は最終的なものでも公式なものでもありません。

© Solidigm. 「Solidigm」は、SK hynix NAND Product Solutions Corp(Solidigmの商号)の商標です。「Intel」は、Intel Corporationの登録商標です。その他の名前やブランドは、他社の所有物であるとの主張があるかもしれません。