データストレージの専門家もいれば、AIワークロードの専門家もいますが、両業界の専門知識を提供する企業を探すのはなかなか困難です。
そこで登場したのが、新しいSolidigm AIセントラルラボです。
モデルトレーニングと推論の最新テクノロジーに基づいて構築されたSolidigmラボは、ストレージとAI機能を統合して最先端の研究を行います。そして、主な協力企業との連携によって最終的な結果を改善し、両業界を前進させます。
このラボは、NVIDIA B200やH200などの高性能GPU、800Gbpsイーサネットネットワーク、そしてもちろん、多数のSolidigm SSDを備えています。カリフォルニア州ランチョコルドバにあるSolidigm本社の向かいにある施設に設置されたこのラボは、AIインフラプロバイダーであるFarmGPUとの連携で開発され、テスト用の新しいハードウェアとソフトウェアを迅速に立ち上げることができるようになっています。
このラボは、ハイパースケーラーや各分野の企業が世界中のデータセンターで導入しているものを反映したリファレンスアーキテクチャーに基づいて設計されており、テスト結果をお客様環境に広く適用できます。
このラボには、実環境のAIワークロードの実行に加えて、テレメトリーを収集し、システムリソースの使用状況やボトルネックの発生箇所を詳細に把握する機能もあります。Solidigmと協力企業はそれによって最適化を提案し、パフォーマンスと電力効率を改善できるようになります。
SolidigmのSVP兼製品・マーケティング責任者であるGreg Matson(グレッグ・マトソン)の言葉を借りると、「ストレージのテストを実行するだけではもはや不十分」です。
同ラボは新設ながら、すでに成果を上げています。直近のMLPerf Storageテストは、AIモデルトレーニング実行時にGPUを稼働させ続けるストレージサブシステムの能力を測定するために設計され、FarmGPUは24台のSolidigm™ D7-PS1010 SSDを搭載したAIセントラルラボシングルノードクラスターについての結果を提出しました。Solidigmの主力パフォーマンスドライブを搭載したこのクラスターは、116 GB/秒を達成し、このテストでこれまで測定したノードあたりのスループットとしては最高値となりました。このアーキテクチャーは、今後のテストのために、複数のノードに容易に拡張できます。
また、このラボには、これまで構築された中で最も高密度であろうストレージテストクラスターも設置されています。それぞれ122TBの大容量ストレージを備えた192台のSolidigm D5-P5336 SSDを装備したこのクラスターは、わずか16Uのラックスペースに23.4PBもの容量を収めています。300年分を上回るHDビデオの連続再生や、約50億曲の楽曲に相当する容量です。
こうした構成をはじめとするラボの環境を利用することで、SolidigmはAIアプリケーションにおけるストレージのパフォーマンスと密度の前進を推進し、未来のイノベーションと最適化に向けた新たな道を切り拓いていきます。
本ラボの開発を行う主な推進力の1つは、さまざまな組織のハードウェアとソフトウェアをホストし、新たなレベルの共同イノベーションをテストして引き出すことでした。これまでのところ、反応は期待通りです。
「AIとストレージの専門知識を独自に組み合わせた当ラボへの関心は、桁外れに高いものです」とMatsonは述べています。AI関連のさまざまな企業との間で、テストや先駆的な取り組みに関する合意を締結中、または締結済みです。
初期のテスト結果は、優れたストレージがAIの成果をどう向上させるかという見解の再定義に、すでに貢献しています。今年初め、Solidigmは、AIワークロード分析とエンタープライズソリューションのプロバイダーであるMetrum AIと共同で、検索拡張生成(RAG)に関するホワイトペーパーを発表しました。両社は、RAGデータをシステムメモリからSSDに移行することの利点について、パフォーマンスと精度を維持しながらDRAM使用量を最大57%削減できることを含む、広範な調査を実施しました。
その他の世界クラスの協力企業との共同作業も進行中であり、追加の発表が間もなく行われる予定です。
Ace Stryker(エース・ストライカー)は、Solidigmの市場開発担当ディレクターで、データセンターストレージソリューションのポートフォリオの新たな分野の開発に力を注いでいます。