DUG が Solidigm SSD で AI 推論をエッジ環境へ展開

DUG Technology のハリー・マクヒュー CIOが、 Solidigm SSD を使用して最も 過酷な 環境下でハイパフォーマンス コンピューティング (HPC) をエッジに展開する方法について解説 してします。 たとえば、コンテナ化されたモジュール式データセンターである DUG Nomad 10 は、10 フィートの輸送コンテナに 100 基以上の H200 GPU を配置できます。 また、 DUG  液浸 冷却技術は、どれほど離れた環境でも  、タンク内で非常に 高い電力効率と温度の安定性を保ちます。

しかし、このような 限られた スペースに非常に多くの 計算 能力を詰め込むためには、 データストレージが小さなフットプリントで大容量を提供する必要があります。 Solidigm SSD は、1 台のドライブで最大 122TB という課題をクリアし、DUG にエッジ の AI 推論と HPC に必要な ストレージ 容量を提供します。 

Solidigm NVMeドライブの超高容量と高性能により、大量のデータストレージとパフォーマンスを小さなフットプリントに格納できます。これは、まさにエッジでのAI推論に求められる条件です。
ハリー・マクヒュー DUG Technology の CIO


 

データ処理の需要は急増しています。 AIは、データの取り込みや保存だけでなく処理能力も大量に必要とするため、 これまで以上に 計算リソースが求められるように なりました。 今や こうした状況は 、皆様がこれまで 設置していた  大規模な物理的施設の中の データセンターだけでなく、エッジ環境にも広がっています。

 DUG Technologyで CIOを務めているハリー・マクヒューと申します。

 DUG Technologyは、ハイパフォーマンスコンピューティングに重点を置く企業です。 従来 は石油・ガス業界 に軸足を置いていましたが、その後 、あらゆる業種でハイパフォーマンスコンピューティングを 展開するようになりました。

DUG  は 10 年以上  にわたって データセンターを 運営してきました。いずれのデータセンターも、 DUG COOLの液浸冷却技術に基づいています。 液浸冷却技術は、 ごく小さな スペースに大量の 計算 能力を投入することを可能にします。 つまり、映画で見るような従来のラックで空気冷却するのではなく、コンピュータ全体を オイルタンクに沈めて冷却するのです。 

これは、同じスペース で コンピュート性能を劇的に高められることを意味します。なぜなら 、空気ではなく油 や 液体を使ってコンピュータを冷却したほうが はるかに効率的だからです。あらゆる 業界 が、データ重力と呼ばれる現象に悩まされています。大量のデータを別の場所に移動するのに長い時間がかかるためです。

従来、 データの移動は 光ファイバー ネットワーク上で行われていました。しかし、いかに高速の 光ファイバー ネットワークであっても、AI や HPC アプリケーションが必要とする量のデータを移動するためには数日から数週間、場合によっては 数か月間かかる ことがあります。 そして、データセンターで 10 年以上にわたって液浸冷却技術を改良し、実装してきた結果、 今では DUG Nomad( コンテナ型 モジュール式 データセンター)を通じてエッジ環境を展開するに至りました。 例えば、 DUG Nomad 10 は、10 フィートの 出荷コンテナに 100 基以上の H200 GPU を配置することができます。

出荷コンテナ が データセンター そのものであるため、 物流が簡素化されます。超遠隔 環境 で展開できるだけでなく、  超過酷な 気候にも耐えられるように堅牢化され、テストされています。 さらに、現場に設置された後は、DUG Immersion Cool 技術により  タンク内で非常に高い電力効率と温度安定性を維持することができます。 

このシステムは可搬性が高く頑丈ですが、タンク内に収容できる機器の量には限りがあります。 従来は 、HDD と クラスタ型 ストレージシステムを使用していました。 

このソリューションには、ドライブの故障や 構成の複雑さ、 運用管理の難しさなど、多くの問題があることが分かりました。 そこで 、ストレージシステムの かなりの部分 を Solidigm NVMe ベースのドライブに移行しました。  Solidigm NVMe ドライブは超大容量で高性能なため、小さなスペースで膨大なデータ容量とパフォーマンスを実現できます。これはまさにエッジでの AI 推論 に必要な要素です。