液浸冷却ストレージでエッジAIと地震データ処理を変革

エッジストレージ展開のために遠く離れた南極大陸にヘリコプターで運ばれている、Solidigmの大容量SSDを搭載したDUG Nomad。
エッジストレージ展開のために遠く離れた南極大陸にヘリコプターで運ばれている、Solidigmの大容量SSDを搭載したDUG Nomad。

人工知能(AI)、ハイパフォーマンスコンピューティング(HPC)、エッジ展開の融合によって、データ処理インフラに対する革新的なアプローチが必要とされています。HPCと液浸冷却ソリューションのリーダーであるDUG Technologyは、DUG Nomadを創設しました。これは、輸送用コンテナに設置された画期的なデータセンターです。HypertecサーバーおよびSolidigm™ NVMe SSDと組み合わせることで、DUG Nomadは前例のない計算能力をエッジ展開に直接もたらします。

この連携は、液浸冷却技術、専用サーバー、高性能ストレージが、エッジにおけるAIとHPCをどのように変革できるかを示しています。 

課題:データセンターのエッジへの移行

従来のデータ処理ワークフローでは、膨大な量の生データを遠隔地の収集拠点から集中データセンターに輸送して分析する必要がありました。このプロセスには大きな課題がつきまといます。 

  • ネットワーク帯域幅の制限による、送信可能なデータ量の制限 

  • データ処理の遅延による重要な意思決定の遅れ

  •  すべての生データをネットワーク経由で移動させるコストの高さ 

世界で最も人里離れた過酷な環境の1つであるサウジアラビアの砂漠で、データを取得、処理、送信する際の課題について考えてみましょう。 革新的なエッジコンピューティングソリューションは、孤立したデータ収集サイトや移動データ収集サイトでのデータ取得に革命をもたらし、地震データの超効率的な収集を可能にします。

ライブデータフィード上で高度な計算集約的アルゴリズムを実行する能力により、リアルタイムの分析が可能になります。高密度のストレージソリューションを追加することで、継続的で中断のないオペレーションが実現し、効率を最大化して、洞察までの時間を短縮できます。 

ソリューション:DUG Nomadモバイルデータセンター

DUG Nomadは、コンテナ型の液浸冷却データセンターです。世界中どこにでも設置できます。このモバイルソリューションは、高性能コンピューティング機能をデータ収集現場に直接持ち込み、エッジでのリアルタイム処理と分析を可能にします。

システムは、10フィート、20フィート、40フィートのコンテナサイズを含む複数の構成で利用可能です。10フィートモデルは、26の使用可能なラックユニットのコンピューティングスペースを提供します。このコンテナは、ヘリコプターによる輸送を想定して設計されており、吊り上げポイントが一体化されているため、従来のコンピューティングインフラでは到達不可能な場所でも展開することができます。DUG Nomadは、-40℃から+50℃の温度範囲と、耐候性と密閉設計により、実質的にどこでも動作します。電源接続だけで完全な自立が可能です。 

酷暑の砂漠に設置された、Solidigmの大容量SSDを搭載したDUG Nomadモバイルデータセンター。 世界中どこにでも設置可能な、DUG Nomadコンテナ型液浸冷却データセンター

おそらく最も素晴らしい点は、システム全体を2時間以内に導入・運用できることです。遠隔地でも、データセンターレベルのコンピューティングとストレージ機能に即座にアクセスできます。

技術革新:エッジ展開に特化したHypertecの液浸サーバー設計

Hypertecの貢献は、「液浸対応」から「初めから液浸」のサーバー設計への根本的な転換を意味します。Hypertecは、空冷サーバーを液体環境に適応させるのではなく、液浸冷却専用として一からサーバーを設計することで、優れたパフォーマンス、信頼性、効率を実現しています。

「初めから液浸」の設計思想は、サーバーシャーシ全体に最適化されたコンポーネント配置に現れています。GPUは温度が最も低いタンクの底に設置され、電源やその他の発熱部品は最大の効率を得るために戦略的に配置されています。特殊な素材には、特定の冷却液粘度に合わせて設計されたカスタムヒートシンク、液体環境でも劣化しないインジウム箔サーマルインターフェイス、液浸認証されたケーブルとコネクタなどがあります。 Hypertec TRIDENT液浸サーバーの内部シャーシとレイアウトは、冷却液の流れをスムーズに導き、ホットスポットを最小限に抑えるように設計されており、均一な熱分布を確保します。カスタムヒートシンクのフィンピッチは、誘電体流体の高粘度に最適化され、循環と熱伝達効率を向上させます。すべてのコンポーネントは、長期間の液浸性能を実現するために、高加速ストレス試験(HAST)、流体老化試験、および膨潤、腐食、劣化に抵抗するための互換性試験などを通じて、厳しくテストされています。サーマルインターフェイス材料(TIM)は、液浸環境における耐久性と導電性を考慮して選択され、一貫した長期的なシステムの信頼性をサポートします。 

密度の高さには目を見張るものがあります。10フィートのDUG Nomadモデルは、26の使用可能なラックユニットの従来のコンピューティングスペースを提供し、さまざまな高さの特殊な液浸冷却タンクを収容することができます。26RUのタンク1つで、AMD EPYCまたはIntel Xeonプロセッサを利用した50台以上の最新CPUサーバー、または1RUのシャーシに4つのGPUを搭載する超高密度構成を使用した100台以上のH200 GPUをサポートできます。 

信頼性指標は、従来の空冷システムでコンポーネントを劣化させる熱サイクルストレスを排除し、安定した動作温度により、いくつかの配備での4年以上の運用において報告されたコンポーネントの故障がゼロであることを示しています。DUGのサーバーは(一般的な寿命は5年ですが)、最初に浸漬してから9年経った今でもスムーズに稼動しています。 

ストレージ:エッジでのSolidigm高性能SSD

Solidigm NVMe SSDソリューションは、エッジAIと地震処理ワークロードに最適な高性能ストレージ基盤を提供します。コンパクトなフォームファクターと卓越した性能は、スペースが制限され、パフォーマンスが重要視されるDUG Nomadシステムの環境において理想的です。

Solidigmの大容量SSDを搭載した、DUG Nomadホットスワップ対応エッジソリューション。

SolidigmはDUGおよびHypertecと協力して、この概念実証を検証しました。現在のストレージ実装では、1台の1Uストレージサーバー内に16台のSolidigm E1.SSDを使用し、ストレージノードあたり約320TBの総容量を提供します。E1.Lフォームファクターのサポートにより、1台の1Uサーバーで最大1.9ペタバイト(PB)のストレージ容量が可能になるなど、スケーラビリティの可能性は大きく広がっています。

高いIOPS性能は、AIによる同時推論ワークロードをサポートし、低レイテンシーはリアルタイムの意思決定を可能にします。より多くのデータをエッジに保存することで、生データをリモートの処理センターに送信する必要性が大幅に減り、インテリジェントデータフィルタリングシステムは帯域幅要件を大幅に削減できます。 

事例と用途

HPC、ストレージ、冷却を組み合わせることで、エッジでの高度なAIや計算負荷の高いアプリケーションが可能になります。  使用例としては、遠隔監視のためのコンピュータービジョン処理、リアルタイムのセンサーデータを使った予測分析、低遅延の意思決定を必要とする自律システム、エッジデータ収集サイトで直接行う科学的モデリングとシミュレーションなどがあります。

機密情報や極秘情報を扱うアプリケーションに対して、エッジコンピューティングは、施設内または国内でのプライベートな機能を提供します。 

ビジネスインパクトとROI

運用効率

リアルタイムのエッジ処理により、生データの伝送要件が大幅に削減されるため、クラウドストレージや帯域幅のコストが大幅に削減されるとともに、地質調査や探査活動においてインサイトを得るまでの時間を短縮できます。

電力効率

液浸サーバー設計は、従来の空冷式ソリューションと比較して大幅な省電力化を実現します。Energy Informaticsに掲載された研究によると、液浸冷却のデータセンターは、空冷のデータセンターよりもエネルギー消費が最大50%少ないとされます。DUGでは、液浸冷却のデータセンター設計に移行したことで、全体の電力消費を51%削減しました。サーバーファンをなくしただけで、総消費電力は最大25%削減されました。業界平均が1.55以上であるのに対し、DUGは1.02という低い電力使用効率(PUE)評価を達成しています。安定した低温動作により、プロセッサはピーク効率曲線を維持しながら、空冷システムで性能を低下させて消費電力を増加させるサーマルスロットリングを回避することができます。

インフラストラクチャの最適化

複数の固定設備を構築する代わりに、1台のモバイルユニットを使用することで、プロジェクト全体で設備を最大限に活用できます。液浸冷却は部品の信頼性を劇的に向上させ、交換やメンテナンスのコストを削減すると同時に、厳しい環境でも安定した性能を発揮します。

戦略的優位性

データ分析機能の強化、機器の故障リスクの低減、運用の柔軟性の向上により、企業は従来のコンピューティングインフラでは考えられなかったビジネスチャンスを追求することができます。

将来のロードマップと拡張性

より大容量のSolidigm SSDへの移行、次世代PCIeプロトコルの統合、潜在的な計算ストレージ技術など、ストレージの進化を通じて技術の進化は続くでしょう。コンピューティングプラットフォームの成長では、DUG Nomad 40のような大型のコンテナ構成に、次世代GPUアーキテクチャと特殊なAIアクセラレータが組み込まれる見込みです。

市場拡大の機会は、遠隔地での製造や産業用IoTアプリケーション、極限環境での科学研究、コンピューティングリソースの迅速な展開が重要な緊急対応シナリオにまで広がっています。 

結論

DUG Nomad、Hypertec社製液浸サーバー、Solidigm社製高性能SSDの組み合わせは、エッジコンピューティングインフラのパラダイムシフトを象徴しています。遠隔地や困難な環境に高度な計算能力をもたらすことで、基本的な課題に対処します。 

さまざまなアーキテクチャ技術の革新的なソリューションを組み合わせることで、このソリューションは、データセンターレベルのパフォーマンスを、世界中どこでも効果的に運用できるモバイル型の自己完結型パッケージで実現できることを示しています。 

DUGの高度なデータ処理による地震イメージング、AI推論、または科学研究に適用されるかどうかにかかわらず、この統合ソリューションは、企業がリモート環境でのデータ処理にアプローチする方法を変革する卓越した機能を提供します。

エッジAIとHPCワークロードの重要性が業界全体で高まり続ける中、DUG Nomadのようなソリューションは、従来の集中処理アプローチのコストと複雑さを最小限に抑えながら、データの価値を最大化しようとする企業にとって、ますます重要になるでしょう。この統合ソリューションが実証した信頼性、性能、展開の柔軟性は、エッジコンピューティングインフラの新たな基準を確立し、将来の技術やアプリケーションの開発に影響を与えると考えられます。 


免責条項

本資料に記載した内容はすべて、明示されているか否かにかかわらず、いかなる保証も行うものではありません。ここにいう保証には、商品適格性、特定目的への適合性、および非侵害性の黙示の保証、ならびに履行の過程、取引の過程、または取引での使用から生じるあらゆる保証を含みますが、これらに限定されるわけではありません。

本書で説明されている製品には、「サイティング」と呼ばれる設計上の不具合が含まれている可能性があり、公表されている仕様とは異なる動作をする場合があります。現在確認済みのサイティングについては、Solidigmまでお問い合わせください。

Solidigmは、サードパーティーのデータについて管理や監査を行っていません。ほかの情報も参考にしてデータの正確さを評価してください。 

製品をご注文される前に最新の仕様をご希望の場合は、Solidigmの担当者または販売代理店にお問い合わせください。 

SOLIDIGMおよびSolidigmの「S」のロゴは、米国、中華人民共和国、日本、シンガポール、欧州連合、英国、メキシコ、およびその他の国で登録されている、SK hynix NAND Product Solutions Corp(商号Solidigm)の商標です。