40℃ の食料品店の冷凍庫の上にボルトで固定した、奥行き半分のシングルソケット・サーバーを思い浮かべてください。小型 GPU がマルチモーダルなプロンプトをリアルタイムで処理しながら、サーバーは静かにブーンという音を立てます。これは実用的なエッジであり、数百ワットを共有し、靴箱のような設置面積で、エアフローはほとんどありません。このような設定では、推論がスムーズなままか停滞するかは、コンピュートではなくストレージによって決まります。
このエッジのボトルネックは、厳しい電力制限、狭いスペース、暖かい周囲空気、急速に増大するモデルファイルなど、具体的な形で現れます。Antillion のウェアラブル・サーバー、Zhengrui の家畜ゲノム・プラットフォーム、PEAK:AIO のオンプレミス AI クラスターでの実績は、古いレガシー SSD やハードディスク層を最新の Solidigm™ ドライブに置き換えることで、いかに設置面積を縮小し、電力消費を削減し、GPUへの給電を維持できるかを示しています。アプリケーションの設置場所が店舗型クリニックであれ、工業用ヤードであれ、田舎の変電所であれ、ストレージを適切に選択することで、厳しいエッジ計算を測定可能なパフォーマンスの余裕へと変えることができます。
クラウドホールのハイパースケールラックは 10kW 以上の電力を消費し、冷却装置の列の下に設置されます。それとは対照的に、エッジノードは、1ワット、1立方インチ、1度の温度が重要となる、掃除用具入れやポールマウントキャビネットに押し込まれる場合があります。多くの専用エッジサーバーは、CPU、GPU、ネットワーキング、ストレージをカバーしなければならない上限である 200W から 300W の定格電源しか搭載していません。コアラックの平均出力は現在約 12kW ですが、AI クラスターではそれよりもはるかに高くなっており、エッジで期待できるよりも桁違いに余裕があります。
スペースも同様に制約があります。奥行きの短い 1 ユニット・シャーシでは、2.5 インチ・ドライブ・ベイが2つと E1.S ドライブ・スロットが 1 組しかないため、1 システムあたりの容量は、ローカルモデルやデータセットのサイズを直接制限することになります。スペアスロットはめったに存在しないため、後から拡張する場合、単純なドライブ交換ではなく、フォークリフト・アップグレードを必要とすることが多くなります。そのため、初日から適切な容量を確保することが、パフォーマンスの余裕と ROI の両方にとって非常に重要となります。
冷却も厳しい条件があります。レノボの ThinkEdge SE450 のような堅牢なエッジ・システムは、ほとんどのデータセンターのコールドアイルで目標とされている 30℃ をはるかに上回る 45℃ までの入口温度で連続稼動することができます。このような空気環境では、10W 以上を消費するドライブは、小型のエンクロージャーでも仕様外となる可能性があります。店頭や診療所、小売店のフロアでは、騒音制限内に収まるようにファンの回転を遅くしなければならないため、各コンポーネントが個別に効率的に熱を排出する必要があります。
帯域幅ではその差は埋められません。クラウドサーバーがペタバイト(PB)のストレージファブリックからデータをストリーミングするのに対し、エッジボックスは多くの場合、単一の 1GbE 回線または共有の 5G リンクに依存しています。そのため、モデル、組み込み、ビデオバッファー、ログは、GPU から何マイルも離れた場所ではなく、数インチの場所に置く必要があります。サービスコールは頻繁に行われるわけではないので、ドライブは何年もの間、注意を払わなくても持ちこたえられる必要があります。
これらの制限の組み合わせにより、ストレージのチェックリストが書き換えられます。エッジ・ビルダーは、クラウドに匹敵する容量でありながら 1 つまたは 2 つの E1.S ドライブ・スロットに収まる容量、数ワット以下に抑えながらバースト性のあるセンサー・トラフィックを吸収する書き込み耐久性、キャビネットの空気が 40 度以上であっても GPU を稼働させ続ける読み込み速度を必要とします。
エッジワークロードの中には、パフォーマンスが命運を左右するものもあります。ライブビデオ分析、リアルタイムのゲノムマッチング、迅速な検索拡張生成は、マイクロ秒のレイテンシーで毎秒数十ギガバイトの持続的な読み取り帯域幅を必要とします。一方、自律走行車のデータキャプチャーや現場でのコンプライアンス・ログなど、数週間から数ヶ月のコンテクストを保持するために容量を重視するものもあります。どのような組み合わせであれ、設計者は同じように厳しい消費電力と狭いエンクロージャー内に収めなければなりません。
効率化の秘訣は、CPU、GPU、ネットワーキングに十分な熱的余裕を残しながら、実際のトラフィック・パターンに合った耐久性、スループット、密度を選択することです。
成功した設計の多くは、ストレージを階層化し、各階層がそれぞれの強みを発揮できるようにしています。
各レイヤーは実際のワークロードに適したサイズであるため、Solidigm SSDを搭載した代表的なスタックは8ベイ未満に収まり、消費電力は60W未満、周囲温度は40℃台前半で対応可能です。同じパターンで、キャビネットを消耗させることなく、診療所のライブ DICOM 画像を取り込んだり、店舗で小売店のビデオを選別したり、1年分の変電所の波形をアーカイブしたりすることができます。
経済性も設計を強化します。12台の低容量ドライブを3台の Solidigm の大容量 NVMe SSD に交換することで、ドライブ数を 75% 削減し、約 150W の熱を削減し、ストレージの計算を約 25% 下げることができます。ワット数とスロット数を削減すると、追加のGPUや、より高速なネットワークカード、より静かなファンを搭載する余裕が生まれます。
Antillion は、現場の作業員がベストに装着する小型エッジコンピュータを製造しています。初期のバージョンは 2.5 インチ SATA SSD を採用しており、容量とスループットの両方に制限がありました。同社はこれらのディスクを、高性能 SSD D7 シリーズのドライブ・ファミリーの Solidigm E1.S NVMe SSD に置き換えました。この置き換えにより、高解像度ビデオとセンサー・フィードのストリーミング帯域幅が2倍以上になり、ソフトウェア導入時のシステム構築時間が約30%短縮され、数百台の出荷後、現場でのドライブ故障はゼロでした。革新的な Solidigm E1.S ドライブにより、Pace A2 戦術ノードは重量を増やすことなく大容量のデータセットを運ぶことができ、頑丈なエッジ・ギアがもはや容量とサイズを引き換えにする必要がないことを証明しています。Antillionとの連携については、こちらの記事をご覧ください。Antillionとソリダイム:最先端でイノベーションを推進する。
四川省にあるZhengrui Technology は、ゲノム配列、表現型画像、環境テレメトリーを取り込む畜産分析プラットフォームを運営しています。24基のSolidigm D5-P5336大容量ドライブを搭載した1台の2Uサーバーは、現在約700TBを保持し、約100万ランダムIOPSを維持しています。HDDと低容量のSSDのハイブリッドストレージから、すべて大容量のSolidigm SSD構成に移行することで、ラックスペースとストレージの電力を79%削減し、予算と熱容量に余裕が生まれ、疾病予測モデルや繁殖価値モデルを現場でトレーニングするためのGPUの追加に充てることができました。Zhengruiと当社のコラボレーションについての詳細は、記事「Zhengrui TechnologyとSolidigm SSD」を参照してください。
PEAK:AIO は Dell と提携し、NVIDIA ConnectX-7 アダプターを介して毎秒 120GB を提供する 2 ユニットの AI データサーバーを構築しました。このシステムは、24個のNVMeベイすべてにSolidigmの61.44TBの大容量SSDを搭載することでこの速度を実現し、サテライトラボや地域のクリニックにも設置できる小型のシャーシで1.5PBを提供します。電力予算に関する調査では、同じアプローチによって、50MW のデータセンター・モデルで 10 ~ 20MW の削減が示されており、これは、オペレータがサイトの総消費電力を上げることなく、GPU 容量を約 50% 追加できる余裕です。PEAK:AIO との連携については、こちらの記事をご覧ください。PEAK:AIO、MONAI、ソリダイム:メディカル AI のストレージに革新をもたらす
これらの導入事例を総合すると、このパターンが確認できます。ストレージ密度が上がり、TB あたりの消費電力が下がれば、エッジサーバーは縮小し、運用コストは下がり、アクセラレーターはデータを待つことなく稼働状態を維持できます。
以下の表は、3 つのドライブ・オプションが、電力制限のあるエッジサーバー内のキャッシュ、動作、容量の役割にどのように適合するかを示しています。
属性 | Solidigm™ D7-P5810 | Solidigm™ D7-PS1010 | Solidigm™ D5-P5336 |
カテゴリー | キャッシュ層 | パフォーマンス層 | 容量階層 |
エッジAIの役割 | ライトバーストキャッシュ | ホットモデルとインデックスストア | 大きなコンテキストと保持 |
インターフェイス | PCIe 4.0 x4 | PCIe 5.0 x4 | PCIe 4.0 x4 |
多様なフォームファクター | U.2 15 mm | E1.S 9.5 mm、 E1.S 15 mm、 E3.S 7.5 mm、 U.2 15 mm。 |
U.2 15 mm、 E3.S 7.5 mm、 E1.L 9.5 mm |
シーケンシャル読み込み | ≈ 6.4 GB/s | ≈ 14.5 GB/s | ≈ 7 GB/s |
ランダム読み込み | ≈ 0.9 M IOPS | ≈ 3.1 M IOPS | ≈ 1 M IOPS |
容量範囲 | 0.8~1.6 TB | 1.92~15.36 TB | 7.68~122.88 TB |
耐久性(DWPD、5年) | ≈ 50 | 1 | ≈ 0.5 |
アイドル時/有効電力 | 5 W/< 10 W | 5 W/23 W(平均) | 5 W/≈ 25 W |
実用的なレイアウトでは、データ取り込みの急増に備えて 2 台のキャッシュ層 SSD ドライブ、アクティブ・セット用に Gen5 パフォーマンス層 SSD ドライブの小さなバンク、そしてコンテキスト・データ用に 1 台または 2 台の大容量 SSD ドライブを組み合わせます。耐久性を書き込みの負荷に、帯域幅をアクセラレータの需要に、密度を保持のニーズに合わせることで、エッジの制約を余裕に変えることができます。Solidigm の適切な層を導入することで、データセンターの予算をフルに使わなくても、クラウドクラスの AI を店頭や工場のフロア、あるいは田舎の送電線のそばなどに設置することができます。
エッジ・コンピューティングは、かつてのルーターやヒューズ・ボックスのためのスペースに AI を押し込みます。このような狭い場所では、選択するフラッシュが、GPU に到達するデータ量、シャーシの冷却性能、そして投資回収の早さを左右します。現場での導入事例では、以下のようなパターンが示されています。
Antillion のタクティカル・リグ、Zhengrui の家畜ゲノムクラスター、PEAK:AIO の研究用サーバーは、それぞれこのパターンを踏襲し、フットプリントの縮小、エネルギー使用量の削減、アクセラレーターの使用率の安定を達成しました。
需要は高まる一方です。モデルは拡張を続け、マルチモーダルな推論はアクセスパターンを広げ、分析スタックはより深い読み取りバーストを促進します。つまり、ストレージは、スロットあたりのテラバイト数の増加、GPU メモリへのパイプの高速化、ワークロードの変化に適応したよりスマートな階層化という 3 つのベクトルに沿って同時に成長する必要があります。
Solidigm の革新的で市場をリードするロードマップは、液冷コールドプレート対応 E1.S SSD、フルスピード PCIe Gen5 レーン、デバイス付近のデータ削減を目指したファームウェアによって、すでにその方向に向かっています。これらの機能が成熟すれば、より大型の AI パイプラインがデータセンターを離れ、センサーのある場所で実行できるようになります。
Jeff Harthorn は、Solidigm の AI データ・インフラストラクチャ担当マーケティング・アナリストです。ソリューション・アーキテクチャー、製品企画、マーケティングの実践経験を活かし、水冷式 E1.S SSD の競合調査など、企業向け AI メッセージングの策定に携わり、専門家レベルの詳細を顧客や協力パートナーのための鮮明なビジネス価値に変換しています。学位は、カリフォルニア州立大学サクラメント校でコンピューターエンジニアリングの理学士号を取得しています。