エッジへの移行が進むエンタープライズコンピュート

AI generated image of man standing at the edge of data collection for AI inferencing.
AI generated image of man standing at the edge of data collection for AI inferencing.

AI の導入は急速に進んでいますが、この進化のスピードについていくには、コンピュート(コンピューティングリソース)をエッジのデータに近い場所に置くことが何よりの近道です。このトレンドは、エッジデータセンターへの大規模な投資を後押ししています。Research and Markets は、エッジデータセンターの CAGR(年平均成長率)が約17%増加し、2024年には約150億ドル規模だった市場が、2030年には400億ドルに迫る規模に拡大すると、予想しています。

IT 部門は、ここ20年ほどでコンピュートをクラウドに集約させてきました。今後10年は、コンピュートをデータに近い場所に戻す取り組みが進むでしょう。
Solidigm AI フェロー、リタ・ウーハイビ

エッジデータセンターは文字通り、組織のサービスにアクセスする顧客、パートナー、デバイスの近くに配置されています。サーバー数台が小売店舗の収納スペースに置かれている場合もあれば、コロケーションセンターのIT機器のラックにある場合など、さまざまな規模や形態があります。マイクロコントローラーとリアルタイムのソフトウェアを利用する IoT デバイスとは対照的に、エッジデータセンターは、小規模なスペースでフルスタックアプリケーションの処理能力を実現します。

エッジ処理への移行が進む理由としては、トランザクションの応答性、サービスの拡張性、データ主権などが挙げられます。もう少し詳しくみましょう。

なぜコンピュートをエッジに移動させるのか

多くの組織のプライマリデータセンターでは、さまざまな制約に直面しています。その例としては、電力、冷却、スペース、システムアーキテクチャー上の制約などが考えられます。エッジデータ処理は、計算を実行する場所を、メインのデータセンターから IT サービス利用者の近距離へと分散させることにより、制約となる要因の多くを回避できる手段となります。

以下のような理由から、エッジ処理は今日の IT 組織に適しているといえます。

  • 応答性と遅延:応答時間が長くなれば、顧客満足度は低下します。安全性を重視して判断(ロボット、自動運転車、ドローンなどの意思決定)する必要がある場合、スピーディーな意思決定で障害物を避けることが不可欠になります。遅延を減らす確実な手段の1つは、コンピュートとストレージを、顧客、パートナー、デバイスがサービスを利用する場所に移すことです。これにより、コアデータセンターとのリクエストとリプライの送受信に要するネットワークのラウンドトリップタイムとコストを抑えることができます。
  • 拡張性:多くの場合、プライマリデータセンターにおけるデータ処理には、ソフトウェアとハードウェアの両面に関わるシステムやアーキテクチャーの制約がつきものです。エッジ処理を導入すれば、電力、冷却、スペースの制約が緩和されるのは明らかですが、一部のワークロードをエッジに分散させることにより、システムやアーキテクチャーの制約も日常的に解消できる可能性があります。これは長期的に、組織の IT サービス拡大を加速させることにつながります。
  • データ削減:良質なデータ、質の悪いデータ、ノイズやエラーの多いデータなど、すべてのデータをコアに送り返す必要はないことが多いため、排除できる場合もあります。たとえば、衛星画像は地形、地上のインフラ、農作物などを写し出すことができますが、雲が覆ってこれらの重要な場所がはっきり見えない場合があります。このような画像をすべて、地上局に送って保存、処理、分析するのは無駄かもしれません。データの発生元で質の悪いデータや冗長なデータを排除し、データの転送と処理が増えないようにして、エッジのデータを減らせば、コスト効率が高まります。
  • データプライバシー:データプライバシーの要件は、データが処理される場所や手段にますます影響を及ぼすようになっています。厳格なデータレジデンシー(データが物理的に保存されている場所)のルールがある法域において、エッジコンピューティングは実用的なアーキテクチャー上のアプローチを実現します。データを手元で、つまり生成される場所の近距離で処理することにより、組織はどの個人データを域内で保持すべきかを判断しやすくなるでしょう。エッジデプロイメントで、データの移動を限定し、データアクセスとデータ保持の制御のさらなるローカライズを可能にして、インフラ戦略を後押しすることができます。

データ処理をエッジに移行するメリットが分かる事例はほかにも数多くあります。組織のニーズによって、さまざまなメリットを見出せるでしょう。

AI 推論がエッジの拡大を加速させる

前述のとおり、システムの制約を解消して応答時間を短縮し、不要なデータ伝送や処理をなくすことのできるプロセスのすべてをエッジで行うことは、検討する価値があります。AI 推論はその好例です。

当社はこれまで、一元管理型データセンターの電力と冷却の制約について説明してきました。一般的にみて、ほとんどの組織において、AI のトレーニングと推論のインフラは、そのような制約にアプローチする大きなきっかけとなっています。組織は、AI モデルのトレーニングを数多く行うために、一元管理された大規模な GPU アクセラレーテッドサーバーのクラスタを必要としています。一方で、AI 推論ソリューションの導入に関わるインフラ面のハードルは大幅に下がっています。推論処理をエッジに移行することによって、組織のコアデータセンターにおける電力と冷却の要件は抑えられ、持続可能性がずっと高まります。また、すべてをコアデータセンターで処理するのではなく、複数のエッジデータセンターで実行することができれば、推論処理の負荷に対応するための AI インフラははるかに拡張しやすくなります。

さらに、AI 推論をサービスが利用される場所の近距離に移して実行することにより、推論の応答時間を短縮できます。大きく異なる2種類の推論プロファイルが、エッジで利用されています。それぞれに異なるストレージ要件があります。

  • ステートレスな大規模言語モデル(LLM)/テキストチャット:CPU セントリックで、遅延の影響を受けやすく、モデルがロードされると主に読み取り専用になります。ストレージに関しては、主に高速なシーケンシャルリードとコスト効率の高い容量が必要とされ、書込みエンデュランス(書き換え可能な回数)はさほど重要ではないため、高密度の QLC SSD が最適です。
  • ビジョンおよびセンサー分析:GPU/NPU 駆動のパイプラインが、連続的な動画、ライダー、あるいは IoT テレメトリデータを取り込みます。これらのワークロードは、ランダムリードとコンスタントに行われる小規模な書込み(メタデータ、特徴ベクトル、ローリングバッファ)でストレージに負荷をかけます。24時間365日のキャプチャサイクルに耐えられるよう、高い読み書き混在 IOPS と優れた書込みエンデュランスが求められます。

Solidigm が注目するのは、適切な SSD をそれぞれのプロファイルと組み合わせると、コスト効率とパフォーマンスを最大化できるという点です。QLC ベースの Solidigm™ D5-P5336 ドライブは、大規模な LLM リポジトリのパフォーマンスを向上させます。一方、Solidigm TLC ベースの D7 シリーズドライブは、NAND に3 DWPD 以上(1日あたりのドライブ書込み数が3回以上)の負荷をかけるビジョンのワークロードに対応し、オーバープロビジョニングなしで長寿命を実現します。

パフォーマンス以外に、データの削減も、エッジで処理を実行する場合のメリットとなります。AI 推論は、良質なデータと、質の悪いデータや冗長なデータをシステムが区別するメインの手段となっており、システムの機能に影響を及ぼすことなく、質の悪いデータを排除できます。

また、規制により、個人データ処理を国内または特定の機関で行うよう求められることがあります。推論をエッジで実行すれば、国境の要件に対応できる可能性があります。

エッジにデプロイすることによって、組織のシステムの目的を果たせる IT ワークロードは、AI 推論のみではありません。それでも、AI 推論で、エッジ処理の成果が明確になり、エンタープライズ企業がエッジ処理を導入する妥当性を証明する大きな根拠となります。

Solidigm のアドバンテージ

分散エッジ処理は、コアデータセンターから遠く離れた場所にユーザーを擁する組織にとって、大きな意味を持ちます。応答性は多くの場合、エッジ処理を導入する大きなきっかけとなっていますが、それだけではありません。

エッジ処理を採用して、データ発生元で無関係なデータを削減、排除すれば、データの転送、処理、ストレージのコストをすべて大幅に減らすことができます。さらに、システムを拡張する際には、多くの場合、中央のデータセンターでソフトウェアとハードウェアの制約に直面しますが、エッジ処理を導入すれば、組織はこうした制約を緩和することができます。

AI 推論は、エッジ処理で大きなメリットを得ることのできる良い例です。エンタープライズ IT の世界で、ますます AI アプリケーションの普及が進むなか、エッジで実行される推論は、さまざまな観点で、成否を左右する判断となる可能性があります。

データインフラを賢く選択することが、こうしたプロセスのカギとなります。Solidigm の製品ポートフォリオと、エッジ AI のおすすめ情報について、詳しくは www.solidigm.com/ai をご覧ください。


著者紹介

エース・ストライカーは、Solidigm のマーケット開発担当ディレクターです。同社のデータセンターストレージソリューションポートフォリオの新たな用途にフォーカスしています。

免責条項

本資料に記載した内容はすべて、明示されているか否かにかかわらず、いかなる保証を行うものでもありません。ここにいう保証には、商品適格性、特定目的への適合性、および非侵害性の黙示の保証、ならびに履行の過程、取引の過程、または取引での使用から生じるあらゆる保証を含みますが、これらに限定されるわけではありません。

本書で説明されている製品には、「エラッタ」と呼ばれる設計上の不具合が含まれている可能性があり、公表されている仕様とは異なる動作をする場合があります。現在確認済みのエラッタについては、Solidigm までお問い合わせください。

Solidigm は、サードパーティーのデータについて管理や監査を行っていません。ほかの情報も参考にしてデータの正確さを評価してください。

製品をご注文される前に最新の仕様をご希望の場合は、Solidigm の担当者または販売代理店にお問い合わせください。

SOLIDIGM および Solidigm の「S」のロゴは、米国、中華人民共和国、日本、シンガポール、欧州連合、英国、メキシコ、およびその他の国で登録されている、SK hynix NAND Product Solutions Corp(商号Solidigm)の商標です。