液冷の基礎知識

データセンターコンポーネント の 液冷

Liquid-cooled SSD for data center and AI factory
Liquid-cooled SSD for data center and AI factory

AIトレーニング、推論、リアルタイム分析、そしてますます 高密度化するハードウェアアーキテクチャ は、データセンターにおける「通常の電力範囲」の基準を書き換えています。かつては 5kW ~ 15kW の範囲で快適に運用できていたラックが、現在では 30kW、60kW、そしてそれ以上に対応するよう設計されるようになりました。電力密度の上昇に伴い、空気流、ファンウォール、ホットアイル、二重床に関する従来の前提が崩れ始めています。ある段階で、 空冷 が  難しくなる だけでなく、効率が下がり、スペースを消費し、運用が不安定 になります。

液冷 がニッチな 選択肢 からインフラ設計における中心的なテーマに変わった背景にはそうした理由があります。データセンターの液冷 は 、 単一の製品 や構成ではありません。液体の優れた熱容量を使用して熱を移動させる  一連の技術です。施設全体を巨大な空調設備に変えることなく、高密度データセンターの冷却を可能にします。

液冷とは

液冷は、液体冷却剤を発熱部品の内部または近くで循環させて熱を除去し、(多くの場合、熱交換器を介して)その熱を別の場所に移し、より効率的に放散させる方法です。データセンターの環境において、これは 一般に、ラック内、サーバー内、または直接チップ上といった発生源の近くで熱を 回収することを意味します。つまり、施設 は大量の冷却空気の移動だけに頼る 必要がありません。

液冷の最大の利点は物理特性にあります。空気と比べると、液体は単位体積あたり約 3,200 倍の熱を吸収できます1。 つまり、同じ量の熱を次のような条件で移動させることができます。

  • 必要な流量が少ない
  • 「施設」内の温度差が小さい
  • ファンにかかるエネルギーが少ない
  • 極端な空気流制御にあまり依存しない

実務上、一般にデータセンターの液体冷却は、次のような熱除去の流れに沿って行われます。

  1. チップ、サーバー、ラックで熱を捕捉する。
  2. クーラントループ(複数の場合あり)を介して熱を輸送する。
  3. 設計 に応じ、施設の水ループ、ドライクーラー、冷却塔、またはチラープラントに排熱する。

熱を「回収」する方法は多数あるので、液冷技術にはいくつかの構成が存在します。段階的な技術(リアドア型熱交換器など)もあれば、変革的な技術(液浸など)もあります。データセンターは、液冷ソリューションを 徐々に導入することも、初日から完全に液冷対応の施設を 設計することも可能です。

液冷を使用する理由

データセンターは、特に AI と HPC を拡張する際に、パフォーマンス、経済性、リスク管理といったさまざまな理由で液冷を採用します。

より高いラック密度に対応

多くの運用者によれば、一定の システム しきい値を超えると、空冷は次第に実用性を失います。業界では一般に、1ラックあたり約 20 kW を超えると空冷のみに依存することは難しいと指摘されていますが、AI ラックはそれを大きく上回る数値に達する場合があります。2

空気の移動にかかるエネルギーを低減

ファンやエアフローのインフラは無料ではありません。チラーを検討する前の段階でも、空冷式設計では、ますます通気が悪くなったサーバー設計を通して空気を流すために、かなりの電力が費やされるケースが多く見られます。液冷を導入すればファンの必要性は小さくなり、構成によっては、施設をより高い温度設定で運用することも可能になります。3

熱安定性が向上

コンポーネントが高温で動作すると、スロットル、エラー、ブースト動作の低下が起きる可能性があります。データセンター環境における液冷は、吸気温度や コンポーネントの 温度をより安定させ、結果として、パフォーマンスを予測可能な状態に保ちます。

設計の自由度が広がる:より高密度のラック、設置面積の縮小、新しい施設条件

 貴社が スペースに限りのある大都市圏で施設を建設する場合や既存の建物を改修する場合、 液冷サーバー を使用すれば、HVAC の方式全体を再構築しなくても、最新の高密度計算環境を実現する道筋になり得ます。4

データセンターにおける液冷とは

データセンターの液冷とは、熱を運び出す媒体として空気のみに頼らず、熱除去のための主要な輸送媒体として液体を使用するすべての冷却方式を指します。

実際には、ほとんどのデータセンター実装は、次のパターンのいずれかに該当します。

  • 施設インフラ主体の液冷統合方式 
    データセンターでは、液体循環系(冷却水、凝縮水、温水)を基盤として使用し、多くの場合、液体冷却ラックをサポートするために熱交換器と組み合わせます。
  • ラックに焦点を当てた液冷 
     液冷サーバーラック には、列内クーラー、リアドア熱交換器、またはサーバーをクーラント分配ユニット(CDU)に接続するチップ直結型冷却などを組み込むことができます。
  • サーバー/コンポーネントに焦点を当てた液冷 
    サーバーは、GPUやCPU のコールドプレート など、最も発熱するコンポーネントに液体が直接接触するように設計されています。さらに、特殊なビルドでの SSDの液冷 に向けた専用設計も増えています。

AIの成長が加速するにつれ、持続可能性がもたらす制約も設計の選択に影響するようになっています。公開資料においても、水の可用性と冷却方式のトレードオフがより明確に示されるようになりました。また、事業者は容量拡大と同時に、クローズドループ方式や水の使用を抑制する手段を模索しています。 現在は、WUE(水利用効率)の使用という新たな基準も追跡されるようになっています。5

データセンター液冷技術の種類

リアドア型熱交換器(RDHx)

リアドア型熱交換器は、ラックの背面ドアを液冷ラジエーターに置き換えたものです。 高温の排気はドアを通過して室内に戻る前に冷却されます。

設置に最適な場所

  • サーバーを再設計せずに大きな熱回収効果を得たい場合の移行型導入
  • 空冷ラックと液冷補助ラックの混在環境

注意 すべき 重要な ポイント 

  • サーバー内ではまだ空気を流している ため、ファンの電力消費 は依然として 重要な要素です。
  • 安全な運用のために、ラックレベルの配管と制御が必要です。

チップ直結(コールドプレート)冷却

チップ直結冷却方式は、データセンターの液冷で一番先に思い浮かべる「標準的な」イメージです。高温のコンポーネント(GPU、CPU、 SSD)に取り付けたコールドプレートを介して冷却液を送ります。 

AI データセンター の液冷では、このカテゴリーが特に重要です。これらの場所では GPU が発熱の大半を占め、ラックの密度は従来の設計をはるかに上回ります。中には GPU 数が約 25 万台に達する場合もあります。6

採用される理由

  • 発生源における高い熱回収効率
  • より高密度化を実現しながら、室内の空気流量を減らせる可能性

運用上の考慮事項

  • ラック内の配管が複雑
  • 漏れ検知、クイックディスコネクトの信頼性、保守手順

液浸冷却(単相式および二相式)

液浸冷却では、サーバーまたはコンポーネントを絶縁性の液体に浸します。熱は液体に直接伝達され、その液体は熱交換器を介して冷却されます。

液浸冷却を選択すべき理由

  • 熱除去能力 が非常に高い。
  • 空気の流れをシンプルにできる可能性がある。また、ファンの使用も最小限に抑えられる可能性がある。

導入上の懸念点

  • 保守運用の変革が必要である。液体に浸かった機器の扱いが難しい。
  • ベンダーロックインのおそれがある。運用面の習熟に時間がかかる。
  • 互換性と材料に関する考慮事項

これらの技術が主流になったことを受け、ASHRAE や業界のガイダンスも進化し続けています。電力密度の上昇に伴い、信頼性、運用性、リスク管理が強調されるようになりました。7

列内冷却および近接冷却方式

列内冷却は、ラックの近くに液冷ユニットを配置し、空気が移動する距離を短くすることで、制御性を向上させます。 その他の点では 従来型の 施設の 高密度ゾーンでしばしば使用されます。

適する用途

  • ハイブリッド展開
  • 特定用途向けの 高密度ポッド (迅速に導入できるように設計された、電源、冷却、ハードウェアラックを一体化した設計済みモジュラー型データセンターユニット)

施設の「温水」ループおよび CDU

多くの最新設計では、クーラント分配ユニット(CDU)を使用して、施設側の冷却回路を IT 側の冷却回路から切り離しています。これにより、制御性、清浄性、圧力管理が向上し、レトロフィットが 容易になります。

液冷 式 SSD: その仕組み

 液冷式 SSD は、単に「ヒートシンクが強化された」SSD ではありません。 液冷式 SSD は、液冷インターフェイスがホットスワップ対応、予測可能な適合性、大規模環境での保守性といった エンタープライズ向けストレージの運用上の期待事項を損なうことなく 効果的に熱を取り除くことができるように設計された SSD です。

Solidigm は NVIDIA と協力し、ホット スワップ対応 や片面冷却といった SSD 液冷の課題に対処してきました。 Solidigm  の完全液冷 SSD ソリューション は、1 枚のコールドプレートで SSD の両側を冷却します。ホットスワップ対応なので、省スペースかつ保守が容易です。 業界初となる本ソリューションの詳細については、こちらをご覧ください。

液冷と空冷の比較

空冷と液冷はいずれも IT 機器から熱を除去しますが、その方法は基本的に 異なります。下の比較を使用すれば、密度、信頼性、 運用 ニーズに適合する冷却方式を手早く選択することができます。

熱の移動方法

空冷

  • ファンを使用してサーバーに冷気を送り、熱を部屋に排出する。
  • 部屋のエアフロー設計に依存する( 例えば 、ホットアイル/コールドアイル、コンテインメント、CRAC/CRAHデリバリーなど)。

液冷

  • 冷却液を使用して熱源付近の熱を吸収し、熱交換器に運ぶ。
  • 部屋の空気の流れだけでなく、配管、CDU/マニホールド、制御された冷却液の流れにも依存する。

各冷却法が最適に機能する場所

空冷

  • 中密度の汎用エンタープライズラック。
  • ハードウェアの変更が 頻繁に発生する 混在環境。
  • 従来の空気の流れとコンテインメントに基づいて最適化された 設備 。

液冷

  • AI、HPC、ハイスループットコンピューティング/ストレージクラスターなどの 高密度ゾーン。
  • 空気の流れだけでは温度管理が困難なラック。
  • ラックあたりの高電力に合わせて繰り返しスケールできるように設計されたポッド。

ラック密度が上昇した場合に起きること

空冷

  • 同じ熱を除去するために、はるかに大きな空気流が必要です。
  • ファンの速度が高頻度で上昇し、電力オーバーヘッドとノイズが増加します。
  • 小さな空気流の中断 (ケーブル配線、ブランクの欠落 、および 圧力の不均等など)により、ホットスポットが発生する可能性があります。

液冷

  • 熱除去は、冷却液の流量と熱交換器の容量に応じて拡大します。
  • 一般に 密度が上がるにつれ、より安定した コンポーネント 温度が 維持されます。
  • 室内の空気流は大きな制約ではなくなりますが、液冷されないコンポーネントの場合は依然として重要です。

ストレージと SSD にとってこれは何を意味するか

空冷式ストレージ

  • SSD は、仕様で定められた範囲内にとどまるために、筐体内の空気流と ヒートシンク に依存します。
  • 高スループットの NVMe 環境では、継続的なワークフローによりドライブが発熱し、空気流に余裕がない場合、スロットリング発生の可能性が高まります。 
  • ストレージから排出される高温の空気は、再循環の前にシステムのさらに内部にあるコンポーネントを冷却する際に障害となる可能性があります。

SSD 液冷

  • 特に高密度の液冷向けサーバープラットフォームでは、ドライブを液冷の熱設計に統合できます。
  • 企業向けの実装では、性能を継続させるために熱除去を向上えさせると同時に、予測可能な装着、ホットスワップ対応、保守性を維持しながらデータセンターのワークフローを維持することに重点が置かれています。 
  • ファンを取り除くことにより、システム設計が改善 され、なおかつ保守性に関する要件を満たすことができます。

データセンターチームのための実務上の要点

空冷 は、空気流の設計がすでに運用の 基盤 となっていて、ラック密度が 定められた許容範囲に 常に収まるような環境に適しています。

水冷 は、密度目標、AI の成長、プラットフォームのロードマップによって空気流がボトルネックになる環境や、チームが、部屋レベルの HVAC だけでなく、インフラストラクチャ(ループ、制御、手順)のように動作する冷却システムを 運用 できる態勢にある環境に適する傾向があります。

ハイブリッド型冷却とは

ハイブリッド型冷却 は、空冷方式と液冷方式を同じ施設、列、またはラックで組み合わせ、最も理に適う場所でそれぞれを使用する方法です。

 ハイブリッド型冷却システムは 、次の場合によく使われます。

  • より大きな企業施設の中で AI ポッドなど環境の 一部 のみが高密度である場合。
  • 組織が段階的な導入を望んでいる場合。
  • 従来型の機器と新しい液冷対応プラットフォームを共存させなければならない場合。

一般的なハイブリッド 冷却 のパターン

  • GPU/CPU/SSD にはチップ直結液冷、一部のコンポーネントには引き続き空冷を使用します。
  • 一部のラック列ではリアドア型熱交換器 を使用し、室内のそれ以外の場所では 従来どおりの冷却方式を使用します。 
  • 専用ルーム内で AI クラスターを液冷し、汎用計算には引き続き空冷を使用します。

ハイブリッド型設計は優れた「移行戦略」になりえますが、明確な運用上の境界が必要です。 すなわち 、保守手順、スペアパーツ、監視、 施設 連携を文書化し、 調整する必要があります。

データセンターにとっての液冷のメリット

高密度対応

AIサーバーの増加は大きな変革要因です。AI インフラストラクチャに関する意見では 、しばしば従来のレベルをはるかに上回る密度のラックが 取り上げられ、高度な AI システムでは超高密度が報告されています。  

効率向上の可能性

構成によっては、液冷によって次のことが可能になります。

  • サーバーファンの電力削減 、場合によってはさらにファンの取り外し。
  • 放熱効率の向上 、および温度条件の拡大。
  • 一部の設計では温水ループの有効化(省エネの支援)。

より精密な制御とホットスポットの減少

液冷は、多くの場合、 コンポーネント レベルでより厳密な温度制御を実現し、空気流の乱れ、ケーブルの障害物、およびラックレベルの不整合による想定外の問題を減らします。

新しいハードウェア設計が可能に

プラットフォームが進化するにつれ、特に保守性が保たれている場合、 液冷式 SSD オプションの統合は、一貫性のあるシステム熱戦略を支えることができます。 

データセンターにとっての液冷のデメリット

導入初期の複雑さと多額の 設備投資

長期的な投資効率が重視される場合でも、 液冷ソリューション では一般に次の条件が必須です。

  • 配管インフラ
  • CDU および熱交換器
  • 監視装置、センサー、制御装置
  • 新たなコミッショニングプロセス
  • 空冷に対して液冷を使うことによる重量および 影響の理解

運用に習熟するまでの時間 

施設チーム、IT チームおよびベンダーは、次の事項に関する手順の共有を必要とします。

  • 漏出の検知および対応

  • クイックディスコネクトの取り扱い

  • 予防保全

  • 冷却材の品質管理

  • 各システムにおける コンポーネント 選択の整合

漏液に関するリスクの 認識 

最新の設計は、漏液の確率と影響の最小化に努めていますが、企業チームは、それでもなお漏液シナリオを最重要故障シナリオとして取り扱い、その前提に沿って計画を立てる必要があります。

まとめ

特に AI がラック密度、発熱密度、インフラストラクチャの負荷を高める中で、液冷は現代データセンターの決定的な機能になりつつあります。しかし、本当に重要 なのは 「液冷が空冷に取って代わる」 ことではありません。 データセンターの液冷 は可能性 を広げます 。つまり、 高密度、より一貫した性能、そして、従来であれば非現実的であったり、非効率的であったりした新しいプラットフォーム設計が可能になるということです。

また、コンピューティングが AI ファクトリー に関する議論の中心になったことから、ストレージも 液冷 へと移行 しつつあります。 Solidigm™ による 独自の片面 液冷式 SSD の導入は、 SSD 向け液冷 が単なるラボレベルの概念ではないことを示しています。 液冷は、次世代の高密度で AI 対応のインフラストラクチャを構築するためのツールキットの一部になりつつあります 。

よくある質問

ラックの密度と発熱量が、空気流で効率的かつ確実に処理できる限界を超えた段階で、データセンターには液冷が必要です。多くの運用事業者は、1 ラックあたり約 20 kW を超えると空冷のみの設計はますます困難になると感じています。AI 向けラックでは、この数字をはるかに上回ることがあります。

チップ直結冷却は、コールドプレートを使用して特定のコンポーネント (GPU、CPU、SSD など) から熱を取り除きます。一方、液浸冷却は、サーバーまたはコンポーネントを絶縁性液体に浸します。液浸は 大量の 熱を除去できますが、多くの場合、より大きな運用上の変更が必要です。

いいえ。 今、AI データセンター向け液冷 は大きな推進要因ではありますが、高密度データベース、分析クラスター、HPC 環境も、熱や設置面積が制約となる場合には、液体ベースの冷却方法の 恩恵 を受けることができます。

 液冷式サーバーラック は、リアドア熱交換器、列内クーラー、CDUに接続されたマニホールドなどの水冷インフラと連動するように設計されたラック です。したがって、室内の空気だけに頼らず、液体で熱を取り除くことができます。 

 液冷式 SSD は、液冷インターフェース(多くの場合、コールドプレート)に熱を効率的に伝達すると同時に、  予測可能な 適合性 や保守性など、データセンターが求める要件を維持するように設計されています。 Solidigm は、効率的な液体による熱除去を可能にしながらホットスワップ動作を維持する設計を採用しています。

高パフォーマンス環境において、 NVMe SSDは、特に液冷向けに最適化されたサーバーで空気流が減少したとき、無視できないレベルの熱を発生させることがあります。 SSD 液冷 は、パフォーマンスを安定させ、より高密度なプラットフォーム設計をサポートします。

ハイブリッド型冷却 は、同じ環境において空冷方式と液冷方式を組み合わせる方法です。たとえば、AI ラックのGPU/CPU には液冷、その他の部分にはそのまま空冷を使用します。 ハイブリッド型冷却システム は、運用の予算が制約されている場合に、しばしば最も現実的な導入の選択肢となります。

データセンターの水使用量は設計によって異なります。一部の冷却システム、特に蒸発冷却方式は大量の水を消費します。閉ループや節水設計を重視するシステムもあります。データセンターの水使用量に厳しい視線が向けられるようになったことから、担当者は、設計または改修の早い段階で、水とエネルギーの節約を検討すべきです。 

運用にあたっての主な懸念は、 漏液 管理、メンテナンス手順、冷却液の品質、ベンダーの変動性です。最善のリスク軽減策としては、ハードウェアの選択はもちろんのこと、戦略的プランニング、監視、プロセスの文書化、研修が挙げられます。

チップ直冷型のコンポーネント、ラック単位、または列単位の導入を組み合わせたハイブリッド型モデルをご検討ください。電力密度、熱安定性、ファンのエネルギー削減、メンテナンスへの影響などについて、明確な成功指標を定義してください。その上で、安定的に運用できることが証明されれば拡張します。


著者について

Cecily Whiteside は、 Solidigm の 検索 およびコンテンツスペシャリストです。  テクノロジー、ライフスタイル、 および & 健康・ ウェルネス関連のウェブサイト や出版物に記事を掲載しています。 複数 の雑誌でマネージングエディターを務め、米国と海外の両方で他誌にも ライター兼フォトグラファーとして寄稿しています。

参考資料

1) https://spectrum.ieee.org/data-center-liquid-cooling

2) https://www.feace.com/single-post/higher-rack-density-requires-liquid-cooled-servers

3) https://blog.equinix.com/blog/2025/10/01/top-3-myths-about-data-center-operating-temperatures/

4) ref: https://www.solidigm.com/products/technology/edge-ai-seismic-data-processing-immersion-cooling.html

5) https://ambient-enterprises.com/news-insights/why-liquid-cooling-data-center-design-matters/

6) https://x.ai/colossus

7) https://www.ashrae.org/technical-resources/standards-and-guidelines/read-only-versions-of-ashrae-standards