データセンターでは今、ストレージの実装面積や消費電力バジェットを調節することで、かつてないほど増え続ける膨大なデータ量に後れをとることなく、そのデータをユーザーや AI 学習モデルにフィードバックするために必要な、ストレージ性能のニーズに応えようとしています。 ストレージ業界が目の当たりにしているのは、既存のデータセンターのスペースを最大限に活用できる、高密度ストレージに対する需要の高まりです。HDD のセグメントでは密度とパフォーマンスを向上させる方法を見つけようと苦戦している一方で、ソリダイムの 3D NAND QLC SSD はすでにこの両方を実現しており、実際 2018年から製造を開始しています。ソリダイムは最新の最大容量 NAND ドライブとして、61.44TB の 3D NAND 構造 QLC SSD 製品 D5-P5336 を発売しました。これはコストとパフォーマンスの要件を両立しながら、データセンターの密度向上を可能にする製品です。CSAL + 高密度ドライブを混合ワークロードに活用リード処理中心のアプリケーションでは、すでにソリダイム™ D5-P5336 のような高密度 QLC SSD のメリットを有効活用できていますが、混合ワークロードやデータ配置アプリケーションの場合はどうでしょうか。ソリダイムのチームは、61.44TB 容量の高密度 SSD を使用するメリットを、混合ワークロードや、ストリーミング、フレキシブル・データ配置 (FDP)、ゾーン名前空間 (ZNS) などのデータ配置テクノロジーといった新しい NVMe デザインへとさらに広げるために、クラウドストレージ高速化レイヤー (CSAL) を採用しました。CSAL は、ストレージ・パフォーマンス開発キット (SPDK) で設計する、オープンソース、クラウドスケール、シェアナッシング 構成のストレージ・ソフトウェア・レイヤー (つまりブロックデバイス) です。CSAL により柔軟な設計が可能になり、プラットフォーム全体で SSD の耐久性を調整することができます。これにより、ソリダイムの第 1 世代 D7-P5810 SSD など新しいストレージ・クラス・メモリー (SCM) SSD を使用して、アプリケーションのライト性能を高く維持することができます。また、TLC に匹敵するリード性能を備えたソリダイムの QLC SSD のような、低コストながら高密度の QLC ストレージを併用することで、総保有コスト (TCO) の最適化にもつながります。[1] 図 1 は、ピラミッドの最下層が低速、頂点が最速を意味する、メモリーの階層構造を示しています。
従来のキャッシュ・アーキテクチャーでは、ストレージ・クラス・メモリー (SCM) SSD などの高性能ストレージは、QLC SSD などのプライマリー・ストレージの前に配置されます。プライマリー・ストレージに直接データを書き込むのではなく、ユーザーやアプリケーション側で書き込みが確認されるとすぐに、キャッシュ層にデータが書き込まれます。その後、データは容量層に書き戻されます。
従来のキャッシュは、高密度 NAND メディアを補完し、TB 当たりのライト性能を維持して、時間的局所性の高いワークロードの耐久性を高めます。例えば、高性能かつ高耐久性の SCM 層は、更新頻度の高い書き込みを QLC NAND 層に送信することなく取り込みます。
CSAL の主な戦略は、SCM SSD をキャッシュとして活用し、ユーザーのランダムライトを圧縮して SSD が処理しやすく成形することです。CSAL 設計の目的は、システムレベルの書き込み増幅と NAND SSD の摩耗を最小化することで、NAND ベースのプライマリー・ストレージの全体的なパフォーマンスとシステムの耐久性を向上させることにあります。
CSAL は、次の 3 つの方法で従来のキャッシュ・テクノロジーを補完します。
下の図 2 は、従来の書き込みキャッシュとライト・シェーピング・キャッシュとの主な違いを示しています。
CSAL は、高性能ストレージシステムを動かす特定のシナリオを想定し、SPDK で実装します。SPDK では、論理ボリュームから汎用のブロックレイヤー、NVMe ドライバーまで、フルスタックのストレージシステムの構築が可能です。CSAL は SPDK のブロックレイヤーに実装し、次のように 2 つの物理ブロックデバイスで構成される 1 つの仮想ブロックデバイスとして展開します。
NVMe over Fabrics (NVMe-oF) などのストレージ・アプリケーションでは、この仮想ブロックを汎用のブロックデバイスとして使用することができます。
図 3 は、CSAL アーキテクチャーの全体像です。注目すべき点がいくつかあります。
ここで説明したデータ移行を実行するために、CSAL では次の 4 つの主要コンポーネントを管理します。
;
C
リット ライト・シェーピング・キャッシュとして機能する CSAL は、高密度 NAND フラッシュメディアの価値を引き出し、ホストサイドの FTL を活用することで既存のソフトウェア・インターフェイスを保持し、同時に書き込みワークロードをシーケンシャル・ライトのワークロードに転換します。CSAL
は
さらに、D7-P5810 SSD で更新頻度の高いデータや一時データをキャッシュ化することで書き込みの頻度を最小限に抑えます。 この 2 つの手法により、プラットフォーム全体の耐久性とアプリケーション性能の向上を図ります。CSAL は、次世代のメディアとデータ配置テクノロジーに適した、ソフトウェア・デファインドの柔軟なストレージ・アーキ
テク
チャーです。データセンターで展開しやすく、さまざまなパフォーマンス要件と TCO 要件に応じて調整できます。
[1] https://www.solidigm.com/products/data-center/d5/p5336.html
粗粒度の間接ユニット SSD で最適なパフォーマンスと耐久性を実現
IDC Global DataSphere Forecast、2022年5月
Open-CAS / standalone-linux-io-tracer
Sarika Mehta は、ストレージ業界で 15 年以上のキャリアを持つ、ストレージ・ソリューション・アーキテクトです。ソリダイムの顧客やパートナー企業との緊密な連携を通じ、コストとパフォーマンスを両立するストレージ・ソリューションの最適化に注力しています。Kapil Karkra は、ソリダイムのシニア・プリンシパル・エンジニア兼ストレージ・プラットフォーム主任アーキテクトとして、ホストベースの FTL であるクラウドストレージ高速化レイヤー (CSAL) のアーキテクチャー設計を担当しています。現在、ソフトウェアとハードウェアの両方でターンキーのリファレンス・ストレージ・プラットフォーム (RSP) を定義することに重点を置いています。これはクラウドのユースケースに関するインサイトの発展と、高密度 NAND SSD の開発と採用促進に役立ちます。Karkra は 25 年以上のストレージ経験を持ち、特許申請 / 取得は 20 件にのぼります。インドの国立工科大学 (NIT) で電気工学の学士号を、アリゾナ州立大学で MBA を取得しました。Wayne Gao は、ストレージ・ソリューション・アーキテクトとしてプリンシパル・エンジニアの任務に就き、PF、Alibaba の商用リリースを含め、CSAL を担当してきました。前 DellEMC ECS オールフラッシュ・オブジェクト・ストレージ・チームでのストレージ開発経験は 20 年以上、米国特許申請 / 取得 4 件、EuroSys 論文を 1 件公開しています。