共有

公開 August 15, 2023

著者 Sarika Mehta, Kapil Karkra, Wayne Gao

記事

クラウドストレージ高速化レイヤー (CSAL) のメリット

ソリダイム、CSAL ライト・シェーピングを有効活用して高密度 QLC SSD の総保有コスト (TCO) を削減

 Cloud storage acceleration layer depicted with a data point overlay on a real-world intersection.
 Cloud storage acceleration layer depicted with a data point overlay on a real-world intersection.

データセンターでは今、ストレージの実装面積や消費電力バジェットを調節することで、かつてないほど増え続ける膨大なデータ量に後れをとることなく、そのデータをユーザーや AI 学習モデルにフィードバックするために必要な、ストレージ性能のニーズに応えようとしています。 ストレージ業界が目の当たりにしているのは、既存のデータセンターのスペースを最大限に活用できる、高密度ストレージに対する需要の高まりです。HDD のセグメントでは密度とパフォーマンスを向上させる方法を見つけようと苦戦している一方で、ソリダイムの 3D NAND QLC SSD はすでにこの両方を実現しており、実際 2018年から製造を開始しています。ソリダイムは最新の最大容量 NAND ドライブとして、61.44TB の 3D NAND 構造 QLC SSD 製品 D5-P5336 を発売しました。これはコストとパフォーマンスの要件を両立しながら、データセンターの密度向上を可能にする製品です。CSAL + 高密度ドライブを混合ワークロードに活用リード処理中心のアプリケーションでは、すでにソリダイム™ D5-P5336 のような高密度 QLC SSD のメリットを有効活用できていますが、混合ワークロードやデータ配置アプリケーションの場合はどうでしょうか。ソリダイムのチームは、61.44TB 容量の高密度 SSD を使用するメリットを、混合ワークロードや、ストリーミング、フレキシブル・データ配置 (FDP)、ゾーン名前空間 (ZNS) などのデータ配置テクノロジーといった新しい NVMe デザインへとさらに広げるために、クラウドストレージ高速化レイヤー (CSAL) を採用しました。CSAL は、ストレージ・パフォーマンス開発キット (SPDK) で設計する、オープンソース、クラウドスケール、シェアナッシング 構成のストレージ・ソフトウェア・レイヤー (つまりブロックデバイス) です。CSAL により柔軟な設計が可能になり、プラットフォーム全体で SSD の耐久性を調整することができます。これにより、ソリダイムの第 1 世代 D7-P5810 SSD など新しいストレージ・クラス・メモリー (SCM) SSD を使用して、アプリケーションのライト性能を高く維持することができます。また、TLC に匹敵するリード性能を備えたソリダイムの QLC SSD のような、低コストながら高密度の QLC ストレージを併用することで、総保有コスト (TCO) の最適化にもつながります。[1] 図 1 は、ピラミッドの最下層が低速、頂点が最速を意味する、メモリーの階層構造を示しています。

アーカイブ用ストレージから、QLC、TLC、SLC、CXL、DRAM、そして CPU キャッシュへとつながる階層構造

図1. ストレージ階層構造における D7-P5810 SSD と QLC SSD の位置

書き込みキャッシュ・アーキテクチャーの概要

従来のキャッシュ・アーキテクチャーでは、ストレージ・クラス・メモリー (SCM) SSD などの高性能ストレージは、QLC SSD などのプライマリー・ストレージの前に配置されます。プライマリー・ストレージに直接データを書き込むのではなく、ユーザーやアプリケーション側で書き込みが確認されるとすぐに、キャッシュ層にデータが書き込まれます。その後、データは容量層に書き戻されます。 

従来のキャッシュは、高密度 NAND メディアを補完し、TB 当たりのライト性能を維持して、時間的局所性の高いワークロードの耐久性を高めます。例えば、高性能かつ高耐久性の SCM 層は、更新頻度の高い書き込みを QLC NAND 層に送信することなく取り込みます。 

プラットフォームのパフォーマンスと耐久性を向上させる CSAL の仕組み

CSAL の主な戦略は、SCM SSD をキャッシュとして活用し、ユーザーのランダムライトを圧縮して SSD が処理しやすく成形することです。CSAL 設計の目的は、システムレベルの書き込み増幅と NAND SSD の摩耗を最小化することで、NAND ベースのプライマリー・ストレージの全体的なパフォーマンスとシステムの耐久性を向上させることにあります。

CSAL は、次の 3 つの方法で従来のキャッシュ・テクノロジーを補完します。

  1. 超高速の読み込みバッファー (SCM) 経由で QLC デバイスへの I/O 書き込みを「シーケンシャル化」し、システムレベルでパフォーマンスと耐久性を向上。
  2. キャッシュ層での大量のユーザー書き込みを取り込み圧縮して、容量層 QLC NAND SSD の耐久性を高め、耐用年数をさらに延長。
  3. キャッシュ層のデータが予測可能な時間内に容量層へ書き戻されるように保証。

下の図 2 は、従来の書き込みキャッシュとライト・シェーピング・キャッシュとの主な違いを示しています。

読み取り / 書き込みフローで見た従来の書き込みキャッシュと CSAL ライト・シェーピング・キャッシュの違い

図2. 従来の書き込みキャッシュと CSAL 設計の違い

クラウドストレージ高速化レイヤー (CSAL) アーキテクチャーの全体像

CSAL は、高性能ストレージシステムを動かす特定のシナリオを想定し、SPDK で実装します。SPDK では、論理ボリュームから汎用のブロックレイヤー、NVMe ドライバーまで、フルスタックのストレージシステムの構築が可能です。CSAL は SPDK のブロックレイヤーに実装し、次のように 2 つの物理ブロックデバイスで構成される 1 つの仮想ブロックデバイスとして展開します。 

  • キャッシュ層としてのソリダイム™ D7-P5810 SSD
  • キャッシュ層としての QLC SSD

NVMe over Fabrics (NVMe-oF) などのストレージ・アプリケーションでは、この仮想ブロックを汎用のブロックデバイスとして使用することができます。 

QLC + SLC 構成の CSAL アーキテクチャー

図3. ライト・シェーピング・キャッシュのブロック図

図 3 は、CSAL アーキテクチャーの全体像です。注目すべき点がいくつかあります。

  1. CSAL は、SPDK 経由で NVMe-oF ターゲットにオーガニック接続する、汎用 SPDK ブロックデバイス (bdev) です。
  2. アプリケーションのリード / ライト処理は、まず SPDK の汎用 bdev レイヤーを経由し、次に CSAL の bdev に入ります。
  3. CSAL の bdev レイヤーは、仮想フラッシュ転換レイヤー (FTL) デバイスであり、D7-P5810 SSD を永続性ライトバッファーと L2P テーブルとして使用することで、ランダム・ワークロードをシーケンシャル・ワークロードへと成形します。
  4. FTL は、ユーザーの書き込み I/O を、D7-P5810 の FIFO ログとして永続性ライトバッファーに記録し、続けて論理-物理 (L2P) 変換テーブルが更新され、D7-P5810 の LBA に指定されます。
  5. キャッシュ容量が特定のしきい値に達すると、FTL バックグラウンド圧縮処理が始まり、以下の処理を実行します。
    • D7-P5810 SSD から FIFO ログを読み込む
    • 無効なログを削除
    • 有効なログを大容量のシーケンシャル I/O としてマージし、QLC SSD に書き込む
    • L2P テーブルを更新して QLC LBA に指定
  6. 再び標準の SPDK bdev を経由して QLC SSD と D7-P5810 SSD にデータを書き込む
  7. FTL デバイスは SSD デバイスと同様に、ハウスキーピングのジョブを実行して新しく書き込むための空きスペースを保持するようにデフラグが設計されています。

ここで説明したデータ移行を実行するために、CSAL では次の 4 つの主要コンポーネントを管理します。 

  • 論理-物理アドレス変換テーブル
  • 永続性ライトバッファー
  • 圧縮ワーカー
  • ガベージ・コレクション (GC) ワーカー CSAL のオープンソース展開 

    ;
    C

SAL ソフトウェア・ソリューション・アーキテクチャーは、特定のハードウェア・アーキテクチャーに限定されることなく、インテル、AMD、ARM をはじめ、IPU/DPU から GPU まで、さまざまなサーバー・アーキテクチャーへの導入が可能です。ソリダイムは、オープンソース・コミュニティーの参加と幅広いアーキテクチャーの自律的成長に強く期待しています。

  CSAL がもたらすメ

リット ライト・シェーピング・キャッシュとして機能する CSAL は、高密度 NAND フラッシュメディアの価値を引き出し、ホストサイドの FTL を活用することで既存のソフトウェア・インターフェイスを保持し、同時に書き込みワークロードをシーケンシャル・ライトのワークロードに転換します。CSAL


さらに、D7-P5810 SSD で更新頻度の高いデータや一時データをキャッシュ化することで書き込みの頻度を最小限に抑えます。  この 2 つの手法により、プラットフォーム全体の耐久性とアプリケーション性能の向上を図ります。CSAL は、次世代のメディアとデータ配置テクノロジーに適した、ソフトウェア・デファインドの柔軟なストレージ・アーキ

テク

チャーです。データセンターで展開しやすく、さまざまなパフォーマンス要件と TCO 要件に応じて調整できます。

参考資料

[1] https://www.solidigm.com/products/data-center/d5/p5336.html

関連記事

粗粒度の間接ユニット SSD で最適なパフォーマンスと耐久性を実現

IDC Global DataSphere Forecast、2022年5月

Open-CAS / standalone-linux-io-tracer

著者紹介

Sarika Mehta は、ストレージ業界で 15 年以上のキャリアを持つ、ストレージ・ソリューション・アーキテクトです。ソリダイムの顧客やパートナー企業との緊密な連携を通じ、コストとパフォーマンスを両立するストレージ・ソリューションの最適化に注力しています。Kapil Karkra は、ソリダイムのシニア・プリンシパル・エンジニア兼ストレージ・プラットフォーム主任アーキテクトとして、ホストベースの FTL であるクラウドストレージ高速化レイヤー (CSAL) のアーキテクチャー設計を担当しています。現在、ソフトウェアとハードウェアの両方でターンキーのリファレンス・ストレージ・プラットフォーム (RSP) を定義することに重点を置いています。これはクラウドのユースケースに関するインサイトの発展と、高密度 NAND SSD の開発と採用促進に役立ちます。Karkra は 25 年以上のストレージ経験を持ち、特許申請 / 取得は 20 件にのぼります。インドの国立工科大学 (NIT) で電気工学の学士号を、アリゾナ州立大学で MBA を取得しました。Wayne Gao は、ストレージ・ソリューション・アーキテクトとしてプリンシパル・エンジニアの任務に就き、PF、Alibaba の商用リリースを含め、CSAL を担当してきました。前 DellEMC ECS オールフラッシュ・オブジェクト・ストレージ・チームでのストレージ開発経験は 20 年以上、米国特許申請 / 取得 4 件、EuroSys 論文を 1 件公開しています。

CSAL data shaping for write-intensive workloads