QLC SSD の持つ価値、パフォーマンス、密度とは

ソリダイム、Gestalt ITのストレージ・フィールド・デーでプレゼンテーション

2023年9月、ソリダイムは Gestalt IT のストレージ・フィールド・デイで、QLC SSDが価値、パフォーマンス、密度のためにどのように設計されているかについてプレゼンテーションを行いました。 日々、生成されるデータ量とそのデータのアプリケーションは増加の一途を辿っています。 ストリーミング・サービスやデータマイニング、機械学習は、革新的なストレージ・ソリューションが求められるリード集約型のワークロードのほんの一例です。

Computer code with speed-oriented graphics to depict density and performance in SSD storage for data centers.
Computer code with speed-oriented graphics to depict density and performance in SSD storage for data centers.

この記事では、変化するワークロードとリード集約型ストレージ要件に対処するためのQLC SSDの使用方法について説明します。 QLC SSD の主要機能と能力の要旨についての説明と、ソリダイム D5-P5336 の紹介をします。

ワークロードが変化すると、ストレージのニーズも変化します。

データはストレージと消費に関連するワークロードの種類に応じて変化しますそのデータの保存場所を変えつつあります。 例えば、AI やコンテンツ配信ネットワーク (CDN) は、バックエンドのリード集約型ストレージに対する需要を増加させ、大容量で高密度ストレージの必要性を強調しています。 もう1つの例はエッジ・コンピューティングで、そこではデータは可能な限りソースの近くに格納されます。 図 1 は、これらの変化するアプリケーションとその要件を示しています。

エッジとデータセンターに対するデータのユースケースと需要を比較するグラフィック。

図 1. データセンター、エッジ・インフラストラクチャー、エッジ・デバイスに関連する変化するデータ需要の概要。

図 1 は、データセンター、エッジ・インフラストラクチャー、エッジ・アプリケーションといった、ストレージ要件が進化している3つの分野を示しています。 サイズと重量は、オンプレミス・サーバー、モノのインターネット (IoT)、デスクトップ・コンピューター、ノートパソコン、その他のポータブルデバイスを含むエッジ・デバイスに影響します。 データセンターからエッジ・デバイスに移行するにつれて、予測不可能な条件下での低電力ソリューションや優れた信頼性、運用効率に対する需要は高まります。 

リード主体のワークロードのデータ転送サイズを示すグラフィック。

図 2. 現代のデータセンターにおけるデータニーズを示すプロット。

図 2 に示すように、今日のデータセンターやクラウド環境で最も一般的なワークロードの多くは、リード主体型です。これらの概算ワークロードの特性は、世界中で収集されたクラウドとエンタープライズ環境全体のデータに基づいています。グラフの左側は、4KB から 1MB 以上を示しています。グラフの下部は、リード / ライトの混合、右側は、小型 / ランダムから大規模 / シーケンシャルまでのデータパターンを示しています。 

図 3 に示すアプリケーションの種類に不可欠なストレージ・ニーズは次のとおりです。

  • まだ調整可能なリード集約型ストレージ
  • 大容量ストレージ
  • 高密度ストレージ
  • スケーラブル・ストレージ
  • 信頼性の高いストレージ

ただし、その他のニーズには、電力要件とサービスの容易さが含まれます。 以前は、このようなストレージのニーズに対する主なソリューションはハードディスクドライブ (HDD) でした。しかし、ソリッドステートドライブ (SSD) のような新しいソリューションが登場しつつあります。

旧来の HDD に代わる SSD

多くのアプリケーションにとって、HDD の効果的な代替品は QLC NAND SSD です。QLC はセルあたり 4 ビットのクアッドレベルセルを表し、NAND はデータを保持するために電力を必要としないフラッシュメモリドライブ、SSD はソリッドステートドライブを表します。

1. QLC SSD: 容量の増加とコスト効率の改善

QLC NAND SSD は、リード集約型のワークロードに非常に適しており、シングルレベルセル (SLC)、マルチレベルセル (MLC)、およびトリプルレベルセル (TLC) NAND SSD よりも大きなデータ容量を備えています。さらに、QLC NAND SSD は経済性を維持しながら高密度ストレージを提供するため、セルあたりの保存ビット数が少ないフラッシュドライブと競合できます。 

2. QLC SSD: ギガバイトあたりのコストの低さ

もうひとつの利点は、QLC NAND SSD は、同じスペースでより大きな容量を、より低いギガバイトあたりのコストで提供できることです。QLC NAND SSD は (従来の HDD とは異なり) 可動部品がないため、低遅延であることに加えて、HDD と比較して信頼性が高くなります [1]。

データを長期保存することに重点を置く場合、QLC NAND SSD はデータのバックアップとアーカイブの目的に優れた選択肢です。これらのアプリケーションでは、パフォーマンス、コスト、容量のバランスをとる必要があるため、QLC NAND SSD が強力なソリューションとなります。

QLC SSD の利用例

QLC SSD には広い分野での数多くの採用例があります。 例としては、機械学習 (ML) や人工知能 (AI) が挙げられます。これらの場合、ドライブは主にデータのキャプチャに利用されますが、別のワークロードで分析処理されている間に実行することができます。 

QLC SSD が有効であるその他の事例にはオンライン分析処理 (OLAP) が挙げられ、これには小売ワークロード、地震、ハイパフォーマンス・コンピューティング (HPC) のデータマイニングなどが含まれます。ほかにも金融サービス業界 (FSI) のワークロード、ハイパーコンバージド インフラストラクチャ (HCI)、CDN があります。 

こういった事例では、データへの高速かつ高帯域幅のアクセスと、低遅延で読み取りに最適化されたパフォーマンスが必要です。ソリダイムの新製品は、こうした現代の集中的なストレージのニーズに応えます。

ソリダイムの QLC SSD

ソリダイム D5-P5336 は最大 61,44TB のリード・パフォーマンスに最適化されたストレージ・ソリューションです。ソリダイムの Value Endurance タイプ QLC SSDである D5-P5336 はリード集約型ワークロードに対して、低総所有コスト (TCO) で大容量を実現します。

リード集約型ストレージのサポートとして、D5-P5336 は 7,000 Mbps のリードと3,300 Mbps のライトが可能ですが、さまざまなワークロードのニーズをより効果的に満たすためにソフトウェアでの調整も可能です。負荷時の優れたレイテンシー、低いエラー率、および 3,000 P/E サイクル程度の耐久性を備えています。  [2]

  • 7.68TB ~ 30.72TB の容量範囲をカバーする E3.5
  • 容量範囲 7.68TB ~ 61.44TB の U.2
  • 容量範囲 15.35TB ~61.44TB の E1.L

図 2、図 3 をもう一度見ていただくと分かるように、ソリダイム D5-P5336 はリード主体のワークロードで最適なパフォーマンスを発揮します。

ソリダイム D5-P5336 がリード主体ワークロードのリード / ライトでどのように動作するかを示すグラフィック。

図 3. ソリダイム D5-P5336 が最適にフィットする最新のデータセンターにおけるデータニーズを説明するプロット。

この QLC SSD ソリューションは、大規模なスケーラビリティと非常に高いデータ密度を提供しながら、高速アクセスにより、より多くのデータを小さなフットプリントで保存します。 [3] これにより、これらの SSD は非常にスケーラブルになります。 例を挙げると、ソリダイム D5-P5336 には 24 台の 61.4TB ドライブが搭載されており、総サーバー容量は 1.47PB になります。

ソリダイムのSSDを基盤に構築された信頼性の高いストレージ・インフラストラクチャーにより、Taboolaは必要なときにストレージがそこに存在するという自信を持って、レコメンデーション・エンジン・ビジネスをさらに拡大することができます。

「Taboolaの分散型ハイパーコンバージド・ストレージ・アーキテクチャーに高い信頼性を持つSSDがあることで、保守コストも抑えられます」と Pisetsky 氏は語ります。

集中テスト下での信頼性

最後に、ソリダイム D5-P5336 の信頼性を図 4 にまとめます。高負荷の試験を潜り抜け、この QLC SSD が達成した業界トップのデータ信頼性にご注目ください。

D5-P5336 SSDの信頼性とそのテスト

図 4. ソリダイム D5-P5336 に組み込まれた品質と信頼性。

最大容量の PCIe SSD

ソリダイム D5-P5336 は、世界最高容量の PCIe 4.0 SSD であり、[2] 主要な機能とて、広く採用されているリード・ワークロードおよびデータ集約型のワークロードにおけるデータの高速化、高密度ストレージ環境の大規模なスケーラビリティ、[2] およびハイパースケール環境における総保有コストと持続可能性の大幅な改善などを備えています。 [2,4]

これらのトピックの詳細については、こちらのリンクから Gestalt ストレージ・フィールド・デイの全ビデオをご覧ください。


注釈

[1] https://arstechnica.com/gadgets/2022/09/five-years-of-data-show-that-ssds-are-more-reliable-than-hdds-over-the-long-haul/

[2] https://www.solidigm.com/products/technology/d5-p5336-product-brief.html

[3] 「ウォームストレージフットプリントを最大20倍削減」という主張は、1PB またはストレージを満たすために10 (2U) のラックスペースを必要とする 4TB HDD と、1PB のストレージ容量を埋めるために 1U のラックスペースを取る 30.72TB ソリダイム SSD D5-5336 E1.L または U.2 ドライブとの比較に基づいています。これは、1PB のストレージ容量を埋めるために 1U のラックスペースを取ることができます。これにより最大20倍以上のラック統合となります。

[4] https://estimator.solidigm.com/ssdtco/index.htm

図 4 注釈

  1. エンドツーエンドのデータ保護 出典 – ソリダイム  電力喪失保護機能の強化 – 追加のファームウェアチェックにより、電力復元時にデータが正確に保存されます。  他社がこの追加のファームウェア チェックを提供しているかどうかは不明です。  ロバストなエンドツーエンドデータ保護 – ECC と CRC の両方が同時にアクティブになる冗長性を内蔵。  コントローラー内のすべての重要なストレージアレイ (命令キャッシュ、データ キャッシュ、間接バッファ、物理バッファ) を保護します。   SRAM の ECC 適用範囲はアレイの 99% 以上におよび、これは業界最高レベルの数値です。 
  2. UBER テスト.  出典 – ソリダイム  修正不能エラー発生率 (UBER) を JEDEC 規格を 10倍上回る基準でテスト。ソリダイムは、ドライブの寿命全体にわたる全範囲の条件とサイクル数で 1E-17 までテストを実行。これは、JEDEC で指定されている 1E-16 の 10 倍の値である。 – Solid State Drive Requirements and Endurance Test Method (JESD218). https://www.jedec.org/standards-documents/focus/flash/solid-state-drives.  無兆候データ破損 (SDC) - 1E-25 でモデル化。典型的信頼性デモンストレーションテストを 1000台の SSD で 1000 時間実施し、1E-18 でモデル化。  ソリダイムのドライブを対象に無兆候データ破損に対する感受性をロスアラモス国立研究所の中性子源にてテストし、1E-23まで測定、1E-25までモデル化。 
  3. SDC 抵抗 出典 – ソリダイム  無兆候データ破損に対する感受性を複数のドライブを対象にロスアラモス国立研究所の中性子源にてテストし、1E-23まで測定、1E-25までモデル化。  テスト実行前にドライブに特定のデータパターンを書き込み。  次に、IO コマンドが継続的に発行され、精度がチェックされている間に、中性子線がドライブ コントローラーの中心に焦点を合わせた。  ドライブに障害が発生してハング / ブリックになった場合、テストスクリプトがドライブと中性子線の電源を切る。その後、ドライブが再起動され、データの整合性がチェックされ障害の原因が分析される。  SDC は、電源ダウンコマンドを引き起こす実行時、または中性子線が制御ロジックに当たり、伝送中のデータ破損の結果ドライブをハングさせた場合の再起動後に観測されることがあります。  データの整合性を保証できない場合、ドライブは無効論理 (ブリック) 状態になるため、エラー処理の有効性の尺度としてブリック AFR が使用されます。ソリダイムのドライブは、4 世代にわたってこのテスト手順を使用してきました。  世代を超えた累積テスト時間は、SDC エラーが検出されなかった 600 万年を超える運用寿命に相当します。  最新のテストでは、同じコントローラーと同様のファームウェアを共有するため、ソリダイム D5-P5430 ドライブのプロキシとして機能するソリダイム D5-P5520 ドライブを使用しました。  比較対象となる競合他社のドライブとして、Samsung 983 ZET、Samsung PM9A3、Samsung PM1733、Micron 7400、Micron 7450、Kioxia XD6、Toshiba XD5および WD SN840 を使用しました。 
  4. 業界最高峰の AFR: 出典 – 2023年3月時点のソリダイム AFR データ。年間故障率 (AFR) とは、検査の結果完全に機能して使用可能であると判明し、顧客による返品数が減少した単位のことであるとソリダイムは定義しています。 
  5. 実際のパフォーマンス 出典: ソリダイム 詳細は、補遺の D5-P5336 パフォーマンステストを参照してください。
  6. カスタマーサポート満足度.  出典 – ソリダイム 2021 年に発行されたコールセンターの全チケットをもとに算出。 

著者紹介

ソリダイムのプロダクト・マーケティング・マネージャーである Jeniece Wnorowski は、14 年以上にわたってデータセンター・ストレージ・ソリューションに携わってきました。Intel Corporation のテクニカルマーケティング部門からキャリアを始めた彼女は、ソリダイム入社後もさまざまな企業やパートナーとともにデータセンター SSD のイノベーションを推進し続けています。仕事以外では、子どもたちと一緒に過ごしたり、柔道のトレーニングやアウトドアの探索を楽しんでいます。