Kingsoft Cloudは、中国を拠点とする数十億ドル規模の独立系クラウド・サービス・プロバイダーです。1 安全性と信頼性が高い分散型クラウド・ストレージ・サービスを提供し、大容量ストレージを低コストで利用できるようにしています。
世界は変わり、AI革命は限界を押し広げ、ストレージ・アーキテクチャーにはこれまでなかったような要件が求められるようになっています。Kingsoftは、クラウド・ストレージ・プラットフォーム向けのKingsoft Cloudや、WPS Officeなどのオフィス・ソフトウェア向けのWPSをはじめとする、包括的なクラウド・コンピューティング・サービスを開発し、長年にわたり業界をリードしてきました。Kingsoft CloudはKS3 Extremeと名付けられた最新のオブジェクト・ストレージ・ソリューションにソリダイムのSSDを採用しました。KS3 Extreme Speedの新しい帯域幅は、データボリュームに基づいて動的に拡張します。 SSDの容量が大きいほど、システムが提供できる帯域幅も増大します。 要求の厳しい今日のワークロードに対応するために、WPS OfficeをはじめとするKingsoftの顧客企業は、より高速に自社アプリケーションにアクセスできることを求めています。
こうしたニーズに応えるために、Kingsoftはパフォーマンスと容量の両面でストレージ・アーキテクチャーの拡張を図りました。KingsoftはHDDをソリダイムのSSDに置き換えることで、帯域幅を100倍以上拡大し、1ペタバイト容量当たり1テラビット/秒 (Tbps) を超える速度を実現しました。2 これは、AI生成コンテンツ (AIGC)、アニメーションのレンダリング処理、ハイパフォーマンス・コンピューティング (HPC) などのワークロードにとって大きなメリットになります。
図 1. Kingsoft Cloudストレージ・アーキテクチャーの進化
図1は、Kingsoftの以前のアーキテクチャーと新しいアーキテクチャーを比較したものです。以前の設計では、AIのような負荷が集中するアプリケーションに必要な高スループットをサポートできなかったため、S3サービスよりも前にファイル・システム・キャッシュが配置されていました。Kingsoftが必要としていたのは、ボトルネックを解消する方法を備えた新しく効率的なアーキテクチャーです。新しいオールフラッシュ設計では、オブジェクトの寿命はS3内に設定されているため、Kingsoftのクライアントはオブジェクト・ストレージを直接S3に接続することができます。容量、パフォーマンス、コストのバランスが取れた新しい設計です。
図2. Kingsoft Cloud S3とKS3 Extreme Speedの比較
今日のAIワークロードでは、使用するデータセットが大容量になり、作成するモデルも大規模になっています。AIの導入と管理を簡単にするため、KingsoftはさまざまなAIワークロードに対応できる、すぐに使えるソリューションを開発しました。
特定のAIインスタンスでの、大規模モデルの学習処理には、高いI/Oスループットが不可欠です。AIモデルの効率的な学習処理を行うシステムでは、膨大な量のデータ処理やさまざまな演算をリアルタイムで実行するため、IOPS(1秒当たりの入出力操作数)の高い、可能な限り高速のストレージが欠かせません。
1,750億パラメーターのデータモデルを例として、学習データの容量を40TBと想定すると、1ペタバイト当たり20Gbpsのスループット容量を持つ標準的なオブジェクト・ストレージを使用した場合、すべての学習データの読み込みには最短でも535分かかります。
1ペタバイト当たり1Tbpsのスループット容量を誇るKS3 Extreme Speed Object Storageを使用すれば、すべてのデータの読み込みはわずか11分で完了します。3 48.6倍高速化できることになります。これはほんの一例で、その他にも以下のようなメリットが挙げられます。
AIなどの新しいサービスによってデータが逼迫し、Kingsoft Cloudのハードウェアは常に最新の状態に保つことが要求されています。KingsoftはストレージI/Oパフォーマンスを向上させるために元々採用していたソリューションでSATA SSDをSATA HDDへと置き換えることが妥当であると判断しましたが、綿密に調査したところ、この置き換えはコスト効率が高くもなければ、効率的なストレージであるわけでもないと判明しました。代わりにTLC NVMe SSDへと完全に移行することで、KingsoftはI/Oパフォーマンス要件を満たすことができました。
ところがソリダイムのチームが追加調査を実施した結果、KingsoftはQLC SSDがさらに有効なソリューションであると分かりました。ソリダイムのQLC SSDはTLCよりもセル当たりのビット数が33%多く、3x8ストレージに集約できるため、総運用コストの削減につながります。ソリダイムが提供するQLC SSDは容量が7.68TB ~ 60.72TBと幅広いうえに、TLC SSDと同等の耐久性と性能を備えています。
「ソリダイムとの複数回にわたる綿密な打ち合わせの結果、両社ともお互いのシステム特性を把握し、オールフラッシュ・ストレージの価値をより深く理解しました。現在ではウェブ・アプリケーション・ファイアウォール (WAF) を削減し、全体的なスループットと安定性を向上させることが可能になりました」とホンシン・ガン氏は述べています。
Kingsoft Cloudとソリダイムの連携は有意義な成果をもたらしました。ソリダイムのTLC SSDとQLC SSDはいずれもKingsoftのオブジェクト・ストレージ・サービスの機能を向上させ、運用コストの削減につながることが証明されています。さらにソリダイムは、顧客サポートチームとともにKingsoftにより効果的かつ全面的なサポートを提供し、品質と信頼性をワンランク上へと引き上げました。
ホンシン・ガン氏は最後に「Kingsoft Cloudは今後も、ソリダイムのQLCテクノロジーの開発と調和しながら、オールフラッシュ・メディアをベースに技術力と製品力を引き続き強化し、コストに焦点を当て高性能でコスト効率の高いオブジェクト・ストレージ製品を生み出し、さまざまな一般のユーザーに価値の高いサービスを提供していきます」と締めくくりました。
ソリダイムの製品マーケティング・マネージャーを務めるジェニース・ウノロフスキーは、データセンター・ストレージ・ソリューションの分野で14年以上の経験を持っています。インテル コーポレーションのテクニカル・マーケティング部門でキャリアをスタートし、ソリダイム入社後は多種多様な企業とパートナーとともに、データセンターSSDイノベーションの推進に携わっています。仕事以外にも、子どもたちと過ごす時間や柔術のトレーニング、アウトドアの探索を楽しんでいます。 ウェイン・ガオは、ストレージ・ソリューション・アーキテクトとして主席エンジニアの任務に就き、PFやAlibabaの商用リリースを含め、CSALを担当してきました。以前はDell EMC ECSのオールフラッシュ・オブジェクト・ストレージ部門の一員として20年以上のストレージ開発経験を積み、米国では4件の特許を出願中 / 取得であり、EuroSysでは論文を1本公開しています。
[1] https://www.macrotrends.net/stocks/charts/KC/kingsoft-cloud-holdings/total-assets