HPCサーバーの安定稼働に必要なデータセンターのスペックは?
~HPCサーバーを安心して利用するためにデータセンターに求められる条件~
【QTnet データセンターテクニカルレポート Vol.4】

HPCサーバーの安定稼働に必要なデータセンターのスペックは?

AIやIoT、ビッグデータを活用したビジネスに備え、新たなITシステム構築にデータセンターの利用を考えています。このようなITシステムを支えるデータセンターには、どのようなスペックや能力が求められるでしょうか?

現在、人工知能(AI)を活用したビジネスが注目を集めています。たとえば店舗などの顧客対応、業務のロボット化、自動運転、リアルタイムの需要予測やシミュレーション、マーケティング、流通、セキュリティ……等々。あらゆる分野でAIを活用した新しいビジネスが誕生し、その活用が模索されています。そこで必要となるITシステムが、膨大なデータを超高速に処理できるHPC(High Performance Computing)サーバーです。ただし、HPCサーバーには、従来のサーバーとは異なる特徴があります。ここでは、その特徴とHPCサーバーを安心して利用するためにデータセンターに求められる条件を整理してみました。

1. Point1 電源供給能力~HPCサーバーの安定稼働に必要な電力を供給できるか?

現在は第3次AIブームだといわれています。このブームのきっかけとなったのが、「ディープラーニング(深層学習)」です。これは、人間や動物の脳神経回路をモデルにした学習モデルで、大量のデータをコンピュータに読み込ませ、高速に分析することで、人間には認識できなかったパターンや情報を発見するテクノロジーです。

ディープラーニング(深層学習)

ディープラーニングを実現するには、画像処理に特化したGPU(Graphics Processing Unit)が重要な役割を果たします。従来のサーバーが主にCPUでデータを処理するのに対し、AIの実現に不可欠なディープラーニングに対応したHPCサーバーは、CPUとともにGPUも搭載し、大量のデータを手分けして高速に処理するのです。

項目 CPU ~Central Processing Unit~ GPU ~Graphics Processing Unit~
主な役割 中央処理装置 グラフィック演算
コア数

数個

cpu

数千個

gpu
得意な演算処理 連続的複雑な計算 並列的単純な計算
処理速度 1 数~100以上

左右にスクロールできます

このため、HPCサーバーは従来のサーバーよりも大量の電力を必要とします。搭載するGPUの種類や数にもよりますが、現在は1台当たり1~2kVA以上の電力が必要です。しかも、ディープラーニングによって急速に注目を集めたGPUは、今後、性能がさらに向上するのは確実で、それにともなって消費電力量はもっと大きくなると予想されます。

このため、従来のサーバーを前提に設計されているデータセンターでは、1ラックあたりの供給電力が不足する可能性があります。現在では最低でも1ラックあたり10kVA、将来的には20kVAは必要となるでしょう。

2. Point2 床荷重~その床は高集積化された"重たい"HPCサーバーを支えられるか?

サーバーやストレージの仮想化がすすみ、より少ない物理サーバーおよび物理ストレージで必要な性能が得られるようになった昨今、従来のサーバーにおいては、重さが問題になることはあまりありませんでした。

しかし、HPCサーバーは、従来のサーバーとは集積度が異なります。高密度のプロセッサやストレージに加え、多数のGPUも搭載し、大量の電力を安定供給する電源ユニットも必要です。さらに、ディープラーニングの処理では、長時間にわたってGPUやCPUを稼働するため、大量の熱も発生します。このため、HPCサーバーの中には、絶縁性の冷却水にサーバーそのものを浸して冷却を行う液浸冷却方式を採用する製品も登場しています。

したがって、HPCサーバーは従来のサーバーよりも圧倒的に重くなり、従来のサーバー設置を前提としたデータセンターでは、その重さに床面が耐えられなくなる可能性があります。液浸冷却方式を採用した最も重いHPCサーバーでも安心して導入・運用するためには、十分な床荷重を持つデータセンターを選択することが重要です。

3. Point3 冷却能力~圧倒的な熱量をクールダウンできる冷却能力はあるか?

サーバーを安定的に稼働・運用するには、冷却が非常に重要です。特にHPCサーバーは非常に集積度が高く、ディープラーニングの長時間稼働によってラックあたりの発熱量は、通常のサーバーを大きく上回ります。このため、通常よりも強力な空調設備が不可欠となります。
さらに、最新のHPCサーバーの中には、液浸冷却方式を採用する製品やラック背面に冷却システムを直接取り付けることで熱を取り除く新しい冷却方式を採用する製品も登場しています。このため、従来のサーバー設置を前提に設計されたデータセンターでは、十分な冷却効果が得られなかったり、新しい冷却方式に対応できず、HPCサーバーの設置そのものが難しい可能性もあります。

したがって、HPCサーバーの安定稼働には、冗長化された冷却能力の高い空調設備とともに、最新の冷却技術にも対応できる設備を備えたデータセンターを選択することがきわめて重要です。

4. まとめ HPCサーバーを利用するなら、HPCサーバーに対応したデータセンターを!

AIやビッグデータなどの新しいテクノロジーの進歩は、ビジネスに大きな変革をもたらしつつあります。その変化にいち早く対応し、新しいビジネスを創造するためには、最新のテクノロジーを活用できるHPCサーバーが不可欠です。
しかし、本記事でご紹介したように、最新のHPCサーバーは「消費電力」「重さ」「発熱量」の3点が、従来のサーバーを大きく上回っています。このため、旧来のデータセンターでは、最新のHPCサーバーを安定的かつ安心して運用できなくなる可能性があるのです。

HPCサーバーを利用するなら、HPCサーバーに対応した最新鋭のデータセンターを選ぶことをおすすめします。

最新HPCサーバーを安定かつ安心して運用するための必須項目

電源供給能力

HPCサーバーの
安定稼働に
必要な供給電力は?

HPCサーバーはGPUの機種や搭載数にもよりますが、1台あたり1~2kVA以上の消費電力となり、最低でも10kVA以上、将来的には20kVA以上のスペックが求められます。

GPUなどの半導体は、計算能力が高まるほど消費電力が増加します。

床荷重

高集積化された
HPCサーバーを
支える床荷重とは?

HPCサーバーを複数台搭載するラックは、従来のサーバーやストレージ、ネットワーク機器を搭載したラックと比べ、高重量となります。

さらに、液浸冷却を行う場合は冷却水の重量も加算されるなど、従来にも増して耐荷重性が高いファシリティが求められます。

冷却能力

高発熱のHPCサーバー、
安定稼働に
必要不可欠な
冷却技術とは?

HPCサーバーは高負荷となり、ラックあたりで高温の発熱が発生するため、通常よりも冷却能力の高い空調設備が求められます。

先進の技術として、サーバー本体を絶縁性液体で満たされた水槽の中に浸す、液浸冷却方式が開発・採用されています。また、ラック背面に冷却システムを直接取付けることで熱を除去するリアドア型冷却方式も登場しています。

5. 電源供給能力×床荷重×冷却能力、すべてにおいてHPCサーバーを安定運用できるデータセンターが「福岡」にあります!

当社が2019年に開業した、「QTnet福岡第3データセンター」は、JDCCティア4に対応した最新鋭のデータセンターです。データセンターの電力供給能力は、1 ラックあたり最大30kVA、床荷重は2.0t/㎡などハイスペックな仕様であるとともに、これまで15年以上にわたり培ってきたデータセンターのノウハウと最新技術を融合した、高信頼ファシリティを備える都市型データセンターです。これから、AI やIoT、ビッグデータを活用したビジネスを展開するお客さまがHPC サーバーなどのIT システムを構築・安定運用いただける最適な環境です。

さらに、東京の拠点と20Gbps の高速・大容量のネットワークで接続されたQLF サービス(当社提供)を利用することで、大手パブリッククラウドとハイブリッドクラウドを構成することも可能です。もちろん、災害リスクが低く、交通の利便性の高い福岡という" 地の利" を活かすことで、ビジネスの拠点やBCP/DR 対策のサイトとしてもご利用いただけます。

6. このようなお客さまへおすすめ

  • AIやIoT、ビッグデータを活用したビジネスを展開したい
  • HPCサーバーを構築・安定運用できるデータセンターを探している
  • 現在のデータセンターではHPCサーバーの導入に制限がある
  • 災害リスクが低く、交通の利便性の高いデータセンターを探している

このブログでご紹介したサービス