理化学研究所、富士通およびNVIDIAとの国際連携による「富岳NEXT」開発体制を始動
理化学研究所(五神真理事長、以下「理研」)は、富士通株式会社(時田隆仁代表取締役社長、以下「富士通」)[1]、NVIDIA Corporation(ジェンスン・ファンCEO、以下「NVIDIA」)[2]とともに、スーパーコンピュータ「富岳」[3]の次世代となる新たなフラッグシップシステム(開発コードネーム:「富岳NEXT」)に関して、理研を開発主体とした国際連携により設計および開発を開始することとしました。日本のフラッグシップシステムとしては初めてGPU(グラフィック処理装置)を加速部に採用し、NVIDIAがそのGPU基盤に関する設計を主導します。全体システムおよび計算ノード、CPU(中央演算装置)の基本設計においては、すでに理研とともに検討を進めている富士通が推進します。三者は連携して、ハイパフォーマンスコンピューティング(HPC)の基盤として計算による課題解決を支える「AI-HPCプラットフォーム」の構築を進めます。
2030年ごろの稼働を目指す「富岳NEXT」は、これまでのスーパーコンピュータが追求してきたシミュレーション性能だけではなく、シミュレーションとAIの双方において世界最高水準の性能を達成し、さらに両者が密に連携して処理を行うことができる「AI-HPCプラットフォーム」となることが求められています。そのため、「富岳NEXT」においては、「富岳」で培ってきたCPU技術を拡張しつつ、GPUを加速部として搭載し、シミュレーションおよびAIのアプリケーションの実行性能の最大化を目指します。一方、次世代計算基盤を活用した科学的成果を創出し続けるためには、ハードウエア技術のみならず、ソフトウエアやアルゴリズムとの総合的な技術革新がこれまで以上に重要となっています。
そこで、理研が強みを持つソフトウエアやアルゴリズム技術と富士通が持つCPU・システム化技術、NVIDIAが持つGPUに関する技術およびエコシステムを活用し、三者による開発を推し進めることで、競争力のあるシステムを開発し、グローバルマーケットへの展開を通じた世界的なエコシステムを構築します。また、「富岳NEXT」では「富岳」に比べて最大100倍程度のアプリケーションの高度化および高速化を進め、その成果を世界に展開していきます。さらに、日米共同で「富岳NEXT」の開発を進めることで、新たな世界標準となる「AI-HPCプラットフォーム」を確立し、仮説の生成・検証やコード生成、物理実証の自動化までを含む科学全体のサイクルを飛躍的に加速・高度化する「AI for Science」[4]の飛躍的な加速を実現します。この世界最高水準の「AI-HPCプラットフォーム」の構築は、世界的に訴求力のある国産技術を高度化し、情報産業や半導体技術における戦略的不可欠性を高めることで、産業競争力の強化に貢献します。また、理研としては、量子コンピュータ(QC)との連携も検討していきます。
(参考)
スーパーコンピュータ開発の課題
「富岳」では、スーパーコンピュータ「京」[5]に対して、当時の先端的な半導体技術や高性能なメモリの搭載により、ハードウエア性能は約40倍の向上を達成しました。さらに、理研主導によるアプリケーションの高度化および最適化を組み合わせることで約3倍程度のアプリケーションの高速化が図られ、トータルで一部アプリケーションにおいて目標とした100倍を超える性能向上を成し遂げました。しかしながら、近年では、半導体プロセス技術による速度向上・電力効率向上の鈍化により、大幅なハードウエア性能の向上が難しくなりつつあります。このため、ハードウエアによる進化に加え、ソフトウエア、アルゴリズムの革新による新しいアプローチが不可欠です。
HPCにおける科学技術と産業競争力の強化に向けて
「富岳NEXT」は、日本の半導体および計算基盤の強化に貢献するとともに、先端的AI技術や計算基盤における日本の主権を確保しつつ、ハードウエアおよびソフトウエアの両面で、グローバルマーケットへの展開を通じた世界的なエコシステムを構築します。ハードウエア面においては、CPU部として富士通が現在開発中の汎用CPU「FUJITSU-MONAKA」[6]を発展させた後継CPU「FUJITSU-MONAKA-X」(仮称)と、加速部としてNVIDIAが設計する並列演算性能とメモリ帯域に優れたGPUを組み合わせます。CPUとGPU間接続には最先端の接続方式の採用を検討するほか、先進的なメモリ技術の採用も視野に入れつつ、基本設計を実施します。これにより、「富岳NEXT」では、「富岳」に比べて5倍以上のハードウエア性能を目指します。
富士通が設計を進めるCPU部の「FUJITSU- MONAKA-X」は、高性能省電力かつ高いセキュリティを特長とする「FUJITSU-MONAKA」をさらに進化させたものになります。超メニーコア[7]とSIMD機能拡張[7]による高いスケーラビリティで、数値シミュレーションなどHPCアプリケーションに対し高い処理性能を発揮、加えてサーバ用としては世界初となる行列演算エンジン(Arm SME)をCPU内に内蔵し、低レイテンシ(遅延時間)なAI推論処理を実現します。さらにGPUとの組み合わせでは、GPUとの広帯域な密結合により、AIトレーニングやGPUに最適化されたHPCアプリケーションで高い処理性能が提供されます。これらにより、高度なセキュリティを確保しつつ汎用ワークロードから数値シミュレーション、AI処理まで多様なコンピューティング需要に応えられます。
NVIDIAが設計する加速部(GPU)は、高度な並列演算が要求されるHPCアプリケーションに加え、産業界でも急速に活用が拡大している生成AIをはじめとするAIアプリケーション、さらにはAIとHPCを融合した次世代アプリケーションにおいて、飛躍的かつ継続的な性能向上を実現できます。また、優れた消費電力効率、高い信頼性と可用性を兼ね備えます。
さらにアプリケーションの性能を向上させていくため、混合精度演算[8]の積極的利用、低精度演算向けハードウエアを利用した高精度演算手法の利用などAI向けに搭載されたハードウエアの有効活用(Ozakiスキーム[9]等)、さらにはAIにより複雑な計算性能を代替させるサロゲートモデル[10]やPINN[10]の導入を含むアルゴリズムの最適化など、ソフトウエア面での革新が必須となります。これらの研究開発を、理研を中心として、三者で連携して実施していくことで、ハードウエアによる高速化とは別に10~20倍のアプリケーション実行性能の向上を目指していきます。
最終的に、理研、富士通、NVIDIAの共同開発によるハードウエアの性能向上分と、三者が連携し推進するアルゴリズム・ソフトウェアの革新を合わせ、「富岳」開発時点と同程度である約40メガワット(MW、1MWは100万ワット)の電力制約の中で、「京」から「富岳」で目標とした性能向上と同様に、総合的に最大で100倍程度のアプリケーションの高度化および高速化を図ることを目標とします。さらに、AIによる仮説の生成や検証、そのためのコードの生成、物理的な実験の自動化など、「AI for Science」の推進により、科学的な価値発見のプロセス全体をさらに加速させることを目指します。
日米の先端的な技術をベースとして設計される「富岳NEXT」は、FP8(スパース)で600エクサフロップス(EFLOPS[11])を超えるAI向けのハードウエア性能を目標として開発を行うこととなり、HPC向けのスーパーコンピュータとしては世界初の「ゼタ(Zetta)スケール」システムとなることが想定されます。開発したソフトウエアやAIモデル、アプリケーションは、「富岳NEXT」稼働前からバーチャル「富岳」などを通じてクラウド環境でオープンに利用可能にすることで、AIとシミュレーションが融合する時代の高性能計算基盤としてのエコシステムを構築していきます。
「富岳NEXT」がもたらすソフトウエアとアプリケーションの高度化(例)
「富岳NEXT」プロジェクトにおいては、ハードウエアの開発と並んで、先進的アプリケーション開発の支援についても重要な開発要素と位置付けています。本開発支援に当たっては、理研はGPUへの移植や最適化の支援のほか、「AI for Science開発用スーパーコンピュータ」[12]等のCPU/GPUマシンの活用を含め、「富岳NEXT」テストベッドの構築を進めていく予定です。特にCI/CD/CB技術[13]を取り入れたシステム設計とアプリケーション開発のコデザインについては、文部科学省(文科省)と米国・エネルギー省(DOE)による「ハイパフォーマンス・コンピューティング及びAIに関する事業取決め」[14]によるDOE傘下の研究との共同研究の中で、自動ベンチマーキング環境(Benchpark)利活用による継続的性能評価環境の開発を推進するなど、幅広いアプリケーション・コミュニティと連携をしていきます。
また、ソフトウエア面についても、大学および研究機関と協力しながら、理研がリードしつつ三者が連携してAI処理向け機能の有効活用や、AIによる複雑な処理の高速化を補助するライブラリの整備、「富岳NEXT」向けのAIによるコード開発・最適化のサポートなど、高度な環境を開発していきます。また、商用アプリケーションや、多様なオープン・ソース・ソフトウエア(OSS)がスムーズに稼働することも重要であり、「富岳」およびバーチャル「富岳」で理研を中心に開発してきたソフトウエアスタックを高度化して利用可能にする予定です。
具体的なアプリケーション展開においては、次世代計算基盤の性能を最大限に活かすためには、物理シミュレーションの改良に加え、AIなどのデータ駆動型技術の導入・最適化が重要テーマになります。藤田航平東京大学地震研究所准教(理研客員研究員)のグループでは、地震発生のメカニズムの理解を深め、将来的に地震や津波の防災・減災につなげることを目指した開発を行っています。広い範囲の地殻変動と局所的な地震動を統一的に扱うことを可能にする「マルチスケールシミュレータ」の開発を推し進めることにより、例えば、大規模地震が起こった後に周辺で起こる地震の発生可能性について、コンピュータ上で検証できるようになることが期待されています。
広範囲地殻変動と周辺で起こる災害の発生可能性を高精度に検証
また、HPCとAIを組み合わせることで、ものづくりの現場に革新をもたらす取り組みが進められています。従来の設計作業は人の経験や試行錯誤に頼っていました。現在は、HPCによるシミュレーションと、AIによるパターン学習や予測を組み合わせた効率化を進めています。これからは、HPCによる高精度なシミュレーションをAIが学習し、AIエージェントと生成AIが連携することによって性能・安全性・コストなどの複数要件を同時に満たす最適な設計を自動化し、迅速かつ競争力の高い製品開発が可能になると期待されています。
AIエージェントと生成AIとが高性能シミュレーションと連携
今後の予定
「富岳NEXT」開発に関しては、2025年度内に基本設計を終え、2026年度以降は詳細設計に移行する予定です。理研としては、DOE傘下の研究所を含む世界的なHPCの研究所とも国際連携体制を構築して、ソフトウエアやアルゴリズムの開発を進めることも想定し、「富岳NEXT」を中核としたエコシステム構築を進めていきます。
また、文科省の「次世代HPC・AI 開発支援拠点形成事業」とも連携しながら、「富岳NEXT」時代を見据えた新たな科学技術分野(「AI for Science」など)における新規アプリケーションの創出を含めて、「富岳NEXT」において導入が決まっている加速部への対応などを促し、さらには人材育成を進めながら、2030年ごろの「富岳NEXT」稼働時において、早期に成果が創出できるよう取り組んでいきます。
さらに、計算可能領域の拡張に向けたHPCとQCとの連携が重要となっており、量子有用性を生かしたアプリケーションも実現されています。「富岳NEXT」が稼働する2030年ごろにおいては、HPCとQCの統合がさらに進むことが想定されていることを踏まえ、理研としては、HPCとQCとのハイブリッド環境を構築するために理研や大学、研究機関、企業などで開発されているソフトウエアスタック群が、「富岳NEXT」においても活用できるよう適用を進めていく予定です。
関係者のコメント
理研 理事長 五神 真 富士通およびNVIDIAと協力し、「富岳NEXT」の開発を推進できることを心より光栄に存じます。人類は古来より計算の科学技術によって文明を築き、社会を発展させてきました。いま、AI、先端半導体、量子コンピュータの登場は、計算科学に不連続な変革、すなわち歴史的なパラダイムシフトをもたらし、新たな地平を切り拓きつつあります。理化学研究所は「京」、「富岳」といった世界最先端のハイパフォーマンス・コンピューティング環境を開発・提供することで、計算科学の最前線を牽引し、国際社会におけるグローバルリーダーシップを発揮してまいりました。「富岳NEXT」は、継承と革新を掲げ、ハードウエアからソフトウエア、アルゴリズムに至る知を結集し、飛躍的な性能を実現し、世界に新たな標準を打ち立てます。我が国の半導体戦略と呼応し、国内外の多様なパートナーと力強く連携し、「Made with Japan」により人類課題の解決と産業の持続的成長に貢献してまいります。
富士通 執行役員副社長 CTO、システムプラットフォーム担当 ヴィヴェック マハジャン
計算基盤の重要性が高まる中、本プロジェクトへの参画を大変光栄に思います。当社のMade in Japanの最先端CPU技術と「富岳」などで培ったシステム構築技術を核とし、理研・協力ベンダとの強固な連携の下、世界最高水準の次世代計算基盤確立に貢献します。また当社は量子コンピュータ技術にも力を入れ、2030年度の1万物理量子ビット超、250論理量子ビットの超伝導量子コンピュータ構築を目指しています。本プロジェクトで培う技術を当社の量子技術と融合させ、量子・HPCハイブリッドプラットフォームを実現し新たな計算手法による価値創出を目指します。