グランドチャレンジ

ABCIグランドチャレンジ2023採択課題について

ABCIグランドチャレンジ2023で採択された課題は次の通りです。

  クラス 所属機関名 代表者名 課題名 研究の概要
第1回 V-Week 東北大学 坂口慶祐 日本語大規模言語モデル学習の三点スケールアップとオープンソース化 2023-1-VW-1
第1回 V-Week 富士通株式会社 笠置明彦 量子化学計算の大規模厳密解法実行 2023-1-VW-2

研究の概要 (2023年度第1回)

課題名:日本語大規模言語モデル学習の三点スケールアップとオープンソース化

研究概要:本課題では、日本語自然言語処理の発展に貢献するため、日本語言語モデルをパラメータ数、総FLOPs数、データサイズの三点で公開されているものの中で最大のものを学習し、完全なオープンソース化を実現する。現在公開されている日本語に特化した言語モデルでは、1) モデルの総パラメータ数、2) 学習時に使われた計算総量、 3)学習時に使用された日本語データの量が最先端の自然言語処理研究を行う基盤として不十分である。そのため、現在公開されているスケールのモデルではInstruction Fine-tuning、Few-shot Learning、Chain-of-Thought、Scaling Lawsなどの最先端の研究手法の効果性を日本語で検証できない。本課題では、日本語言語モデルを100億パラメータまでスケールアップし、1.5×1022の総FLOPsを用いて、GPT-3(4000億トークン)スケールの日本語データセットに学習させる。これらは言語モデルの最先端の研究が可能であるスケールの境界線を超えるものであり、学習されたモデルを完全に公開することで、日本語言語処理の分野でも最先端の言語モデルの研究が可能になることを目指す。

課題名:量子化学計算の大規模厳密解法実行

研究概要:量子化学計算は量子コンピュータの利用が期待される領域であり、ノイズ有り量子コンピュータでも計算可能なVariational Quantum Eigensolver (VQE)アルゴリズムの研究が行われている。量子化学計算では対象分子の各原子の三次元座標を入力することで、その分子の保有するエネルギー量を計算することが可能である。このエネルギー量の厳密解を得るFull CIアルゴリズムはVQE等の精度指標として使われるため、精度向上や技術の発展において非常に重要である。一方で、Full CIは計算量とメモリのオーダーがO(n!)であるため、分子サイズが大きくなると小規模の計算基盤では算出することが困難であり、また算出できないことにより大きな量子ビット演算によるVQEの精度比較や古典アルゴリズムに対する優位性等を論じる事が難しくなる。本研究では量子化学計算の大規模なFull CIを用いて世界発となる問題規模の分子を対象に厳密解を算出し、量子化学計算における精度指標を打ち立て、量子シミュレータ及び量子実機における量子計算の発展を導く事を目的とする。