FY25開発加速利用

FY25開発加速利用

ABCI 3.0は、基盤モデル、生成AI、マルチモーダルAI等の最先端AI技術の研究開発、評価、人材育成を目的とした公的利用等に、重点的に提供することとしています。これを実現するため、共用高性能計算機ABCI利用約款に定める利用(「標準利用」という)のうち、目的への合致性、開発の公開性、利用者・利用原資の属性について要件を満たす利用を「開発加速利用」として認定し、標準利用料金からディスカウントした料金にて計算リソースを提供します。開発加速利用の詳細については下記をご参照ください。

本ページでは、2025年度開発加速利用に採択された研究開発課題を公表します。

研究開発課題

受付番号 研究開発課題名 利用グループ名 研究開発の概要 利用法人名 利用責任者氏名 報告書
1 大規模テキスト処理に関する研究 gab50271 大規模テキストの解析、および生成を含む自然言語処理技術および周辺技術の開発 産業技術総合研究所 高村 大也  
2 シミュレーション技術と人工知能技術の融合の研究 gaa50027 産総研人工知能研究センターNEC産総研人工知能連携研究室でのプロジェクトの一環として、シミュレーション技術を人工知能技術と組み合わせ、従来困難であった問題を解く人工知能技術を研究開発するために、主としてシミュレーションと機械学習のために使用する。 産業技術総合研究所 中田 亨  
3 海上豪雨生成で実現する集中豪雨被害から解放される未来に向けたAI気象モデル開発 gcg51467 気象を対象とした制御手法において律速となる莫大な計算量を解決するため、深層学習を用いた気象代理モデルによる気象予測手法を開発する。 奈良先端科学技術大学院大学 舩冨 卓哉  
4 宇宙機システム開発におけるLLM技術適用のFeasibility Study gcg51532 宇宙開発分野という専門領域において、人だけではなく、組織内部に専門性のノウハウを蓄積することは技術継承の点において重要である。この技術継承実現を目的とした、人工知能のモデル開発を行う。具体的には、組織内に蓄積された文書、ないしは画像を含むデータを自動解析、蓄積し、組織内の開発員の能力向上、教育を目的とした機能開発である。これに向け、公知となっている基盤モデルに対し、所望の挙動の獲得に向けた技術開発を行う。 独立行政法人 宇宙航空研究開発機構 石濱 直樹  
5 学習力学を数理基盤とした革新的ニューラルネットワークの開拓 gaf51208 深層学習の登場によりニューラルネットワークは機械学習や人工知能の基盤技術として急速に発展している。しかし高い性能を発揮するために、大量のデータや計算資源と、それを必要とする特定の情報表現や学習様式に強く依存して開発が進んでいるといえる。 本テーマでは、 深層学習のもとで発展しつつある学習力学の数理に基づいたモデル構造や学習様式、生物の脳神経回路モデルに着想を得たモデル構造や学習様式を取り組み、より効率的で柔軟な神経計算の実現を目指す。 産業技術総合研究所 唐木田 亮  
6 深層学習の数理と応用のための数値実験 gae50944 統計物理学に着想を得た深層学習モデルの解析やアルゴリズム開発を実施する。特に理論から予測される現象の検証を数値実験によって実施する。 産業技術総合研究所 唐木田 亮  
7 楽譜の簡約と分析の相互依存性を考慮した和声分析の教師なし学習 gcg51552 本研究はクラシック音楽を題材に,少量かつ複雑な楽譜データからの特徴簡約と系列モデリングによる法則性獲得を同時に行う方法を開拓します。単なる自動和声分析モデルの提案ではなく,和声の法則性自体をデータから獲得することを目標とします。そのため教師なし学習に着目し,確率モデルをニューラルネットワークで近似する手法を採用することでこれを実現します。また,複数の音符列からなる楽譜というデータが区間グラフに類似した構造を持つことに着目し,Graph Neural Networkなどの特徴抽出モデルと組み合わせて教師なし和声分析の性能向上をはかります。 神奈川大学 上原 由衣  
8 大規模言語モデルのマルチモーダル適応に関する研究 gcf51198 大規模言語モデルのマルチモーダル適応についての研究開発を行う。具体的には,大規模言語モデルに音声や映像を理解可能にするためのモデル改良や,画像を理解してコードを生成可能なモデルの構築及び評価を実施する。これらにより,プレゼンテーションの理解や生成に資するモデルの構築を行う。 東北大学 斉藤 いつみ  
10 大規模地理空間データに基づくAI・基盤モデル開発とその応用 gae50872 緯度・経度・標高・時間といった地理空間と紐づいたデータは現在社会の基盤データの一つとなっているが、多様な地域性を背景に地域、センサ種別やタスク目的ごとにAIモデルは準備され、データの大規模化に対して都度学習のコストが問題になる。本研究では合成開口レーダを筆頭に産総研が独自に整備したペタバイトを超える衛星データ・3次元点群データを活用し、大規模事前学習による基盤モデルの構築を実現するとともに、衛星データの大規模事前学習に適した学習データの構築に関する研究開発を行う。また多様なセンサへの適応を念頭に最適な継続事前学習手法を探索し、再学習コストの劇的な低減を目指す。これらの成果に基づき転移学習(物体検知・セグメンテーションなど)によるユースケースを提示し、地理空間情報への基盤モデル利用の優位性を示す。 産業技術総合研究所 堤 千明  
12 機械学習モデルの超効率的説明技術の研究 gcb50228 本研究では、内部にアクセスできないブラックボックス機械学習モデルにおいて、従来の1/100の計算コストで出力の根拠を説明する技術を開発します。また、ユーザ自身が学習させた機械学習モデルを超効率的に説明可能にする技術を開発します。 千葉工業大学 吉川 友也  
13 計算機の文章読解・生成能力の向上、評価に関する研究 gcc50435 計算機の文章読解・生成能力向上を目的とし、大規模テキストコーパスからの大規模言語モデルの学習、および、それを用いた応用システムの研究開発を行う。まず、Wikipediaやウェブテキストなどの大規模テキストコーパスを用いて大規模言語モデルを構築する。次に、構築した大規模言語モデルに対して継続学習やチューニングを適用することによって応用システムを開発する。文章読解・生成能力を向上させるために、文章読解・生成に関する高品質な評価データセットを構築するとともに、辞書などの知識源の利用方法について検討する。構築したモデルとシステムは、既存のデータセットに加え、上記で構築するデータセットにおいて評価する。構築したモデル、システム、および、データセットは一般公開し、文章読解・生成研究の発展に貢献する。 早稲田大学 河原 大輔  
14 多様な地理空間データと言語を連動する基盤モデル開発 gag51403 地理空間情報は単純な場所だけでなく時系列にも情報を持ち、モノを示す情報だけでなく、都市の発展や耕作地変化、災害発生など地球上でのイベント情報も内包する。他方、現状イベントの解釈は人間が担当し、その大規模化に課題がある。本研究ではVision & Language分野で先行する画像と言語の接続を地理空間データにも拡張し、衛星画像・3次元点群などから単純なモノの説明に加え、時系列情報を取り込みそこで起きているイベントの説明までを行うAIモデルの研究開発を行う。またシーンの理解を深めるために宇宙からの視点(衛星画像)・地上からの視点(Street viewや3次元点群)を統合できる基盤モデル開発を行う。 産業技術総合研究所 原 健翔  
15 オルガノイド解析に関する研究 gae50900 患者由来オルガノイド画像等を人工知能技術等により解析し、生体組織を構成する細胞社会の原理発見の足掛かりを得ると共に、その知見の病理診断および化学療法開発支援への応用の可能性を探る。 産業技術総合研究所 坂無 英徳  
16 多言語LLMを活用した多言語翻訳技術の開発・評価 gcg51586 多言語学習・評価データの整備及び複数の言語に対応した多言語LLMを活用した多言語翻訳技術の開発・評価を実施。 国立研究開発法人情報通信研究機構 内元 清貴  
17 データの倫理問題を根本解決する視覚言語基盤モデル構築 gag51404 本研究では、(1)数式など生成規則から自動生成された擬似画像・テキストによる一段階目の事前学習、(2)権利関係トレース可能な教師ラベル付実画像のみを用いた二段階目の継続事前学習により、データの倫理問題を根本解決する視覚言語基盤モデルを構築する。(1)では合成ながら実世界の法則を模した画像・テキストパターンにより初期の事前学習を実施することで視覚・言語機能を獲得しやすくする。さらに(2)では(1)の学習済パラメータから継続して事前学習を実施する。権利関係が明らかになっている画像・言語データセットのみを用いて視覚言語基盤モデルを構築する。 産業技術総合研究所 原 健翔  
18 深層ブラインド音源分離に基づく大規模施設の音環境分析 gaa50134 人間や計算機による意思決定を支援するための音環境分析の基盤技術を創出するため,商業施設や工場などで,人々が「どのような場面で」「どのようにふるまうか」を分析する技術を実現する.特に,盤石な数理基盤に立った真に使いやすい技術を確立するため,多チャネル混合音を用いた自己教師あり学習に基づくボトムアップ型の基盤構築と,商業施設規模の広範な音場を分析するトップダウン型の応用技術の創出を並行して推進する。 国立研究開発法人 産業技術総合研究所 坂東 宜昭  
19 サブシステム群の水平統合に基づく多様な環境に即応できる音響イベント定位・検出 gac50635 本研究では,多様な環境に即応できる環境音認識システムを実現するため,大規模汎用モデルとマイクアレイ信号処理を各々の長所を最大限生かして統合する方法を確立する。特に,アノテーションコストが膨大な現行のEnd-to-End (E2E) 型システムに代わり,構築が容易な部分問題を解くサブシステム群を効果的に統合して音響イベント定位・検出 (SELD) システムを実現する方法を明らかにする.また,古典的なカスケード型システムと異なり,混合音から並列に情報抽出した結果を統合することで,E2E型に比肩する性能を達成する枠組みの構成法を明らかにする。 国立研究開発法人 産業技術総合研究所 坂東 宜昭  
20 生成AIのための超大規模パラメータ空間の高速最適化に関する研究 gaa50073 生成AIのための深層学習やマルチエージェントシミュレーションの大規模なハイパパラメータを高速で最適化するための研究を行う。 本研究の詳細な研究内容は以下の通り
(1) 深層学習のハイパパラメータ調整
(2) 早期打ち切りによる探索の時間短縮 (3) 転移学習による探索時間の短縮
産業技術総合研究所 大西 正輝  
21 LLM構築の効率化に資する内部挙動分析と計算コスト削減法の確立 gcd50664 LLMの構築には膨大な計算コスト(予算や計算時間)が必要である。従来用いられてきたモデル構築法の学習時の内部挙動を詳細に分析し、コスト削減が可能な要因を特定する。その後、得られた要因分析結果を基に、LLM構築のネックになっている部分を改善し、現在の事前学習コストを半分以下に削減可能な新手法の確立を目指す。 こちはの研究計画は,2024年度に出した計画を継続する形で2025年度も実施する予定であり、2025年度中に論文などの成果を出す予定である。 国立大学法人東北大学 鈴木 潤  
23 動画基盤モデルの構築 gag51400 本研究では,動画を扱うAI基盤モデルの構築を目指す.特に,(1)手・物体インタラクションの詳細な理解を可能とする基盤モデルおよび(2)作業手順を理解可能な基盤モデルの構築にそれぞれ取り組む.コンピュータビジョン分野においては,基盤モデルにより静止画内の内容を高精度に理解することは実現されつつある一方で,動画中の時系列的な変化を的確に理解するには未だ困難な課題が残っている。人が作業をする際には目的を持った一連の作業が行われ,各手順の中で扱う物体の状態は継続的に変化していくため,それらの手順を適切に切り分けつつその中で生じる手・物体インタラクションを理解することは難しい。そこで本研究では,手・物体インタラクションの理解および作業手順の理解の両側面から問題の解決に取り組む。 産業技術総合研究所 原 健翔  
24 データの枯渇問題を軽減する3D基盤モデル構築 gag51402 本研究では,限られた3D データ下において深層学習モデルの性能を改善することを目指し,生成モデルから生成された合成3D点群をデータ拡張として活用することで3D基盤モデルを構築する。具体的には,生成モデルから実世界法則を模した3Dパターンを自動生成することにより,高品質かつ多様な3Dデータが必要とされる3D基盤モデル開発において喫緊した課題であるデータ枯渇問題を解消する。さらに,言語-画像-3Dデータのマルチモーダル学習による学習済みモデルを構築することで,追加学習データを一切必要とせずに実環境の物体やシーンを正確に認識する。 産業技術総合研究所 原 健翔  
25 衛星画像等を用いた自動判読・検出システムのための深層学習モデル開発 gca50072 リモートセンシング等によって得られた大量の画像・データから、必要な情報を抽出し、空間情報として利用するために、深層学習を利用してそれらの画像から必要な情報を取り出すためのモデルの開発 株式会社パスコ 島崎 康信  
27 最先端AIモデルの研究開発 gcb50243 ・東京科学大学の横田研究室、産業技術総合研究所と共同で大規模言語モデルSwallowの開発
・画像言語モデルなどのマルチモーダル基盤モデルの開発
・基盤モデルを分野やタスク特化型にチューニングする研究
・大規模言語モデルの安全性を高めるための研究開発
・基盤モデルの開発のために必要な学習データの開発
東京科学大学 岡崎 直観  
28 高効率AIチップを実現するHardware Friendly深層学習モデルの開発 gae50884 従来のAI処理専用ハードウェア・アクセラレータ(AIチップ)は、複数種類の演算を様々な精度で実行できるよう冗長に作られている。もし、モデルを工夫して実行に必要なハードウェアを絞ることができれば、AIチップの面積や電力当たりの性能を高効率化可能である。そこで、本研究では、このようなハードウェアを考慮したモデルの開発を行う。対象は言語モデルとし、ABCIを利用してモデルの学習を行う。最終的には、当モデル向けの専用ハードウェア(AIチップ)を開発し、従来技術(GPUなど)に比べて、大幅に高効率化できる事を示す。 産業技術総合研究所 更田 裕司  
29 世界最大級の高品質な日本語データを用いた日本文化、アイデンティティーに忠実なLLMの構築 gcg51448 NICTではこれまでに100個以上の大小の日本語LLMを構築した経験を有しており、本研究では、その経験を元に世界最大級の高品質な20TB以上の日本語学習データを用いて日本文化、アイデンティティーに忠実な2,000億パラメータ以上のLLMの学習を行う。現在、NICTでは、民間企業とのLLMの共同研究や民間企業に巨大日本語データの提供を開始しているが、LLMの学習データとしての日本語データの適切な構成、学習環境や有効性の確認という意味でも本研究は学術的、社会的、公共的インパクトを有するものである。加えて、複数のLLMやその他のAIをRAG等の手段を含めて柔軟に組み合わせて、生成AIの創造性、安全性、多様性をenhanceするためのソフトウエアプラットフォームであるWISDOM-LLMの開発を進めているところであり、今回構築するLLMは、WISDOM-LLMの構成要素の一つとなり、その能力の強化に資するものである。また、NICTのデータ、ノウハウだけでなく、日本の民間企業からも合成データやノウハウ等の提供を受け、その有効性も検証し、日本のLLM研究開発の底上げにも貢献する。 国立研究開発法人情報通信研究機構 呉 鍾勲  
30 最先端AIモデルの研究開発_信号処理の視点から大規模言語・視覚モデルを理解する:方法論と応用 gah51588 近年、大規模言語・視覚モデルは急速な発展を遂げ、その性能は限界を超え、革新的な応用を現実のものとしている。大規模言語・視覚モデルをより深く理解し、透明性、説明可能性や堅牢性を備えた責任あるAIの実現するために、本研究では、既存の説明可能AI(XAI)技術とは一線を画す、信号処理の知見・観点から人間にとって理解しやすい多角的な解釈を与える技術として、「XAI for LLM」に革新をもたらす。 産業技術総合研究所 叶 嘉星  
31 汎用・準汎用学習済み診断支援モデルの構築 gac50561 汎用学習済み診断支援モデル構築のための学習用データをABCI上で生成・管理し、診断支援AIモデルを構築して検証する。 産業技術総合研究所 野里 博和  
32 病理画像診断支援に関する研究 gab50336 構築した病理画像診断用のAIモデルを用いて、病理画像や関連情報に基づく異常検出や、良悪性の鑑別など、病理診断の支援に資する病理画像診断支援基盤モデルの研究開発を行う。 産業技術総合研究所 野里 博和  
33 人工知能による医療画像診断支援システムの研究開発 gaa50086 人工知能を用いた医療画像診断支援技術の実用化を目指した研究開発を行う。深層学習モデルの転移学習による手法をベースとした研究開発において、医療機関から提供を受けた医療画像を用いた実験によるパラメータ調整や開発手法の検証をABCI上で実施する。 産業技術総合研究所 野里 博和  
34 人工知能の応用に関する研究 gaa50088 深層学習などの人工知能技術を用いて、画像や波形、文字列データを解析し、クラス分類や異常検知、予測、生成等を行う技術に関する研究開発のために利用する。機械学習モデルの訓練および性能評価、モデル探索、ハイパーパラメータの最適化、メタ学習等の技術開発や実証など行う。 産業技術総合研究所 野里 博和  
35 研究データ連携基盤構築プロジェクト gag51409 研究DX推進室が取り組んでいる研究データ連携基盤構築プロジェクトの一環で、複数の研究データをまとめたデータセットを用いた継続事前学習(段階的転移学習)により、個々の研究データ単体で作るよりも高性能な機械学習モデルの構築を可能にする枠組みを作る。 産業技術総合研究所 濱崎 雅弘  
36 少量データで性能を発揮するAI開発のための音声音響基盤モデルの構築と利活用 gag51394 多種多様な言語や方言・高齢者音声などの少量データに基づくAI開発に資する音声音響基盤モデルを、AI橋渡しクラウド(ABCI)を用いた大規模計算を通じて構築する。日本語や多言語の音声データ・字幕情報等や、多様な環境で収録された音響・センサデータを用いて音声・音響AIを構築する。その成果として、高齢者音声の音声認識や、方言の音声合成など、少量なデータに基づいてAIを開発する必要がある課題を解決する音声AIを実現する。さらに構築した基盤モデルを産業界およびアカデミア向けにリリースし、音声・音響AIの構築を容易化することで、音声音響AIが広く世の中に普及させる。 国立研究開発法人 産業技術総合研究所 深山 覚  
37 少ない収集データによる高効率なAI の学習方法及び精度に関する検証 gaf51334 基盤モデルや保有するデータを活用し、少ない対象データによる高効率なAIの学習モデルを構築する。 産業技術総合研究所 野里 博和  
38 量子コンピュータ向け生成モデルの開発 gag51408 量子コンピュータアルゴリズム開発を行う人工知能を実現するための基盤技術を開発する。
1. Transformerを用いて、量子回路を生成する技術の開発
2. 量子回路記述言語(Qiskitなど)のコードの生成技術の開発など
産業技術総合研究所 G-QuAT 門脇 正史  
39 マルチモーダル情報を活用するタンパク質言語モデル gag51413 近年、深層学習に基づくタンパク質配列の解析技術が台頭してきており、その中でも大規模言語モデルに代表される自然言語処理技術を適用するタンパク質言語モデルに関する研究が注目を集めている。本研究では、系列情報とタンパク質が持つ異種モダリティの情報を包括的に組み合わせて利用可能なタンパク質言語モデルの実現を目指す。 国立研究開発法人産業技術総合研究所 浅田 真生  
40 ドメイン依存性に着目した時系列基盤モデルの適用性の解明 gcg51544 タスクごとに大規模なデータを収集することは困難であるため,近年では,時系列データの分野においても,大規模な基盤モデルを事前学習し,さまざまなタスクに応用するアプローチが注目されている.本研究課題では,時系列予測や異常検知といった時系列解析タスクを対象に,時系列基盤モデルと,各タスクごとにモデルを個別に学習する従来手法との比較と分析を行う。実験では,複数のドメインから構成されるデータセットを用い,各ドメインへの適応時におけるモデルの挙動や,ドメイン固有のデータが学習に含まれていない場合に生じる課題を分析する.これにより,時系列データにおけるドメイン依存性の影響について考察を行う。 中央大学 丸 千尋  
41 生命科学系イベント抽出のための言語モダリティのAIの開発 gcg51547 文献情報から効率良く酵素反応など生命科学系イベント抽出を行う言語モダリティのAI開発を行う。膨大な文献情報から、生命科学におけるイベント(現象)に関する情報を効率よく抽出するAIシステムの開発を行う。AIに学習させる言語リソース(コーパス)や酵素などのデータベースのRDFデータを元に、ABCIを活用して、生命科学におけるイベント抽出を行うシステムの開発を行う。 豊田工業大学 三輪 誠  
42 継続事前学習に基づく汎用性および有用性の高い日本語大規模言語モデルの構築 gag51395 最新のオープンなLLMをベースに継続事前学習を行うことで、高い日本語基礎能力を持ち、汎用性及び有用性を兼ね備えた基盤LLMを構築する。加えて、チューニングやアライメントについても取り組み、幅広いタスクで人間の指示に従い、高い性能を示すモデルを構築する。これらの研究開発を通じて、GPT-4やClaude 3並の応答を返すLLMを構築するための「レシピ」を明らかにし、開発したモデルを公開する。これにより、日本の研究コミュニティへの知識共有だけでなく、産業界におけるLLMの利用にも貢献する。また、得られた知見は論文や技術報告として一般に公開する。 国立研究開発法人産業技術総合研究所 高村 大也  
43 生成AIおよび周辺技術の開発 gag51407 言語モデルなどの生成AIの構築や、その活用技術および周辺技術の開発を行う。
特に、構造化データや数値データに強い生成AIの開発、特定ドメインでの大規模言語モデルの開発、実世界での言語生成技術の開発、また大規模言語モデルの内部機序の分析などを行う。
国立研究開発法人産業技術総合研究所 高村 大也  
44 メディアインタラクション技術に関する研究開発 gaa50003 膨大なメディアコンテンツおよびその利用ログを含むメタデータの解析や機械学習、メディアコンテンツ処理、音響信号処理、ビッグデータ処理、深層学習等に利用する。 産業技術総合研究所 濱崎 雅弘  
47 BRIDGE事業:高度なヒューマンマシンインタラクションのためのLLMによるマルチモーダルAIの強化 gag51479 マルチモーダルAIは、テキスト、画像、構造グラフ、時系列などの複数のデータモダリティを活用して、多様な分野のタスク解決を目的とする先進的なシステムである。
大規模言語モデル (LLM) が単一のモダリティを対象とした問題設定において、文脈に沿った一貫性のある表現生成が可能になったことから、近年のAI研究開発では複数のモダリティに対するLLMの性能強化に焦点が当てられている。
マルチモーダルLLMの開発における重要な課題は、異なるデータモダリティの特徴を融合してタスク解決に意味のある知見を導き出す点にある。
マルチモーダルデータの効果的な統合手法の実現は、AIシステムが複雑な実世界のシナリオをより直感的に理解・解釈し、洗練されたヒューマンマシンインタラクションを確立するために不可欠である。
本事業では、テキスト、視覚情報、および知識グラフに代表される構造化情報をLLMに融合する高性能なアプローチを実現し、AIモデルを学習・評価するため、ABCIを利用する。
国立研究開発法人産業技術総合研究所 浅田 真生  
49 効率的なAIの研究開発 gcc50455 本研究は、深層学習モデルの学習・推論における計算コストの削減を目的とし、効率的かつ高性能なモデルの構築手法を開発する。軽量なアーキテクチャ設計やデータ効率の高い学習法を通じて、限られた資源でも深層学習を活用可能にする。成果は論文化およびコード公開を通じて広く還元する。 千葉工業大学 竹内 彰一  
50 AIセキュリティの研究 gcg51452 敵対的サンプル,LLMとGroundingによる自律サイバー推論システムや未知バイナリコードの機能推定,Jailbreak等の研究 情報セキュリティ大学院大学 大塚 玲  
51 マルチビジョンセンサーによる他機体・障害物認識技術の開発 gae50988 本課題はJST K Program「災害・緊急時等に活用可能な革新的自律制御ドローン及び 自律分散協調飛行制御技術の研究開発」(2024年度より5年間)において、複数の自律ドローンが非GNSS、未知環境、複雑環境下において安全に飛行するため、マルチセンサーAIにより他機体や障害物を認識する技術の研究開発を行う。 産業技術総合研究所 岩田 健司  
52 日本語に強い大規模言語モデルの構築およびチューニング並びに透明性・信頼性の確保 に向けた研究開発。 gcg51557 日本語に強い大規模言語モデルの事前学習およびSFT/DPOなどの手法を用いたチューニングの実施並びに構築したモデルを用いた透明性・信頼性の確保
に向けた研究開発。
国立情報学研究所(NII) 黒橋 禎夫  
53 機械学習による静止画・動画像認識アルゴリズムの開発および実証 gac50571 様々な分野へのAI応用のための深層学習や機械学習手法の研究開発を、画像(静止画・動画像)を対象として行う。 産業技術総合研究所 野里 博和  
55 自然言語処理・知識グラフモデルの改善 gce50999 LLMに代表される自然言語処理モデルと知識グラフ表現モデルそれぞれの改善とそれらの連携を図る。 豊田工業大学 三輪 誠  
56 深層学習を用いた画像認識モデルの改良に関する研究 gch51615 利用責任者が主催する研究室で実施している,画像認識モデルの改良に関する研究に利用します。
主な研究テーマは以下の通りです。
・工業製品の異常検知の性能向上にむけたバックボーン改善
・工業製品の異常検知の性能向上にむけたモデル改良
・高精細画像認識モデルの性能向上に向けた画像生成AIの画像生成性能向上
・画像生成AIを用いた高精細画像認識モデルの訓練手法の改善
・深層アンサンブル学習の性能改善
福井大学 長谷川 達人  
58 冗長な観測のマルチビュー学習による動的表面の厳密な3次元復元 gcd50788 本研究は、汎用デジタルカメラセンサーを用いて、表面状態が可変的な被写体に対し、情報捏造を行わない高い信頼性と精度を有する三次元センシング技術を創出する。従来の多視点ステレオ法や照度差ステレオ法のように、被写体の多角的な観測を物理的に解釈するのではなく、機械学習
の一分野であるマルチビュー学習に着目して、分光・偏光イメージング技術に基づく未校正かつ冗長な観測の解釈をデータから直接学習する事により、厳格な物理モデルと環境制御の必要性を大幅に軽減し、未知の状況に対する頑健性と信頼性を向上させる。
国立情報学研究所 池畑 諭  
59 偽情報対策特化型LLMの開発 gcg51583 本研究は、NEDOのプロジェクト「経済安全保障重要技術育成プログラム/偽情報分析に係る技術の開発」(1)の開発項目の一つであり、「偽情報対策特化型LLM」をモデル学習することが目的です。
偽情報対策特化型LLMは、偽情報対策が対象とする災害・医療・政治・経済などの領域において高い自然言語処理を備え、報道文章やソーシャルメディア文章において優れた解釈能力を持つことが要請されます。
本研究では、既存のLLM(100Bパラメータ規模を想定)をベースモデルとして選定し、そこに偽情報対策が対象とする報道文章やソーシャルメディア文章を中心として学習データを準備し、継続事前学習や指示学習を行います。
このLLMの継続事前学習および指示学習をABCI3.0で実行したく、本件に応募するものです。

FY24では、LLMに対する継続事前学習を無償データセットを⽤いて実施しました。FY25では、
有償データセットを⽤いて追加の継続事前学習の実施と、偽情報対策特化のファインチューニ
ングを実施する予定です。

1
NEDOのプロジェクト公募: https://www.nedo.go.jp/koubo/CD2_100359.html
プロジェクト採択時(2024年7月)のNEDOのプレスリリース: https://www.nedo.go.jp/news/press/AA5_101763.html
同、富⼠通のプレスリリース: https://pr.fujitsu.com/jp/news/2024/07/19.html
プロジェクト開始時(2024年10⽉)の富⼠通のプレスリリース: https://pr.fujitsu.com/jp/
news/2024/10/16.html
富士通株式会社 小林 健一  
60 機械学習とベイズ推論の融合によるマルチオミクスデータ解析手法の開発 gce50902 細胞の機能は、DNA、RNA、タンパク質などの異なる種類の分子群が、同一細胞内また異なる細胞間において互いに影響を与え合う複雑な制御機構により担われている。これらの機構を理解し制御することは、医学・生命科学の大きな目標である。近年の計測技術の発達により、それぞれの分子群の発現を網羅的に計測することができるようになってきた(マルチオミクスデータ)、またタンパク質の立体構造を予測および生成するAI・機械学習モデルの発展も目覚ましい。本研究では、これらの多種多様な計測データおよびAIにより生成されたデータから細胞のシステムの理解に資する知見を獲得するための先端的なAI・機械学習手法の開発を行う。

本年度は、特にタンパク質間相互作用の動態予測におけるタンパク質構造生成モデルの可能性を探求し、生成モデルがコンフォメーション空間をどの程度再現できるかを定量的に評価する手法を確立することを目指す。これにより、分子動力学シミュレーションの限界を克服し、生成モデルと高精度な結合能予測モデルを組み合わせることで、タンパク質複合体の多様な結合コンフォメーションを効率的に生成・解析し、結合動態の理解と構造予測技術の発展に貢献することを目指す。
愛知県がんセンター 山口 類  
61 科学技術文献に対するメタデータ自動付与に関する研究開発 gce50980 国内外の科学技術文献(論文、予稿集、解説記事等、医薬系分野を含む)に対して索引語(キーワード)や抄録などのメタデータを精度良く自動付与する手法を開発する。
いずれのメタデータ項目についても、科学技術振興機構(JST)が過去より蓄積してきた「専門家が人手で付与したメタデータ」を教師データとして、大規模言語モデル等による機械学習アプローチによる開発を行う。
国立研究開発法人科学技術振興機構 水田 寿雄  
62 小規模LLMによるコード生成のハルシネーション検知 gcc50582 本研究開発では、小規模LLMにおけるコード生成を対象として新しいハルシネーション検知手法の探究を行う。研究は大きくわけて、ハルシネーション検出のための評価用データセットの構築、追加学習やアライメントのハルシネーションへの影響分析、生成されたコードの抽象解釈手法、ハルシネーション診断用モデル評価法の各方面から総合的に進める。 日本女子大学 倉光 君郎  
63 マルチモーダルAIによる多様なドメインの専門知学習方法の開発 gce51019 本研究の目的は,LLMに視覚機能を持たせたマルチモーダルAI(MLLM)に,専門家が持つ「マルチモーダル専門知」を獲得させる方法を開発することである.マルチモーダル専門知とは,インフラの維持管理や災害リスク評価,自動車の運転など多岐にわたる実社会の問題解決において必要な,視覚と言語を組み合わせた専門的な知識や技能を指す。これまでの研究において,MLLMの基本的な画像理解能力を拡張するアーキテクチャ設計および学習方法について検討を進め,多様な画像情報の抽出可能性に関する基礎的な有効性を確認した.今年度はさらに専門知獲得のためのより高度な情報抽出を可能とする新規アーキテクチャの設計を進め,より実践的なアプリケーションにおいて,MLLMの実問題解決能力を改善することを目指す.研究成果は論文や公開データとして広く社会に還元し,国内外のAIの開発および実用化を加速する。 国立大学法人東北大学 岡谷 貴之  
64 深層学習モデルのハイブリッド圧縮手法とその最適化に関する研究 gch51614 AIの飛躍的進展を支える基盤技術である深層学習モデル(AIモデル)は、近年ますます深層化・大規模化が進み、推論精度の向上が実現されている一方で、学習・推論に伴う計算コ ストや消費電力の増加により、エッジデバイスやモバイルデバイス上での実装が困難となっている。そのため、プルーニング、量子化、知識蒸留といったモデル圧縮技術が提案されてきたが、単一の圧縮手法ではモデル削減の限界があり、それを超えると、更なる圧縮は期待しにくい。そして近年、複数の圧縮手法を組合せたアプローチが開発されているが、その組合せの必要性、圧縮手法の適用順序がモデル性能に与える影響、さらに各手法における最適 な圧縮率については、まだ十分に解明されていない。
本研究は、複数の圧縮手法の組合せに着目し、その適用順序および最適な適用方法を明らかにすることで、ハイブリッド圧縮手法の確立を目的とする。これにより、各手法の特性を最大限に活かし、限られた資源環境下でAIモデルの実用性を大幅に向上させ、より多くの分野におけるAI技術の普及に貢献することが期待される。
学校法人 東洋大学 田 丹鶴  
65 A Knowledge-aware Multi-tasks-based Disease Network Construction on Biomedical Literature gac50543 In this research, we will introduce a knowledge-aware neural disease network that will extract such as diseases, proteins, genes, and their relations events, those are found in scientific articles on idiopathic pulmonary fibrosis (IPF). National Institute of Advanced Industrial Science and Technology Sohrab Mohammad Golam  
66 深層学習を利用した非一般画像情報処理技術の展開 gcf51214 本研究では、ラベル不足と高ノイズ環境に置かれた医用画像、および意味と視覚印象が重層する文字文書画像という“非一般画像”に対し、ラベル効率学習と印象‐意味マルチモーダル表現学習を統合した深層学習基盤を一年で構築する。自己教師・弱教師を組み合わせ、センサ特性や書体潜在変数を注入した拡散生成モデルを開発し、医療診断支援と書体・印象解析を同時に高度化する。開発した手法のコードを公開し再現性を担保、サーバ資源を活用して計算集約的実験を推進することで、専門家依存の課題を克服し、非一般画像処理の新たな可能性を切り拓く。特に、少量ラベルでの診断補助モデル運用と、多様書体の印象推定機能を実証し、非一般画像に特化した次世代AI研究の基盤を提供する。さらには国内外の共同研究を促進する。 九州大学 内田 誠一  
67 深層学習技術を用いた映像解析による動物園動物の行動分析 gcg51458 動物園では、飼育動物(多くが希少種)に対する理解を深め、よりよい飼育・動物福祉・展示を実現するために、動物の様子を監視カメラで記録・蓄積し、観察や研究に活用している。従来、観察は目視で行われてきたが、継続記録された映像は膨大になるため、長期間にわたる網羅的な観察を多種多様な動物に対して行うのは困難であった。本研究では、このような動物の行動観察に、深層学習技術を用いる。蓄積された膨大な監視カメラ映像から、 動物の行動をデータとして抽出する機械学習モデルを適用し、目視での観察では得られなかった緻密な行動データの抽出を行えるようにする。特に、動物園で行われる行動観察は、学術的関心から動物福祉、教育普及での利用まで幅広い観点で行われ、目的・内容・対象種は幅広い。このような入出力データの多様性に対し、VLM等の先進的な機械学習モデルの特性を生かし、柔軟に対応可能とすることを目指す(科研費基盤研究(B)24K00167)。 公益財団法人京都高度技術研究所 吉田 信明  
68 高解像度人間基盤モデルの構築 gae50891 Meta社のSapiensなど高解像度人間画像基盤モデルは、身体の関節だけでなく手指の姿勢の検出を行うwhole-body pose estimationタスクなどのfine-grainedの人間の認識を高性能に実現できるため注目を集めている。しかしながら、これらのモデルは、Vision Transformerを用いたネットワーク構造を採用しているため、計算コストが高くリアルタイムアプリケーションに利用することが難しいなどの課題がある。本研究開発では、リアルタイム実行可能な高解像度人間画像基盤モデルの構築を目指す。開発した基盤モデルを拡張して、三次元認識タスクだけでなく生成タスクやロボット基盤モデルへの適用も目指す。 産業技術総合研究所 吉安 祐介  
69 産業現場でのロボットの自動を目指すマルチモーダル基盤モデルの開発 gag51454 「産業現場タスクの自動を目指すマルチモーダル・ロボティクス基盤モデルの開発」において、教示データ(人間がロボットを操縦して取得したデータや人間がタスクを実行する様子を計測したデータ)をもとに、テキスト等の指示に応じてロボットに日常環境や製造工程の多様なタスクスキルを獲得させることを目的として、マルチモーダルな深層学習モデルの開発やロボットへの組み込みを行う。 産業技術総合研究所 元田 智大  
70 視覚・言語基盤モデルの開発 gah51624 これまで日本語に強い言語基盤モデルSwallowの開発を行なってきたが、本研究では視覚・言語基盤モデルの開発及びそのためのデータセットやハイパーパラメータの検証を行う。 産業技術総合研究所 横田 理央  
71 深層学習による系列学習 gcg51420 深層学習により、言語情報や時系列データなどの系列予測を実現する。言語情報については、大規模言語モデルに対するファインチューニングによる対話や知識獲得の性能向上を目指す。時系列データ解析においては、生成モデルにより生成された人工データによる深層学習モデルの事前学習を実施し、その効果を検証する。 学校法人トヨタ学園 豊田工業大学 佐々木 裕  
72 大規模言語モデルを用いた金融市場における気候変動リスク計測に関する研究 gch51625 本研究は、大規模言語モデル(Large Language Models, LLM)と金融分野のテキストデータを活用して、気候変動リスクの新たな定量的評価手法を構築し、そのリスクが日本の金融資産価格および金融機関経営に与える影響を明らかにするものである。
従来の金融リスク分析では主に数値データが用いられてきたが、気候変動に関する情報は定量化が難しく、多くが非構造化テキストとして存在する。特に新聞記事、有価証券報告書、企業の適時開示資料といった情報源には、重要な気候関連リスク情報が含まれており、LLMを用いることでその抽出・構造化が可能となる。
本研究では、日本の金融市場を対象に、LLMを用いてテキストから気候変動に関連する情報を抽出・指標化し、従来の金融データと統合する形で、リスクの影響を産業別・金融機関別に分析する。これにより、気候変動リスクの可視化とその経済的影響の理解を深め、脱炭素社会に向けた金融政策・投融資戦略の高度化に資する基盤的知見を提供する。
横浜国立大学 五島 圭一  
74 マルチモーダルAIの多様な実社会の課題解決への応用研究 gch51629 本研究の目標は、視覚機能を備えた大規模言語モデル=マルチモーダル AI(MLLM)を、多様な実社会の課題解決に応用することである。その鍵となるのが、専門家が保持する視覚と言語を統合した高度な知識・技能――「マルチモーダル専門知」――を AI に獲得させることである。マルチモーダル専門知は、インフラ維持管理、災害リスク評価、自動車運転などの領域で不可欠な要素である。これまでに、MLLM の画像理解能力を拡張するアーキテクチャ設計と学習手法を検討し、有効性を示す知見を蓄積してきた。今後はこれらを発展させ、実践的アプリケーションにおける問題解決性能を一層高める。得られた成果は論文および公開データとして広く社会に還元し、国内外の AI 研究と実用化を加速する。 理化学研究所 岡谷 貴之  
75 計算効率の良い機械学習法の開発 gcg51430 本研究は、ディープラーニングにおける学習および推論フェーズの計算負荷を軽減し、効率的かつ高精度なモデルの実現を目指すものである。リソース制約のある環境でも深層学習が適用可能となるよう、軽量なネットワーク構造の設計やデータ利用効率の高い学習手法に焦点を当てる。 千葉工業大学 重藤 優太郎  
76 直接遷移型半導体にて生じる再帰的に生じる量子・光現象に関する研究 gch51632 直接遷移型半導体にて生じる再帰的に生じる量子・光現象に関する研究を行う。具体的には、高い量子効率を有するバルク結晶内にて生じるフォトンリサイクリング(PR)現象や、電気的に中性な励起子が空間的に輸送され、PRや正孔生成などを通じてデバイスの電気特性に影響を及ぼす可能性など、新奇現象・応用をシミュレーションにて予測することを主たる目的とする。当方では主に実験的に上記の現象を評価しているが、明らかなPRの発生を示すデータ(量子効率が低い場合には見られない発光スペクトルの変化)などが得られており、時間・空間的なキャリア輸送を与えられたデバイス構造を考慮した精度の高いシミュレーションが必須となる。事前検証では、モデル計算への再帰的な素過程の導入により、計算の不安定化がみられているため、AIを活用したメッシュの効率的作成や収束性の観点での安定性向上などに力点を置いて研究を進めたい。 大阪大学 小島 一信