FY25開発加速利用

ABCI 3.0は、基盤モデル、生成AI、マルチモーダルAI等の最先端AI技術の研究開発、評価、人材育成を目的とした公的利用等に、重点的に提供することとしています。これを実現するため、共用高性能計算機ABCI利用約款に定める利用（「標準利用」という）のうち、目的への合致性、開発の公開性、利用者・利用原資の属性について要件を満たす利用を「開発加速利用」として認定し、標準利用料金からディスカウントした料金にて計算リソースを提供します。開発加速利用の詳細については下記をご参照ください。

開発加速利用

本ページでは、2025年度開発加速利用に採択された研究開発課題を公表します。

研究開発課題

受付番号	研究開発課題名	利用グループ名	研究開発の概要	利用法人名	利用責任者氏名
1	大規模テキスト処理に関する研究	gab50271	大規模テキストの解析、および生成を含む自然言語処理技術および周辺技術の開発	産業技術総合研究所	高村　大也
2	シミュレーション技術と人工知能技術の融合の研究	gaa50027	産総研人工知能研究センターＮＥＣ産総研人工知能連携研究室でのプロジェクトの一環として、シミュレーション技術を人工知能技術と組み合わせ、従来困難であった問題を解く人工知能技術を研究開発するために、主としてシミュレーションと機械学習のために使用する。	産業技術総合研究所	中田　亨
3	海上豪雨生成で実現する集中豪雨被害から解放される未来に向けたAI気象モデル開発	gcg51467	気象を対象とした制御手法において律速となる莫大な計算量を解決するため、深層学習を用いた気象代理モデルによる気象予測手法を開発する。	奈良先端科学技術大学院大学	舩冨　卓哉
4	宇宙機システム開発におけるLLM技術適用のFeasibility Study	gcg51532	宇宙開発分野という専門領域において、人だけではなく、組織内部に専門性のノウハウを蓄積することは技術継承の点において重要である。この技術継承実現を目的とした、人工知能のモデル開発を行う。具体的には、組織内に蓄積された文書、ないしは画像を含むデータを自動解析、蓄積し、組織内の開発員の能力向上、教育を目的とした機能開発である。これに向け、公知となっている基盤モデルに対し、所望の挙動の獲得に向けた技術開発を行う。	独立行政法人　宇宙航空研究開発機構	石濱　直樹
5	学習力学を数理基盤とした革新的ニューラルネットワークの開拓	gaf51208	深層学習の登場によりニューラルネットワークは機械学習や人工知能の基盤技術として急速に発展している。しかし高い性能を発揮するために、大量のデータや計算資源と、それを必要とする特定の情報表現や学習様式に強く依存して開発が進んでいるといえる。本テーマでは、深層学習のもとで発展しつつある学習力学の数理に基づいたモデル構造や学習様式、生物の脳神経回路モデルに着想を得たモデル構造や学習様式を取り組み、より効率的で柔軟な神経計算の実現を目指す。	産業技術総合研究所	唐木田　亮
6	深層学習の数理と応用のための数値実験	gae50944	統計物理学に着想を得た深層学習モデルの解析やアルゴリズム開発を実施する。特に理論から予測される現象の検証を数値実験によって実施する。	産業技術総合研究所	唐木田　亮
7	楽譜の簡約と分析の相互依存性を考慮した和声分析の教師なし学習	gcg51552	本研究はクラシック音楽を題材に，少量かつ複雑な楽譜データからの特徴簡約と系列モデリングによる法則性獲得を同時に行う方法を開拓します。単なる自動和声分析モデルの提案ではなく，和声の法則性自体をデータから獲得することを目標とします。そのため教師なし学習に着目し，確率モデルをニューラルネットワークで近似する手法を採用することでこれを実現します。また，複数の音符列からなる楽譜というデータが区間グラフに類似した構造を持つことに着目し，Graph Neural Networkなどの特徴抽出モデルと組み合わせて教師なし和声分析の性能向上をはかります。	神奈川大学	上原　由衣
8	大規模言語モデルのマルチモーダル適応に関する研究	gcf51198	大規模言語モデルのマルチモーダル適応についての研究開発を行う。具体的には，大規模言語モデルに音声や映像を理解可能にするためのモデル改良や，画像を理解してコードを生成可能なモデルの構築及び評価を実施する。これらにより，プレゼンテーションの理解や生成に資するモデルの構築を行う。	東北大学	斉藤　いつみ
10	大規模地理空間データに基づくAI・基盤モデル開発とその応用	gae50872	緯度・経度・標高・時間といった地理空間と紐づいたデータは現在社会の基盤データの一つとなっているが、多様な地域性を背景に地域、センサ種別やタスク目的ごとにAIモデルは準備され、データの大規模化に対して都度学習のコストが問題になる。本研究では合成開口レーダを筆頭に産総研が独自に整備したペタバイトを超える衛星データ・3次元点群データを活用し、大規模事前学習による基盤モデルの構築を実現するとともに、衛星データの大規模事前学習に適した学習データの構築に関する研究開発を行う。また多様なセンサへの適応を念頭に最適な継続事前学習手法を探索し、再学習コストの劇的な低減を目指す。これらの成果に基づき転移学習(物体検知・セグメンテーションなど)によるユースケースを提示し、地理空間情報への基盤モデル利用の優位性を示す。	産業技術総合研究所	堤　千明
12	機械学習モデルの超効率的説明技術の研究	gcb50228	本研究では、内部にアクセスできないブラックボックス機械学習モデルにおいて、従来の1/100の計算コストで出力の根拠を説明する技術を開発します。また、ユーザ自身が学習させた機械学習モデルを超効率的に説明可能にする技術を開発します。	千葉工業大学	吉川　友也
13	計算機の文章読解・生成能力の向上、評価に関する研究	gcc50435	計算機の文章読解・生成能力向上を目的とし、大規模テキストコーパスからの大規模言語モデルの学習、および、それを用いた応用システムの研究開発を行う。まず、Wikipediaやウェブテキストなどの大規模テキストコーパスを用いて大規模言語モデルを構築する。次に、構築した大規模言語モデルに対して継続学習やチューニングを適用することによって応用システムを開発する。文章読解・生成能力を向上させるために、文章読解・生成に関する高品質な評価データセットを構築するとともに、辞書などの知識源の利用方法について検討する。構築したモデルとシステムは、既存のデータセットに加え、上記で構築するデータセットにおいて評価する。構築したモデル、システム、および、データセットは一般公開し、文章読解・生成研究の発展に貢献する。	早稲田大学	河原　大輔
14	多様な地理空間データと言語を連動する基盤モデル開発	gag51403	地理空間情報は単純な場所だけでなく時系列にも情報を持ち、モノを示す情報だけでなく、都市の発展や耕作地変化、災害発生など地球上でのイベント情報も内包する。他方、現状イベントの解釈は人間が担当し、その大規模化に課題がある。本研究ではVision & Language分野で先行する画像と言語の接続を地理空間データにも拡張し、衛星画像・3次元点群などから単純なモノの説明に加え、時系列情報を取り込みそこで起きているイベントの説明までを行うAIモデルの研究開発を行う。またシーンの理解を深めるために宇宙からの視点(衛星画像)・地上からの視点(Street viewや3次元点群)を統合できる基盤モデル開発を行う。	産業技術総合研究所	原　健翔
15	オルガノイド解析に関する研究	gae50900	患者由来オルガノイド画像等を人工知能技術等により解析し、生体組織を構成する細胞社会の原理発見の足掛かりを得ると共に、その知見の病理診断および化学療法開発支援への応用の可能性を探る。	産業技術総合研究所	坂無　英徳
16	多言語LLMを活用した多言語翻訳技術の開発・評価	gcg51586	多言語学習・評価データの整備及び複数の言語に対応した多言語LLMを活用した多言語翻訳技術の開発・評価を実施。	国立研究開発法人情報通信研究機構	内元　清貴
17	データの倫理問題を根本解決する視覚言語基盤モデル構築	gag51404	本研究では、（1）数式など生成規則から自動生成された擬似画像・テキストによる一段階目の事前学習、（2）権利関係トレース可能な教師ラベル付実画像のみを用いた二段階目の継続事前学習により、データの倫理問題を根本解決する視覚言語基盤モデルを構築する。（1）では合成ながら実世界の法則を模した画像・テキストパターンにより初期の事前学習を実施することで視覚・言語機能を獲得しやすくする。さらに（2）では（1）の学習済パラメータから継続して事前学習を実施する。権利関係が明らかになっている画像・言語データセットのみを用いて視覚言語基盤モデルを構築する。	産業技術総合研究所	原　健翔
18	深層ブラインド音源分離に基づく大規模施設の音環境分析	gaa50134	人間や計算機による意思決定を支援するための音環境分析の基盤技術を創出するため，商業施設や工場などで，人々が「どのような場面で」「どのようにふるまうか」を分析する技術を実現する．特に，盤石な数理基盤に立った真に使いやすい技術を確立するため，多チャネル混合音を用いた自己教師あり学習に基づくボトムアップ型の基盤構築と，商業施設規模の広範な音場を分析するトップダウン型の応用技術の創出を並行して推進する。	国立研究開発法人産業技術総合研究所	坂東　宜昭
19	サブシステム群の水平統合に基づく多様な環境に即応できる音響イベント定位・検出	gac50635	本研究では，多様な環境に即応できる環境音認識システムを実現するため，大規模汎用モデルとマイクアレイ信号処理を各々の長所を最大限生かして統合する方法を確立する。特に，アノテーションコストが膨大な現行のEnd-to-End (E2E) 型システムに代わり，構築が容易な部分問題を解くサブシステム群を効果的に統合して音響イベント定位・検出 (SELD) システムを実現する方法を明らかにする．また，古典的なカスケード型システムと異なり，混合音から並列に情報抽出した結果を統合することで，E2E型に比肩する性能を達成する枠組みの構成法を明らかにする。	国立研究開発法人産業技術総合研究所	坂東　宜昭
20	生成AIのための超大規模パラメータ空間の高速最適化に関する研究	gaa50073	生成AIのための深層学習やマルチエージェントシミュレーションの大規模なハイパパラメータを高速で最適化するための研究を行う。本研究の詳細な研究内容は以下の通り (1) 深層学習のハイパパラメータ調整 (2) 早期打ち切りによる探索の時間短縮 (3) 転移学習による探索時間の短縮	産業技術総合研究所	大西　正輝
21	LLM構築の効率化に資する内部挙動分析と計算コスト削減法の確立	gcd50664	LLMの構築には膨大な計算コスト（予算や計算時間）が必要である。従来用いられてきたモデル構築法の学習時の内部挙動を詳細に分析し、コスト削減が可能な要因を特定する。その後、得られた要因分析結果を基に、LLM構築のネックになっている部分を改善し、現在の事前学習コストを半分以下に削減可能な新手法の確立を目指す。こちはの研究計画は，2024年度に出した計画を継続する形で2025年度も実施する予定であり、2025年度中に論文などの成果を出す予定である。	国立大学法人東北大学	鈴木　潤
23	動画基盤モデルの構築	gag51400	本研究では，動画を扱うAI基盤モデルの構築を目指す．特に，(1)手・物体インタラクションの詳細な理解を可能とする基盤モデルおよび(2)作業手順を理解可能な基盤モデルの構築にそれぞれ取り組む．コンピュータビジョン分野においては，基盤モデルにより静止画内の内容を高精度に理解することは実現されつつある一方で，動画中の時系列的な変化を的確に理解するには未だ困難な課題が残っている。人が作業をする際には目的を持った一連の作業が行われ，各手順の中で扱う物体の状態は継続的に変化していくため，それらの手順を適切に切り分けつつその中で生じる手・物体インタラクションを理解することは難しい。そこで本研究では，手・物体インタラクションの理解および作業手順の理解の両側面から問題の解決に取り組む。	産業技術総合研究所	原　健翔
24	データの枯渇問題を軽減する3D基盤モデル構築	gag51402	本研究では，限られた3D データ下において深層学習モデルの性能を改善することを目指し，生成モデルから生成された合成3D点群をデータ拡張として活用することで3D基盤モデルを構築する。具体的には，生成モデルから実世界法則を模した3Dパターンを自動生成することにより，高品質かつ多様な3Dデータが必要とされる3D基盤モデル開発において喫緊した課題であるデータ枯渇問題を解消する。さらに，言語-画像-3Dデータのマルチモーダル学習による学習済みモデルを構築することで，追加学習データを一切必要とせずに実環境の物体やシーンを正確に認識する。	産業技術総合研究所	原　健翔
25	衛星画像等を用いた自動判読・検出システムのための深層学習モデル開発	gca50072	リモートセンシング等によって得られた大量の画像・データから、必要な情報を抽出し、空間情報として利用するために、深層学習を利用してそれらの画像から必要な情報を取り出すためのモデルの開発	株式会社パスコ	島崎　康信
27	最先端AIモデルの研究開発	gcb50243	・東京科学大学の横田研究室、産業技術総合研究所と共同で大規模言語モデルSwallowの開発・画像言語モデルなどのマルチモーダル基盤モデルの開発・基盤モデルを分野やタスク特化型にチューニングする研究・大規模言語モデルの安全性を高めるための研究開発・基盤モデルの開発のために必要な学習データの開発	東京科学大学	岡崎　直観
28	高効率AIチップを実現するHardware Friendly深層学習モデルの開発	gae50884	従来のAI処理専用ハードウェア・アクセラレータ(AIチップ)は、複数種類の演算を様々な精度で実行できるよう冗長に作られている。もし、モデルを工夫して実行に必要なハードウェアを絞ることができれば、AIチップの面積や電力当たりの性能を高効率化可能である。そこで、本研究では、このようなハードウェアを考慮したモデルの開発を行う。対象は言語モデルとし、ABCIを利用してモデルの学習を行う。最終的には、当モデル向けの専用ハードウェア(AIチップ)を開発し、従来技術(GPUなど)に比べて、大幅に高効率化できる事を示す。	産業技術総合研究所	更田　裕司
29	世界最大級の高品質な日本語データを用いた日本文化、アイデンティティーに忠実なLLMの構築	gcg51448	NICTではこれまでに100個以上の大小の日本語LLMを構築した経験を有しており、本研究では、その経験を元に世界最大級の高品質な20TB以上の日本語学習データを用いて日本文化、アイデンティティーに忠実な2,000億パラメータ以上のLLMの学習を行う。現在、NICTでは、民間企業とのLLMの共同研究や民間企業に巨大日本語データの提供を開始しているが、LLMの学習データとしての日本語データの適切な構成、学習環境や有効性の確認という意味でも本研究は学術的、社会的、公共的インパクトを有するものである。加えて、複数のLLMやその他のAIをRAG等の手段を含めて柔軟に組み合わせて、生成AIの創造性、安全性、多様性をenhanceするためのソフトウエアプラットフォームであるWISDOM-LLMの開発を進めているところであり、今回構築するLLMは、WISDOM-LLMの構成要素の一つとなり、その能力の強化に資するものである。また、NICTのデータ、ノウハウだけでなく、日本の民間企業からも合成データやノウハウ等の提供を受け、その有効性も検証し、日本のLLM研究開発の底上げにも貢献する。	国立研究開発法人情報通信研究機構	呉　鍾勲
30	最先端AIモデルの研究開発_信号処理の視点から大規模言語・視覚モデルを理解する：方法論と応用	gah51588	近年、大規模言語・視覚モデルは急速な発展を遂げ、その性能は限界を超え、革新的な応用を現実のものとしている。大規模言語・視覚モデルをより深く理解し、透明性、説明可能性や堅牢性を備えた責任あるAIの実現するために、本研究では、既存の説明可能AI（XAI）技術とは一線を画す、信号処理の知見・観点から人間にとって理解しやすい多角的な解釈を与える技術として、「XAI for LLM」に革新をもたらす。	産業技術総合研究所	叶　嘉星
31	汎用・準汎用学習済み診断支援モデルの構築	gac50561	汎用学習済み診断支援モデル構築のための学習用データをABCI上で生成・管理し、診断支援AIモデルを構築して検証する。	産業技術総合研究所	野里　博和
32	病理画像診断支援に関する研究	gab50336	構築した病理画像診断用のAIモデルを用いて、病理画像や関連情報に基づく異常検出や、良悪性の鑑別など、病理診断の支援に資する病理画像診断支援基盤モデルの研究開発を行う。	産業技術総合研究所	野里　博和
33	人工知能による医療画像診断支援システムの研究開発	gaa50086	人工知能を用いた医療画像診断支援技術の実用化を目指した研究開発を行う。深層学習モデルの転移学習による手法をベースとした研究開発において、医療機関から提供を受けた医療画像を用いた実験によるパラメータ調整や開発手法の検証をABCI上で実施する。	産業技術総合研究所	野里　博和
34	人工知能の応用に関する研究	gaa50088	深層学習などの人工知能技術を用いて、画像や波形、文字列データを解析し、クラス分類や異常検知、予測、生成等を行う技術に関する研究開発のために利用する。機械学習モデルの訓練および性能評価、モデル探索、ハイパーパラメータの最適化、メタ学習等の技術開発や実証など行う。	産業技術総合研究所	野里　博和
35	研究データ連携基盤構築プロジェクト	gag51409	研究DX推進室が取り組んでいる研究データ連携基盤構築プロジェクトの一環で、複数の研究データをまとめたデータセットを用いた継続事前学習（段階的転移学習）により、個々の研究データ単体で作るよりも高性能な機械学習モデルの構築を可能にする枠組みを作る。	産業技術総合研究所	濱崎　雅弘
36	少量データで性能を発揮するAI開発のための音声音響基盤モデルの構築と利活用	gag51394	多種多様な言語や方言・高齢者音声などの少量データに基づくAI開発に資する音声音響基盤モデルを、AI橋渡しクラウド（ABCI）を用いた大規模計算を通じて構築する。日本語や多言語の音声データ・字幕情報等や、多様な環境で収録された音響・センサデータを用いて音声・音響AIを構築する。その成果として、高齢者音声の音声認識や、方言の音声合成など、少量なデータに基づいてAIを開発する必要がある課題を解決する音声AIを実現する。さらに構築した基盤モデルを産業界およびアカデミア向けにリリースし、音声・音響AIの構築を容易化することで、音声音響AIが広く世の中に普及させる。	国立研究開発法人産業技術総合研究所	深山　覚
37	少ない収集データによる高効率なAI の学習方法及び精度に関する検証	gaf51334	基盤モデルや保有するデータを活用し、少ない対象データによる高効率なAIの学習モデルを構築する。	産業技術総合研究所	野里　博和
38	量子コンピュータ向け生成モデルの開発	gag51408	量子コンピュータアルゴリズム開発を行う人工知能を実現するための基盤技術を開発する。 1. Transformerを用いて、量子回路を生成する技術の開発 2. 量子回路記述言語(Qiskitなど)のコードの生成技術の開発など	産業技術総合研究所 G-QuAT	門脇　正史
39	マルチモーダル情報を活用するタンパク質言語モデル	gag51413	近年、深層学習に基づくタンパク質配列の解析技術が台頭してきており、その中でも大規模言語モデルに代表される自然言語処理技術を適用するタンパク質言語モデルに関する研究が注目を集めている。本研究では、系列情報とタンパク質が持つ異種モダリティの情報を包括的に組み合わせて利用可能なタンパク質言語モデルの実現を目指す。	国立研究開発法人産業技術総合研究所	浅田　真生
40	ドメイン依存性に着目した時系列基盤モデルの適用性の解明	gcg51544	タスクごとに大規模なデータを収集することは困難であるため，近年では，時系列データの分野においても，大規模な基盤モデルを事前学習し，さまざまなタスクに応用するアプローチが注目されている．本研究課題では，時系列予測や異常検知といった時系列解析タスクを対象に，時系列基盤モデルと，各タスクごとにモデルを個別に学習する従来手法との比較と分析を行う。実験では，複数のドメインから構成されるデータセットを用い，各ドメインへの適応時におけるモデルの挙動や，ドメイン固有のデータが学習に含まれていない場合に生じる課題を分析する．これにより，時系列データにおけるドメイン依存性の影響について考察を行う。	中央大学	丸　千尋
41	生命科学系イベント抽出のための言語モダリティのAIの開発	gcg51547	文献情報から効率良く酵素反応など生命科学系イベント抽出を行う言語モダリティのAI開発を行う。膨大な文献情報から、生命科学におけるイベント（現象）に関する情報を効率よく抽出するAIシステムの開発を行う。AIに学習させる言語リソース（コーパス）や酵素などのデータベースのRDFデータを元に、ABCIを活用して、生命科学におけるイベント抽出を行うシステムの開発を行う。	豊田工業大学	三輪　誠
42	継続事前学習に基づく汎用性および有用性の高い日本語大規模言語モデルの構築	gag51395	最新のオープンなLLMをベースに継続事前学習を行うことで、高い日本語基礎能力を持ち、汎用性及び有用性を兼ね備えた基盤LLMを構築する。加えて、チューニングやアライメントについても取り組み、幅広いタスクで人間の指示に従い、高い性能を示すモデルを構築する。これらの研究開発を通じて、GPT-4やClaude 3並の応答を返すLLMを構築するための「レシピ」を明らかにし、開発したモデルを公開する。これにより、日本の研究コミュニティへの知識共有だけでなく、産業界におけるLLMの利用にも貢献する。また、得られた知見は論文や技術報告として一般に公開する。	国立研究開発法人産業技術総合研究所	高村　大也
43	生成AIおよび周辺技術の開発	gag51407	言語モデルなどの生成AIの構築や、その活用技術および周辺技術の開発を行う。特に、構造化データや数値データに強い生成AIの開発、特定ドメインでの大規模言語モデルの開発、実世界での言語生成技術の開発、また大規模言語モデルの内部機序の分析などを行う。	国立研究開発法人産業技術総合研究所	高村　大也
44	メディアインタラクション技術に関する研究開発	gaa50003	膨大なメディアコンテンツおよびその利用ログを含むメタデータの解析や機械学習、メディアコンテンツ処理、音響信号処理、ビッグデータ処理、深層学習等に利用する。	産業技術総合研究所	濱崎　雅弘
47	BRIDGE事業：高度なヒューマンマシンインタラクションのためのLLMによるマルチモーダルAIの強化	gag51479	マルチモーダルAIは、テキスト、画像、構造グラフ、時系列などの複数のデータモダリティを活用して、多様な分野のタスク解決を目的とする先進的なシステムである。大規模言語モデル (LLM) が単一のモダリティを対象とした問題設定において、文脈に沿った一貫性のある表現生成が可能になったことから、近年のAI研究開発では複数のモダリティに対するLLMの性能強化に焦点が当てられている。マルチモーダルLLMの開発における重要な課題は、異なるデータモダリティの特徴を融合してタスク解決に意味のある知見を導き出す点にある。マルチモーダルデータの効果的な統合手法の実現は、AIシステムが複雑な実世界のシナリオをより直感的に理解・解釈し、洗練されたヒューマンマシンインタラクションを確立するために不可欠である。本事業では、テキスト、視覚情報、および知識グラフに代表される構造化情報をLLMに融合する高性能なアプローチを実現し、AIモデルを学習・評価するため、ABCIを利用する。	国立研究開発法人産業技術総合研究所	浅田　真生
49	効率的なAIの研究開発	gcc50455	本研究は、深層学習モデルの学習・推論における計算コストの削減を目的とし、効率的かつ高性能なモデルの構築手法を開発する。軽量なアーキテクチャ設計やデータ効率の高い学習法を通じて、限られた資源でも深層学習を活用可能にする。成果は論文化およびコード公開を通じて広く還元する。	千葉工業大学	竹内　彰一
50	AIセキュリティの研究	gcg51452	敵対的サンプル，LLMとGroundingによる自律サイバー推論システムや未知バイナリコードの機能推定，Jailbreak等の研究	情報セキュリティ大学院大学	大塚　玲
51	マルチビジョンセンサーによる他機体・障害物認識技術の開発	gae50988	本課題はJST K Program「災害・緊急時等に活用可能な革新的自律制御ドローン及び自律分散協調飛行制御技術の研究開発」（2024年度より5年間）において、複数の自律ドローンが非GNSS、未知環境、複雑環境下において安全に飛行するため、マルチセンサーAIにより他機体や障害物を認識する技術の研究開発を行う。	産業技術総合研究所	岩田　健司
52	日本語に強い大規模言語モデルの構築およびチューニング並びに透明性・信頼性の確保に向けた研究開発。	gcg51557	日本語に強い大規模言語モデルの事前学習およびSFT／DPOなどの手法を用いたチューニングの実施並びに構築したモデルを用いた透明性・信頼性の確保に向けた研究開発。	国立情報学研究所（NII）	黒橋　禎夫
53	機械学習による静止画・動画像認識アルゴリズムの開発および実証	gac50571	様々な分野へのAI応用のための深層学習や機械学習手法の研究開発を、画像（静止画・動画像）を対象として行う。	産業技術総合研究所	野里　博和
55	自然言語処理・知識グラフモデルの改善	gce50999	LLMに代表される自然言語処理モデルと知識グラフ表現モデルそれぞれの改善とそれらの連携を図る。	豊田工業大学	三輪　誠
56	深層学習を用いた画像認識モデルの改良に関する研究	gch51615	利用責任者が主催する研究室で実施している，画像認識モデルの改良に関する研究に利用します。主な研究テーマは以下の通りです。・工業製品の異常検知の性能向上にむけたバックボーン改善・工業製品の異常検知の性能向上にむけたモデル改良・高精細画像認識モデルの性能向上に向けた画像生成AIの画像生成性能向上・画像生成AIを用いた高精細画像認識モデルの訓練手法の改善・深層アンサンブル学習の性能改善	福井大学	長谷川　達人
58	冗長な観測のマルチビュー学習による動的表面の厳密な3次元復元	gcd50788	本研究は、汎用デジタルカメラセンサーを用いて、表面状態が可変的な被写体に対し、情報捏造を行わない高い信頼性と精度を有する三次元センシング技術を創出する。従来の多視点ステレオ法や照度差ステレオ法のように、被写体の多角的な観測を物理的に解釈するのではなく、機械学習の一分野であるマルチビュー学習に着目して、分光・偏光イメージング技術に基づく未校正かつ冗長な観測の解釈をデータから直接学習する事により、厳格な物理モデルと環境制御の必要性を大幅に軽減し、未知の状況に対する頑健性と信頼性を向上させる。	国立情報学研究所	池畑　諭
59	偽情報対策特化型LLMの開発	gcg51583	本研究は、NEDOのプロジェクト「経済安全保障重要技術育成プログラム／偽情報分析に係る技術の開発」(1)の開発項目の一つであり、「偽情報対策特化型LLM」をモデル学習することが目的です。偽情報対策特化型LLMは、偽情報対策が対象とする災害・医療・政治・経済などの領域において高い自然言語処理を備え、報道文章やソーシャルメディア文章において優れた解釈能力を持つことが要請されます。本研究では、既存のLLM（100Bパラメータ規模を想定）をベースモデルとして選定し、そこに偽情報対策が対象とする報道文章やソーシャルメディア文章を中心として学習データを準備し、継続事前学習や指示学習を行います。このLLMの継続事前学習および指示学習をABCI3.0で実行したく、本件に応募するものです。 FY24では、LLMに対する継続事前学習を無償データセットを⽤いて実施しました。FY25では、有償データセットを⽤いて追加の継続事前学習の実施と、偽情報対策特化のファインチューニングを実施する予定です。 1 NEDOのプロジェクト公募: https://www.nedo.go.jp/koubo/CD2_100359.html プロジェクト採択時(2024年7月)のNEDOのプレスリリース: https://www.nedo.go.jp/news/press/AA5_101763.html 同、富⼠通のプレスリリース: https://pr.fujitsu.com/jp/news/2024/07/19.html プロジェクト開始時(2024年10⽉)の富⼠通のプレスリリース: https://pr.fujitsu.com/jp/ news/2024/10/16.html	富士通株式会社	小林　健一
60	機械学習とベイズ推論の融合によるマルチオミクスデータ解析手法の開発	gce50902	細胞の機能は、DNA、RNA、タンパク質などの異なる種類の分子群が、同一細胞内また異なる細胞間において互いに影響を与え合う複雑な制御機構により担われている。これらの機構を理解し制御することは、医学・生命科学の大きな目標である。近年の計測技術の発達により、それぞれの分子群の発現を網羅的に計測することができるようになってきた（マルチオミクスデータ）、またタンパク質の立体構造を予測および生成するAI・機械学習モデルの発展も目覚ましい。本研究では、これらの多種多様な計測データおよびAIにより生成されたデータから細胞のシステムの理解に資する知見を獲得するための先端的なAI・機械学習手法の開発を行う。本年度は、特にタンパク質間相互作用の動態予測におけるタンパク質構造生成モデルの可能性を探求し、生成モデルがコンフォメーション空間をどの程度再現できるかを定量的に評価する手法を確立することを目指す。これにより、分子動力学シミュレーションの限界を克服し、生成モデルと高精度な結合能予測モデルを組み合わせることで、タンパク質複合体の多様な結合コンフォメーションを効率的に生成・解析し、結合動態の理解と構造予測技術の発展に貢献することを目指す。	愛知県がんセンター	山口　類
61	科学技術文献に対するメタデータ自動付与に関する研究開発	gce50980	国内外の科学技術文献（論文、予稿集、解説記事等、医薬系分野を含む）に対して索引語（キーワード）や抄録などのメタデータを精度良く自動付与する手法を開発する。いずれのメタデータ項目についても、科学技術振興機構（JST）が過去より蓄積してきた「専門家が人手で付与したメタデータ」を教師データとして、大規模言語モデル等による機械学習アプローチによる開発を行う。	国立研究開発法人科学技術振興機構	水田　寿雄
62	小規模LLMによるコード生成のハルシネーション検知	gcc50582	本研究開発では、小規模LLMにおけるコード生成を対象として新しいハルシネーション検知手法の探究を行う。研究は大きくわけて、ハルシネーション検出のための評価用データセットの構築、追加学習やアライメントのハルシネーションへの影響分析、生成されたコードの抽象解釈手法、ハルシネーション診断用モデル評価法の各方面から総合的に進める。	日本女子大学	倉光　君郎
63	マルチモーダルAIによる多様なドメインの専門知学習方法の開発	gce51019	本研究の目的は，LLMに視覚機能を持たせたマルチモーダルAI（MLLM）に，専門家が持つ「マルチモーダル専門知」を獲得させる方法を開発することである．マルチモーダル専門知とは，インフラの維持管理や災害リスク評価，自動車の運転など多岐にわたる実社会の問題解決において必要な，視覚と言語を組み合わせた専門的な知識や技能を指す。これまでの研究において，MLLMの基本的な画像理解能力を拡張するアーキテクチャ設計および学習方法について検討を進め，多様な画像情報の抽出可能性に関する基礎的な有効性を確認した．今年度はさらに専門知獲得のためのより高度な情報抽出を可能とする新規アーキテクチャの設計を進め，より実践的なアプリケーションにおいて，MLLMの実問題解決能力を改善することを目指す．研究成果は論文や公開データとして広く社会に還元し，国内外のAIの開発および実用化を加速する。	国立大学法人東北大学	岡谷　貴之
64	深層学習モデルのハイブリッド圧縮手法とその最適化に関する研究	gch51614	AIの飛躍的進展を支える基盤技術である深層学習モデル(AIモデル)は、近年ますます深層化・大規模化が進み、推論精度の向上が実現されている一方で、学習・推論に伴う計算コストや消費電力の増加により、エッジデバイスやモバイルデバイス上での実装が困難となっている。そのため、プルーニング、量子化、知識蒸留といったモデル圧縮技術が提案されてきたが、単一の圧縮手法ではモデル削減の限界があり、それを超えると、更なる圧縮は期待しにくい。そして近年、複数の圧縮手法を組合せたアプローチが開発されているが、その組合せの必要性、圧縮手法の適用順序がモデル性能に与える影響、さらに各手法における最適な圧縮率については、まだ十分に解明されていない。本研究は、複数の圧縮手法の組合せに着目し、その適用順序および最適な適用方法を明らかにすることで、ハイブリッド圧縮手法の確立を目的とする。これにより、各手法の特性を最大限に活かし、限られた資源環境下でAIモデルの実用性を大幅に向上させ、より多くの分野におけるAI技術の普及に貢献することが期待される。	学校法人　東洋大学	田　丹鶴
65	A Knowledge-aware Multi-tasks-based Disease Network Construction on Biomedical Literature	gac50543	In this research, we will introduce a knowledge-aware neural disease network that will extract such as diseases, proteins, genes, and their relations events, those are found in scientific articles on idiopathic pulmonary fibrosis (IPF).	National Institute of Advanced Industrial Science and Technology	Sohrab Mohammad Golam
66	深層学習を利用した非一般画像情報処理技術の展開	gcf51214	本研究では、ラベル不足と高ノイズ環境に置かれた医用画像、および意味と視覚印象が重層する文字文書画像という“非一般画像”に対し、ラベル効率学習と印象‐意味マルチモーダル表現学習を統合した深層学習基盤を一年で構築する。自己教師・弱教師を組み合わせ、センサ特性や書体潜在変数を注入した拡散生成モデルを開発し、医療診断支援と書体・印象解析を同時に高度化する。開発した手法のコードを公開し再現性を担保、サーバ資源を活用して計算集約的実験を推進することで、専門家依存の課題を克服し、非一般画像処理の新たな可能性を切り拓く。特に、少量ラベルでの診断補助モデル運用と、多様書体の印象推定機能を実証し、非一般画像に特化した次世代AI研究の基盤を提供する。さらには国内外の共同研究を促進する。	九州大学	内田誠一
67	深層学習技術を用いた映像解析による動物園動物の行動分析	gcg51458	動物園では、飼育動物(多くが希少種)に対する理解を深め、よりよい飼育・動物福祉・展示を実現するために、動物の様子を監視カメラで記録・蓄積し、観察や研究に活用している。従来、観察は目視で行われてきたが、継続記録された映像は膨大になるため、長期間にわたる網羅的な観察を多種多様な動物に対して行うのは困難であった。本研究では、このような動物の行動観察に、深層学習技術を用いる。蓄積された膨大な監視カメラ映像から、動物の行動をデータとして抽出する機械学習モデルを適用し、目視での観察では得られなかった緻密な行動データの抽出を行えるようにする。特に、動物園で行われる行動観察は、学術的関心から動物福祉、教育普及での利用まで幅広い観点で行われ、目的・内容・対象種は幅広い。このような入出力データの多様性に対し、VLM等の先進的な機械学習モデルの特性を生かし、柔軟に対応可能とすることを目指す(科研費基盤研究(B)24K00167)。	公益財団法人京都高度技術研究所	吉田信明
68	高解像度人間基盤モデルの構築	gae50891	Meta社のSapiensなど高解像度人間画像基盤モデルは、身体の関節だけでなく手指の姿勢の検出を行うwhole-body pose estimationタスクなどのfine-grainedの人間の認識を高性能に実現できるため注目を集めている。しかしながら、これらのモデルは、Vision Transformerを用いたネットワーク構造を採用しているため、計算コストが高くリアルタイムアプリケーションに利用することが難しいなどの課題がある。本研究開発では、リアルタイム実行可能な高解像度人間画像基盤モデルの構築を目指す。開発した基盤モデルを拡張して、三次元認識タスクだけでなく生成タスクやロボット基盤モデルへの適用も目指す。	産業技術総合研究所	吉安祐介
69	産業現場でのロボットの自動を目指すマルチモーダル基盤モデルの開発	gag51454	「産業現場タスクの自動を目指すマルチモーダル・ロボティクス基盤モデルの開発」において、教示データ（人間がロボットを操縦して取得したデータや人間がタスクを実行する様子を計測したデータ）をもとに、テキスト等の指示に応じてロボットに日常環境や製造工程の多様なタスクスキルを獲得させることを目的として、マルチモーダルな深層学習モデルの開発やロボットへの組み込みを行う。	産業技術総合研究所	元田智大
70	視覚・言語基盤モデルの開発	gah51624	これまで日本語に強い言語基盤モデルSwallowの開発を行なってきたが、本研究では視覚・言語基盤モデルの開発及びそのためのデータセットやハイパーパラメータの検証を行う。	産業技術総合研究所	横田理央
71	深層学習による系列学習	gcg51420	深層学習により、言語情報や時系列データなどの系列予測を実現する。言語情報については、大規模言語モデルに対するファインチューニングによる対話や知識獲得の性能向上を目指す。時系列データ解析においては、生成モデルにより生成された人工データによる深層学習モデルの事前学習を実施し、その効果を検証する。	学校法人トヨタ学園　豊田工業大学	佐々木裕
72	大規模言語モデルを用いた金融市場における気候変動リスク計測に関する研究	gch51625	本研究は、大規模言語モデル（Large Language Models, LLM）と金融分野のテキストデータを活用して、気候変動リスクの新たな定量的評価手法を構築し、そのリスクが日本の金融資産価格および金融機関経営に与える影響を明らかにするものである。従来の金融リスク分析では主に数値データが用いられてきたが、気候変動に関する情報は定量化が難しく、多くが非構造化テキストとして存在する。特に新聞記事、有価証券報告書、企業の適時開示資料といった情報源には、重要な気候関連リスク情報が含まれており、LLMを用いることでその抽出・構造化が可能となる。本研究では、日本の金融市場を対象に、LLMを用いてテキストから気候変動に関連する情報を抽出・指標化し、従来の金融データと統合する形で、リスクの影響を産業別・金融機関別に分析する。これにより、気候変動リスクの可視化とその経済的影響の理解を深め、脱炭素社会に向けた金融政策・投融資戦略の高度化に資する基盤的知見を提供する。	横浜国立大学	五島圭一
74	マルチモーダルAIの多様な実社会の課題解決への応用研究	gch51629	本研究の目標は、視覚機能を備えた大規模言語モデル＝マルチモーダル AI（MLLM）を、多様な実社会の課題解決に応用することである。その鍵となるのが、専門家が保持する視覚と言語を統合した高度な知識・技能――「マルチモーダル専門知」――を AI に獲得させることである。マルチモーダル専門知は、インフラ維持管理、災害リスク評価、自動車運転などの領域で不可欠な要素である。これまでに、MLLM の画像理解能力を拡張するアーキテクチャ設計と学習手法を検討し、有効性を示す知見を蓄積してきた。今後はこれらを発展させ、実践的アプリケーションにおける問題解決性能を一層高める。得られた成果は論文および公開データとして広く社会に還元し、国内外の AI 研究と実用化を加速する。	理化学研究所	岡谷　貴之
75	計算効率の良い機械学習法の開発	gcg51430	本研究は、ディープラーニングにおける学習および推論フェーズの計算負荷を軽減し、効率的かつ高精度なモデルの実現を目指すものである。リソース制約のある環境でも深層学習が適用可能となるよう、軽量なネットワーク構造の設計やデータ利用効率の高い学習手法に焦点を当てる。	千葉工業大学	重藤　優太郎
76	直接遷移型半導体にて生じる再帰的に生じる量子・光現象に関する研究	gch51632	直接遷移型半導体にて生じる再帰的に生じる量子・光現象に関する研究を行う。具体的には、高い量子効率を有するバルク結晶内にて生じるフォトンリサイクリング（PR）現象や、電気的に中性な励起子が空間的に輸送され、PRや正孔生成などを通じてデバイスの電気特性に影響を及ぼす可能性など、新奇現象・応用をシミュレーションにて予測することを主たる目的とする。当方では主に実験的に上記の現象を評価しているが、明らかなPRの発生を示すデータ（量子効率が低い場合には見られない発光スペクトルの変化）などが得られており、時間・空間的なキャリア輸送を与えられたデバイス構造を考慮した精度の高いシミュレーションが必須となる。事前検証では、モデル計算への再帰的な素過程の導入により、計算の不安定化がみられているため、AIを活用したメッシュの効率的作成や収束性の観点での安定性向上などに力点を置いて研究を進めたい。	大阪大学	小島　一信
77	解析可能な経路予測モデルの開発	gch51634	本研究では、深層学習モデルを用いて道路利用者の進路を予測する手法を提案する。自動運転技術は、周囲の状況を認知し、判断し、実際に自動車を操作するまでをコンピュータが行う技術である。このうち「判断」の部分は、まだ実用化が十分に進んでいないのが現状である。この課題を解決するために、深層学習による意思決定の仕組みを取り入れる試みが進められている。自動車が進む方向を決めるうえで、周囲の車など他の道路利用者の動きを正確に予測することは非常に重要である。そこで本研究では、そのような進路を予測するモデルの開発に取り組む。	東北大学	佐野　修弥
78	ＡＩの安全性確保に関する研究開発・検証等の推進事業／日本語版医療特型ＬＬＭ化の社会実装に向けた安全性検証・実証	gch51639	本研究は、NEDO 2025年度採択事業「AIの安全性確保に関する研究開発・検証等の推進事業／日本語版医療特化型LLMの社会実装に向けた安全性検証・実証」の一環として、ABCIを用い、日本語医療特化型LLMの開発・検証を行うものです。最新のオープンモデル（例：Llama 3、Qwen、MoE系など）に対し、日英の医学論文・書籍・電子カルテ等をもとに構築した高品質な医療データや大規模合成データを継続事前学習に用い、さらにDPOやGRPOなどの手法で事後学習を行います。電子カルテ標準化や創薬レジストリ構築などの実用ユースケースを想定し、安全で高性能な国産モデルを目指します。	さくらインターネット株式会社	小西　史一
79	マルチモーダル実況生成とその評価	gag51470	動画やセンサーデータからリアルタイムに実況を生成する言語生成技術・音声合成技術の開発を行う．基盤となるマルチモーダルLLMをファインチューニングしたり，センサーデータを効果的にプロンプト表現に変換する手法を開発し評価する。	産業技術総合研究所	石垣　達也
80	時空間複雑データを対象とした機械学習モデルの研究	gcc50557	科研費の挑戦的萌芽研究１件と基盤B１件の実施のためのコンピューティングパワーとして利用を希望しています。	上智大学情報理工学科	矢入　郁子
81	相関行列に基づくスケーラブルな正則化法の研究	gcg51473	教師なし画像表現学習用に開発した, 相関行列や共分散行列を計算せずに特徴量無相関化を行う手法 (Shigeto, Shimbo et al. CVPR 2023) を発展させる. 無相関化のみならず相関行列・共分散行列に基づく正則化や, その他の目的関数に適用可能なフレームワークを実現するための研究開発を行う.	千葉工業大学	新保　仁
82	深層学習モデルの効率的な構築および運用のための最適化に関する研究	gce51075	深層学習モデルや大規模言語モデル等の効率的な構築や運用を実現する最適化技術に関する研究開発を行う。特に、大規模言語モデル等のモデルマージ、軽量化、プロンプト設計に関わる最適化、深層学習モデル等のアーキテクチャ探索やハイパーパラメータ最適化、自動機械学習技術の研究開発を実施する。	横浜国立大学	白川　真一
83	相関行列に基づく機械学習法に関する研究開発	gcf51163	本研究では，高次元データにおける相関情報の計算コスト問題に着目し，既存の無相関化技術を一般化した軽量フレームワークを開発します。Transformer などの汎用モデルへ組み込み，計算時間・メモリ消費を削減しつつ相関行列・共分散行列を活用可能にします。	千葉工業大学	重藤　優太郎
84	認知的AIエージェントによるヒューマン・コンピュータ・インタラクションのシミュレーション	gch51651	認知モデルに大規模言語モデルを組み込んだ「認知的AIエージェント」を開発し、SNS等のウェブメディアやインタラクティブデバイスとユーザのインタラクションを再現する。これにより、ヒューリスティクスや認知バイアスに起因するインタラクションの失敗、誤情報の拡散などの不正利用の背後にあるユーザの認知プロセスを解明する。ABCIを、認知実験データによるLLMのファインチューニングと、エージェントシミュレーションを実行に利用する。	東京都立大学	福地　庸介
85	大規模言語モデル等の透明性・信頼性の確保に向けた研究開発	gch51650	大規模言語モデル構築のための性能解析・モデリング・分散並列事前学習、モデルの評価・分析・原理解明、モデルの性能・安全性・信頼性向上、マルチモーダル型AIによる実世界インタラクションシステム、対話処理性能向上に関する研究開発を行い、大規模言語モデル等の透明性・信頼性の確保に資する。	大学共同利用機構法人情報・システム研究機構	黒橋　禎夫
86	深層学習の予測性能向上のための効率的なデータ拡張技術および追加学習技術の開発	gah51657	様々な応用分野において単一のタスクでは高品質な学習用データが不足し、高い予測性能をもつモデルを学習するのが難しいという問題点がある。そこで、学習データにノイズや左右反転等の変形を加えることでデータ数を増やすデータ拡張が用いられる。本研究では、学習にとって効果的なデータを生成し、かつ効率的なアルゴリズムによって計算コストを抑えたデータ拡張技術の開発を行う。また並列して、大規模AIの典型的な設定である異なるタスク間で知識転移する問題設定においても実験検証を行う。複数の大規模データセットやニューラルネットワークを用いて検証するほか、既存手法との比較やハイパーパラメータの影響について分析するため、多数の学習を行う必要がある。	産業技術総合研究所	高瀬　朝海
87	大規模ベクトル検索を応用した基盤モデルの拡張と生涯学習に関する研究開発	gch51658	基盤モデルの知識やスキルをモデル内部に固定化せず外部の学習可能なデータベースとして構造化し、そのデータベースが自己組織化しながら基盤モデルと動的に連携する新たなアーキテクチャを研究します。	オムロンサイニックエックス株式会社	西村　真衣
88	科学技術文献に対するメタデータ自動付与に関する研究開発	gch51659	国内外の科学技術文献（論文、予稿集、解説記事等、医薬系分野を含む）に対して索引語（キーワード）や抄録などのメタデータを精度良く自動生成する手法を開発する。いずれのメタデータ項目についても、科学技術振興機構（JST）が過去より蓄積してきた「専門家が人手で付与したメタデータ」を教師データとして、大規模言語モデル等による機械学習アプローチによる開発を行う。	国立研究開発法人科学技術振興機構	水田　寿雄
89	多品種少量生産品の外観検査に有効な人工知能技術の研究開発	gah51661	多品種少量生産品の外観検査は作業者の熟練度やスキルに大きく依存し、作業者への精神的・身体的負荷が高く、技能伝承にも時間がかかっている。これが、企業の製造現場において大きな問題となっている。実世界の問題にはそれぞれ固有の考慮すべき点が複数存在するため、各問題に対する最適なAIモデルの構築には、より多くの現場での情報が必要となっている。そのため、熊本県産業技術センターが所有する生産品のデータを産総研が持つ人工知能の要素技術を融合し、多品種少量生産品の外観検査に有効な人工知能技術を研究開発することを検討する。	産業技術総合研究所	KIM Wonjik
90	信頼できる大規模言語モデルの研究	gch51662	信頼性の高い言語処理システムの実現を目指し、最先端の大規模言語モデル（LLM）に対して構造的・機能的・動的など様々な観点から内部機序の解明を行い、その成果を活かしてLLMの信頼性を高める方法を探究する。	北陸先端科学技術大学院大学	井之上直也
91	人間の広範な高次認知機能の基盤モデルの有効性の検証と開発	gch51673	2025年7月に人間の広範な高次認知機能の基盤モデルが発表され、多くの実験タスクで人間の行動とバイアスを再現している (Binz+ 2025 Nature)。これは、基礎心理学のみならず、神経科学、計算論的精神医学、計算論的社会科学など、多くの重要な研究分野の方法論を塗り替える可能性がある。そこで、本テーマでは当該基盤モデルの科学的検証とモデル／データ両面での拡張を試みる。	東京電機大学	高橋達二
92	フィジカルAIシステムの３Dシミュレーション環境の構築と安全性・信頼性・説明性に関する研究開発	gah51671	Embodied AIは、３Dシミュレーション環境内での強化学習や模倣学習により、言語で指示されたものを探すなどのナビゲーション行動を学習する。LLMなどの生成AIとの融合により、より高度で複雑な行動生成が可能になってきており、生活空間で人を支援するロボットなどへの搭載に期待されている。しかし、これまでのEmbodied AIの実装・評価方法は現実世界に対応できていない。本研究では、暮らし領域のフィジカルAIシステムの安全性実装評価技術の研究開発を行う。今年度は、リアリティの高いシミュレーションフレームワークを構築するために、Gaussian splattingなどの自由視点生成技術を用いて複数視点画像から住居屋内環境を簡便に三次元再構成する技術を開発するとともに、AirBnB民泊施設などの国内に存在する住居の内部を多数撮影した多視点画像データを収集し、住居三次元環境データセットを構築することを目指す。また、従来の成功率と最短経路と異なる衝突回避などのEmbodied AIの安全性・信頼性・説明性に関する評価指標の検討や部屋の乱雑さをコントロールできるEmbodied AIシミュレーションフレームワークを開発し、AIセーフティー基準を活用したEmbodied AIロボットシステムの学習評価ツールを構築する。	産業技術総合研究所	吉安祐介
93	ブラジル・アマゾン域における森林伐採予測手法の構築	gah51677	地球上に存在する4割の森林資源はブラジル・アマゾン域にあるとされ、世界規模の温暖化対策としてアマゾン域での違法伐採対策が求められており、複雑なパターンが予想される未来の伐採予測にAIの活用が計画されている。森林伐採のパターンには過去の伐採履歴や伐採木材搬出のための道路などと関係が深いことが知られている。そこで本研究では広大なアマゾン域を網羅できる衛星画像を学習データに用い、道路検知AIによるアマゾン広域での高頻度な道路情報更新を目的とする研究開発を実施する。またその結果からブラジル・アマゾン域を対象に次に伐採が起こる可能性の高い地点の予測を行うために独自AIモデルの設計・研究開発を行う。	産業技術総合研究所	神山徹
94	AIセーフティ強化に関する研究開発「マルチモーダルAIモデル開発用データのセーフティ管理技術の研究開発」	gah51681	大規模視覚言語モデルをはじめとしたマルチモーダル AI モデル開発用データのセーフティ管理技術の実現を目的とし、構造化知識や外部知識の応用により、入力の意図やデータの不確実性を取り扱う技術、および高度なフィルタリング技術を開発する。開発した技術の有効性を公開データセットを用いてオープン／プロプライエタリなマルチモーダルAIモデルに適用して実証する。大規模視覚言語モデルの学習および推論実験を高速かつ効率的に実施するため、ABCI 3.0を利用する。	産業技術総合研究所	浅田真生
95	若手研究人材によるABCIを用いたディープテック分野の研究開発（令和７年度覚醒プロジェクト）	gah51684	令和7年度覚醒プロジェクトに採択された27名の若手研究人材に各自が提案した研究課題を実施してもらう。このうち、ABCIを活用した独自の研究課題を提案した20名に対して、ABCIを用いた先端的なAI技術に基づいたディープテック分野の研究開発を加速させることで、社会課題解決に貢献する研究人材の育成を行う。	産業技術総合研究所	加藤大
96	拡散モデルを用いた道路インフラ点検の自動化に向けた異常検知システムの開発	gch51685	本研究では、拡散モデルを用いて、道路インフラの異常検知を自動化する高精度なAIシステムを開発する。対象とするのは、①路面の損傷、②不均一な影の除去、③道路設備の破損である。近年、拡散モデルは、構造保持性や高品質な再構成能力を活かして、異常検知や修復タスクへの応用が進められている。特に、異常の種類や位置をラベル付けせずとも、正常なデータのみを学習に用いることで、異常検知を実現できる点に大きな特長がある。拡散モデルは、異常を含む画像に対しても正常なパターンを再構成しようとするため、入力画像と生成画像の差分を解析することで、異常部位を明示的に抽出することが可能となる。道路画像に対してもその適用が始まっているが、実際の道路環境に特有の要素――たとえば木陰による複雑な影、舗装状態のばらつき、設備の経年劣化――に対応した異常検知手法の確立は十分とは言えない。本研究は、拡散モデルの生成的特性を活かしつつ、実環境における多様な異常を高精度に検出可能なモデルの構築を目指す。これにより、点検作業の省力化、安全性向上、さらに将来的な自動運転社会に向けたインフラ基盤の整備にも寄与することが期待される。	国立大学法人茨城大学	関根栄子
97	Self-supervised Learning for Cancer Pathology Foundation Models (SLC-PFM)	gah51694	産総研が主体となって、NeurIPS2025が主催する病理画像基盤モデルコンペティション（https://deeplearningpathology.org/）に参加して研究開発を行う。本コンペティションにおいて、提供された病理画像を用いた、自己教師あり学習による病理画像基盤モデルの開発を行うとともに、産総研で開発した基盤モデル構築・最適化技術の適用を行い、その性能向上を図る。	産業技術総合研究所	野里博和
98	大規模な深層学習モデルの解釈性向上のための研究開発	gch51696	本研究では、大規模言語モデル（LLM）の内部メカニズムを解明し、モデルの透明性・信頼性を向上させるための技術開発を行う。特に、既存のオンプレミス環境では計算量的に困難な規模のモデルに対して、大規模計算資源を用いた解析・制御手法の検証を行う。	The University of Tokyo	野海芳博
99	深層学習における学習データのセーフティ管理技術の研究開発	gah51697	データ不足によるモデルの性能低下や敵対的攻撃によるリスクに対処するために、本研究ではデータ拡張による安全で有用なデータの管理方法および評価指標の確立を行う。学習条件に応じて適切なデータ拡張を選択できるようにするために、データ数や拡張方法などの属性指標と、モデル精度や計算時間などの性能指標の関係を可視化する。複数のデータセットや深層学習モデルを用い、様々な属性指標と性能指標のもとで網羅的な学習を行うことによって、典型的な拡張方法のカタログ化を進める。	産業技術総合研究所	高瀬朝海
100	大規模言語モデル等の自然言語処理を中心とした最先端教育AIとその周辺技術の研究開発	gca50048	本課題はJSTさきがけ「大規模言語モデル上での学習者の思考過程シミュレーションによる教育変革基盤技術」と科研費「教育上の有用性を考慮した「知識の難しさ」を推定できるリーダビリティ判定技術の研究」に関連して行う。本課題では、テキストの内容を理解し、学習者の思考過程をシミュレートして難しい箇所等を予測することで学習者に個別適応し、人間の教員とも協働できる高い解釈性を持つ最先端AIモデルとその周辺技術を、大規模言語モデル（LLM）に対するファインチューニング・文脈内学習・継続学習等を通じて研究開発する。このLLMは、テキストデータや学習者の反応や回答データから、テキストの難しさや学習者の能力や状態を推定し、学習者にとって有用な支援・助言・ヒントを予測・生成を通じて与えることを主な目的とする。LLMが使用するデータは公開データ等を中心として適切に使用する。作成したLLM等のモデルやLLMが出力した難易度等のデータは原則公開する。また、教育AI研究として学術的に高く評価されるAIED, EDM, LAK等の査読付き国際会議等での論文公開を通じても最先端AIの研究開発に貢献する。	東京学芸大学	江原遥
101	「山梨らしさ」を評価する感性評価モデル構築に適した学習画像に関する研究	gch51700	AIにより画像の地域らしさを評価するための感性評価モデルの構築を目的として，画像の「山梨らしさ」を評価する感性評価モデルの構築を行う．あわせて，感性評価モデルの評価過程を可視化し，AIの注目領域を検証することにより，感性評価モデル構築に適した学習画像についても検討を行う．	山梨県産業技術センター	中村卓
102	大規模言語モデル等の透明性・信頼性の確保に向けた研究開発	gch51701	大規模言語モデル等のチューニングに関し、データ設計・前処理、継続学習・微調整手法、評価・分析、効率化、堅牢性・安全性の向上に関する取り組みを広く促進し、大規模言語モデルの性能・信頼性向上に資する。	大学共同利用機構法人情報・システム研究機構	黒橋禎夫
103	公共空間におけるAIセーフティ強化に関する研究開発	gcc50584	公共空間についての学習データ・評価データの作成、およびプライバシー対策技術の研究開発を行う。	産業技術総合研究所	大西正輝
104	人工知能を用いた大規模交通流データの解析	gcc50599	生成AIやデータ同化などを用いて大規模な交通流データの解析を行う．	産業技術総合研究所	大西正輝
106	自動運転における環境認識および安全性評価などに伴うAI開発	gch51704	本研究では，自動運転で活用するAIモデルの学習や自動運転環境での適合性を検証する．自動運転車両に搭載されているカメラとLiDAR，レーダなどのセンサから得られる膨大なデータをもとに，認識モデルやプランナーモデルなどの高度化を実施する予定である．また，近年急速に発達している大規模言語モデルのファインチューンなども検討している．自動運転車両に搭載されているセンサを適合させ，マルチモーダルLLMを構成し，自動運転システムの安全性評価などに適用する．	金沢大学	福田有輝也
108	継続的ベイズ推論の改善	gch51727	深層学習では全てのデータが揃った状態で学習を行い、一度学習したモデルは更新できないのが一般的であるが、本利用課題では、継続的に学習しつづけるモデルの開発を目指す。これまでにも、継続的な深層学習に関する試みはいくつか存在するが、技巧的な手法を用いて経験的な性能向上を重視するものが多い。これに対し、本利用課題では、数学的に厳密なベイズの原理に基づく理論により継続学習を根本的に見直すことを目的とする。	理化学研究所	Khan Emtiyaz