ニュースの要約
- JAPAN AI株式会社が、画像とテキストを統合的に理解する「マルチモーダルRAG」を実装
- 図面検索や、グラフの詳細情報を抽出して回答生成が可能になった
- 製造業の技術資料活用を大幅に効率化できるようになった
概要
JAPAN AI株式会社は、画像とテキストを統合的に理解するマルチモーダルRAG(Retrieval-Augmented Generation)を実装しました。
これまで製造業を含む多くの企業のAI導入と伴走支援を行ってきた中で、技能継承と知見活用の課題に直面していることが明らかになっていました。設計図面、作業手順書、品質管理データなどの膨大な技術資料が社内に存在するものの、長年蓄積された技術的ノウハウや経験値が部門や個人に分散して管理されており、必要な時に適切な情報にアクセスすることが困難な状況となっていました。
従来のRAGでは、社内に点在していた図面などの技術文書を検索して見つけることはできていましたが、その図面に記載された具体的な数値や仕様を抽出し、回答を生成することは困難でした。今回マルチモーダルRAGが実装されたことで、PDFファイル内のテキストと画像を自動判別し、両方の情報を統合的に理解して、回答を生成することができるようになりました。図面の詳細な寸法情報やグラフのデータなどの情報を理解して読み取ることが可能となりました。
この機能を使えば、図面検索で過去の類似事例を効率的に参照できるようになり、設計者は新規設計の参考資料として活用できます。また、四半期売上推移のグラフから具体的な数値データと傾向分析を含めた包括的な回答を得ることができます。今後は、より複雑な図面や多様なグラフ形式への対応範囲を拡大できるようRAG技術の向上に努め、単なる情報検索を超えた知識活用支援システムとして、製造業をはじめとする各業界の業務効率化と技術革新に貢献していく予定です。
編集部の感想
編集部のまとめ
JAPAN AI:マルチモーダルRAG実装についてまとめました
JAPAN AIが開発したマルチモーダルRAGは、製造業などの企業が長年蓄積してきた膨大な技術資料を有効活用できる新しいソリューションだと言えます。これまで図面などの図形情報から具体的な数値や仕様を抽出するのが難しかったところを、AIが自動的に理解し回答生成することで業務の効率化が期待できます。さらに今後は、より複雑な図面やグラフへの対応範囲を広げていくとのことで、今回の発表は製造業を中心とした企業の技術革新に大きな影響を与えるものと考えられます。編集部としても、この新機能の拡張性と応用可能性に注目しています。
参照元:https://prtimes.jp/main/html/rd/p/000000118.000124536.html
人気記事