あふれる情報の中から必要な情報を素早く直観的に把握でき、情報収集時間を大幅に削減
三菱電機株式会社は、当社AI技術「Maisart®(マイサート)※1」を用いて、膨大な資料群から キーとなる単語や著者、引用関係、図表における全体と部分の関係情報などを獲得して情報のつ ながりをグラフ構造で表す知識グラフを自動構築し、入力したキーワードを起点に情報の関連性 をたどる「知識探索支援技術」を開発しました。これにより、必要な情報を素早く網羅的・直観 的に把握でき、情報収集時間の大幅な削減に貢献します。
情報過多な現代において、あふれる情報の中から自分にとって必要な情報を見つけ出すには多 くの時間がかかります。知りたい情報、興味のある情報に素早くアクセスするためには、資料を あらかじめデジタル化(電子化)しておくだけではなく、資料内あるいは資料間の情報の関係を 構造的に管理しておく必要があります。
本技術は、AIによって重要な情報を自動獲得し、また情報間の関係を自動推定することで、さ まざまな資料やデータを構造的にデジタル化します。次に、情報の探索時には、帯の太さで関連 の強さを可視化することで、例えば入力したキーワードと一番関連が強い人物を特定できるなど、 知りたい情報、興味のある情報、これまで気付かなかった情報に素早く直観的に辿り着くことが できます。
開発の特長
- 知識グラフを自動構築し、さまざまな資料やデータを構造的にデジタル化
- AI がテキストのみならず図表やプレゼン資料、画像、音声などのデータから、キーとなる単 語や著者、引用関係、図表における全体と部分の関係情報などを獲得し、知識グラフを自動構築することで、さまざまな資料やデータを構造的にデジタル化
- 業界で初めて※2、図形と文字が組み合わされた資料の解析を実現
- 従来は人手で構築していた知識グラフを自動構築できるため、関連性をたどる知識探索をよ り短い時間で実現でき、低コストで導入可能
- 情報の関連性を直観的に把握することで、情報収集時間を 41.7%削減
- 業界で初めて※2、サンキー・ダイアグラム※3 の帯とその太さを用いた情報の関連性可視化を実現したことで、所望の情報を直観的に把握可能とし、短時間での知識の探索を支援
- 資料の中身を読まなくても情報の関連性を俯瞰できるため、複数の文書やファイルから特定の文字列を検索する従来の全文検索と比べて、情報収集時間を 41.7%削減※4
今後の予定・将来展望
2027年までの運用開始を目指し、当社や子会社の三菱電機インフォメーションシステムズ株式 会社において、過去の資料やデータの再活用・部門間相互活用において、知識探索支援技術の実 業務への適用と検証を進めていきます※5。
特長の詳細
- 知識グラフを自動構築し、さまざまな資料やデータを構造的にデジタル化
情報過多な時代において、さまざまな形式の資料から必要な情報を見つけ出すためには、資料 をデジタル化(電子化)するだけでなく、資料内あるいは資料間の情報の関係を構造的に管理す る必要があります。特に、図表から知識を獲得するには、図形やセル結合などの意味を人が判断する必要がありました。
今回、当社AI技術「Maisart」により、テキストのみならず図表やプレゼン資料、画像、音声などのデータから、知識グラフを自動構築する技術を開発しました。特に、図表やプレゼン資料な どの図形と文字を組み合わせて表現された資料からは、業界で初めて、資料中の図形や表、テキ ストを解析し、オブジェクトの種類と位置情報から図表における全体と部分の関係情報などを推 定することで、知識グラフを自動構築します(図1)。
例えば図1の場合、従来、資料Aに「ロボット技術」や「XXプロジェクト」のキーワードが含ま れていることは全文検索技術で分かりましたが、「ロボット技術」と「XXプロジェクト」の関係ま では分かりませんでした。今回開発した技術では、テキストや図表といったオブジェクトの種類 や位置情報などをAIが事前に学習することで、オブジェクトの組み合わせや他の要素との組み合 わせに応じて、キーワード間の関係を自動推定します。これにより、「屋内自動走行」と「XXプロ ジェクト」が同一セットである(「屋内自動走行」が「XXプロジェクト」に属する)ことや、「ロ ボット技術」と「XXプロジェクト」が同一行である(「XXプロジェクト」が「ロボット技術」に 関するプロジェクトである)ことが分かるようになりました。これにより、テキスト解析のみで は分からなかった、図表で表現されている関係性も含めた、より詳細な知識グラフが完成します。 複数の資料から得られた知識グラフを統合することで、これまで見えていなかった関係も含めた、 より精緻な知識グラフを構築できます。
- 情報の関連性を直観的に把握することで、情報収集時間を 41.7%削減
多くの資料から知識グラフを構築した場合、情報とそのつながりの数は膨大になり、知識グラ フを描画しただけでは人間が情報間の関連性を把握することは難しく、構造化した知識を十分に活かすことができませんでした。 今回、当社AI技術「Maisart」により、業界で初めて、知識グラフから情報間の関連の強さを推論し、サンキー・ダイアグラムの帯とその幅を使って関連の強さを表す技術を開発しました(図2)。
例えば、「屋内自動走行するロボット」について社内で詳しい人物を調べるため、「屋内自動走 行 ロボット技術」というキーワードを入力するシーンを考えます。この時、事前に構築した知 識グラフから「屋内自動走行」「ロボット技術」に紐づく人物は3人見つかりますが、誰が一番詳 しいかは直観的には分かりません。そこで、入力したキーワードと複数見つかった人物との関連 性を知識グラフから推論します。さらに、サンキー・ダイアグラムを用いて、関連性が強いほど 帯を太く表示することでキーワードと人物の関連の強さを直観的に把握可能とし、知識の探索を 支援します。
これにより、技術資料から構築した知識グラフを用いて技術キーパーソンを探すタスクにおい て、従来の複数の文書やファイルから特定の文字列を検索する全文検索と比べて、情報収集時間 を41.7%削減しました。
商標・特許関連
商標 「Maisart」 三菱電機株式会社の登録商標です。
※1 Mitsubishi Electric’s AI creates the State-of-the-ART in Technology の略。 全ての機器をより賢くすることを目指した当社の AI 技術ブランド
※2 2022 年 5 月 31 日現在、当社調べ。国内メーカーの提供する知識処理サービスにおいて
※3 工程間の流量を表現するために用いられるフロー図の一種
※4 技術資料から構築した知識グラフを用いて、技術キーパーソンを探すタスクにより評価(当社調べ) ※5 実業務への適用と検証に際しては、プライバシーへ配慮し、対応して参ります
本件の参照先:https://www.mitsubishielectric.co.jp/news/2022/0531-c.html