富士フイルムは27日、CTやMRIなどで撮影された医用画像に対して、放射線医が作成する読影レポートを構造化する、同社独自の自然言語処理技術「読影レポート構造化AI」を開発したと発表した。放射線医が専門知識に基づき書かれた読影レポートを構造化することで、効率的にデータベース化し活用することが可能となる。
読影レポートは、医師特有の言い回しや医学専門用語を含んだ非定型の自由文で記載されており、レポートの記載内容をそのまま統計情報の作成やAI学習データ、プログラム開発などに活用することが困難だった。
同社は、この課題解決に向けて大阪大学の富山憲幸教授らが構築した過去10年分以上のCT/MRI検査などの読影レポート約20万件のデータセットを活用し、読影レポートを構造化する技術を確立した。構造化とは、文書を構成する要素を分解し、それぞれの関係性を一定の規則に則して整理すること。
同技術は、▽所見文/臓器判定AI▽所見用語抽出AI▽事実性判定AI▽関係性抽出AI――の5プロセスから構成されている。
所見文で用いられる各用語は、医師による言語表現の違いによって、全く同じ意図であっても異なる表現がある場合が多々ある。同社は、国内外で公開されているコーパス(辞書)を参考にしつつ、所見文に使用される表現の意味と関係性を理解し、同義語辞典(約28万語を収録)として整理した。これにより、異なる表現で所見文が記載されていても、その情報は一意に同じ情報として構造化できるようになった。
同技術を同社が評価した結果、所見文の約7割を占める比較的単純な所見文で90%以上、より複雑な主訴に関する所見文で約80%の精度で自動的に構造化できることを確認している。
この技術を活用することで、「過去の類似所見の検索」「各所見の発生確率の統計情報可視化」「新規患者に対する所見例提示」といった従来では開発困難だった、より高度な診断支援AI・IT技術の開発が可能となる。また、最新AIの一つで、生成AIの回答精度向上に寄与する「検索拡張生成AI(RAG)」と同技術により構築したデータベースを活用し「放射線科医の読影アシストAI」開発にも応用できる。
将来的には、同技術で作成したデータベースと医用画像内の所見位値とを紐づける技術を開発することで、様々な疾患を網羅的に見つけるようなAI技術の開発加速が期待される。
なお、同技術は、同社の画像診断に関する知見と、富士フイルムビジネスイノベーションがドキュメント領域で培った自然言語処理技術を融合して開発された。