記事

2024年7月8日

胸部X線から肺機能を推定するディープラーニングモデルの多施設共同研究

10.1016S2589-7500(24)00113-4

胸部X線画像だけで強制肺活量と1秒量を推定するAIモデルを日本の5施設のデータで検証し、相応に高い精度が得られたことを報告しました。

論文

A deep learning-based model to estimate pulmonary function from chest x-rays: multi-institutional model development and validation study in Japan

The Lancet Digital Health

https://doi.org/10.1016/S2589-7500(24)00113-4

著者談

今回の研究は、かねて構想していた「胸部X線から肺機能を推定できるか」という疑問に取り組むもので、実は心機能や弁膜症を画像から導き出す先行研究とほぼ同時期に着想を得ました。しかし多施設から大量のデータを集める作業や、その管理体制を構築する段取りに非常に時間を要し、構想から実際に成果をまとめるまでに6年以上を費やしました。さらに査読者との折衝も1年以上かかり、The Lancet Digital Healthの編集委員会とのやり取りに難航する時期もありましたが、結果的に良好な関係を築けたのは大きな収穫でした。本研究の公開後は世界中から問い合わせがあり、私たちの研究室にとって国際的な共同研究や企業との連携が加速する契機となりました。

論文概要

2024年7月8日にThe Lancet Digital Healthで公表した本研究では、2003年から2021年までに日本の5施設(A〜E)で収集した胸部X線画像とスパイロメトリ検査結果を基に、ディープラーニングを用いて強制肺活量(FVC)と1秒量(FEV1)を推定できるモデルを構築しました。合計14万件以上の胸部X線と肺機能検査のペアデータを解析対象とし、A〜Cの施設を訓練・検証・内部テスト用に、DとEの施設を外部テスト用としました。

論文詳細

開発したモデルを外部テスト用データに適用したところ、FVC推定の相関係数は施設Dで0.91(99%信頼区間0.90–0.92)、施設Eで0.90(0.89–0.91)を示しました。MSE(平均二乗誤差)は約0.17 L²、MAE(平均絶対誤差)は約0.31 Lと、実測値との差は比較的小さい値でした。FEV1でも施設DとEの相関係数がともに0.91程度となり、MSEは0.11〜0.13 L²と一定の精度で推定できています。興味深い点として、肺全体の形態変化や末梢の線状影など、呼吸器疾患を反映するとされる特徴をAIモデルは多角的にとらえていました。これにより、スパイロメトリを実施しづらい方でも肺機能の概況を把握しやすくなる可能性があります。ただし、患者背景や疾患の種類による推定精度の差は依然存在し、より幅広い集団や病態を含む追加検証が望まれます。今後は臨床情報を組み合わせ、画像検査の適切なカスタマイズや呼吸器疾患の早期診断に貢献できるよう、さらなる研究を進めていきたいと考えています。