新しいAIは、マンモグラフィの組織密度を分析することで乳がんを検出します
- 新しいディープラーニングモデルは、マンモグラムの乳房組織を分析し、密度の評価を正確に推定します。
- これらの評価は、乳がんの独立した危険因子です。
- このモデルは1つのマンモグラムを処理するのに1秒もかからず、病院全体で簡単にスケーリングできます。
米国では、乳がんによる死亡率は、肺がん(女性)を除いて、他のどの種類のがんよりも大幅に高くなっています。乳がん.orgによると、米国の女性の約12.4%が、生涯にわたって浸潤性乳がんを発症しています。
マンモグラフィは、低倍率のX線を利用して、スクリーニングと診断のために人間の乳房を分析する方法です。ただし、組織が密集していると、マンモグラムでがんがマスクされるため、このプロセスが困難になる可能性があります。通常、乳房密度の評価は主観的な人間の評価に依存します。結果は、いくつかの要因により放射線科医によって異なります。
現在、マサチューセッツ総合病院(MGH)とMITの研究者は、マンモグラムで高密度の乳房組織を正確に分析する自動化ツールを構築しました。これは、さまざまな種類の乳房組織を区別する方法を学習できるように、何万もの高解像度デジタルマンモグラムでトレーニングされた深層学習モデルです。
新しいマンモグラフィ画像が与えられると、ツールは専門の放射線科医と同じくらい信頼できる密度測定を検出できます。著者によると、これは病院の患者で成功裏に実証されたこの種の最初のAIです。彼らは、この技術は全国に広く実装でき、乳房組織の評価に高い信頼性をもたらすと信じています。
トレーニング
このツールは、学習可能な重みとバイアスを持つニューロンで構成される畳み込みニューラルネットワークに基づいています。彼らは、2009年から2011年にスクリーニングされた39,000人の女性からランダムに取得された58,000を超えるマンモグラフィ画像を含む豊富なデータセットでネットワークをトレーニングおよびテストしました。これらの画像の約41,000がトレーニングに使用され、8,600がテストに使用されました。
各人口統計画像には、4つのグループの標準BI-RAIDS(乳房画像レポートおよびデータシステム)密度評価が含まれています。
- 不均一(ほとんどが密)
- 散乱密度
- 密
- 太っている
トレーニングとテストの段階では、40%近くが高密度で不均一であると評価されました。トレーニングフェーズ全体を通じて、ネットワークには評価用のランダムなマンモグラフィ画像が提供されます。専門家の密度評価と密接に一致する方法でマンモグラムをマッピングすることを徐々に学びます。
たとえば、脂肪の多い乳房組織ネットワークは全体が灰色の領域で薄く見えますが、密な乳房は繊維状および腺状の結合組織で構成されており、白い斑点と太い白い線の密集したネットワークとして表示されます。テストフェーズでは、ネットワークは新しいマンモグラフィ画像を確認し、最も可能性の高い密度グループを推定します。
参照:RSNA放射線学| doi:10.1148 / radiol.2018180694 | MIT
このツールはMGHの乳房画像部門に実装され、隔離されたマシンにインストールされました。通常、マンモグラムが生成され、専門の放射線科医によって実行される評価のために施設に送信されます。必要なすべての調査の後、彼/彼女は各マンモグラムに密度評価を割り当てます。
専門家が施設でスキャンを行うと、このディープラーニングツールによって割り当てられた評価が表示され、さらに拒否または受け入れることができます。
結果
ネットワークは1つのマンモグラムを処理するのに1秒もかからず、多くのお金と多大な人的資源を費やすことなく、市内の病院全体に拡張できます。
バイナリテストの放射線科医評価と深層学習(DL)評価|研究者の礼儀
1月から5月(2018年)の間に、ネットワークは10,000枚以上のマンモグラフィ画像を観察し、乳房が密で不均一であるか、散在して脂肪であるかを判断する必要があるバイナリテストで専門家の間で94%の一致を達成することができました。 4つのBI-RAIDSグループすべてについて、90%の確率で専門家の意見と一致していました。
4つのBI-RAIDSグループの放射線科医による評価と深層学習(DL)による評価|研究者の礼儀
一般的なテスト(トレーニングデータセットに基づく)では、ネットワークは、バイナリテストで87%の時間、4つのBI-RADSグループで77%の時間、放射線科医の解釈と一致しました。
読む:AIは人間の呼吸の病気を嗅ぐことができる|さまざまながんを含む
従来の予測手法では、カッパスコアという名前のメトリックが使用されます。ここで、1は推定が毎回一致することを表し、値が低いほど一致するケースが少ないことを表します。既存の方法の場合、カッパスコアは最大0.6に達しますが、新しいモデルの場合、臨床応用では0.85に達し、一般的なテストでは0.76に達します。これは、新しいツールが従来の手法よりも優れた推定を行うことを明確に示しています。
産業技術