日本語AIでPubMedを検索
局所的な肝臓病変。コントラスト強化USシネ記録を用いたコンピュータ支援診断
Focal Liver Lesions: Computer-aided Diagnosis by Using Contrast-enhanced US Cine Recordings.
PMID: 29072980 PMCID: PMC5831265. DOI: 10.1148/radiol.2017170365.
抄録
目的 コンピュータ支援診断(CAD)システムの性能を評価し、造影剤を用いたUSクリップを用いて、良性と悪性の巣状肝病変(FLL)を分類する際に支配的な超音波検査(US)の特徴を明らかにする。材料および方法 悪性54例、良性51例、不確定性1例のFLLを含む多施設共同試験から、3施設に登録された全被験者の160例のUSデータセットをレトロスペクティブに解析した。105例の良性または悪性病変は、組織学的検査、造影CT、ダイナミック造影MR画像、および/または6ヵ月以上の臨床フォローアップで確認された。データセットには、面内運動を自動的に補正し、面外で取得したフレームを自動的にフィルタリングした3分間のシネクリップが含まれていた。Bモードおよびコントラスト固有の特徴は、ピクセル単位で自動的に抽出され、人工ニューラルネットワーク(ANN)とサポートベクターマシン(SVM)を用いて解析されました。CADの受信機動作特性曲線(AUC)の下の面積は、経験豊富な1人の盲検読者と経験の浅い1人の盲検読者のそれと比較されました。3人目のオブザーバーは、CADのパフォーマンスへの影響を評価するために、シネの品質を評価した。結果 CAD、経験の浅い観察者、経験豊富な観察者はそれぞれ95、100、102のシネクリップを解析できた。SVM、ANN、経験者と未経験者のAUCはそれぞれ0.883(95%信頼区間[CI]:0.793、0.940)、0.829(95%CI:0.724、0.901)、0.843(95%CI:0.756、0.903)、0.702(95%CI:0.586、0.782)であったが、SVMと未経験者の差のみが統計的に有意であった。精度は、CADが経験の浅い観察者と一致した場合は71.3%(94中67;95%CI:60.6%、79.8%)から87.7%(65中57;95%CI:78.5%、93.8%)に、CADが経験の浅い観察者と一致した場合は80.9%(94中76;95%CI:72.3%、88.3%)から90.3%(72中65;95%CI:80.6%、95.8%)に、それぞれ向上した。Bモードの不均一性と造影剤のウォッシュアウトは、すべての反復においてCADによって選択された最も識別的な特徴であった。CADはFLLを分類するために時間ベースの時間強度曲線(TIC)特徴を99.0%(209件中207件)選択したのに対し,強度ベースの特徴では1.0%(209件中2件)の時間で選択した.15のビデオ品質基準のいずれもCADの精度に統計的に有意な影響を与えなかった-すべてのP値は多重比較のためのHolm-Sidakαレベル補正よりも大きかった。結論 CADシステムは、専門家による読影と同等の精度で良性と悪性のFLLを分類した。CADは両方のリーダーの精度を向上させた。TICの時間ベースの特徴は、強度ベースの特徴よりも識別力が高かった。 RSNA, 2017 この論文のオンライン補足資料があります。
Purpose To assess the performance of computer-aided diagnosis (CAD) systems and to determine the dominant ultrasonographic (US) features when classifying benign versus malignant focal liver lesions (FLLs) by using contrast material-enhanced US cine clips. Materials and Methods One hundred six US data sets in all subjects enrolled by three centers from a multicenter trial that included 54 malignant, 51 benign, and one indeterminate FLL were retrospectively analyzed. The 105 benign or malignant lesions were confirmed at histologic examination, contrast-enhanced computed tomography (CT), dynamic contrast-enhanced magnetic resonance (MR) imaging, and/or 6 or more months of clinical follow-up. Data sets included 3-minute cine clips that were automatically corrected for in-plane motion and automatically filtered out frames acquired off plane. B-mode and contrast-specific features were automatically extracted on a pixel-by-pixel basis and analyzed by using an artificial neural network (ANN) and a support vector machine (SVM). Areas under the receiver operating characteristic curve (AUCs) for CAD were compared with those for one experienced and one inexperienced blinded reader. A third observer graded cine quality to assess its effects on CAD performance. Results CAD, the inexperienced observer, and the experienced observer were able to analyze 95, 100, and 102 cine clips, respectively. The AUCs for the SVM, ANN, and experienced and inexperienced observers were 0.883 (95% confidence interval [CI]: 0.793, 0.940), 0.829 (95% CI: 0.724, 0.901), 0.843 (95% CI: 0.756, 0.903), and 0.702 (95% CI: 0.586, 0.782), respectively; only the difference between SVM and the inexperienced observer was statistically significant. Accuracy improved from 71.3% (67 of 94; 95% CI: 60.6%, 79.8%) to 87.7% (57 of 65; 95% CI: 78.5%, 93.8%) and from 80.9% (76 of 94; 95% CI: 72.3%, 88.3%) to 90.3% (65 of 72; 95% CI: 80.6%, 95.8%) when CAD was in agreement with the inexperienced reader and when it was in agreement with the experienced reader, respectively. B-mode heterogeneity and contrast material washout were the most discriminating features selected by CAD for all iterations. CAD selected time-based time-intensity curve (TIC) features 99.0% (207 of 209) of the time to classify FLLs, versus 1.0% (two of 209) of the time for intensity-based features. None of the 15 video-quality criteria had a statistically significant effect on CAD accuracy-all P values were greater than the Holm-Sidak α-level correction for multiple comparisons. Conclusion CAD systems classified benign and malignant FLLs with an accuracy similar to that of an expert reader. CAD improved the accuracy of both readers. Time-based features of TIC were more discriminating than intensity-based features. RSNA, 2017 Online supplemental material is available for this article.