日本語AIでPubMedを検索
プライバシー保護型連合学習とドメイン適応を用いたマルチサイトfMRI解析.ABIDEの結果
Multi-site fMRI analysis using privacy-preserving federated learning and domain adaptation: ABIDE results.
PMID: 32679533 DOI: 10.1016/j.media.2020.101765.
抄録
ディープラーニングモデルは、神経画像解析を含む様々なタスクにおいてその優位性を示してきた。しかし、高品質なディープラーニングモデルを効果的に学習するためには、かなりの量の患者情報の集約が必要である。例えば、大規模なfMRIデータセットなどは、集合化する際の取得やアノテーションに時間とコストがかかるため、一度に大量に取得することは難しい。しかし、患者データのプライバシー保護の必要性から、複数の施設から中央データベースを組み立てることは困難である。合同学習では、グローバルモデルをローカルエンティティに送信し、ローカルでモデルを学習し、グローバルモデルの勾配または重みを平均化することで、エンティティのデータを中央集権化することなく、母集団レベルのモデルを学習することができる。しかし、いくつかの研究では、モデルの勾配や重みからプライベートな情報が復元できることが示唆されている。本研究では,マルチサイトfMRI分類の問題をプライバシー保護の手法を用いて解決する.この問題を解決するために,我々は分散型の反復最適化アルゴリズムを実装し,ランダム化機構によって共有された局所モデルの重みを変更する連合学習アプローチを提案する.さらに,異なる部位からのfMRI分布の系統的な違いを考慮して,2つの領域適応法を提案する.我々は、協調的モデル最適化の実用的な側面を調査し、協調学習と代替的な学習戦略との比較を行った。全体的に、我々の結果は、神経画像解析のパフォーマンスを向上させ、信頼性の高い疾患関連バイオマーカーを見つけるために、データ共有なしでマルチサイトデータを利用することが有望であることを示している。本研究で提案したパイプラインは、プライバシーに配慮した他の医療データ解析問題にも一般化することが可能である。我々のコードは https://github.com/xxlya/Fed_ABIDE/ で公開されています。
Deep learning models have shown their advantage in many different tasks, including neuroimage analysis. However, to effectively train a high-quality deep learning model, the aggregation of a significant amount of patient information is required. The time and cost for acquisition and annotation in assembling, for example, large fMRI datasets make it difficult to acquire large numbers at a single site. However, due to the need to protect the privacy of patient data, it is hard to assemble a central database from multiple institutions. Federated learning allows for population-level models to be trained without centralizing entities' data by transmitting the global model to local entities, training the model locally, and then averaging the gradients or weights in the global model. However, some studies suggest that private information can be recovered from the model gradients or weights. In this work, we address the problem of multi-site fMRI classification with a privacy-preserving strategy. To solve the problem, we propose a federated learning approach, where a decentralized iterative optimization algorithm is implemented and shared local model weights are altered by a randomization mechanism. Considering the systemic differences of fMRI distributions from different sites, we further propose two domain adaptation methods in this federated learning formulation. We investigate various practical aspects of federated model optimization and compare federated learning with alternative training strategies. Overall, our results demonstrate that it is promising to utilize multi-site data without data sharing to boost neuroimage analysis performance and find reliable disease-related biomarkers. Our proposed pipeline can be generalized to other privacy-sensitive medical data analysis problems. Our code is publicly available at: https://github.com/xxlya/Fed_ABIDE/.
Copyright © 2020 The Authors. Published by Elsevier B.V. All rights reserved.