日本語AIでPubMedを検索
ブラジルにおけるCovid-19動態の予測。データドリブンアプローチ
Forecasting Covid-19 Dynamics in Brazil: A Data Driven Approach.
PMID: 32679861 DOI: 10.3390/ijerph17145115.
抄録
本論文の貢献は2つある。第一に、Covid-19パンデミックの動態を予測するためのデータ駆動型の新しいアプローチを紹介する。第二に、このアプローチを用いて得られた結果を、2020年5月4日時点での予測をもとに、ブラジルの各州で報告し、議論することである。予備研究として、我々はまずLong Short Term Memory for Data Training-SAE(LSTM-SAE)ネットワークモデルを使用した。この最初のアプローチでは、やや期待外れの結果となりましたが、他のタイプのANNをテストするための良いベースラインとなりました。その後、ANNモデルの学習に用いる国や地域を特定するために、パンデミックが進行している世界の地域のクラスタリングを行いました。このクラスタリングは、パンデミックの早期流行に対する国の対応を表す特徴量を人手で加工したものであり、得られた異なるクラスタを用いて、モデルの学習に用いる国を選択する。最終的に保持されるモデルは修正オートエンコーダーネットワークであり、これらのクラスタで訓練され、ブラジルの州の将来のデータを予測するために学習されます。これらの予測は、ピークや確定症例数など、病気に関する重要な統計情報を推定するために使用されます。最後に、カーブフィッティングが行われ、MAEの出力に最もフィットする分布を見つけ、パンデミックのピークの推定値を洗練させます。予測された感染者数は100万人以上に達し、各州に分散しており、サンパウロを筆頭に約15万人の確定症例が予測された。この結果は、ほとんどの州で感染のピークが2020年5月後半と推定されているブラジルでは、パンデミックがまだ成長していることを示しています。パンデミックの終了予想(97%の症例が結果に到達)は、州によって異なりますが、2020年6月から8月末までの間に広がっています。
The contribution of this paper is twofold. First, a new data driven approach for predicting the Covid-19 pandemic dynamics is introduced. The second contribution consists in reporting and discussing the results that were obtained with this approach for the Brazilian states, with predictions starting as of 4 May 2020. As a preliminary study, we first used an Long Short Term Memory for Data Training-SAE (LSTM-SAE) network model. Although this first approach led to somewhat disappointing results, it served as a good baseline for testing other ANN types. Subsequently, in order to identify relevant countries and regions to be used for training ANN models, we conduct a clustering of the world's regions where the pandemic is at an advanced stage. This clustering is based on manually engineered features representing a country's response to the early spread of the pandemic, and the different clusters obtained are used to select the relevant countries for training the models. The final models retained are Modified Auto-Encoder networks, that are trained on these clusters and learn to predict future data for Brazilian states. These predictions are used to estimate important statistics about the disease, such as peaks and number of confirmed cases. Finally, curve fitting is carried out to find the distribution that best fits the outputs of the MAE, and to refine the estimates of the peaks of the pandemic. Predicted numbers reach a total of more than one million infected Brazilians, distributed among the different states, with São Paulo leading with about 150 thousand confirmed cases predicted. The results indicate that the pandemic is still growing in Brazil, with most states peaks of infection estimated in the second half of May 2020. The estimated end of the pandemics (97% of cases reaching an outcome) spread between June and the end of August 2020, depending on the states.