あなたは歯科・医療関係者ですか?

WHITE CROSSは、歯科・医療現場で働く方を対象に、良質な歯科医療情報の提供を目的とした会員制サイトです。

日本語AIでPubMedを検索

日本語AIでPubMedを検索

PubMedの提供する医学論文データベースを日本語で検索できます。AI(Deep Learning)を活用した機械翻訳エンジンにより、精度高く日本語へ翻訳された論文をご参照いただけます。
Bioinformatics.2020 Jul;btaa629. doi: 10.1093/bioinformatics/btaa629.Epub 2020-07-17.

OPUS-TASS: アンサンブルニューラルネットワークに基づくタンパク質バックボーンのねじれ角と二次構造予測器

OPUS-TASS: A Protein Backbone Torsion Angles and Secondary Structure Predictor Based on Ensemble Neural Networks.

  • Gang Xu
  • Qinghua Wang
  • Jianpeng Ma
PMID: 32678893 DOI: 10.1093/bioinformatics/btaa629.

抄録

動機:

配列からのタンパク質背骨のねじれ角(φとψ)と二次構造の予測は、タンパク質の構造予測において重要なサブプロブレムです。ディープラーニングアプローチの開発により、これらの精度は大幅に改善されてきました。長距離相互作用を捉えるために、多くの研究では双方向リカレントニューラルネットワークをモデルに組み込んでいる。本研究では、2つの残基間の相互作用を任意の距離で理論的に捉えるために、最近提案されたTransformerというアーキテクチャを導入し、修正する。さらに、マルチタスク学習を利用して、関連するタスクを学習プロセスに導入することで、ニューラルネットワークの汎用性を向上させています。多くの先行研究と同様に、OPUS-TASSでもモデルのアンサンブルを使用し、より良い結果を得ています。

MOTIVATION: Predictions of protein backbone torsion angles (ϕ and ψ) and secondary structure from sequence are crucial subproblems in protein structure prediction. With the development of deep learning approaches, their accuracies have been significantly improved. To capture the long-range interactions, most of studies integrate bidirectional recurrent neural networks into their models. In this study, we introduce and modify a recently proposed architecture named Transformer to capture the interactions between the two residues theoretically with arbitrary distance. Moreover, we also take advantage of multi-task learning to improve the generalization of neural network by introducing related tasks into the training process. Similar to many previous studies, OPUS-TASS uses an ensemble of models and achieves better results.

結果:

OPUS-TASSはSPOT-1Dと同じ学習・検証セットを使用しています。SPOT-1Dで提案されたTEST2016(1213タンパク質)とTEST2018(250タンパク質)、SANITで提案されたCASP12(55タンパク質)、CASP13(32タンパク質)、CASP-FM(56タンパク質)、そして最近公開されたCAMEOから収集されたPDB構造(93タンパク質)を用いて、OPUS-TASSとSPOT-1Dの性能を比較しました。これら6つのテストセットにおいて、OPUS-TASSは背骨のねじれ角予測と二次構造予測の両方において一貫した改善を達成しています。CAMEO93では、SPOT-1Dでφとψの平均絶対誤差がそれぞれ16.89と23.02、3状態と8状態の二次構造予測精度がそれぞれ87.72%と77.15%となっています。これに対し、OPUS-TASSでは、φとψの予測精度はそれぞれ16.56と22.56、3状態と8状態の二次構造予測精度はそれぞれ89.06%と78.87%を達成しています。特に、OPUS-TASSの後処理として我々のねじれ角精密化手法OPUS-Refineを使用した後、最終的なϕとψ予測の平均絶対誤差は16.28と21.98とさらに減少しました。

RESULTS: OPUS-TASS uses the same training and validation sets as SPOT-1D. We compare the performance of OPUS-TASS and SPOT-1D on TEST2016 (1213 proteins) and TEST2018 (250 proteins) proposed in SPOT-1D paper, CASP12 (55 proteins), CASP13 (32 proteins) and CASP-FM (56 proteins) proposed in SANIT paper, and a recently released PDB structures collected from CAMEO (93 proteins) named as CAMEO93. On these 6 test sets, OPUS-TASS achieves consistent improvements in both backbone torsion angles prediction and secondary structure prediction. On CAMEO93, for SPOT-1D, the mean absolute errors for ϕ and ψ predictions are 16.89 and 23.02, respectively, and the accuracies for 3 and 8-state secondary structure predictions are 87.72% and 77.15%, respectively. In comparison, OPUS-TASS achieves 16.56 and 22.56 for ϕ and ψ predictions, and 89.06% and 78.87% for 3 and 8-state secondary structure predictions, respectively. In particular, after using our torsion angles refinement method OPUS-Refine as the post-processing procedure for OPUS-TASS, the mean absolute errors for final ϕ and ψ predictions are further decreased to 16.28 and 21.98.

利用可能性:

OPUS-TASSとそのデータのトレーニングコードと推論コードは https://github.com/thuxugang/opus_tass から入手可能です。

AVAILABILITY: The training and the inference codes of OPUS-TASS and its data are available at https://github.com/thuxugang/opus_tass.

補足情報:

補足データはBioinformatics onlineに掲載されています。

SUPPLEMENTARY INFORMATION: Supplementary data are available at Bioinformatics online.

© The Author(s) (2020). Published by Oxford University Press. All rights reserved. For Permissions, please email: journals.permissions@oup.com.