日本語AIでPubMedを検索
遺伝的に相関する形質と相関しない形質の既存のGWASサマリーデータを活用して、新しいGWASの検出力を向上させる
Leveraging existing GWAS summary data of genetically correlated and uncorrelated traits to improve power for a new GWAS.
PMID: 32677173 DOI: 10.1002/gepi.22333.
抄録
複雑な形質や一般的な疾患に関連する遺伝的変異体の同定において、ゲノムワイド関連研究(GWAS)は多大な成功を収めているにもかかわらず、まだ多くのものが発見されていません。したがって、GWASの統計的な力を向上させることが常に望まれています。本研究では、GWASと機能的アノテーションやその他のオーミックデータとの統合に向けた集中的な取り組みと並行して、他の公開されているGWASのサマリーデータを活用して、新規・重点的なGWASの統計力を向上させることを提案します。本研究では、重み付け仮説検定の理論的基礎をもとに、様々な形質の公表された22のGWASデータセットに基づいて一塩基多型(SNP)に特異的な重み付けを行う新規かつ効果的な手法を開発し、標準/非重み付け解析と比較して有意なSNPや独立遺伝子座の数が飛躍的に増加することを検出した。例えば、統合失調症のGWAS要約データセットと、統合失調症以外の19のGWAS要約データセットを統合したところ、15の連結不平衡独立遺伝子座に対応する1,585個のゲノムワイドな有意SNPが同定され、標準/非重み付け解析で同定された13の独立遺伝子座の818個の有意SNPを大きく上回った。さらに、より大規模な統合失調症GWASサマリーデータセットを検証データとして用いたところ、重み付け解析では1,423個(1,585個中)の有意SNPが確認されたのに対し、非重み付け解析では705個(818個中)の有意SNPが確認され、15個の独立遺伝子座と13個の独立遺伝子座のすべてが確認された。脂質とアルツハイマー病(AD)形質についても同様の結論が得られた。提案されたアプローチは、GWASのパワーを向上させるためのシンプルで費用対効果の高いものであると結論づけた。
In spite of the tremendous success of genome-wide association studies (GWAS) in identifying genetic variants associated with complex traits and common diseases, many more are yet to be discovered. Hence, it is always desirable to improve the statistical power of GWAS. Paralleling with the intensive efforts of integrating GWAS with functional annotations or other omic data, we propose leveraging other published GWAS summary data to boost statistical power for a new/focus GWAS; the traits of the published GWAS may or may not be genetically correlated with the target trait of the new GWAS. Building on weighted hypothesis testing with a solid theoretical foundation, we develop a novel and effective method to construct single-nucleotide polymorphism (SNP)-specific weights based on 22 published GWAS data sets with various traits, detecting sometimes dramatically increased numbers of significant SNPs and independent loci as compared to the standard/unweighted analysis. For example, by integrating a schizophrenia GWAS summary data set with 19 other GWAS summary data sets of nonschizophrenia traits, our new method identified 1,585 genome-wide significant SNPs mapping to 15 linkage disequilibrium-independent loci, largely exceeding 818 significant SNPs in 13 independent loci identified by the standard/unweighted analysis; furthermore, using a later and larger schizophrenia GWAS summary data set as the validation data, 1,423 (out of 1,585) significant SNPs identified by the weighted analysis, compared to 705 (out of 818) by the unweighted analysis, were confirmed, while all 15 and 13 independent loci were also confirmed. Similar conclusions were reached with lipids and Alzheimer's disease (AD) traits. We conclude that the proposed approach is simple and cost-effective to improve GWAS power.
© 2020 Wiley Periodicals LLC.