あなたは歯科・医療関係者ですか?

WHITE CROSSは、歯科・医療現場で働く方を対象に、良質な歯科医療情報の提供を目的とした会員制サイトです。

日本語AIでPubMedを検索

日本語AIでPubMedを検索

PubMedの提供する医学論文データベースを日本語で検索できます。AI(Deep Learning)を活用した機械翻訳エンジンにより、精度高く日本語へ翻訳された論文をご参照いただけます。
BMC Genomics.2019 Dec;20(Suppl 12):1007. 10.1186/s12864-019-6333-6. doi: 10.1186/s12864-019-6333-6.Epub 2019-12-30.

全エクソーム配列データを用いたヒスパニック系集団の個人祖先推定のための祖先情報マーカーパネルデザイン

An ancestry informative marker panel design for individual ancestry estimation of Hispanic population using whole exome sequencing data.

  • Li-Ju Wang
  • Catherine W Zhang
  • Sophia C Su
  • Hung-I H Chen
  • Yu-Chiao Chiu
  • Zhao Lai
  • Hakim Bouamar
  • Amelie G Ramirez
  • Francisco G Cigarroa
  • Lu-Zhe Sun
  • Yidong Chen
PMID: 31888480 PMCID: PMC6936141. DOI: 10.1186/s12864-019-6333-6.

抄録

背景:

これらの祖先グループは、多くの種類の癌の発生率と転帰が著しく異なっています。そのため、遺伝的混血は、ヒスパニック系特有のがん感受性変異体との遺伝的関連研究に偏りを生じさせる可能性がある。例えば、肝臓がんの発生率は、ヒスパニック系、アジア系、非ヒスパニック系白人の間でかなりの格差があることが示されています。現在、祖先情報マーカー(AIM)パネルは、祖先の混血を推測するために、最大数百の祖先情報一塩基多型(SNP)を用いて広く利用されている。注目すべきは、現在利用可能なAIMは主にイントロン領域と遺伝子間領域に位置しているが、トランスレーショナルリサーチや臨床で一般的に使用されている全エクソームシークエンシング(WES)プロトコルはこれらのマーカーをカバーしていないことである。したがって、追加のDNA検査を行わずに患者の混血率を正確に決定することは依然として困難である。

BACKGROUND: Europeans and American Indians were major genetic ancestry of Hispanics in the U.S. These ancestral groups have markedly different incidence rates and outcomes in many types of cancers. Therefore, the genetic admixture may cause biased genetic association study with cancer susceptibility variants specifically in Hispanics. For example, the incidence rate of liver cancer has been shown with substantial disparity between Hispanic, Asian and non-Hispanic white populations. Currently, ancestry informative marker (AIM) panels have been widely utilized with up to a few hundred ancestry-informative single nucleotide polymorphisms (SNPs) to infer ancestry admixture. Notably, current available AIMs are predominantly located in intron and intergenic regions, while the whole exome sequencing (WES) protocols commonly used in translational research and clinical practice do not cover these markers. Thus, it remains challenging to accurately determine a patient's admixture proportion without additional DNA testing.

結果:

本研究では、アフリカ(AFR)、ヨーロッパ(EUR)、東アジア(EAS)の3つの異なる選択的な大陸集団から、進化的に保存されているエクソン領域内の3方向の遺伝的混血を推測するユニークなAIMパネルを設計した。1000 Genomesプロジェクトでは、当初、選択的な3つの集団から約100万個のエクソン系SNPを連結不平衡(LD)でトリミングし、バイトリルバリアントに限定し、最終的に250個のSNPマーカーを持つAIMパネル(UT-AIM250パネル)に最適化し、先祖代々の情報化統計量を用いている。公表されているAIMパネルと比較して、UT-AIM250は3つの祖先集団を用いて試験を行った場合、より高い精度を示した(精度:AFRで0.995±0.012、EURで0.997±0.007、EASで0.994±0.012)。さらに、UT-AIM250パネルの性能を1000 Genomes Projectのadmixed American(AMR)サンプルで実証したところ、これまでに発表されたAIMパネル(AFR, 0.085±0.098、EUR, 0.665±0.182、EAS, 0.250±0.205)と同様の結果が得られた(AFR, 0.085±0.098、EUR, 0.665±0.182、EAS, 0.250±0.020、EAS, 0.250±0.205)。205)を既発表のAIMパネル(Phillips-AIM34:AFR、0.096±0.127、EUR、0.575±0.290、EAS、0.330±0.315;Wei-AIM278:AFR、0.070±0.096、EUR、0.537±0.267、EAS、0.393±0.300)に適用した。その後、テキサス州南部の肝細胞癌(HCC)の自己申告患者26人の臨床データセットにUT-AIM250パネルを適用した。隣接する非がん性肝組織のWESデータ(AFR、0.065±0.043、EUR、0.594±0.150、EAS、0.341±0.160)を用いて混和割合を推定した。同様の混和物の割合は、対応する腫瘍組織から同定された。さらに、The Cancer Genome Atlas(TCGA)コレクションの肝細胞癌(TCGA-LIHC)サンプル(376人)について、UT-AIM250パネルを用いて混和物の割合を推定した。このパネルは、腫瘍組織と一致した正常組織から一貫した混和割合を得て、人種/民族性が誤って報告されている可能性3を特定し、必要に応じて人種/民族性の判定を行った。

RESULTS: In this study we designed an unique AIM panel that infers 3-way genetic admixture from three distinct and selective continental populations (African (AFR), European (EUR), and East Asian (EAS)) within evolutionarily conserved exonic regions. Initially, about 1 million exonic SNPs from selective three populations in the 1000 Genomes Project were trimmed by their linkage disequilibrium (LD), restricted to biallelic variants, and finally we optimized to an AIM panel with 250 SNP markers, or the UT-AIM250 panel, using their ancestral informativeness statistics. Comparing to published AIM panels, UT-AIM250 performed better accuracy when we tested with three ancestral populations (accuracy: 0.995 ± 0.012 for AFR, 0.997 ± 0.007 for EUR, and 0.994 ± 0.012 for EAS). We further demonstrated the performance of the UT-AIM250 panel to admixed American (AMR) samples of the 1000 Genomes Project and obtained similar results (AFR, 0.085 ± 0.098; EUR, 0.665 ± 0.182; and EAS, 0.250 ± 0.205) to previously published AIM panels (Phillips-AIM34: AFR, 0.096 ± 0.127, EUR, 0.575 ± 0.290, and EAS, 0.330 ± 0.315; Wei-AIM278: AFR, 0.070 ± 0.096, EUR, 0.537 ± 0.267, and EAS, 0.393 ± 0.300). Subsequently, we applied the UT-AIM250 panel to a clinical dataset of 26 self-reported Hispanic patients in South Texas with hepatocellular carcinoma (HCC). We estimated the admixture proportions using WES data of adjacent non-cancer liver tissues (AFR, 0.065 ± 0.043; EUR, 0.594 ± 0.150; and EAS, 0.341 ± 0.160). Similar admixture proportions were identified from corresponding tumor tissues. In addition, we estimated admixture proportions of The Cancer Genome Atlas (TCGA) collection of hepatocellular carcinoma (TCGA-LIHC) samples (376 patients) using the UT-AIM250 panel. The panel obtained consistent admixture proportions from tumor and matched normal tissues, identified 3 possible incorrectly reported race/ethnicity, and/or provided race/ethnicity determination if necessary.

結論:

ここでは、混血の割合を推測するためにevolutionarilyconserved exonic領域を使用することの実現可能性を実証し、遺伝子解析のためのサンプル収集または患者層別化のための頑健で信頼性の高いコントロールを提供した。UT-AIM250のR実装は、https://github.com/chenlabgccri/UT-AIM250 から入手可能です。

CONCLUSIONS: Here we demonstrated the feasibility of using evolutionarily conserved exonic regions to infer admixture proportions and provided a robust and reliable control for sample collection or patient stratification for genetic analysis. R implementation of UT-AIM250 is available at https://github.com/chenlabgccri/UT-AIM250.