日本語AIでPubMedを検索
小児期から老年期までの共通のエピジェネティック時計
A common epigenetic clock from childhood to old age.
PMID: 35777225
抄録
法医学的年齢推定は、法医学的DNA表現型の重要な一部を形成するDNA情報ツールです。容疑者のいない犯罪事件やDNAデータベースの検索に失敗した事件、大規模災害における人体識別分析、人類学的研究や法的紛争など、捜査の手がかりを得るために年齢推定はすべて有益である。さまざまなDNAメチル化技術や多様な統計的手法が提案されているが、そのほとんどは血液サンプルに基づくもので、主に成人の年齢範囲に限定されている。本研究では、2歳から104歳までの均等に分布した895のスペイン人DNA血液サンプルに基づく拡張年齢予測モデルを紹介する。ELOVL2、ASPA、PDE4C、FHL2、CCDC102B、MIR29B2CHG、chr16:85395429 (GRCh38)の7つのゲノム領域に位置する合計7つのCpG部位について、Agena Bioscience EpiTYPER®技術を用いてDNAメチル化レベルを検出した。年齢予測システムの精度は、3つの統計的手法、すなわち、分位数回帰(QR)、分位数回帰ニューラルネットワーク(QRNN)、分位数回帰サポートベクターマシン(QRSVM)を比較することによって検証された。最も正確な予測は、QRNNまたはQRSVMを使用した場合に得られた(平均絶対予測誤差、MAEはそれぞれ±3.36と±3.41)。独立したスペイン語のテストセット(N=152)でモデルの検証を行ったところ、両手法とも同程度の精度が得られた(MAE:それぞれ±3.32、±3.45)。分位値回帰統計ツールを使用する主な利点は、推定年齢に誤差を適合させ、年齢に依存した予測区間を得ることにある。次元削減の追加分析では、訓練サンプルサイズが小さくなるにつれて誤差が増加し、正しい分類が減少するという直接的な相関が示された。その結果、個人間のばらつきを最も効率的に捉えるためには、トレーニングセットでカバーされる年齢1歳につき最低6サンプルのサンプルサイズが推奨されることが示された。
Forensic age estimation is a DNA intelligence tool that forms an important part of Forensic DNA Phenotyping. Criminal cases with no suspects or with unsuccessful matches in searches on DNA databases; human identification analyses in mass disasters; anthropological studies or legal disputes; all benefit from age estimation to gain investigative leads. Several age prediction models have been developed to date based on DNA methylation. Although different DNA methylation technologies as well as diverse statistical methods have been proposed, most of them are based on blood samples and mainly restricted to adult age ranges. In the current study, we present an extended age prediction model based on 895 evenly distributed Spanish DNA blood samples from 2 to 104 years old. DNA methylation levels were detected using Agena Bioscience EpiTYPER® technology for a total of seven CpG sites located at seven genomic regions: ELOVL2, ASPA, PDE4C, FHL2, CCDC102B, MIR29B2CHG and chr16:85395429 (GRCh38). The accuracy of the age prediction system was tested by comparing three statistical methods: quantile regression (QR), quantile regression neural network (QRNN) and quantile regression support vector machine (QRSVM). The most accurate predictions were obtained when using QRNN or QRSVM (mean absolute prediction error, MAE of ± 3.36 and ± 3.41, respectively). Validation of the models with an independent Spanish testing set (N = 152) provided similar accuracies for both methods (MAE: ± 3.32 and ± 3.45, respectively). The main advantage of using quantile regression statistical tools lies in obtaining age-dependent prediction intervals, fitting the error to the estimated age. An additional analysis of dimensionality reduction shows a direct correlation of increased error and a reduction of correct classifications as the training sample size is reduced. Results indicated that a minimum sample size of six samples per year-of-age covered by the training set is recommended to efficiently capture the most inter-individual variability..