日本語AIでPubMedを検索
Oxford Nanopore PromethIONシーケンシングとHi-C技術を用いた、アオカワカワヒメジ(Thamnaconus septentrionalis)の染色体レベルでのゲノムアセンブリー
Chromosome-level genome assembly of the greenfin horse-faced filefish (Thamnaconus septentrionalis) using Oxford Nanopore PromethION sequencing and Hi-C technology.
PMID: 32390337 DOI: 10.1111/1755-0998.13183.
抄録
アオジハタタテダイ(Thamnaconus septentrionalis)は、インド・西太平洋に広く分布する貴重な商業魚種である。青緑色のヒレが特徴的で、肌が荒く、棘のような第一背びれがある。また、中国では重要な海洋養殖魚種であり、個体数が激減していることから保全が懸念されている。本種のゲノム資源は不足しており、参照ゲノムは公開されていない。本研究では、ナノポアシーケンシングとHi-C技術を用いてT.septentrionalisの最初の染色体レベルのゲノムを構築した。合計50.95Gbの研磨されたナノポア配列が生成され、474.31MBのゲノムに組み立てられました。組み立てられたゲノムには242個のコンティグしか含まれておらず、達成されたコンティグN50は22.46Mbであり、これはすべてのシークエンスされた魚種の中では驚くほど高い値であった。ゲノムをHi-Cでスキャフォールディングした結果、20個の擬染色体が全アセンブル配列の99.44%を含んでいた。ゲノムには67.35Mbの繰り返し配列が含まれており、アセンブリの14.2%を占めていた。そのうち94.82%のタンパク質をコードする遺伝子が予測され、そのうちの94.82%の機能がアノテーションされた。さらに、1,872個のシングルコピーオルソログ遺伝子を用いて系統樹を構築し、ヒラメゲノム中に67個のユニークな遺伝子ファミリーを同定した。この高品質なゲノムは、今後のT.septentrionalisのゲノム研究、保全研究、育種研究のための貴重なリソースとなるだろう。
The greenfin horse-faced filefish, Thamnaconus septentrionalis, is a valuable commercial fish species that is widely distributed in the Indo-West Pacific Ocean. This fish has characteristic blue-green fins, rough skin and a spine-like first dorsal fin. Thamnaconus septentrionalis is of conservation concern because its population has declined sharply, and it is an important marine aquaculture fish species in China. Genomic resources for the filefish are lacking, and no reference genome has been released. In this study, the first chromosome-level genome of T. septentrionalis was constructed using nanopore sequencing and Hi-C technology. A total of 50.95 Gb polished nanopore sequences were generated and were assembled into a 474.31-Mb genome, accounting for 96.45% of the estimated genome size of this filefish. The assembled genome contained only 242 contigs, and the achieved contig N50 was 22.46 Mb, a surprisingly high value among all sequenced fish species. Hi-C scaffolding of the genome resulted in 20 pseudochromosomes containing 99.44% of the total assembled sequences. The genome contained 67.35 Mb of repeat sequences, accounting for 14.2% of the assembly. A total of 22,067 protein-coding genes were predicted, 94.82% of which were successfully annotated with putative functions. Furthermore, a phylogenetic tree was constructed using 1,872 single-copy orthologous genes, and 67 unique gene families were identified in the filefish genome. This high-quality assembled genome will be a valuable resource for a range of future genomic, conservation and breeding studies of T. septentrionalis.
© 2020 John Wiley & Sons Ltd.