日本語AIでPubMedを検索
qSNE。大規模データセットのための自動パラメータ調整機能を備えた二次レートt-SNEオプティマイザ
qSNE: Quadratic rate t-SNE optimizer with automatic parameter tuning for large data sets.
PMID: 32663244 DOI: 10.1093/bioinformatics/btaa637.
抄録
モチベーション:
t-Distributed stochastic neighbor embedding (t-SNE) などのノンパラメトリック次元削減技術は、単細胞データセットの探索的解析で最も頻繁に使用されている手法です。現在の実装では、大規模なデータセットへの拡張性が悪く、ダウンサンプリングや補間近似を必要とすることが多く、頻度の低い母集団が発見されず、多くの情報が探索されないままになってしまうことがあります。
MOTIVATION: Nonparametric dimensionality reduction techniques, such as t-distributed stochastic neighbor embedding (t-SNE), are the most frequently used methods in the exploratory analysis of single-cell data sets. Current implementations scale poorly to massive data sets and often require downsampling or interpolative approximations, which can leave less frequent populations undiscovered and much information unexploited.
結果:
準ニュートンオプティマイザを用いた2次収束率の高速なt-SNEパッケージqSNEを実装した。これらの改良により、qSNEは通常のt-SNEパッケージよりも大幅に高速化され、マスサイトメトリーデータのような大規模データセットをダウンサンプリングなしで完全に解析できることが示された。
RESULTS: We implemented a fast t-SNE package, qSNE, which uses a quasi-Newton optimizer, allowing quadratic convergence rate, and automatic perplexity (level of detail) optimizer. Our results show that these improvements make qSNE significantly faster than regular t-SNE packages and enables full analysis of large data sets, such as mass cytometry data, without downsampling.
利用可能性:
ソースコードとドキュメントは https://bitbucket.org/anthakki/qsne/ で公開されています。
AVAILABILITY: Source code and documentation are openly available at https://bitbucket.org/anthakki/qsne/.
補足情報:
補足データはBioinformatics onlineで公開されています。
SUPPLEMENTARY INFORMATION: Supplementary data are available at Bioinformatics online.
© The Author(s) 2020. Published by Oxford University Press.