あなたは歯科・医療関係者ですか?

WHITE CROSSは、歯科・医療現場で働く方を対象に、良質な歯科医療情報の提供を目的とした会員制サイトです。

日本語AIでPubMedを検索

日本語AIでPubMedを検索

PubMedの提供する医学論文データベースを日本語で検索できます。AI(Deep Learning)を活用した機械翻訳エンジンにより、精度高く日本語へ翻訳された論文をご参照いただけます。
Technol Cult.2019;60(2S):S129-S160. S1097372919200383. doi: 10.1353/tech.2019.0066.

声の特徴。音声認識から機械による音声認識まで

Vocal Features: From Voice Identification to Speech Recognition by Machine.

  • Xiaochang Li
  • Mara Mills
PMID: 31231075 DOI: 10.1353/tech.2019.0066.

抄録

この記事では、1908年から1970年までの間に、話者識別や音声認識のための声楽録音の収集、処理、および応用に使用された機械の方法について考察します。最初のフォノグラフィック・アーカイブには「声の肖像画」のコレクションがあり、これが個人識別のための人間の声の本質的な特徴についての国際的な調査を促しました。その後、音声の視覚的記録も同様の用途に使われるようになりましたが、1960年代にサウンド・スペクトログラフィによる「声紋識別」が法的にも商業的にも成功を収めるようになると、この方法はより広く科学的に注目されるようになりましたが、最終的にはその正確性と理論的根拠の両方が否定されました。同時に、スペクトログラム収集は、機械による音声認識という新しいアプリケーションに拍車をかけました。音声スペクトログラムは、個々の声の特徴を記録したものから、音声の基本的な不変量のモデルへと変化していきましたが、それは自動化された処理への要求と、音声アーカイブから音響データベースへの移行に根ざしていました。

This article considers machine methods used in the collection, processing, and application of vocal recordings for speaker identification and speech recognition between 1908 and 1970. The first phonographic archives featured collections of "vocal portraits" that prompted international investigations into the essential features of human voices for individual identification. Visual records of speech later found the same applications, but as "voiceprint identification" via sound spectrography began to achieve legal and commercial success in the 1960s, the procedure attracted more widespread scientific attention, which ultimately discredited both its accuracy and its rationale. At the same time, spectrogram collections spurred a new application-speech recognition by machine. The changing status of the speech spectrogram, from a record of unique features of individual voices to a model of fundamental invariants in speech sounds, was rooted in the demands of automated processing and a corresponding shift from the sound archive to the acoustic database.