あなたは歯科・医療関係者ですか?

WHITE CROSSは、歯科・医療現場で働く方を対象に、良質な歯科医療情報の提供を目的とした会員制サイトです。

日本語AIでPubMedを検索

日本語AIでPubMedを検索

PubMedの提供する医学論文データベースを日本語で検索できます。AI(Deep Learning)を活用した機械翻訳エンジンにより、精度高く日本語へ翻訳された論文をご参照いただけます。
J. Neurosci..2020 Jul;JN-RM-0469-20. doi: 10.1523/JNEUROSCI.0469-20.2020.Epub 2020-07-17.

ヒトの音声認識におけるノイズへの適応は、ノイズレベルの統計量と高速ダイナミックレンジ圧縮に依存している

Adaptation to noise in human speech recognition depends on noise-level statistics and fast dynamic-range compression.

  • Miriam I Marrufo-Pérez
  • Dora Del Pilar Sturla Carreto
  • Almudena Eustaquio-Martín
  • Enrique A Lopez-Poveda
PMID: 32680938 DOI: 10.1523/JNEUROSCI.0469-20.2020.

抄録

人間の聴覚は背景雑音に適応します。これは、単語が雑音の中で早く提示されるよりも遅く提示された方が、聞き手がより孤立した単語を認識するという事実からも明らかです。この適応は、聴覚ニューロンのダイナミックレンジをシフト(適応)させることで、音声スペクトルや時間的手がかりの神経エンコーディングを改善することができます。神経のダイナミックレンジの適応は刺激レベルの統計量に依存するため、ここではノイズの多い背景での音声認識を改善するための「統計的」適応の重要性を調べた。刺激レベルが一定または50ミリ秒ごとに変化するノイズ前駆体の存在下と非存在下で、異なる統計的分布に従ってノイズ付きの単語の認識を比較した。28名の聴取者(男性9名)について適応性を測定し、前駆体がある場合とない場合との相対的な前駆体の認識改善度として定量化した。2種類の前駆体が同じ平均レベルを持ち、両方とも内側 olivocochlear reflexを活性化した場合でも、適応は一定レベルの前駆体で最大であり、変動の大きい前駆体では発生しなかった。変動の大きい前駆体の瞬間的な振幅圧縮は、一定レベルの前駆体が圧縮なしで行ったのと同じくらいの適応を生じた。以上の結果から、音声認識における騒音適応は、おそらく最も頻度の高い音レベルへの神経のダイナミックレンジ適応によって媒介されていることが示唆された。さらに、聴覚末梢圧迫は、内側乏脊髄反射ではなく、それ自体が雑音のレベル変動を減少させることで、雑音適応を促進する可能性があることを示唆している。雑音の中での音声認識は困難であるが、雑音適応によって容易になる可能性がある。この適応の基礎となる神経機構については不明な点が多い。本研究では、雑音中の単語認識における適応の効果を報告し、(1)適応は静止した雑音に対しては起こるが、平均レベルが同じで変動の大きい前駆体に対しては起こらないこと、(2)静止した雑音と変動の大きい雑音の両方が内側 olivocochlear reflexを活性化すること、(3)刺激を高速振幅圧縮機に通すと、変動の大きい雑音に対しても適応が起こること、を示した。これらの結果から、騒音適応は最も頻繁に発生する騒音レベルに対する神経のダイナミックレンジ適応を反映しており、内側 olivocochlear reflexではなく聴覚末梢圧迫が騒音適応を促進する可能性があることが示唆された。

Human hearing adapts to background noise, as evidenced by the fact that listeners recognize more isolated words when words are presented later rather than earlier in noise. This adaptation is likely due to the leading noise shifting ('adapting') the dynamic range of auditory neurons, which can improve the neural encoding of speech spectral and temporal cues. Because neural dynamic range adaptation depends on stimulus level statistics, here we investigated the importance of 'statistical' adaptation for improving speech recognition in noisy backgrounds. We compared the recognition of noised-masked words in the presence and in the absence of adapting noise precursors whose level was either constant or was changing every 50 ms according to different statistical distributions. Adaptation was measured for 28 listeners (9 men) and was quantified as the recognition improvement in the precursor relative to the no-precursor condition. Adaptation was largest for constant-level precursors and did not occur for highly fluctuating precursors, even when the two types of precursors had the same mean level and both activated the medial olivocochlear reflex. Instantaneous amplitude compression of the highly fluctuating precursor produced as much adaptation as the constant-level precursor did without compression. Altogether, results suggest that noise adaptation in speech recognition is probably mediated by neural dynamic range adaptation to the most frequent sound level. Further, they suggest that auditory peripheral compression per se, rather than the medial olivocochlear reflex, could facilitate noise adaptation by reducing the level fluctuations in the noise.Recognizing speech in noise is challenging but can be facilitated by noise adaptation. The neural mechanisms underlying this adaptation remain unclear. Here, we report some benefits of adaptation for word-in-noise recognition and show that (1) adaptation occurs for stationary but not for highly fluctuating precursors with equal mean level; (2) both stationary and highly fluctuating noises activate the medial olivocochlear reflex; and (3) adaptation occurs even in highly fluctuating noise when the stimulus is passed through a fast amplitude compressor. These findings suggest that noise adaptation reflects neural dynamic range adaptation to the most frequent noise level and that auditory peripheral compression rather than the medial olivocochlear reflex could facilitate noise adaptation.

Copyright © 2020 the authors.