日本語AIでPubMedを検索
ディープニューラルネットワークを用いた音声によるいびき検出
Audio-based snore detection using deep neural networks.
PMID: 33434817
抄録
背景と目的:
いびきは広く普及している現象である。良性の場合もあるが、広く普及している睡眠障害である閉塞性睡眠時無呼吸症候群(OSA)の症状である場合もある。いびきを正確に検出することは、OSAのスクリーニングと診断に役立つ可能性がある。
BACKGROUND AND OBJECTIVE: Snoring is a prevalent phenomenon. It may be benign, but can also be a symptom of obstructive sleep apnea (OSA) a prevalent sleep disorder. Accurate detection of snoring may help with screening and diagnosis of OSA.
方法:
我々は、畳み込みニューラルネットワーク(CNN)とリカレントニューラルネットワーク(RNN)の組み合わせに基づくいびき検出アルゴリズムを紹介する。我々は、睡眠研究のために臨床センターに紹介された38人の被験者の音声記録を入手した。すべての被験者は、ベッドの周囲の戦略的な位置に置かれた合計5つのマイクロフォンによって録音された。CNNは音声スペクトログラムから特徴を抽出するために使用され、RNNは連続したCNN出力を処理し、音声イベントをいびきイベントと非いびきイベントに分類するために使用された。また、マイクの配置がアルゴリズムの性能に与える影響についても取り上げた。
METHODS: We introduce a snore detection algorithm based on the combination of a convolutional neural network (CNN) and a recurrent neural network (RNN). We obtained audio recordings of 38 subjects referred to a clinical center for a sleep study. All subjects were recorded by a total of 5 microphones placed at strategic positions around the bed. The CNN was used to extract features from the sound spectrogram, while the RNN was used to process the sequential CNN output and to classify the audio events to snore and non-snore events. We also addressed the impact of microphone placement on the performance of the algorithm.
結果:
本アルゴリズムは、18412個の音声イベントを含むデータセットにおいて、すべてのマイクロフォンにおいて、いびき検出の精度95.3±0.5%、感度92.2±0.9%、特異度97.7±0.4%を達成することができた。最も精度が高かったのは、被験者の頭上約70cmに設置したマイクで95.9%、最も精度が低かったのは、被験者の頭上約130cmに設置したマイクで94.4%であった。
RESULTS: The algorithm achieved an accuracy of 95.3 ± 0.5%, a sensitivity of 92.2 ± 0.9%, and a specificity of 97.7 ± 0.4% over all microphones in snore detection on our data set including 18412 sound events. The best accuracy (95.9%) was observed from the microphone placed about 70 cm above the subject's head and the worst (94.4%) was observed from the microphone placed about 130 cm above the subject's head.
結論:
本手法は、音声記録から高い精度でいびき事象を検出することができ、マイクロフォンの配置は検出性能に大きな影響を与えないことが示唆された。
CONCLUSION: Our results suggest that our method detects snore events from audio recordings with high accuracy and that microphone placement does not have a major impact on detection performance.