（記事）ＮＴＴ　２人の声を同時に聞き分け　会議録の自動編集に活用

[ フォローアップ ] [ フォローアップを投稿 ] [ ★阿修羅♪　Ψ空耳の丘Ψ１４ ]

投稿者踊る藁人形日時 2001 年 7 月 27 日 02:50:00:

回答先: （転載）『携帯電話のすべての会話が覗かれるための技術的裏付け』＋α 投稿者踊る藁人形日時 2001 年 7 月 25 日 00:47:04:

　ＮＴＴコミュニケーション科学基礎研究所は、同時に話す二人の声をコンピューターで聞き分ける技術を開発した。重なった二人の声を話し手ごと分離し、別々にスピーカーから出力する。今後は聖徳太子の耳のように複数人の声が聞き分けられるよう改良を進め、会議の議事録を自動編集するシステムなどへの応用を目指す。

　ＮＴＴ研の開発した技術
「アヒャヒャ+ゴルァ」　　注）新聞記事のとは表現が若干異なります。
Λ_Λ → マイク１＿＿　／￣￣￣￣￣＼
（ﾟ∀ﾟ) -----------E⊃　　　　　　　　　　　　　　 |○｜＜「アヒャヒャ」|　
「アヒャヒャ」 + │ ∞ 　 /===ヘ　／￣￣＼＿＿＿＿＿_／
　　　　　＼　　 + ┷ ∞ 　 /====ヘ|___| | ／　スピーカー１
　　　　　＼ + ∞ 　 ∥〃 ∥||＝=| |／
+＼　　　　　　 ∞ ====／_| o| |
　 + 　＼　　／￣￣/ /L 　|／＼
∧_∧ + ＼　マイク２　∞　￣￣￣￣￣￣　＼スピーカー２
（｀Д´)+ + + + + +E⊃ ∞　　　　パソコン　　　　　＼＿＿　／￣￣￣＼
「ゴルァ」　→　　　　│ ∞　　　　　　　　　　　　　 |○｜＜「ゴルァ」|
　　　　　　　　　　　┷　　　　　　　　　　　　　　　　￣￣＼＿＿＿／
「ゴルァ+アヒャヒャ」　

　開発した技術は、部屋の中で話し手がいる位置や雑音の状況などに関係なく使えるのが特徴。二つのマイクがそれぞれとらえた二人の声の重なった音声をコンピューターで処理し、一人ずつの声の分けてスピーカーから再生する。
　二つのマイクからとらえた信号には、二人の位置とマイクの位置が違うために、音声がシステムに到達する時間や音の響き具合（残響）に微妙なずれがある。脳波の分析に使われる独立成分分析という手法を応用、ある変数をかけて二人の話者の信号を比較し、一人の声を大きく、もう一人の声が小さくなるように処理する。
　この操作を２回繰り返して、二人分の声をそれぞれ取り出す。
　現在の技術は、音声を正確に分けるために話者の位置を固定したり、ヘッドセットマイクを使ったりして話者の声をしっかり取り込む必要があった。雑音が入るとうまく分離できないため、響かないような特殊な部屋でないとうまくいかなかった。新技術では、こうした制限が無く、通常の部屋でも使えるという。
　研究グループは、よりはっきり聞き分けるよう精度を上げ、聞き分けられる人数を増やして実用化を目指す。将来はロボットの耳をして組み込むことも考えている。
[日経産業7/17]　

★コメント
これは、諜報メールに紹介されたＡＩ音声認識システム「オアシス」の水準とは、どのくらいの距離があるのかな？
「脳波」っても、例えば周波数成分を求めておいて相関性の高い集合を推定して分離するんだろうかねえ。
カルト野郎はこのネタ使ってインチキカルト投稿するな

フォローアップ:

投稿コメント全ログ　コメント即時配信　スレ建て依頼　削除コメント確認方法

★阿修羅♪　http://www.asyura2.com/ 　since 1995

　題名には必ず「阿修羅さんへ」と記述してください。
掲示板,ＭＬを含むこのサイトすべての
一切の引用、転載、リンクを許可いたします。確認メールは不要です。
引用元リンクを表示してください。

（記事）ＮＴＴ ２人の声を同時に聞き分け 会議録の自動編集に活用

（記事）ＮＴＴ　２人の声を同時に聞き分け　会議録の自動編集に活用