投稿者 踊る藁人形 日時 2001 年 7 月 27 日 02:50:00:
回答先: (転載)『携帯電話のすべての会話が覗かれるための技術的裏付け』+α 投稿者 踊る藁人形 日時 2001 年 7 月 25 日 00:47:04:
NTTコミュニケーション科学基礎研究所は、同時に話す二人の声をコンピューターで聞き分ける技術を開発した。重なった二人の声を話し手ごと分離し、別々にスピーカーから出力する。今後は聖徳太子の耳のように複数人の声が聞き分けられるよう改良を進め、会議の議事録を自動編集するシステムなどへの応用を目指す。 |
|
開発した技術は、部屋の中で話し手がいる位置や雑音の状況などに関係なく使えるのが特徴。二つのマイクがそれぞれとらえた二人の声の重なった音声をコンピューターで処理し、一人ずつの声の分けてスピーカーから再生する。
二つのマイクからとらえた信号には、二人の位置とマイクの位置が違うために、音声がシステムに到達する時間や音の響き具合(残響)に微妙なずれがある。脳波の分析に使われる独立成分分析という手法を応用、ある変数をかけて二人の話者の信号を比較し、一人の声を大きく、もう一人の声が小さくなるように処理する。
この操作を2回繰り返して、二人分の声をそれぞれ取り出す。
現在の技術は、音声を正確に分けるために話者の位置を固定したり、ヘッドセットマイクを使ったりして話者の声をしっかり取り込む必要があった。雑音が入るとうまく分離できないため、響かないような特殊な部屋でないとうまくいかなかった。新技術では、こうした制限が無く、通常の部屋でも使えるという。
研究グループは、よりはっきり聞き分けるよう精度を上げ、聞き分けられる人数を増やして実用化を目指す。将来はロボットの耳をして組み込むことも考えている。
[日経産業7/17]
★コメント
これは、諜報メールに紹介されたAI音声認識システム「オアシス」の水準とは、どのくらいの距離があるのかな?
「脳波」っても、例えば周波数成分を求めておいて相関性の高い集合を推定して分離するんだろうかねえ。
カルト野郎はこのネタ使ってインチキカルト投稿するな