TOP > Up > Today


Date:  Sun, 7 May 2006 16:16:52 +0900
From:  no@ann.co.jp
Subject:  [pasml 191481] Re: 追調査結果です。
To:  pasml@ann.co.jp
Message-Id:  <200605070716.k477Gqc20439@ns.pas2.jp>
X-Mail-Count: 191481

お名前   : Osaka 困りごと掲示板から
URL      : 
質問URL: http://pasokoma.jp/?num=345663&ope=v
ツリー: http://pasokoma.jp/cgi/tree.cgi?num=345663
--
Rolandkmasaさんは No.345553「Re:追調査結果です。」で書きました。
前回に引き続いてのアドバイスに感謝申し上げます。オーディオ機器に弱い私には、かなり難しい話になって来たという感じです。
正直言ってお金は余りかけられません。個人のポケットマネーの範囲でやり繰りしています。それにしては難しい要求をしているではないかと言われそうですが、私なりに考えていることがあるので、述べておきます。
分析対象は肉声です。しかし個人の声の質の違いを調べるのが目的ではなく、「ア」なら「ア」という単音について、万人共通の音響的特徴は何かということを調べるのが目的です。個人によって「カ」という音声の声質は違うし、口調も違いますが、それでも誰もが「カ」と認識します。「カ」という音のどんな音響的特徴を手掛かりにして人は「カ」と認識するのか、こんな事は過去の研究で分かっているとお思いになるでしょうが、不思議なことに未だに分かっていないのです。「話者正規化問題」と呼ばれて未だに世界中の学者の研究テーマです。
音声認識をやっている先生達は、このテーマを正面から取り組むことをあきらめて、別な角度からアプローチしています。要するにコンピュータで言葉を識別できさえすれば良いからです。ご存知のように、この分野は非常に進歩しています。しかし1枚の紙片を手から離したとき、その紙の運動を予測出来ませんが、月にロケットを打ち上げることが出来るというのと同じ類の話です。
ところで現在の音声分析は、周波数分析をするときの計算量の制約から、16ビットでサンプリング周波数もせいぜい20kHz程度です。音楽分野のように44kHzといった高周波数での分析は出来ていません。それから雑音も実際に調べてみると、余ほどの雑音でない限り言語音の認識に対しては大した悪影響も与えていません。(もしそうでなかった、人は無響音室でしか会話が出来ない筈です。)
ですから、声質やイントネーションなどの個人差とか雑音ということを気にする必要がありません。それらの要因を超えて、なおかつ人が言語音を識別する手掛かりがある筈です。その意味では随分荒っぽい分析になりますが、それを捉えるのが目的です。この点がオーディオ関係の人達のきめ細かい気遣いとは違うところかと思います。それゆえ「音質」については問題にしていません。ただマイクの周波数特性は極力フラットなことが望ましいと考えています。現実の声をそのままの姿で収録したいからです。(その観点からSHUREのマイクを購入したのですが・・・)
このような観点から「単純にマイクゲインが低く、波形が振れない」という形で質問を提供させてもらいました。音声信号の振幅が小さ過ぎると、FFT計算をするときの誤差が大きくなる恐れがあるからです。
特性の点からやはりコンデンサーマイクが良いと理解していますが、価格面ではソニー ECM-360どまりかと思うのですが、これはPC用マイクではないのではないかと危惧しています。もしPC用でなければ、マイクゲインが小さくて、問題になるからです。どんなものなのでしょうか?
また1点教えて頂きたいのは、Rolandのことですが、Audio用マイク+Roland UA-20+パソコン(マイク端子)という組合せなら十分なマイクゲインを得られるのでしょうか?Polandという装置をよく知らないので教えてください。
一度検討してみようかと考えています。PC用マイクの範疇で感度の良いものをえらぶのと、どちらが良いのか迷うところです。
教えていただいた点は今後参考にして行きたいと思います。



--
== 掲示板URL: http://pasokoma.jp/ ==
   配信の停止: http://pasokoma.jp/taikai.shtml
   本メールマガジンへの返信はなさらないで下さい
== 投稿はパソコン困りごと掲示板でお願い致します ===
    

TOP > Up > Today