« テープ起こし原稿の楽ちん確実バックアップ法 | トップページ | ATOKの単語登録をGoogle日本語入力に引き継ぐ方法 »

2009年12月15日 (火)

複数話者の声を特定するICレコーダー

複数話者の音声を特定できるという画期的な「Voice Writing Professional Edition」が、10月20日より発売された。

しかし、発売からほぼ2カ月がたっているが、ググッても、「複数話者の特定に便利」という声は見つけられない。テープ起こしプロで、このソフトを話者特定に実際に使っている人は果たしているのだろうか。

話者7名のテープ起こしを受注したので、このソフトを試用してみた。テープ起こし屋はスピードが求められる。しかし、このソフトに話者特定させるまでの下準備に時間がかかりすぎる。結局、このソフトは使わずに、自分の耳で話者特定した原稿を納品した。

お請けした音声ファイルがステレオ録音だったので、音が聞こえてくる方向で話者が特定できた。複数話者のときはステレオ録音に限る。

では、このソフトにはどんな下準備が必要なのかをざっと挙げてみる。
1.話者特定できるのは1時間まで、16kHz、16bitのモノラルWav形式のファイルのみ。
 したがって、60分を超えた音声ファイルなら、60分以内に分割したうえで、指定のWaveファイルにコンバートしなければならない。

 私が受注したのは3時間強の音声ファイルだったので、それだけで、4つの音声ファイルが余分にできた。ファイル管理をきっちりしておかないと、順番がめちゃくちゃになる。さらに、Waveファイルなので容量はかなり大きくなり、パソコンの動きが鈍くなる。

2.ノイズ除去をしなければいけない。
3.波形編集で話者モデルファイルを作成・保存しなければならない。

マニュアルを読みながら作業を進めていくうち、マニュアルが理解できない失敗も重なって、どんどん時間は経過していく。これだけの作業をするのに試用期間が1週間だなんて短すぎる。テープ起こし屋は、音声ファイルの波形編集やノイズ除去がすぐにできる人ばかりではないはず。せめて1カ月ぐらいの猶予が欲しい。

しかも、これだけの作業をやっても、マニュアルいわく「話者の特定精度は保証するものではありません」。となれば、「こんな面倒なこと、もうや~らない」となる。

そして、購入断念の決定的理由は、Windows XPではこの機能が使えないこと。

NECのロボットは、音源の方向で話者を認識するという。話者複数の場合のテープ起こし屋の切望は、下準備に時間のかかる面倒なソフトより、声の方向がわかる音声ファイル。音の方向を計測するアレイマイクで録音するICレコーダー、どこかのメーカーさん、開発してくれないかな。

keyword:テープ起こし,ICレコーダー,複数話者,Voice Writing Professional,マイクロホンアレイ

musicリンク
日本語テープ起こし 英語テープ起こし 翻訳 テープ起こしプロたち ICレコーダーのテープ起こし 裁判反訳


« テープ起こし原稿の楽ちん確実バックアップ法 | トップページ | ATOKの単語登録をGoogle日本語入力に引き継ぐ方法 »