かわら版の声カテゴリー新設、AIによる音声認識

 この度、かわら版の声カテゴリーを新設しました。カテゴリー新設に伴い紐付けのため本文そのままで年初からの投稿をすべて再更新しています。今後このかわら版は、文字のみでなく、映像音声コンテンツも随時掲載していく予定です。

 映像音声コンテンツには、AIによる音声認識で生成したテキストも掲載します(SEO対策)。要旨ではなく収録された音声そのままをテキスト化したものです。話し言葉をそのままテキストにしたものですので、誤りを含むかもしれません。

 実は、私の学生時代の同じ研究室の後輩で、AIによる音声認識の精度向上を研究テーマにしていた人がいました。当時はまだiPhoneも発売されていなかった時代です。計測とデータ解析の研究室だったので、バラエティに富んだ研究テーマでみな自由に研究していました。原発の原子炉格納容器内の探傷をテーマにしていた人もいました。MEGを使った脳研究では先輩に頼まれて何度も被検者になりました。

 その後輩は実験で自らマイクで喋って収音し、音声認識プログラムで認識させては改良し、エラーレートを減らすことに取り組んでいました。その光景を知っていますので、最近のAIの音声認識精度は目を見張るものがあり、とても感慨深いです。映像を再生させながらテキストと照らし合わせることで、差分を見ればいかに正確にAIが音声認識できているか、体感いただけると思います。

 実は行政書士法第1条の2第一項に、事実証明文書の作成という業務が定められています。この事実証明文書の作成依頼として、依頼者が骨子として手書きで作成した文書の内容を私が詳しくヒアリングし、その聴取内容を当職名で事実証明してほしいという依頼を受けたことがあります(何でも事実証明できるというワケではありませんのであしからず)。

 ところで、最近の文書作成ソフトにはAIによる音声認識のディクテーション機能が実装されています。弊社では補助金業務等でZoomのやり取りを行いますが、それと同じ要領でPCにマイクを繋ぎ、ディクテーション機能をオンにすると、あとはスラスラとマイクに向かって喋るだけ。自動的に文字変換されてテキスト化できるという、隠れ優れ機能です。滑舌よく喋ればその通りに認識され、滑舌悪い部分もその通りに誤って文字認識されて実に面白い。句読点も自動で入ります。

 この機能をフル活用することで、あっという間に下書きが手に入りました。業務の超絶時短・効率化に貢献してくれたことは言うまでもありません。

Follow me!