7/30の夕刻は、元同僚が主催する、高齢化社会に向けたサービス検討の情報交換会の中で、株式会社ロゼッタの、音声翻訳のプレゼンをオンラインで受けました。
翻訳ツールのボトルネックがリアルタイムの音声認識にあることがわかり、ここにAIを導入することで、音声認識用の話し方をしなくても(口語でも)認識できるようになった、というものです。コロナ禍で高齢者がオンラインで会議をすることも少なくなくなっていますが、耳が遠いときなど字幕がサポート尾になるのではないか、という議論がされました。
実際、PC上で動く様子なども見ることができました、その速度と精度の進化を体感することができました。やはり技術の進捗は、動作するのを見るに限る(資料だけではわからない)ですね!
コメント