【Googleの音声文字変換技術】
現在(2019.4.7時点)で公開されているAndroidアプリ「Live Transcribe」。
どんなアプリかというと、
「リアルタイムで話した声を文字にしてくれる」
という優れもの。
ようするに「音声書き起こしアプリ」ですね。
まずは英語からお手並み拝見。
ポッドキャスト小説「Limetown」を再生しながら、
このアプリに聞かせてみました。
文字起こし機能の結果はこんな感じ。

す、すごく精度の高い音声入力ですね。
しかも電話で話しているシーンで雑音も多いなか、しっかり認識してくれます。
ポッドキャストに字幕をつけるような用途でも活用できそうです。
リスニングに自信がなくても、
あれ?と思った部分はテキスト化してみるのもありかもしれませんね。
ブログを音声入力してみるのもいいかもしれません。
お次は日本語の「ねじまきラジオ」。
音楽が流れていても、しっかり声を認識してくれます。

日本語でもばっちり認識してくれます。
しかも一瞬どもったところもしっかり修正して文字にしてくれるという。
他の言語でもおそらくこのレベルを保っているのではないでしょうか。
アプリの動作的には、文脈によって考えながら瞬時に表示しているような様子です。
読み上げている途中は一瞬、怪しい文章になっているのですが、
一文を話し終えるころには完全に音声がテキスト化されてます。
違和感もほとんどなし。
少し手直しさえすれば、文字起こしとしても十分に活用できそうです。
先月末、グーグルの動きでPodcast界が大きくざわついたのがこれ。
https://www.androidpolice.com/2019/03/26/google-podcasts-in-episode-search-is-coming-shows-now-being-fully-transcribed/
この記事によると、グーグルは音声を完全にテキスト化・文字起こしする仕組みはもう準備できているとのこと。
つまり、
・ポッドキャストを全て文字化して検索できるなサービス
・耳が聞こえない人でもPodcastが楽しめるようになる
・ポッドキャストアプリ内で自動字幕表示
・逆にテキストから自動でロボット音声のポッドキャストを作れる
なんてことも十分に考えられます。(あくまで想像ですが)
音声メディアの盛り上がりとともに、
最近、グーグルポッドキャストもブラウザで聞けるようになったり、気合が入り始めたGoogle。
http://www.nejimakiblog.com/entry/google-podcast-app-browser
今後の展開に、色んな想像が膨らみます。
なおこの音声変換アプリ、
英語だけでなく、日本語や様々な国の言語に対応している模様。
それもすごいですね。
類似のサービスである「Speech Notes」も割とすごいのですが、
Googleの音声文字変換アプリの方が、表示が早い気がします。
まだベータ版ということで 文章の区切りがないのがたまに傷、ですが、
アプリ自体がかなり軽快な動作で、ほんと驚かされました。
ピクセル4などでは今後さらなる昨日の進化が期待出来そうです。
※追記:(2019.5.7)ライブトランスクリプションのアップデートがGoogleI/Oカンファレンスで発表。
Live transcriptionの威力凄まじいですね。
ポッドキャスト論まとめ
Podcastやってます。
iPhone/iTunesで聴く→ https://itunes.apple.com/jp/podcast/世界のねじを巻くラジオ-ゲイのねじまきラジオ/id1409236261?l=en
Spotifyで聴く→https://open.spotify.com/show/6ComJ7U0Y0yJ9DM1eEt9jj?si=FlR5lp6VTQuDe86DH125VA
Android(Google)で聴く→ https://podcasts.google.com/?feed=aHR0cHM6Ly9uZWppbWFraS1yYWRpby5jb20vZmVlZC8%3D
※追記(2019.9.4): Android10で追加された(Live Transcription)ライブトランスクリプション機能がすごいです。
AndroidQでは画面に文字を自動で表示してくれます!→英語版のみ2019年内に追加予定の機能。日本語対応も一刻も早くしてほしいな。
「Live Caption」という名称だったり、名前がいまいち定まってないようですね。
「Made by Google」のイベントで、Pixel4の進化を早く見てみたいところ。
Youtubeとポッドキャストの統合の噂など、今後も状況を追っていきたいと思います。
※追記(2019.10.15): Made by Googleのイベントで発表されたPixel4の「Recorder」がすごいです。
機内モードでも機能するテキスト化機能を備えたボイスレコーダーアプリ。
他のAndroidスマートフォンでも使えるようになるといいですね。
※Pixel3 / Pixel3XLでも文字おこし機能が使えるようになったようです。
※追記(2020.10.15):Pixel5のためにアップデートされて録音アプリがさらにすごくなってます。
Googleレコーダーアプリの音声文字変換がすごい【Pixel6】
ポッドキャスト論まとめ