グーグルの「Live Transcribe」にポッドキャストの未来を見た

【Googleの音声文字変換技術】

現在(2019.4.7時点)で公開されているAndroidアプリ「Live Transcribe」。
どんなアプリかというと、
リアルタイムで話した声を文字にしてくれる
という優れもの。

まずは英語からお手並み拝見。
ポッドキャスト小説「Limetown」を再生しながら、
このアプリに聞かせてみました。
結果はこんな感じ。

google transcribe グーグル音声変換
Limetown

す、すごい。
しかも電話で話しているシーンで雑音も多いなか、しっかり認識してくれます。
ポッドキャストに字幕をつけるような用途でも活用できそうです。
リスニングに自信がなくても、
あれ?と思った部分はテキスト化してみるのもありかもしれませんね。

お次は日本語の「ねじまきラジオ」。
音楽が流れていても、しっかり声を認識してくれます。

グーグル音声変換技術 テキスト化
ねじまきラジオ

日本語でもばっちり認識してくれます。
しかも一瞬どもったところもしっかり修正して文字にしてくれるという。
他の言語でもおそらくこのレベルを保っているのではないでしょうか。

アプリの動作的には、文脈によって考えながら瞬時に表示しているような様子です。

読み上げている途中は一瞬、怪しい文章になっているのですが、
一文を話し終えるころには完全に音声がテキスト化されてます。
違和感もほとんどなし。
少し手直しさえすれば、文字起こしとしても十分に活用できそうです。


先月末、グーグルの動きでPodcast界が大きくざわついたのがこれ。
https://www.androidpolice.com/2019/03/26/google-podcasts-in-episode-search-is-coming-shows-now-being-fully-transcribed/

この記事によると、グーグルは音声を完全にテキスト化する仕組みはもう準備できているとのこと。
つまり、

・ポッドキャストを全て文字化して検索できるなサービス
・耳が聞こえない人でもPodcastが楽しめるようになる

・ポッドキャストアプリ内で自動字幕表示
・逆にテキストから自動でロボット音声のポッドキャストを作れる

なんてことも十分に考えられます。(あくまで想像ですが)

音声メディアの盛り上がりとともに、
最近、グーグルポッドキャストもブラウザで聞けるようになったり、気合が入り始めたGoogle。
http://www.nejimakiblog.com/entry/google-podcast-app-browser

今後の展開に、色んな想像が膨らみます。
なおこの音声変換アプリ、
英語だけでなく、日本語や様々な国の言語に対応している模様。
それもすごいですね。

類似のサービスである「Speech Notes」も割とすごいのですが、
Googleの音声文字変換アプリの方が、表示が早い気がします。

まだベータ版ということで 文章の区切りがないのがたまに傷、ですが、
アプリ自体がかなり軽快な動作で、ほんと驚かされました。
今後さらなる昨日の進化が期待出来そうです。

Podcastやってます。

iPhone/iTunesで聴く→ https://itunes.apple.com/jp/podcast/世界のねじを巻くラジオ-ゲイのねじまきラジオ/id1409236261?l=en 

Spotifyで聴く→https://open.spotify.com/show/6ComJ7U0Y0yJ9DM1eEt9jj?si=FlR5lp6VTQuDe86DH125VA

Android(Google)で聴く→ https://podcasts.google.com/?feed=aHR0cHM6Ly9uZWppbWFraS1yYWRpby5jb20vZmVlZC8%3D

返信を残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です

CAPTCHA