2021年1月6日水曜日

Google、合成音声によるオーディオブックをPlay Booksで無償提供。

音声合成技術の進歩はめざましいものがあり、特にAIの技術が導入されたことでその表現力は飛躍的に向上しました。「棒読み」と揶揄された平板で機会的な声のイメージは過去のものとなりつつあります。

メジャーな製品としてはAmazonのPolly、Microsoft AzureのText to Speech、東芝などによるコエステなどが思いつきますが、検索するとそれこそ数多くのサービスを見つけることができます。


音声合成の技術は幅広い分野へ応用されています。ATMや自動販売機といった電子機器はもちろん、テレビやラジオのニュース読みといったこれまで人間の声でなければ不自然と思われていた分野でも合成音声が採用されるようになってきました。

そんな中クラウド型音声合成サービスText-to-Speechを提供しているGoogleは、この技術をオーディオブックへ応用する取り組みを始めています。

AmazonのAudibleaudiobook.jpなどで配信されているオーディオブックは声優や俳優の肉声による録音が基本となっていますが、これを最新の音声合成技術によるナレーションで制作してしまおうというわけです。


9to5Googleの記事によると同社が運営する電子書籍ストア「Play Books」では、すでに8冊のフィクションと12冊のノンフィクション作為品が合成音声による自動生成でオーディオブック化され、無償で公開されているとのことです。これらの無料オーディオブック(Auto-narrated audiobook)の販売元はGoogle Play Public Domainとなっており、ナレーターとしてAlistairなどの合成音声の名前がクレジットされています。なお現時点では英語版のみで日本から購入・試聴することはできないようです。


Play Booksのヘルプには自動生成オーディオブックについて以下のようなエクスキューズが記載されています。

  • Mispronounced words(言葉の読み間違いがあるかも)
  • Pauses in places that don’t make sense(変なタイミングで間が空くかも)
  • A mismatch between the tone or emotion of word pronunciations and the content(内容とマッチしていない声のトーンや感情表現があるかも)

やっぱりまだ完璧という感じではなさそうですね。今後もしこれらのオーディオブックが有料で販売されるようになると、どこまで読み上げ品質が保証されるのかちょっと気になります。でも多少読み上げが不自然でもクセのある肉声と比べ合成音声の方が、意外と聴きやすくて好評だったりするのかもしれません。


海外ではオーディオブックの需要が高まっている一方、制作に必要な時間とナレーターのコストが負担となり供給が追いついていない状態が続いていると言われています。

自動生成できるようになればこれまでコスト回収が見込めなかった作品もオーディオブック化される道が開けてくるでしょう。電子書籍ではちょっと影が薄いPlay Booksですが、これでラインナップを拡充し巻き返しを狙っているのかもしれませんね。

Googleは現在パブリッシャー向けにオーディオブック変換ツールを開発しており(現在ベータ版)、2021年中にも正式リリースする予定とのことです。

視覚障害者としては「合成音声でオーディオブック」と聞くと、どうしても録音図書にも応用できないもんか?と考えてしまいます。


参考:Free Play audiobooks using Google auto-generated narrators - 9to5Google


0 件のコメント:

コメントを投稿

注: コメントを投稿できるのは、このブログのメンバーだけです。

米国マクドナルド、同社のキオスク端末に「JAWS Kiosk]を導入。視覚に障害があっても音声を用いた操作で注文から支払いまでを単独で実行可能に。

画像引用元: TPGi 米国マクドナルドは2021年9月9日、、支援技術ディベロッパーであるVispero社とと提携し、同社が運営する直営店およびフランチャイズ店舗に設置されているキオスク端末に対し「 JAWS Kiosk 」テクノロジーを採用したことを発表しました。 なおここで...