日頃、耳にするカーナビや自動オペレーターなどの「音声」。
よく聞いてみると、機械的に棒読みをしていた昔のものと違い、最近のものは比較的自然に話していることに気づくと思います。

もしかすると、それは人ではなくハイテク音声合成技術「エーアイトーク」かもしれません。今回は、いまや生活で身近になった“人間らしい音声”の秘密に迫ります!

機械ではなく“実在する人の声”?

エーアイトークはスマートフォンの天気予報読み上げや、自治体のスピーカー放送など、なんと約400カ所で使われているとっても身近な音声。

「エーアイトーク」はスマートフォンの天気予報読み上げ「エーアイトーク」はスマートフォンの天気予報読み上げ
約400カ所で使われている身近な音声「エーアイトーク」約400カ所で使われている身近な音声「エーアイトーク」

使われるシーンに合わせて、大人の男女から子供まで様々な声の種類があるのも特徴の一つです。これは実際に人の声をたくさん録音し、それを元に音声を作ることで可能にしているとのこと。

たくさんの言葉を人の声で録音し、それを元に音声を作成たくさんの言葉を人の声で録音し、それを元に音声を作成

しかし声色だけではなく、自然な抑揚まで再現できているのはなぜでしょうか?

人間らしい抑揚を作るため、文章を音読?

エーアイトークの抑揚は、独自開発した200本の文章を人に読んでもらい、五十音分のさまざまな抑揚の要素を取得することで実現していました。

言葉はそれぞれ、発音や文脈によって強さや長さが異なるため、「あ」の抑揚のパターンだけでも約80種類以上あるのだとか。

「あ」の抑揚だけでも約80種類以上「あ」の抑揚だけでも約80種類以上

それらの要素を組み合わせることによって、自然な抑揚がついた音声を出すことを可能にしています。

自然な抑揚がついた音声を再現できる「音声辞書」の組み合わせ自然な抑揚がついた音声を再現できる「音声辞書」の組み合わせ

 

「エーアイトーク」生みの会社

ハイテク音声合成技術エーアイトークを作っているのは、株式会社エーアイ。

ハイテク音声合成技術「エーアイトーク」を作っている株式会社エーアイハイテク音声合成技術「エーアイトーク」を作っている株式会社エーアイ

2003年に創業したエーアイは、今では年商は7億円にまで大成長。2018年6月に株式上場を果たしました。

自然な抑揚で文章を読み上げてくれるエーアイトーク、これからも活用の場はどんどん広がりそうですね。

経済のことが学べる
がっちりマンデー!!
(TBS系列 日曜あさ7:30~)

 

▪️次回(6/16)の放送

 

TBS Topics

毎週日曜午後6時から放送中の『世界遺産』。番組は1996年4月に放送を開始、今年4月に放送25年目に突入した。10月4日(日)午後6時からの放送では、放送25年スペシャルとして「4K8K特別編比叡山の四季」をお送りする(地上波ではフルハイビジョンに変換して放送。BS-TBSでは12月に4K放送の予定

ページトップへ
Twitter Facebook