AIsmiley Magazine

AIsmiley編集部によるAI・人工知能サービスの導入事例や活用事例などの情報を記事にしてお届けします

500円・15分の収録で自分の声を「AI音声合成」化してみた!音声合成プラットフォーム「CoeFont CLOUD」


こんにちは、AIsmiley編集部の伊藤です。

2021年7月28日(水)、株式会社Yellstonが提供するAI音声合成プラットフォーム「CoeFont CLOUD」が正式リリースを開始しました。先行リリースでは、1,500件以上の先行体験の申し込みがあるなど、今注目のAI音声合成クラウドサービスです。

今回は実際に「CoeFont CLOUD」を使って自分のCoeFontをAIで作成してみました。

 

■AI音声合成プラットフォーム「CoeFont CLOUD」とは



「CoeFont CLOUD」はAI音声合成プラットフォームです。CoeFontとは、「声」を、手軽かつ表現力豊かな、「フォント」のようにする、というコンセプトの音声合成です。

従来では、50万円・10時間以上の収録を必要としていました。本サービスでは、500円・15分の収録で、それよりもかなり自然な発声のできる、CoeFont(AI音声合成)を作成できます。作成したCoeFontが利用されるたびに、CoeFontの作成者に収益として還元されます。またAPIを利用して、アプリやウェブサイトに組み込むこともできます。

 

■「CoeFont CLOUD」サービス登録の方法

公式ホームページの右上から新規登録をクリックします。

https://coefont.cloud/

メールアドレスを入力、Googleアカウントをお持ちの方はGoogleで新規登録が可能です。

会社名と電話番号を入力すると、サービス利用画面のトップページに遷移します。

■500円で自分の声を「AI音声合成」化

収録時間が長いほど、高品質なCoeFontを作成できると言います。今回は初めてなのでお試し版を使って収録をしたいと思います。収録はブラウザ上での録音になります。録音環境はPC版 Google Chromeを推奨です。決済情報を入力したら、次は自分の性別情報を入力します。

 

録音前には注意事項が表示されます。なるべく静かな場所で落ち着いて収録できるような環境を作ってから臨みましょう。約10秒ほどマイクの確認時間があります。

 

■いざ収録本番、ボタンを押して・読んで・スイッチ

環境音のノイズチェックが終わったらいよいよ収録本番です。画面に分かりやすく簡潔な文章で原稿が表示されます。

「近所で猫がニャーニャー鳴いている。」

操作方法は簡単で、ボタンを押して録音スタートし、表示されている原稿を音読、終わったらストップボタンを押して次の画面にスイッチするだけです。この繰り返し作業をお試し版では最大100回繰り返します。

録音ボタンを押してゆっくりとした口調で収録すると精度の向上が期待できるようです。途中で録音を中断も出来るので、休憩をはさみながらの録音をおすすめします。

時折でてくる、突拍子もない原稿が笑いを誘うこともあります。ユーザーに収録を飽きさせないで楽しむための工夫の一つかもしれません。


全100回の収録を完了しました。収録時間はわずか15分でしたが、日常で原稿を読む機会が少ないので、体感ではもう少し長く感じました。

収録が完了して直ぐには自分のCoeFontは使えず、ここからAIによる音声合成が開始します。CoeFontの生成には通常6~8時間ほどかかるということなので、完成の通知メールを楽しみに待ちたいと思います。

 

■ついに完成!自分オリジナルの「AI音声合成」

 

ついに自分の音声データを使った「AI音声合成」が完成しました。CoeFontはプロフィールを設定することが出来ます。自分の顔写真を設定する人よりも、自分の手で創作したオリジナルキャラクターのイラストと紹介文を登録する人が多い印象です。

 

「CoeFontを試す」では、「セリフ」「ニュース」「小説」のサンプルボイスを試聴することが出来ます。自分のCoeFontを聞いてみた感想は「え、まったく違和感がない」と期待を超えてくる完成度でした。最近はWeb会議に参加する機会が増えましたので、一度マイクとスピーカーを通した「通話中の自分の声」と同じくらいという印象です。「CoeFontを試す」は無料なので、もし興味がある方は、こちらのリンクから実際に私の音声合成を聴いてみて下さい。

■AIsmiley編集部スタッフに「AI音声合成」の感想をきいてみた

AIsmiley編集部のスタッフに私のCoeFontを聴いてもらい、感想をインタビューしてみました。

Q. 本人の声とCoeFontを聴き比べた感想を教えて下さい

「 伊藤さんを美化した感じ。綺麗な伊藤さんですね。『セリフ』の話し言葉よりも、『ニュース』の原稿のほうが自然な声に聞こえました」

「あっはっは(爆笑) 。声質は違うと感じましたが、声の抑揚などはとても特徴を捉えていると感じました 」

「 クスクス(失笑)。『ゆっくり実況』よりもこちらの方が聞きやすいと思いました。もしも話している相手の表情が見えない電話などのシーンなら、本人と勘違いするかもしれませんね」

「シンプルにすごいですね!自分が思っていたよりも人間らしい声に聞こえたので驚きです」

 

一同、最初は笑いをこらえながら聴いていましたが、ニュースの原稿を読み上げるCoeFontには皆が口をそろえて「想像以上だった」という反応でした。「帰ったら自分の声でもやってみたい」という人もいました。500円で自分の声を「AI音声合成」化できるAI音声合成プラットフォーム「CoeFont CLOUD」、気になる方はぜひお試し下さい。

■ますます活用の輪が広がる合成音声×AI

CoeFontは人の声帯の代替手段としても活用されています。咽頭癌患者が声帯切除手術前にCoeFontを作成、術後にCoeFontを利用されています。

この他、AIsmileyでは合成音声AIの技術の中核となる自然言語処理技術や音声認識の技術、導入事例についても取り上げてきました。

最近話題のボイスボットでは、コールセンターなどに寄せられるお客様の電話をAIが音声認識し、あらかじめ設計したシナリオに従って、音声合成した滑らかな発話で自動応答する音声チャットボットの提供を実現しています。また、YouTubeなどの動画コンテンツやラジオやポッドキャスト番組などの音声コンテンツにも、合成音声AIの活用が広がっています。

今後ますます活用が期待されるAIを使った音声合成の最新技術について、引き続きAIsmiley編集部でも注目していきたいと思います。

 

このAI記事が気に入ったら
いいね ! しよう

Twitter でAIポータルメディアAIsmileyを
この記事で紹介されたAIサービスを無料で資料請求