AIsmiley Magazine

AIsmiley編集部によるAI・人工知能サービスの導入事例や活用事例などの情報を記事にしてお届けします

AI・人工知能サービス

最終更新日:2020/6/23

音声認識機能で議事録の作成は可能?精度はどれくらい?【地方自治体の導入事例】

  • 編集部記事

音声認識機能で議事録の作成は可能?精度はどれくらい?【地方自治体の導入事例】|人工知能を搭載した製品・サービスの比較一覧・導入活用事例・資料請求が無料でできるAIポータルメディア

「会議の議事録づくりが面倒」と感じている人は決して少なくないでしょう。録音されたテープを聞きながら文字を起こしていくのは、決して楽な作業ではありません。当然、人にはミスがつきものですから、場合によっては聞き間違いなどをしてしまう可能性もあるわけです。重要な言葉を聞き間違えてしまえば、その後重大なトラブルになる可能性もあります。

そういったミスを最小限に留め、より効率的に議事録を作成するための方法として最近注目されているのが、音声認識機能を活用した議事録の作成です。最近では、Googleドキュメントやエバーノートで音声認識機能が搭載され始めていますが、議事録作成に役立つレベルまで精度が上がっているのでしょうか。

今回は、音声認識機能の精度や、実際に音声認識機能を導入している自治体の事例などを詳しくみていきましょう。

 

■議事録作成を効率化する音声認識技術の仕組み

議事録の作成を効率的に行うための方法として注目を集めている音声認識ですが、具体的にどのような仕組みで成り立っているものなのでしょうか。まずは、その具体的な仕組みについてみていきましょう。

そもそも言葉というものは、調節器官を用いて発せられるものであり、人間の目には見えない音波として耳に届きます。音声認識技術は、その音波を読み取った上で音の最小構成単位の「音素」を特定し、テキストに変換していくという仕組みです。ちなみに「音素」は、日本語の場合だと以下のようなものが該当します。

・あいうえお(母音)
・ん(撥音)
・23種類の子音

たとえば「おはよう」という言葉の場合、音素として抽出するとo-h-a-y-oとなり、アルファベット一つひとつが音素となるわけです。この音素をもとにしてテキスト化を行っていくのが、音声認識の仕組みとなります。

ちなみに、テキスト化までのプロセスは以下の通りです。

1.マイクなどの音声入力装置で人の声を録音
2.ノイズや雑音といった不要な音声を取り除く
3.音波から音素を特定する
4.音素の並びを特定した上で単語に変換していく
5.単語の並びから文章を作成し、テキスト化する

上記のプロセスからもお分かりいただけるように、ただ音素を抽出しただけではテキスト化を行うことはできません。音素を特定し、意味のある単語として認識させることが必要になるのです。

 

■Googleドキュメントの音声認識はどれくらいの実力?

まず、無料で手軽に音声認識機能が試せるツールとして、Googleドキュメントの音声入力を試してみましょう。

Googleの音声入力機能の強みは、変換のスピードとその正確性です。タイピング入力だとつまずいてうまく文章が作成できないという人でも、音声入力なら話をする感覚で入力できるのでスムーズに作業が進むということもあるようです。

また、さまざまな端末で使用することができるという点も、Googleの音声入力機能の強みといえるでしょう。Googleドキュメントの音声入力は、Chromeブラウザで使用することができます。Chromeブラウザはパソコンやタブレット、そしてスマホにも使用できるため、それらすべての端末において音声入力が使用できるということです。もちろん、パソコンはWindowsでもMacでも問題ありません。

ただ、Googleの音声入力はパソコンやスマホのマイクに話しかけなくては認識されません。また、紙をめくる音や周囲の雑音によって音声認識が途切れてしまうことも少々あり、雑音が多い複数人での会議の音声をそのまま議事録として文字に起こすというのは難しいかもしれません。

録音した会議の内容を聞きながら自分で読み上げて、それを音声入力機能に認識させて文字化するといった使い方であれば、議事録の作成も可能でしょう。中には、文章を書くことが得意でない方もいらっしゃるかもしれません。そのような方であっても、音声入力であれば自動的に違和感のない文章にしてくれるため、よりスムーズに議事録の作成を行えるわけです。

また、タイピングが得意ではないという方であっても、音声入力であればスムーズに書き起こしすることができるので、そのような方はぜひGoogleドキュメントの音声認識を使用してみてはいかがでしょうか。

Googleドキュメントの音声認識はどれくらいの実力?|人工知能を搭載した製品・サービスの比較一覧・導入活用事例・資料請求が無料でできるAIポータルメディア

(参照:applica Googleドキュメントの音声入力でテキスト化する使い方!文字認識できない時は?)

 

■高精度のAIエンジンによって議事録の自動要約が行える「QuickSummary」

株式会社エーアイスクエアが提供している「QuickSummary」というAIシステムでは、高精度のAIエンジンが搭載されているため、議事録や対話などの音声を自動で要約・分類することが可能です。そのような「QuickSummary」の大きな特徴としては、以下の3つが挙げられます。

 

1.カスタマイズなしでダイジェストを抽出できる

文・単語間の参照関係を数値化(スコアリング)することによって、文字数や圧縮率を指定し、重要な箇所だけ抜粋することが可能です。また、論文やニュース、書籍など、一定のテーマに沿って論理的に構成されている文章であれば、ユーザー側が学習させる必要もないので非常に便利です。

 

2.教師付き学習によって業務の特性に応じた要約や分類が行える

業務特性によっては、重要性に応じた要約や分類が必要になるケースも存在します。「QuickSummary」では、教師データを与えることによってモデルの最適化を行えるため、業務に応じた要約や分類を柔軟に進めていくことが可能です。

 

3.重要語句の自動抽出、自動分類によるVoC分析・SNS解析が可能

トレンドキーワードや業界用語などが含まれるテキスト群のタグ付けを自動で行うことができます。また、キーワード抽出も自動で行えるため、人間による恣意性を排除した上で、どのような傾向にあるのかを把握していくことが可能です。

このような特徴を持つ「QuickSummary」ですが、具体的な機能としては以下のようなものが備わっています。

 

・学習データメンテナンス機能

要約対象のセンテンスや、分類などの教師データを、管理画面からメンテナンスできる機能です。

 

・対応分類機能

対応を自動で分類していく機能です。ユーザーが定義した複数の分類を同時に付与していくこともできます。

 

・要約文の抽出機能

要約の上限文字数や上限発話数、センテンス重要度といった条件に沿って要約文を作成することができる機能です。

 

・辞書登録機能

管理ツールから、重要なワードやNGワード、強制置換ワードなどを辞書に登録することができます。

 

・重要キーワード機能

会話の全文から重要なキーワードを抽出していくことができる機能です。

 

・ダッシュボード機能

キーワードクラウドや分類チャート、日別のコール数などを集計することによって、コールの全体的な傾向がどのようなものか確認できる機能です。
これらの機能が備わっている「QuickSummary」は、議事録はもちろんのこと、コールセンターでの活用も可能なため、議事録以外でも活用していきたいと考えている企業にはとくにおすすめのAIシステムといえるでしょう。

 

QuickSummaryを無料で資料請求する

 

■茨城県庁や滋賀県庁が議事録作成の音声認識サービスを導入

音声認識技術のエキスパートであるアドバンスド・メディアは、議事録作成のクラウドサービス「ProVoXT(プロボクスト)」を提供しています。

茨城県庁ではこのほど、この「ProVoXT」を採用し、会議の議事録作成の効率化を図ると明らかにしました。

自治体では、住民に公開するための議事録作成は大切な業務のひとつです。正確な内容を作成するために細心の注意が必要とされますが、専門の業者でない職員が手作業で入力しようとすると、かなりの作業時間を必要とします。その結果、職員の残業が増えたり、通常業務に支障をきたしたりといった問題がありました。重要な会議などは文字起こしの専門業者に委託することもありますが、費用がかかるというデメリットがあります。

「ProVoXT」はICレコーダーなどで録音した会議の音声をインターネット経由でアップロードすると、内容が文字化されるというサービスです。数時間の録音データも十数分で文字データに起こすことができます。そのため、人の手による議事録作成と比較すると、50%から70%の作業時間短縮につながるそうです。

また、アップロードした音声の認識結果は音声データと紐付けされているため、「AmiVoice Rewriter(アミボイス リライター)」というProVoXT専用の編集ソフトを使用することで、誤認識の修正を行えます。

現在、茨城県庁では小さい会議も含むかなりの数の議事録を作成しているといいます。「ProVoXT」を活用すれば、会議の内容を短時間で確認することができ、作業時間も大幅に短縮されるので、職員は議事録作成に充てていた時間を他の業務に活用することが可能になります。また、大事な発言だけを抜粋したいというニーズにも対応でき、導入の成果を挙げているということです。

このアドバンスド・メディアの議事録作成支援システムは滋賀県でも導入されています。滋賀県においても、議事録作成における「業務効率化」と「経費削減」は大きな課題となっていたことから、音声認識の導入に踏み切りました。従来の人の手による文字起こし作業と比べて、2~3倍の速さでテキスト化が可能になったといいます。また、滋賀県庁で過去に行われた会議の議事録をもとに専用辞書も搭載しているため、独特の言い回しや用語なども認識・変換が可能になっています。

さらに、アドバンスド・メディアの議事録作成支援システムは全庁的に利用可能であり、Webインターフェイスが採用されています。これにより、音声のアップロードや認識結果の確認、ダウンロードなどの作業をすべて自席で行うことができるのです。わざわざ席を離れる必要がないという点も、業務効率化につながる大きなポイントといえるのではないでしょうか。

ただし、音声認識の精度は録音状態に左右されてしまうため、マイクの整備など録音機能を高めるための環境整備が必要とされています。

(参照:IT Leaders 茨城県庁、音声認識で議事録を自動作成するクラウドサービス「ProVoXT」を全庁で導入)
(参照:IT Leaders 音声認識で議事録作成を半自動化するソフト、アドバンスト・メディアが販売)
(参照:IT Leaders 滋賀県庁、音声認識で議事録の作成を半自動化、手作業の2~3倍の速さでテキスト化)

 

AmiVoice MediaScriber Cloudを無料で資料請求する

 

■東京都港区や徳島県も議事録作成に音声認識を活用

先に紹介した都道府県意外にも、議事録作成に音声認識を活用している自治体は存在します。たとえば東京都港区では、2018年よりアドバンスト・メディアが提供する「AmiVoice 議事録作成支援システム」を本格運用し始めました。議事録作成の業務効率化と経費削減は大きな課題となっていたことから、このシステムの運用が決まったといいます。

また、徳島県では、知事の定例会見の議事録作成に音声認識が活用されています。AIがテキスト化と要約を行い公開するというシステムを採用しており、これにより議事録作成にかかる時間が5分の1程度に減少したそうです。これまでは複数の職員が会見内容を文字に起こし、3〜4日後に公開されていましたが、音声認識の導入によって瞬時に公開できるようになったといいます。

職員の作業も大幅に軽減されていることを踏まえると、音声認識によるメリットを得られている良い事例といえるのではないでしょうか。

(参照:東京都港区役所にて、AI音声認識を活用したAmiVoice 議事録作成支援システムが採用されました|PR TIMES)

 

■音声認識の精度が向上し議事録作成を手軽に利用できるサービスが増えることに期待

会議内容の把握に議事録の作成は欠かせません。しかし、音声データからの文字入力は手間のかかる作業であることは間違いなく、音声認識技術を活用して議事録作成を自動化できれば、かなりの作業負担が軽減されるようになるでしょう。

また、人の手で行う作業には、どうしてもミスが発生してしまいがちですが、音声認識機能を活用することでミスを極限まで減らすことが可能です。今後、音声認識の技術が発展していくにつれ、ミスが起こる確率はさらに減少していくでしょう。

今後さらに音声認識機能の精度が向上し、議事録作成を手軽に利用できるサービスが増えることが期待されています。

 

音声認識AIのサービス比較と企業一覧を見る

 

このAI記事が気に入ったら
いいね ! しよう

Twitter でAIポータルメディアAIsmileyを
この記事で紹介されたAIサービスを無料で資料請求