AIsmiley Magazine

AIsmiley編集部によるAI・人工知能サービスの導入事例や活用事例などの情報を記事にしてお届けします

AI・人工知能サービス

2020/4/27

AIの精度向上に欠かせない教師データの作成方法とは?

  • 業種・業態
  • 編集部記事

AIの精度向上に欠かせない教師データの作成方法とは|人工知能を搭載した製品・サービスの比較一覧・導入活用事例・資料請求が無料でできるAIポータルメディア

近年は多くの企業で人手不足が深刻な課題となっており、その課題を解決するための手段としてAIを導入する企業も多くなってきています。とはいえ、AIはさまざまな用途で活用することができるため、どのような用途でAIを活用するのか明確にしなければ、AIを有効活用できずに失敗してしまう可能性も否めません。

また、AIは日々の学習によって精度を向上していくものでもあるため、その精度を高めるための「教師データ」にもしっかりと目を向けることが大切になります。今回は、AIの精度を高める上で欠かせない教師データについてご紹介していくとともに、具体的な作成方法についても解説していきますので、ぜひ参考にしてみてください。

■そもそも「教師データ」って何?

■そもそも「教師データ」って何?|人工知能を搭載した製品・サービスの比較一覧・導入活用事例・資料請求が無料でできるAIポータルメディア

これまでAIを導入したことがない企業の担当者や、これからAIを導入しようか悩んでいる担当者の中には、「AIという言葉の意味自体は何となく理解できているものの、具体的には分からない」という方も多いのではないでしょうか。AIを理解する上で、教師データは極めて重要なものであるため、まずは教師データの基礎的な部分からご紹介していきます。

AIには、機械学習という要素技術が存在します。その機械学習は、データの種類や状況などに応じて「教師あり学習」「教師なし学習」「強化学習」という3つに分けることができ、教師データは「教師あり学習」において必要となるデータとなるわけです。

教師あり学習とは、その名の通り、教師となるデータをもとに学習していくものであり、不明なデータを持ち寄った場合には正解を教えてくれるというイメージで問題ありません。そのため、正解となるデータを大量に学習していくことで、新しいデータにも対応することができるようになるのです。

そんな教師あり学習は、「学習」「認識・予測」という2つのプロセスによって成り立っています。1つ目のプロセスである「学習」では、正解のデータを用いてルールやパターンの学習を行っていくわけです。そして2つ目のプロセスである「認識・予測」では、新しくインプットされた「まだ正解がわからないデータ」に対して、これまでに学習したデータを用いて認識・予測を行っていきます。

なお、「教師なし学習」に関しては、その名の通り教師データが必要ありません。教師なし学習は、膨大なデータの学習を行うわけではなく、データそのものが持っている構造や特徴の分析を行っていくため、グループ分けやデータ簡略化といった作業がメインになります。

 

■機械学習にはどれくらいの教師データが必要なのか?

■機械学習にはどれくらいの教師データが必要なのか?|人工知能を搭載した製品・サービスの比較一覧・導入活用事例・資料請求が無料でできるAIポータルメディア

機械学習を行うためには教師データが必要であることがお分かりいただけたかと思いますが、具体的にどれくらいの教師データを用意する必要があるのでしょうか。

機械学習において必要となる教師データの数は、AIの用途によっても大きく変化するため、一概には言えないというのが実際のところです。そのため現状では、必要だと予測される教師データの数を人間が推測しなければなりません。

銀行の融資の審査を行うためのAIを構築していく場合であれば、「1万人の過去の融資審査データが用意できていれば精度を十分高められるだろう」「100人の融資審査データを用意しただけでは少ないだろう」といったように、あらかじめ予測した上でデータを用意する必要があるということです。

ただし、AIを構築するにあたり、必ずしも教師データの数は多くなければならないというわけではありません。運用を開始した後に収集したデータを活用して学習していくこともできるからです。そのため、教師データが少ない状態でもAIの運用を開始すること自体は可能といえます。

 

■教師データの作成方法(集め方)

■教師データの作成方法(集め方)|人工知能を搭載した製品・サービスの比較一覧・導入活用事例・資料請求が無料でできるAIポータルメディア

教師データを大量に用意しなくても、AIの運用を開始すること自体は可能であることがお分かりいただけたかと思います。では、肝心の教師データはどのような方法で収集すれば良いのでしょうか。教師データの集め方は、AIの用途によって方法が異なりますので、それぞれ詳しくみていきましょう。

 

・社内に蓄積されたデータを活用する

社内には顧客データや売り上げデータ、文書データ、機械のセンサデータなど、さまざまなデータが蓄積されています。それらを活用してAIに学習させることで、より業務効率化を推進することができるでしょう。

たとえば、クレジットカードの審査の場合、過去の数千人分のデータと審査結果の正解ラベルを用意することによって、「クレジットカードを発行できるかどうか」の判別を自動化させることができるわけです。

 

・動画から画像データを収集する

画像データを必要とするAIを構築する場合には、動画から画像データを集める方法が有効です。そもそも動画は、画像データをパラパラ漫画のように連続で表示させてアニメーションにしたものであるため、フレームレートが30fpsの30分の動画からは5万4,000枚の画像データが収集できます。

ちなみに、動画から画像データを収集することで機械学習に活かした事例のひとつに、「Googleのネコ」というものが挙げられます。これはGoogleが行った実験のひとつで、1週間コンピューターにYouTubeを見せ続け、そのコンピューターに猫の写真を判別できるよう学習させたというものです。

一般的な機械学習の場合、事前に「猫」というラベル付けを行った画像を学習させるわけですが、この実験ではコンピューター自身がYouTubeの映像から「猫がどのようなものなのか」を学んでいきました。一見、動画を見せ続けていただけですが、その動画から大量の画像データを学習していたのです。

 

■教師データの作成を代行するサービスも増加中

今回は、精度の高いAIを構築する上で重要な役割を果たしている教師データについてご紹介しました。教師データの収集に難しさを感じられた方もいらっしゃるかもしれませんが、最近では教師データの作成を代行してくれるサービスなども増えてきています。より効率的にAIを構築していきたい場合には、こういったサービスの利用を検討してみても良いかもしれません。

もちろん、社内に蓄積されたデータを活用するのも有効な手段のひとつですが、蓄積されたデータはその企業にとって極めて大切な財産です。情報が漏洩してしまわないように、十分な注意を払ってデータを扱うようにしましょう。

 

教師データ・アノテーションの作成代行サービスを見る

 

このAI記事が気に入ったら
いいね ! しよう

Twitter でAIポータルメディアAIsmileyを
この記事で紹介されたAIサービスを無料で資料請求