AIsmiley Magazine

AIsmiley編集部によるAI・人工知能サービスの導入事例や活用事例などの情報を記事にしてお届けします

AI・人工知能サービス

2020/2/19

データにタグ付け?AI開発におけるアノテーションとは?

  • 業種・業態
  • 編集部記事

「結局、AIを使って何が出来るの?」各業界注目の画像認識AIの導入活用事例

近年、AI・人工知能を活用したサービスが急増しており、気軽にAIの技術を体感することができるようになりました。私たちにとって非常に身近な存在になりつつあるわけですが、AIという領域にはさまざまな専門用語が存在するため、それらの専門用語までは理解できていないという方も多いのではないでしょうか。また、聞いたことはあるものの詳しい意味までは分からない言葉なども存在するかもしれません。

そこで今回は、AIという領域において特に重要な専門用語である「アノテーション」という言葉を取り上げ、その詳しい意味を解説していきます。

■AI領域で耳にする機会が多い「アノテーション」とは

■AI領域で耳にする機会が多い「アノテーション」とは|人工知能を搭載した製品・サービスの比較一覧・導入活用事例・資料請求が無料でできるAIポータルメディア

アノテーションとは、テキスト(文章)や音声、動画といったさまざまな形態のデータに、「タグ」を付けていく作業のことです。AIの機械学習アルゴリズムは、タグが付けられているデータを取り込むことによって、初めてパターン認識が可能になります。そのため、AIを開発する上では、タグが付けられている状態のデータを大量に用意した上で、機械学習アルゴリズムを学習させていかなければならないのです。

タグ付けが正確に行われていないデータを用意しても、AIは正しく学習することができませんから、AI開発において「タグ付け」の作業を行うアノテーションは、絶対に欠かせないものであることがお分かりいただけるでしょう。

 

■データにタグ付けを行う「アノテーション」にもいくつかの種類がある

■データにタグ付けを行う「アノテーション」にもいくつかの種類がある|人工知能を搭載した製品・サービスの比較一覧・導入活用事例・資料請求が無料でできるAIポータルメディア

アノテーションがどのような作業なのかお分かりいただけたかと思いますが、実はアノテーションにもいくつかの種類が存在し、それぞれ目的が大きく異なります。ここからはアノテーションの種類について詳しくみていきましょう。

 

・セマンティック(意味的)アノテーション

セマンティックアノテーションとは、テキスト内に存在するさまざまな単語(人の名前、物体の名称、企業名など)に意味付けをするタグ付けのことです。機械学習アルゴリズムが適切な形でデータの読み込みを行えるようにすることが目的で、具体的な活用例としては「検索エンジンの関連性改善」「チャットボットの学習」などが挙げられます。

 

・画像、映像アノテーション

機械学習による画像認識、映像処理といったAI活用は、さまざまな分野で導入されています。その代表例としては、「自動車の自動運転」「商品リストの分類」「SNSにおける不適切画像の摘出」などが挙げられるでしょう。これらの機械学習モデルは、それぞれの画像・映像の内容を的確に理解しなければ正しく機能しません。そのため、開発者は画像認識や映像処理の学習をさせるために「現場測定データ」として利用可能な「タグ付けされたデータ」を大量に用意する必要があるのです。

 

・テキストやコンテンツの分類

テキストやコンテンツの分類を行う作業もアノテーションに該当します。具体的には、「あらかじめ定義されたカテゴリを、フリーテキストの文章に割り当てていく」といった作業です。ニュースサイトなどで「スポーツ」「娯楽」「政治」「国内」といったカテゴリ分けが行われているものを目にしたことがある方も多いのではないでしょうか。あのようなカテゴリ分けは、まさにこの「テキスト・コンテンツ分類」というアノテーションによって実現できるものです。

 

・インテント(意図)抽出

最近ではAIが文章を理解して自動応対する「チャットボット」が注目を集めていますが、このチャットボットにおいてもアノテーションが行われています。チャットボットがユーザーの質問に対して的確な回答を行うためには、そのユーザーの意図をしっかりと汲み取らなくてはなりません。
たとえば、飲食店のチャットボットに「キャンセル料はいくらですか?」という質問が寄せられたとします。当然、このユーザーの意図は「キャンセル料を教えて欲しい」というものになるわけですが、チャットボットに判断能力が備わっていない場合、「事前に連絡をすればキャンセル料は発生しませんか?」といった問い合わせに対しても「キャンセル料がいくらなのか」という質問に対する回答を行ってしまう可能性があるのです。
それこそ、「チャットボットという単語が含まれているか」という判断基準しか備えていないチャットボットであれば、上記のような回答になってしまう可能性があります。そのような問題を解消するために行うのが、このインテント抽出です。インテント抽出では、語句や文といったレベルでユーザーの意図をタグ付けしていきます。この作業を継続していくことで、特定の要求を行う上で必要な表現のライブラリが構築されていき、より的確にコミュニケーションを取れるようになっていくわけです。

 

■アノテーションを自社で行っていくことの難しさ

ここまでのご紹介で、AI開発におけるアノテーションの重要性がお分かりいただけたのではないかと思います。しかし、アノテーションの「タグ付け」という作業は決して簡単なものではないことも忘れてはなりません。

AIを開発していく上では大量のデータを扱っていく必要がありますし、そのデータも多種多様なものになる可能性があります。その大量のデータを適切に扱っていくことは決して簡単ではありませんし、何より専門的な知識が求められます。

そのため、専門的な知識を持つ従業員がいない企業が1からアノテーションを含めたAI開発に着手するのは現実的とはいえないでしょう。とはいえ、専門知識を持つ担当者がいないという理由だけでAIの開発や運用を諦めてしまう必要もありません。最近ではアノテーション作業や品質チェックなどの代行サービスを提供する企業が増加しているからです。

その一例として、アノテーション作業や品質管理、そして管理進行まで、すべての業務を任せていくことが可能なプラットフォームが増加しつつあります。

こういったプラットフォームを活用していけば、専門知識を持つ担当者が存在しない企業や、開発コストの捻出が難しい企業などでも、AIの運用を検討していくことができるでしょう。AIが身近な存在になりつつある現代において、AIの活用は、新たな可能性を引き出すために欠かせない手段のひとつと言っても過言ではありません。この機会に、アノテーションをはじめとする「AI開発」の領域にも目を向けてみてはいかがでしょうか。

 

アノテーションのサービス比較と企業一覧を見る

 

このAI記事が気に入ったら
いいね ! しよう

Twitter でAIポータルメディアAIsmileyを
この記事で紹介されたAIサービスを無料で資料請求