AIsmiley Magazine

AIsmiley編集部によるAI・人工知能サービスの導入事例や活用事例などの情報を記事にしてお届けします

AI・人工知能サービス

最終更新日:2020/2/12

検索を効率化!AIを搭載した全文検索の魅力とは?

  • 業種・業態
  • 編集部記事

検索を効率化!AIを搭載した全文検索の魅力とは?|人工知能を搭載した製品・サービスの比較一覧・導入活用事例・資料請求が無料でできるAIポータルメディア

数多くの文書を作成し、管理しなければならない企業において、「必要な文書を検索する際の手間」はできる限り削減したい部分ではないでしょうか。このような「何かしらを探す時間」を削減することができれば、さらなる生産性の向上が期待できます。今回は、「探す時間」の短縮に大きく貢献しているAIを活用した全文検索についてまとめました。

■全文検索とは?

「全文検索」とは、複数の文書から特定の文章(キーワード)が含まれているものを検索することです。GoogleやYahoo!などの検索エンジンを用いて何かしらのキーワードを入力し、情報を検索するという行為をイメージしていただければ分かりやすいでしょう。また、パソコンに格納されているファイル(文書)の中から、特定のキーワード文章が含まれているファイルを検索することも全文検索といえます。

 

■全文検索の技術には主に2つの種類が存在する

そんな全文検索ですが、現代では主に2種類の技術が存在しています。それが「逐次検索」と「索引を用いた全文検索」です。これら2つの違いは、大量の靴を収納してあるシューズボックスの中から特定の靴を取り出す場面をイメージしていただければ分かりやすいかと思います。

逐次検索というのは、実際にシューズボックスを開いて一つずつ靴を確認しながら見定めていく方法のことを指します。その一方で、索引を用いた全文検索というのは、あらかじめ「どの段のどの場所にどの靴が収納されているのか」を分かりやすく記載したリストをシューズボックスの扉に貼っておくという方法を指すわけです。

当然、索引を用いる方法であれば一つずつ靴を取り出しながら確認していく必要がなく、あらかじめ「目的の靴がどこにあるか」を理解した上で靴を取り出すことができます。

もちろん、本来の全文検索はコンピューターで行われるものなので、いまご紹介したシューズボックスの例とは同等ではありませんが、大まかなイメージとしてお分かりいただけたのではないでしょうか。

では、具体的に「逐次検索」と「索引を用いた検索」にどのようなメリット・デメリットがあるのか、詳しくみていきましょう。

(参照:サイト内検索最適化コラム 全文検索とは?非エンジニアでもわかる検索の仕組み)

 

■「逐次検索」と「索引」のメリット・デメリット

逐次検索は「全文照合方式」「順次走査方式」などと呼ばれることもあるのですが、その主なメリットとしては、極めてシンプルで検索精度が高いという点が挙げられるでしょう。検索精度が高いため、検索結果に偏りが出たり誤りが出たりする可能性も少ない傾向にあります。

ただし、一つずつチェックしていかなければならないため、チェックに時間がかかってしまう点はデメリットといえるでしょう。つまり、検索の精度は高いものの、検索にかかる時間は長いということです。

一方、「索引」の主なメリットとしては、検索速度が速く、余計なデータ保存領域を確保する必要がない点が挙げられます。逐次検索のように一つずつ検索するわけではなく、あらかじめ索引データを作成しておくため、余計なパフォーマンスをかけずに住むからです。

ただしデメリットもあり、日本語辞書に登録されていない平仮名やカタカナの単語は抽出できない可能性が高い傾向にあります。うまく抽出を行えなければ検索精度も低下してしまうため、注意を払う必要があるでしょう。ただ、あらかじめ専門的な用語などもしっかりと辞書登録できていれば、多くのメリットを得られる方法といえます。

(参照:サイト内検索最適化コラム 全文検索とは?非エンジニアでもわかる検索の仕組み)

 

■AIを搭載した全文検索はより高度な検索も可能に

近年はAI・人工知能を搭載した全文検索システムなども販売されており、より効率よく全文検索できるようになりつつあります。たとえば、住友電工情報システムが販売している「QuickSolution 11」という全文検索システムでは、日本語の意味を考慮して検索する機能が備わっています。本来であれば、検索の際に入力したキーワード(文章)に一致する文書が表示されるのが一般的です。しかし、「QuickSolution 11」には日本語の意味を考慮して検索する機能があるので、「検索文の意味に合った書類」を優先して表示させることができるのです。つまり、検索文と一致していない文書であっても、関連性の高い文書であれば優先的に表示されるということです。

(参照:atmarkit 人工知能を使った全文検索システム、住友電工情報システムが発売)

 

QuickSolutionのサービス詳細を見てみる

 

■より高度な全文検索を実現するセマンティック機能

より高度な全文検索を実現するセマンティック機能|人工知能を搭載した製品・サービスの比較一覧・導入活用事例・資料請求が無料でできるAIポータルメディア

こういった「日本語の意味を考慮して検索する機能」のことをセマンティック機能と呼びます。このセマンティック機能は、AIが構文解析や意味解析をすることで可能になるものです。たとえば、肯定表現と否定表現を区別することができる点などは、AIが活用されているセマンティック機能ならではの特徴といえるでしょう。仮に「天候の影響を受けない業界」というキーワードで検索する場合、天候の影響を受ける業界を優先的に表示させるべきではありません。

しかし、ただ単純に「天候」というキーワードを頼りにして検索を行ってしまうと、本来必要ではない文書も表示されてしまう可能性があるのです。その点、セマンティック機能を活用すれば「影響を受けない」という言葉の意味も捉えた上で適切に検索できます。つまり、「天候の影響を受ける業界」についての文書は表示されなくなります。こういった特徴を持つセマンティック機能は、「探す時間」の削減に大きく貢献するのではないでしょうか。

 

 

■類義語も考慮する全文検索で「探す時間」を大幅に削減

日本語には数多くの類義語が存在するため、一般的な検索では「同じ意味を持つ言葉で検索しても表示されない」というケースが少なくありません。しかし、AIを搭載した全文検索システムを活用すれば、「左折」という言葉で検索しても「左に曲がる」という言葉が含まれている文書を表示させることができます。これは、AIが同じ意味合いの言葉を理解できているからに他なりません。

人によって言葉選びは大きく異なりますから、「あの文書を検索したい」と考えた時に使用するキーワードが一人ひとり異なるケースもあるでしょう。そのような場合にAIによって「同じ意味を持つ言葉」も検索できれば、検索の手間も大幅に削減されます。

 

人手不足が進み、生産性の向上が求められる昨今において、このような形で「探す時間」を大幅に削減できるAI搭載の全文検索システムは、企業の業績にも大きな影響を与えるのではないでしょうか。

 

AI検索システムのサービス比較と企業一覧を見る

 

この記事で紹介されたAIサービスを無料で資料請求