WEELメディア事業部リサーチャーのいつきです。
AI開発において欠かせないアノテーションですが、学習データのラベル付けやタグ付け作業を面倒に感じている方も多いのではないでしょうか。実は、そんなアノテーションの工程にも生成AIを活用できるので、コストや時間的リソースを節約したいのであれば利用しない手はありません。
そこで今回の記事では、生成AIを使ったアノテーションについて詳しく解説していきます。最後まで目を通していただくと、生成AIをアノテーションに活用するメリットやデメリットを理解できるので、アノテーションを生成AIに任せるかどうかの判断ができるようになるはずです。
ぜひ最後までご覧ください。
AI開発におけるアノテーション
AI開発における「アノテーション / annotation」とは「注釈」の意味どおり、学習データに説明を付ける処理のこと。具体的には、テキスト / 画像 / 音声…etc.さまざまな形式のデータに、「それが何を意味するデータなのか」を説明するラベル・タグを付ける作業となります。AIの性能を大きく左右する重要な工程です。
※ちなみにYouTube / Google Meet / Javaにも「アノテーション」がありますが、それぞれ意味は異なっています。詳しくは、以下を参照ください。
- YouTubeのアノテーション:動画上にクリック可能な箇所を表示させる機能のこと(2019年に完全廃止)
- Google Meetのアノテーション:共有する資料に図形やテキストでマーキングできる機能
- Javaのアノテーション:プログラミング言語・Javaでコード中に記載する注釈のことを指す
アノテーションの需要・必要性
アノテーションなら膨大かつ煩雑なデータの1つ1つに意味・分類を与えることが可能です。コンピュータからみて処理しやすいデータが用意できるため、AI開発やビッグデータ活用といった文脈で需要があります。
とくに「教師あり学習」を活用したAI開発においては、アノテーションが欠かせません。教師あり学習とは入力例と正解の出力例を与えて他の入力に対しても正解が出力できるモデルを目指す、というアルゴリズムのこと。その工程のうち、入力例と正解の出力例を用意する際にアノテーションが用いられているんです。
そんなアノテーションは、後述するようにクラウドソーシングで行われることもあります。将来的にアノテーションが副業として普及するかもしれません。
アノテーションの種類
アノテーションは、データの形式や方法の違いによって細分化されます。ここでは、7種類の代表的なアノテーションについて徹底解説!本職がITエンジニアの方はもちろんのこと、アノテーションを副業にしたい方は必見です。
画像分類
画像分類(クラシフィケーション)は、属性・カテゴリを画像全体にタグ付けするアノテーションの一種です。わかりやすくするために、下記の画像を例にとって画像分類をしてみると……
このように画像ファイルそのものに対して「動物カテゴリの猫」とタグが付けられます。
この画像分類は画像を確認してタグ付けするだけ、と手順がシンプル。他のアノテーションと比べて容易に行えます。
ただし、「無関係な要素にもまとめてタグがついてしまう」「細かく分類ができない」等のデメリットもあり、精度を重視する場合は不向きです。
物体検出
物体検出(オブジェクト・ディテクション)とは画像分類から一歩進んで、画像内の特定の物体にのみタグを付けるアノテーションのやり方です。先ほどの画像で図解すると……
このように画像中の猫を長方形(バウンディングボックス)で囲んで「動物カテゴリの猫」とタグ付けするというものになっています。
こちらは画像分類よりも手間がかかるものの、同一画像内の複数の物体を分けてタグ付けできるという利点があります。
領域抽出
物体検出では、タグと無関係な要素がバウンディングボックスの内側に入り込んでしまいます。自動運転や指紋認証等AIモデルの精度を追求したい場合は、より厳密な領域抽出(セマンティック・セグメンテーション)が必要です。この領域抽出はピクセル単位で画像中の物体を指定してタグ付けするアノテーションの一手法になります。
ポリゴンセグメンテーション
物体検出以上に厳密なアノテーションのやり方として、画像中の要素を多角形で囲ってタグ付けするポリゴンセグメンテーションというものもあります。こちらは領域抽出より容易で、ある程度正確に物体が指定できます。
ランドマークアノテーション
顔や全身の動きを認識するAIモデルを開発する際には、ランドマークアノテーションという手法が用いられます。こちらは顔のパーツや全身の骨格&関節等、動く箇所に目印を入れるというもの。下記の画像で例をお伝えすると……
このように、猫の頭部や四肢に目印を入れるというやり方になっています。
テキスト分類
テキスト分類はテキストファイル全体にジャンル・意味でタグ付けを行うアノテーションの一手法です。こちらはコンテンツ・記事のサジェスト用AIモデルを開発する際に欠かせません。
意味的アノテーション
文中に登場する単語に対してタグを付ける意味的(セマンティック)アノテーションというやり方も存在します。こちらを用いると、より高度な検索エンジンやチャットボットが開発できます。
音声のアノテーション
音声データでも様々なアノテーションのやり方がとられます。タグ付けできる要素の代表例を挙げると……
- 音量
- 音階
- 音の種類
- 音声の意味
- 音声が含む感情
以上のとおり。それぞれ、作曲AIや音声認識モデル等に用いられます。
なお、音声認識モデルについて詳しく知りたい方は、下記の記事を合わせてご確認ください。
アノテーションの実施方法
集めたデータに対してアノテーションを実施する手段・方法としては……
- インハウス
- アウトソーシング
- クラウドソーシング
の3つがあります。まずは最も手軽なインハウスから、みていきましょう!
インハウス
「インハウス」とは、アノテーション業務を社内で完結させてしまう手法を指します。外注しないためデータ流出のリスクを抑えられるというのがメリットです。逆にデメリットは、業務に際して人件費がかかるという点に尽きます。
ただ人件費についても、近年はアノテーションを自動化できるツールが多数登場していますので、抑えられるはず。自社にIT人材が在籍している場合は、最も手軽なやり方かもしれません。
アウトソーシング
社内にIT人材がいない場合は、社外のITベンダーや代行サービスにアノテーション業務を「アウトソーシング」するのも手です。アウトソーシングは選定から契約までの間に費用・時間がかかりますが、高品質なデータが用意できるというメリットもあります。
ちなみにアウトソーシングの際には、コミュニケーション能力重視で外注先を選ぶことが重要。技術力だけでなく、課題・ゴールの共有しやすさも加味して外注先を探しましょう!
クラウドソーシング
コストを抑えつつ外注したい場合は、「クラウドソーシング」が有効。不特定多数のクラウドワーカーにアノテーション業務を委託することで、安価かつ迅速にデータが用意できます。
ただし、タグ付けの品質・基準が安定しないというデメリットもあります。ここはコストと要相談ですね。
今後、副業としてアノテーションを行う人が増えてくるかもしれません。そうなれば、クラウドソーシングでAI事業に参入するというやり方がスタンダードになってくるでしょう。
アノテーションもできる生成AI
アノテーションは生成AIの品質を高めるために必要な工程ですが、この工程自体も生成AIで効率よく行えます。多くの企業がアノテーション用の生成AIをリリースしているので、テキストや画像などの種類に応じて適切なサービスを利用しましょう。
当サイトでもおすすめのアノテーションAIをピックアップしてみたので、以下のサービスもチェックしてみてください。
無料で利用したいならMicrosoftが提供している「Microsoft VoTT」がおすすめです。ただし、ダウンロードの必要があるので、Web上でアノテーションを行いたいなら、「FastLabel」や「harBest Data」を利用しましょう。
アノテーションに生成AIを使うメリット3点
アノテーションに生成AIを使うと、以下3つのメリットが受けられます。
- コストが削減できる
- 時間・工数も削減できる
- AI開発のハードルが下がる
業務にかかる時間やコスト面の負担を減らせるので、多くの方にとってメリットがあります。
以下でそれぞれのメリットを詳しくみていきましょう!
コストが削減できる
アノテーションができる生成AIには、元々必要なデータが蓄積されているので、アノテーションを効率よく行えます。また、手動でアノテーションを行う場合に比べて人員を要する業務が減るので、相対的に人件費の削減が可能です。
削減できたコストを使えば、さらに高性能な生成AIを開発できますね!
時間・工数も削減できる
アノテーションに生成AIを使えば、データのラベル分けやタグ付けを自動化できるので工数が減ります。さらに、人が手動でアノテーションするよりも早く仕上げてくれるので、作業時間の削減も可能です。
生成AIをいち早くリリースして、自社業務の効率化や新たな事業の立ち上げを行いたい方は、ぜひ生成AIの力を借りてみてください。
AI開発のハードルが下がる
ここまで、生成AIでアノテーションすることによりコストや時間を削減できることを解説しましたが、これらのメリットによって相対的にAI開発のハードルが下がります。
生成AIの開発を少ない時間やコストで実現できるようになるので、中小規模の事業者にとって大きなメリットといえるでしょう。また、専門知識がなくてもアノテーションできるようになるので、人材が不足している企業でも問題ありません。
アノテーションの生成AIサービスを提供している会社のなかには、業務委託に対応しているケースもあるので、AI開発のハードルをより下げたいのであれば利用してみるのもおすすめです。
アノテーションでの生成AI活用時の注意点3つ
アノテーションで生成AIを活用する際は、以下3つの注意点が存在します。
- 文化的偏見を含むリスク
- モデル学習に使われるリスク
- ハルシネーションのリスク
これらの注意点は、開発する生成AIの品質に関わってきます。
それぞれの注意点を解説していくので、ぜひ参考にしてみてください。
文化的偏見を含むリスク
生成AIの普及に伴い、生成AIによる文化的偏見の露呈が度々問題になっています。とある画像切り抜きAIは特定の人種や性別を優遇して切り抜いたことで物議を醸しました。
このような文化的偏見が入り込んでしまうと、生成AIの品質が悪化するのはもちろん、最悪の場合はユーザーの気持ちを害してしまいます。文化的偏見が出力結果に出ないよう、出力テストなどを繰り返しながら細心の注意を払いましょう。
モデル学習に使われるリスク
生成AIは提供されたデータを学習することで、日々精度を向上させています。アノテーション用の生成AIも例外ではないため、アノテーションのために提供したデータがトレーニングに利用される可能性は否定できません。
秘匿性の高い情報をモデル学習に使われると、自社にとって大きな不利益になる恐れがあるので、提供データの学習有無は事前に確認しておきましょう。
ハルシネーションのリスク
ハルシネーションとは、AIが幻覚を見ているかのように「もっともらしい嘘」を出力する現象のことです。とくに、AIチャットボットが普及した初期段階で多くみられ、ChatGPTを開発したOpenAIが訴訟される問題にまで発展しました。
生成AIを使ってアノテーションした場合もハルシネーションが起きるリスクがあるので、一般公開する前に出力結果を十分にテストしておきましょう。
なお、生成AIのリスクとその対策方法について詳しく知りたい方は、下記の記事を合わせてご確認ください。
アノテーションでの生成AI活用方法5選
アノテーションにおける生成AIの活用方法を5つまとめました。
- 画像分類
- 物体検出
- セグメンテーション
- ランドマークアノテーション
- テキスト分類
以下で、それぞれの活用法を詳しく解説していくので、アノテーションを自社で行う場合や副業とする場合の参考にしてみてください。
画像分類
画像入力にも対応した生成AI「大規模マルチモーダルモデル / LMM」であれば、画像の内容を理解して適切なカテゴリ・属性での画像分類がほぼ完全に自動化できます。もともと手軽な画像分類がさらに、実施しやすくなります。
物体検出
LMMなら「どこに何が写っているのか?」の識別まで可能。ここにバウンディングボックスの機能を追加することで、物体検出も自動化できます。このLMMによる物体検出は、自動運転や検品に用いる画像認識AIを開発する際に、大活躍してくれるでしょう。
セグメンテーション
物体の境界線を識別できるAIモデルとLMMの組み合わせなら、物体のみをピクセル単位で指定するセグメンテーションも自動化可能です。将来的には、LMMによるセグメンテーションが一般的になるかもしれません。
ランドマークアノテーション
顔や動きの識別に欠かせないランドマークアノテーションも、LMMで代行可。こちらは顔認証や自動運転等での活躍が期待できそうです。
テキスト分類
テキスト特化型の生成AI・LLM(大規模言語モデル)を活用することで、テキスト分類の自動化が図れます。単語レベルではなく意味・感情レベルでテキスト分類が行えるため、検索用AIモデルの開発にうってつけです。
アノテーションでの生成AI活用事例2選
最後に、アノテーションでの生成AI活用事例を2つお届けします。まずはLMMの代表格・GPT-4Vの事例から、詳しくみていきましょう!
GPT-4Vによる画像セグメンテーション
生成AIの「GPT-4V」をアノテーションで利用した事例があったのでご紹介します。
DeepL翻訳
上記の投稿者は、以下の合わせ技で生成AIを活用することで、写真内のメルセデス・ベンツの部分に「mercedes」とアノテーションをつけています。
- GroundingDINO & GPT-4V API:画像から所定の物体だけを検出する
- SAM / Segment Anything Model:物体とそれ以外の境界線を引く
この技術をマスターすれば、もう画像アノテーションを外部企業に委託する必要はなくなりますね!
外注費をカットできるだけでなく、自社メンバーのスキルアップにもつながるので、ぜひ真似してみてください。
GPT-3.5による化学文書への意味的アノテーション
九州工業大学と旭化成株式会社は共同で、化学文書への意味的アノテーションの自動化に成功しています!(※1)
そもそも化学分野では、「分野特化のAIモデルの学習に使えるデータが用意しづらい」という課題がありました。
そこで、九工大と旭化成は、理解力と知識量に優れたGPT-3.5に着目。こちらを活用して、化学文書中の化合物名や実験手法に自動でタグ付けするという試みを決行しました。
その結果は大成功で、ニッチな分野でのアノテーションにおける生成AIの効果が証明されています。今後は、学習データが用意しづらい専門分野でも、特化型のAIモデルが続々登場するかもしれません。
なお、GPT-4V APIのおすすめ活用事例を知りたい方は、以下の記事を合わせてご確認ください。
生成AIをアノテーションに活用しよう
アノテーションは、生成AIの動作を安定させるうえで重要な工程です。手動で行うとかなりの労力を必要としますが、生成AIを活用すればアノテーションの工程を効率化できます。
具体的には、アノテーションで生成AIを活用すると以下3つのメリットを受けられます。今後、副業としてのアノテーションが浸透した際には、生成AIが大活躍しそうです。
- コストが削減できる
- 時間・工数も削減できる
- AI開発のハードルが下がる
ただし、以下のような注意点も存在するので、生成AIの取り扱いには細心の注意を払いましょう。
- 文化的偏見を含むリスク
- モデル学習に使われるリスク
- ハルシネーションのリスク
なお、生成のアノテーションでは、以下5つの活用方法が存在します。
- 物体検出
- セグメンテーション
- ランドマークアノテーション
- 画像分類
- テキスト分類
実際にアノテーションで生成AIを活用している企業も増えてきているので、生成AI開発を効率よく行うためにも利用を検討してみてください!
生成系AIの業務活用なら!
・生成系AIを活用したPoC開発
・生成系AIのコンサルティング
・システム間API連携
最後に
いかがだったでしょうか?
弊社では
・マーケティングやエンジニアリングなどの専門知識を学習させたAI社員の開発
・要件定義・業務フロー作成を80%自動化できる自律型AIエージェントの開発
・生成AIとRPAを組み合わせた業務自動化ツールの開発
・社内人事業務を99%自動化できるAIツールの開発
・ハルシネーション対策AIツールの開発
・自社専用のAIチャットボットの開発
などの開発実績がございます。
まずは、「無料相談」にてご相談を承っておりますので、ご興味がある方はぜひご連絡ください。
︎生成AIを使った業務効率化、生成AIツールの開発について相談をしてみる。
「生成AIを社内で活用したい」「生成AIの事業をやっていきたい」という方に向けて、生成AI社内セミナー・勉強会をさせていただいております。
セミナー内容や料金については、ご相談ください。
また、弊社紹介資料もご用意しておりますので、併せてご確認ください。