TOP特許意匠商標
特許ウォッチ Twitter
公開番号2024164314
公報種別公開特許公報(A)
公開日2024-11-26
出願番号2024154367,2022569380
出願日2024-09-06,2020-12-15
発明の名称アノテーション装置、アノテーション方法およびアノテーションプログラム
出願人日本電信電話株式会社
代理人弁理士法人酒井国際特許事務所
主分類G06N 20/00 20190101AFI20241119BHJP(計算;計数)
要約【課題】機械学習における教師あり学習において、より低コストかつ高精度なアノテーションを行うこと。
【解決手段】アノテーション装置10は、機械学習に用いられる第1の学習データを取得する取得部15aと、取得部15aによって取得された第1の学習データを複数のアノテータに配信する第1配信部15bと、各アノテータによって第1の学習データにそれぞれ付与された第1の正解ラベルの信頼度に基づいて、第1の学習データを分類する分類部15cと、分類部15cによって分類された第1の学習データの分類結果を配信する第2配信部15eとを備える。
【選択図】図2
特許請求の範囲【請求項1】
機械学習に用いられる第1の学習データに、複数のアノテータによってそれぞれ付与された第1の正解ラベルの信頼度に基づいて、前記第1の学習データを分類する分類部と、
前記分類部によって分類された前記第1の学習データの分類結果を前記アノテータに配信する配信部と
を備えることを特徴とするアノテーション装置。
続きを表示(約 910 文字)【請求項2】
前記信頼度は、前記第1の正解ラベルのばらつきを表すことを特徴とする請求項1に記載のアノテーション装置。
【請求項3】
前記分類結果には、前記信頼度に基づいて選定された基準データを含むことを特徴とする請求項1に記載のアノテーション装置。
【請求項4】
前記分類結果には、前記第1の学習データを、前記信頼度に基づいて、正確に正解ラベルを付与しやすいデータ、または正確に正解ラベルを付与しにくいデータに分類したものを含むことを特徴とする請求項1に記載のアノテーション装置。
【請求項5】
前記分類結果には、極値の異なる複数の前記基準データを含むことを特徴とする請求項3に記載のアノテーション装置。
【請求項6】
前記分類結果を含み、かつ、前記分類結果に含まれる各データの発生源が同一のデータ群である第2の学習データを生成する生成部をさらに備えることを特徴とする請求項1に記載のアノテーション装置。
【請求項7】
前記配信部は、前記基準データを最初に配信することを特徴とする請求項3または5に記載のアノテーション装置。
【請求項8】
アノテーション装置によって実行されるアノテーション方法であって、
機械学習に用いられる第1の学習データに、複数のアノテータによってそれぞれ付与された第1の正解ラベルの信頼度に基づいて、前記第1の学習データを分類する分類工程と、
前記分類工程によって分類された前記第1の学習データの分類結果を前記アノテータに配信する配信工程と
を含むことを特徴とするアノテーション方法。
【請求項9】
機械学習に用いられる第1の学習データに、複数のアノテータによってそれぞれ付与された第1の正解ラベルの信頼度に基づいて、前記第1の学習データを分類する分類ステップと、
前記分類ステップによって分類された前記第1の学習データの分類結果を前記アノテータに配信する配信ステップと
をコンピュータに実行させることを特徴とするアノテーションプログラム。

発明の詳細な説明【技術分野】
【0001】
本発明は、アノテーション装置、アノテーション方法およびアノテーションプログラムに関する。
続きを表示(約 2,500 文字)【背景技術】
【0002】
従来、機械学習における教師あり学習のためには、学習データとそれに対応する正解ラベルが必要である。多くの研究では、複数名でデータを視聴等してメタデータを付与する作業(アノテーション)が行われている。
【0003】
例えば、音声や動画像に対するアノテーションの場合、作業者(適宜、「アノテータ」)は、提示された数秒~数十秒の音声や動画像を視聴し、仕様に合うようにメタデータを付与する。具体的には、音声からの感情認識の研究開発に向けたアノテーションであれば、聴取した音声に対して最も適切な感情を選択するし、画像に対するオブジェクト検出やオブジェクト認識であれば、オブジェクトの画像内における領域を選択し、オブジェクトに対する説明を付与する。
【0004】
従来のアノテーション手法は、作業の比較対象の有無に分けることができる。比較対象がない場合、アノテータは静止画もしくは数秒程度の音声や動画像を視聴して、メタデータを付与する。この手法は、データ視聴回数=総サンプル数Nとなるため、時間コストが低い。また、短時間でも確実に誰もが理解できるタスク(例:文字起こし、オブジェクトへのタグ付け、誰が見聞きしても明らかに怒っている状態等)であれば、正確にアノテーションを行うことができる。
【0005】
一方、比較対象がある場合、アノテータは長時間(数十秒~数分)の音声や動画像を視聴して連続的かつ相対的な事象の変化に関するメタデータを付与したり(例えば、非特許文献3参照)、複数の音声や動画像を視聴して相対的に順位やスコアを付与したりする(例えば、非特許文献4参照)。この手法は、比較する対象があるため、アノテータ間のブレを低減し、より正確なメタデータを付与できる。
【先行技術文献】
【非特許文献】
【0006】
Mohammad Soleymani, and Martha Larson, “Crowdsourcing for Affective Annotation of Video: Development of a Viewer-reported Boredom Corpus”, 2010.
Ryutaro Tanno, Ardavan Saeedi, Swami Sankaranarayanan, Daniel C. Alexander, and Nathan Silberman, “Learning From Noisy Labels By Regularized Estimation Of Annotator Confusion”, 2019.
David Melhart, Antonios Liapis, and Georgios N. Yannakakis “PAGAN: Video Affect Annotation Made Easy”, 2019.
Lifang Yang, and Rui Zhu, “Subjective Evaluation of Cooling Fan Sound based on Grade Scoring and Paired Comparison”, 2016.
【発明の概要】
【発明が解決しようとする課題】
【0007】
しかしながら、上述した従来技術では、機械学習における教師あり学習において、より低コストかつ高精度なアノテーションを行うことができない。なぜならば、比較対象がないアノテーション手法では、短時間の視聴では理解が難しいタスクの場合、正確なアノテーションができず、アノテータ間の付与ラベルのばらつきが大きくなり、アノテーション結果の信頼性が低くなるといった問題がある。
【0008】
このような問題に対して、アノテータの品質、回答傾向の考慮、多人数アノテーションでノイズの影響を小さくする等の対応があるが、アノテーションそのものの信頼性を上げるという根本的な解決にはなっていない(例えば、非特許文献1、2参照)。例えば、集中度のアノテーションを行う場合、非常に集中している、または全く集中していない様子、つまり誰が見聞きしても明らかにわかる状態であれば複数アノテータによる投票は一致しやすいが、集中しているのかそうでないのかがわかりにくい状態の場合、正確なアノテーションは難しく、結果として微妙な違いを表現できない。
【0009】
一方、比較対象がないアノテーション手法では、長時間もしくは大量のデータを視聴する必要があり、アノテーションに膨大なコストを要する。例えば、いくつかのデータの組み合わせを同時に視聴する場合、全Nサンプルのデータからn個ずつ選択すると最大



個の組み合わせが存在し得る。心理学実験法を参考にアノテーションの品質を保ちつつ組み合わせ数を削減することは可能かもしれないが、そのためにはどの組み合わせを除外するかについては慎重な検討が必要である。
【課題を解決するための手段】
【0010】
上述した課題を解決し、目的を達成するために、本発明に係るアノテーション装置は、機械学習に用いられる第1の学習データを取得する取得部と、前記取得部によって取得された前記第1の学習データを複数のアノテータに配信する第1配信部と、各アノテータによって前記第1の学習データにそれぞれ付与された第1の正解ラベルの信頼度に基づいて、前記第1の学習データを分類する分類部と、前記分類部によって分類された前記第1の学習データの分類結果を配信する第2配信部とを備えることを特徴とする。
(【0011】以降は省略されています)

この特許をJ-PlatPatで参照する
Flag Counter

関連特許

個人
プログラム
27日前
個人
情報提示方法
2か月前
個人
プログラム
2か月前
個人
プログラム
2か月前
個人
アカウントマップ
2か月前
株式会社理研
演算装置
1か月前
個人
日本語入力支援システム
1か月前
個人
情報検索システム
7日前
個人
AI旅行最適化プラグイン
1か月前
個人
確率場データ同化演算手法
19日前
個人
発想支援方法及びシステム
2か月前
個人
納骨堂システム
26日前
個人
学習装置及び推論装置
2か月前
シャープ株式会社
電子機器
20日前
個人
案件管理装置および端末装置
1か月前
個人
分類処理プログラム及び方法
2か月前
個人
技術実行管理システム
21日前
キヤノン株式会社
電子機器
6日前
キヤノン株式会社
電子機器
6日前
キヤノン株式会社
電子機器
6日前
富士通株式会社
金融システム
2か月前
株式会社イノベイト
広告装置
9日前
個人
不動産情報提供システム
16日前
株式会社発明屋
電池指向の構造設計
1か月前
トヨタ自動車株式会社
管理装置
1か月前
キヤノン株式会社
情報処理装置
1か月前
個人
ダブルオークションシステム
1か月前
個人
ネイルスキルテストシステム
20日前
株式会社プレニーズ
仲介システム
2か月前
合同会社IPマネジメント
内部不正対策
14日前
トヨタ自動車株式会社
電気自動車
1か月前
株式会社イズミ
総合代行システム
1か月前
富士通株式会社
プロセッサ
1か月前
富士通株式会社
予測
1か月前
トヨタ自動車株式会社
管理システム
1日前
トヨタ自動車株式会社
生成装置
2か月前
続きを見る