TOP特許意匠商標
特許ウォッチ Twitter
公開番号2024164314
公報種別公開特許公報(A)
公開日2024-11-26
出願番号2024154367,2022569380
出願日2024-09-06,2020-12-15
発明の名称アノテーション装置、アノテーション方法およびアノテーションプログラム
出願人日本電信電話株式会社
代理人弁理士法人酒井国際特許事務所
主分類G06N 20/00 20190101AFI20241119BHJP(計算;計数)
要約【課題】機械学習における教師あり学習において、より低コストかつ高精度なアノテーションを行うこと。
【解決手段】アノテーション装置10は、機械学習に用いられる第1の学習データを取得する取得部15aと、取得部15aによって取得された第1の学習データを複数のアノテータに配信する第1配信部15bと、各アノテータによって第1の学習データにそれぞれ付与された第1の正解ラベルの信頼度に基づいて、第1の学習データを分類する分類部15cと、分類部15cによって分類された第1の学習データの分類結果を配信する第2配信部15eとを備える。
【選択図】図2
特許請求の範囲【請求項1】
機械学習に用いられる第1の学習データに、複数のアノテータによってそれぞれ付与された第1の正解ラベルの信頼度に基づいて、前記第1の学習データを分類する分類部と、
前記分類部によって分類された前記第1の学習データの分類結果を前記アノテータに配信する配信部と
を備えることを特徴とするアノテーション装置。
続きを表示(約 910 文字)【請求項2】
前記信頼度は、前記第1の正解ラベルのばらつきを表すことを特徴とする請求項1に記載のアノテーション装置。
【請求項3】
前記分類結果には、前記信頼度に基づいて選定された基準データを含むことを特徴とする請求項1に記載のアノテーション装置。
【請求項4】
前記分類結果には、前記第1の学習データを、前記信頼度に基づいて、正確に正解ラベルを付与しやすいデータ、または正確に正解ラベルを付与しにくいデータに分類したものを含むことを特徴とする請求項1に記載のアノテーション装置。
【請求項5】
前記分類結果には、極値の異なる複数の前記基準データを含むことを特徴とする請求項3に記載のアノテーション装置。
【請求項6】
前記分類結果を含み、かつ、前記分類結果に含まれる各データの発生源が同一のデータ群である第2の学習データを生成する生成部をさらに備えることを特徴とする請求項1に記載のアノテーション装置。
【請求項7】
前記配信部は、前記基準データを最初に配信することを特徴とする請求項3または5に記載のアノテーション装置。
【請求項8】
アノテーション装置によって実行されるアノテーション方法であって、
機械学習に用いられる第1の学習データに、複数のアノテータによってそれぞれ付与された第1の正解ラベルの信頼度に基づいて、前記第1の学習データを分類する分類工程と、
前記分類工程によって分類された前記第1の学習データの分類結果を前記アノテータに配信する配信工程と
を含むことを特徴とするアノテーション方法。
【請求項9】
機械学習に用いられる第1の学習データに、複数のアノテータによってそれぞれ付与された第1の正解ラベルの信頼度に基づいて、前記第1の学習データを分類する分類ステップと、
前記分類ステップによって分類された前記第1の学習データの分類結果を前記アノテータに配信する配信ステップと
をコンピュータに実行させることを特徴とするアノテーションプログラム。

発明の詳細な説明【技術分野】
【0001】
本発明は、アノテーション装置、アノテーション方法およびアノテーションプログラムに関する。
続きを表示(約 2,500 文字)【背景技術】
【0002】
従来、機械学習における教師あり学習のためには、学習データとそれに対応する正解ラベルが必要である。多くの研究では、複数名でデータを視聴等してメタデータを付与する作業(アノテーション)が行われている。
【0003】
例えば、音声や動画像に対するアノテーションの場合、作業者(適宜、「アノテータ」)は、提示された数秒~数十秒の音声や動画像を視聴し、仕様に合うようにメタデータを付与する。具体的には、音声からの感情認識の研究開発に向けたアノテーションであれば、聴取した音声に対して最も適切な感情を選択するし、画像に対するオブジェクト検出やオブジェクト認識であれば、オブジェクトの画像内における領域を選択し、オブジェクトに対する説明を付与する。
【0004】
従来のアノテーション手法は、作業の比較対象の有無に分けることができる。比較対象がない場合、アノテータは静止画もしくは数秒程度の音声や動画像を視聴して、メタデータを付与する。この手法は、データ視聴回数=総サンプル数Nとなるため、時間コストが低い。また、短時間でも確実に誰もが理解できるタスク(例:文字起こし、オブジェクトへのタグ付け、誰が見聞きしても明らかに怒っている状態等)であれば、正確にアノテーションを行うことができる。
【0005】
一方、比較対象がある場合、アノテータは長時間(数十秒~数分)の音声や動画像を視聴して連続的かつ相対的な事象の変化に関するメタデータを付与したり(例えば、非特許文献3参照)、複数の音声や動画像を視聴して相対的に順位やスコアを付与したりする(例えば、非特許文献4参照)。この手法は、比較する対象があるため、アノテータ間のブレを低減し、より正確なメタデータを付与できる。
【先行技術文献】
【非特許文献】
【0006】
Mohammad Soleymani, and Martha Larson, “Crowdsourcing for Affective Annotation of Video: Development of a Viewer-reported Boredom Corpus”, 2010.
Ryutaro Tanno, Ardavan Saeedi, Swami Sankaranarayanan, Daniel C. Alexander, and Nathan Silberman, “Learning From Noisy Labels By Regularized Estimation Of Annotator Confusion”, 2019.
David Melhart, Antonios Liapis, and Georgios N. Yannakakis “PAGAN: Video Affect Annotation Made Easy”, 2019.
Lifang Yang, and Rui Zhu, “Subjective Evaluation of Cooling Fan Sound based on Grade Scoring and Paired Comparison”, 2016.
【発明の概要】
【発明が解決しようとする課題】
【0007】
しかしながら、上述した従来技術では、機械学習における教師あり学習において、より低コストかつ高精度なアノテーションを行うことができない。なぜならば、比較対象がないアノテーション手法では、短時間の視聴では理解が難しいタスクの場合、正確なアノテーションができず、アノテータ間の付与ラベルのばらつきが大きくなり、アノテーション結果の信頼性が低くなるといった問題がある。
【0008】
このような問題に対して、アノテータの品質、回答傾向の考慮、多人数アノテーションでノイズの影響を小さくする等の対応があるが、アノテーションそのものの信頼性を上げるという根本的な解決にはなっていない(例えば、非特許文献1、2参照)。例えば、集中度のアノテーションを行う場合、非常に集中している、または全く集中していない様子、つまり誰が見聞きしても明らかにわかる状態であれば複数アノテータによる投票は一致しやすいが、集中しているのかそうでないのかがわかりにくい状態の場合、正確なアノテーションは難しく、結果として微妙な違いを表現できない。
【0009】
一方、比較対象がないアノテーション手法では、長時間もしくは大量のデータを視聴する必要があり、アノテーションに膨大なコストを要する。例えば、いくつかのデータの組み合わせを同時に視聴する場合、全Nサンプルのデータからn個ずつ選択すると最大



個の組み合わせが存在し得る。心理学実験法を参考にアノテーションの品質を保ちつつ組み合わせ数を削減することは可能かもしれないが、そのためにはどの組み合わせを除外するかについては慎重な検討が必要である。
【課題を解決するための手段】
【0010】
上述した課題を解決し、目的を達成するために、本発明に係るアノテーション装置は、機械学習に用いられる第1の学習データを取得する取得部と、前記取得部によって取得された前記第1の学習データを複数のアノテータに配信する第1配信部と、各アノテータによって前記第1の学習データにそれぞれ付与された第1の正解ラベルの信頼度に基づいて、前記第1の学習データを分類する分類部と、前記分類部によって分類された前記第1の学習データの分類結果を配信する第2配信部とを備えることを特徴とする。
(【0011】以降は省略されています)

この特許をJ-PlatPatで参照する
Flag Counter

関連特許

個人
認証システム
7日前
個人
保証金管理システム
1日前
個人
鑑定証明システム
7日前
アズビル株式会社
防爆装置
1か月前
個人
業界地図作成システム
1か月前
個人
人的価値発掘システム
1か月前
株式会社MRC
集客システム
1日前
株式会社宗建
SNSサーバー
1か月前
個人
技術マッチングシステム
13日前
キヤノン電子株式会社
情報処理装置
1か月前
ミサワホーム株式会社
システム
1か月前
個人
配送システムおよび同包箱
1か月前
株式会社ネットブリッジ
展示販売装置
8日前
ミサワホーム株式会社
管理装置
1か月前
トヨタ自動車株式会社
分析装置
1日前
キヤノン株式会社
印刷制御装置
22日前
個人
文字入力方法、文字入力プログラム
14日前
個人
動作のデザイン評価の方法及び装置
1か月前
ミサワホーム株式会社
プログラム
7日前
アスエネ株式会社
森林管理の方法
1か月前
オムロン株式会社
認証中継サーバ
1か月前
大同特殊鋼株式会社
棒材計数装置
1か月前
株式会社八咲
イベント管理システム
1か月前
トヨタ自動車株式会社
作業評価装置
20日前
トヨタ自動車株式会社
部品管理装置
7日前
株式会社LIFE
送迎管理システム
今日
トヨタ自動車株式会社
車載機
7日前
個人
口座悪用を防止する口座管理システム
1か月前
株式会社インザック
コンピュータシステム
13日前
株式会社チノー
ユーザ認証システム
29日前
個人
後払いポイントシステム「先用後利」
8日前
三菱電機モビリティ株式会社
メモリ制御装置
1か月前
個人
処理制御装置及びプロセッサ
28日前
樋口工業有限会社
求人情報提供システム
14日前
ミサワホーム株式会社
水素配送システム
1か月前
株式会社デンソー
操作装置
8日前
続きを見る