TOP特許意匠商標
特許ウォッチ Twitter
公開番号2024164314
公報種別公開特許公報(A)
公開日2024-11-26
出願番号2024154367,2022569380
出願日2024-09-06,2020-12-15
発明の名称アノテーション装置、アノテーション方法およびアノテーションプログラム
出願人日本電信電話株式会社
代理人弁理士法人酒井国際特許事務所
主分類G06N 20/00 20190101AFI20241119BHJP(計算;計数)
要約【課題】機械学習における教師あり学習において、より低コストかつ高精度なアノテーションを行うこと。
【解決手段】アノテーション装置10は、機械学習に用いられる第1の学習データを取得する取得部15aと、取得部15aによって取得された第1の学習データを複数のアノテータに配信する第1配信部15bと、各アノテータによって第1の学習データにそれぞれ付与された第1の正解ラベルの信頼度に基づいて、第1の学習データを分類する分類部15cと、分類部15cによって分類された第1の学習データの分類結果を配信する第2配信部15eとを備える。
【選択図】図2
特許請求の範囲【請求項1】
機械学習に用いられる第1の学習データに、複数のアノテータによってそれぞれ付与された第1の正解ラベルの信頼度に基づいて、前記第1の学習データを分類する分類部と、
前記分類部によって分類された前記第1の学習データの分類結果を前記アノテータに配信する配信部と
を備えることを特徴とするアノテーション装置。
続きを表示(約 910 文字)【請求項2】
前記信頼度は、前記第1の正解ラベルのばらつきを表すことを特徴とする請求項1に記載のアノテーション装置。
【請求項3】
前記分類結果には、前記信頼度に基づいて選定された基準データを含むことを特徴とする請求項1に記載のアノテーション装置。
【請求項4】
前記分類結果には、前記第1の学習データを、前記信頼度に基づいて、正確に正解ラベルを付与しやすいデータ、または正確に正解ラベルを付与しにくいデータに分類したものを含むことを特徴とする請求項1に記載のアノテーション装置。
【請求項5】
前記分類結果には、極値の異なる複数の前記基準データを含むことを特徴とする請求項3に記載のアノテーション装置。
【請求項6】
前記分類結果を含み、かつ、前記分類結果に含まれる各データの発生源が同一のデータ群である第2の学習データを生成する生成部をさらに備えることを特徴とする請求項1に記載のアノテーション装置。
【請求項7】
前記配信部は、前記基準データを最初に配信することを特徴とする請求項3または5に記載のアノテーション装置。
【請求項8】
アノテーション装置によって実行されるアノテーション方法であって、
機械学習に用いられる第1の学習データに、複数のアノテータによってそれぞれ付与された第1の正解ラベルの信頼度に基づいて、前記第1の学習データを分類する分類工程と、
前記分類工程によって分類された前記第1の学習データの分類結果を前記アノテータに配信する配信工程と
を含むことを特徴とするアノテーション方法。
【請求項9】
機械学習に用いられる第1の学習データに、複数のアノテータによってそれぞれ付与された第1の正解ラベルの信頼度に基づいて、前記第1の学習データを分類する分類ステップと、
前記分類ステップによって分類された前記第1の学習データの分類結果を前記アノテータに配信する配信ステップと
をコンピュータに実行させることを特徴とするアノテーションプログラム。

発明の詳細な説明【技術分野】
【0001】
本発明は、アノテーション装置、アノテーション方法およびアノテーションプログラムに関する。
続きを表示(約 2,500 文字)【背景技術】
【0002】
従来、機械学習における教師あり学習のためには、学習データとそれに対応する正解ラベルが必要である。多くの研究では、複数名でデータを視聴等してメタデータを付与する作業(アノテーション)が行われている。
【0003】
例えば、音声や動画像に対するアノテーションの場合、作業者(適宜、「アノテータ」)は、提示された数秒~数十秒の音声や動画像を視聴し、仕様に合うようにメタデータを付与する。具体的には、音声からの感情認識の研究開発に向けたアノテーションであれば、聴取した音声に対して最も適切な感情を選択するし、画像に対するオブジェクト検出やオブジェクト認識であれば、オブジェクトの画像内における領域を選択し、オブジェクトに対する説明を付与する。
【0004】
従来のアノテーション手法は、作業の比較対象の有無に分けることができる。比較対象がない場合、アノテータは静止画もしくは数秒程度の音声や動画像を視聴して、メタデータを付与する。この手法は、データ視聴回数=総サンプル数Nとなるため、時間コストが低い。また、短時間でも確実に誰もが理解できるタスク(例:文字起こし、オブジェクトへのタグ付け、誰が見聞きしても明らかに怒っている状態等)であれば、正確にアノテーションを行うことができる。
【0005】
一方、比較対象がある場合、アノテータは長時間(数十秒~数分)の音声や動画像を視聴して連続的かつ相対的な事象の変化に関するメタデータを付与したり(例えば、非特許文献3参照)、複数の音声や動画像を視聴して相対的に順位やスコアを付与したりする(例えば、非特許文献4参照)。この手法は、比較する対象があるため、アノテータ間のブレを低減し、より正確なメタデータを付与できる。
【先行技術文献】
【非特許文献】
【0006】
Mohammad Soleymani, and Martha Larson, “Crowdsourcing for Affective Annotation of Video: Development of a Viewer-reported Boredom Corpus”, 2010.
Ryutaro Tanno, Ardavan Saeedi, Swami Sankaranarayanan, Daniel C. Alexander, and Nathan Silberman, “Learning From Noisy Labels By Regularized Estimation Of Annotator Confusion”, 2019.
David Melhart, Antonios Liapis, and Georgios N. Yannakakis “PAGAN: Video Affect Annotation Made Easy”, 2019.
Lifang Yang, and Rui Zhu, “Subjective Evaluation of Cooling Fan Sound based on Grade Scoring and Paired Comparison”, 2016.
【発明の概要】
【発明が解決しようとする課題】
【0007】
しかしながら、上述した従来技術では、機械学習における教師あり学習において、より低コストかつ高精度なアノテーションを行うことができない。なぜならば、比較対象がないアノテーション手法では、短時間の視聴では理解が難しいタスクの場合、正確なアノテーションができず、アノテータ間の付与ラベルのばらつきが大きくなり、アノテーション結果の信頼性が低くなるといった問題がある。
【0008】
このような問題に対して、アノテータの品質、回答傾向の考慮、多人数アノテーションでノイズの影響を小さくする等の対応があるが、アノテーションそのものの信頼性を上げるという根本的な解決にはなっていない(例えば、非特許文献1、2参照)。例えば、集中度のアノテーションを行う場合、非常に集中している、または全く集中していない様子、つまり誰が見聞きしても明らかにわかる状態であれば複数アノテータによる投票は一致しやすいが、集中しているのかそうでないのかがわかりにくい状態の場合、正確なアノテーションは難しく、結果として微妙な違いを表現できない。
【0009】
一方、比較対象がないアノテーション手法では、長時間もしくは大量のデータを視聴する必要があり、アノテーションに膨大なコストを要する。例えば、いくつかのデータの組み合わせを同時に視聴する場合、全Nサンプルのデータからn個ずつ選択すると最大



個の組み合わせが存在し得る。心理学実験法を参考にアノテーションの品質を保ちつつ組み合わせ数を削減することは可能かもしれないが、そのためにはどの組み合わせを除外するかについては慎重な検討が必要である。
【課題を解決するための手段】
【0010】
上述した課題を解決し、目的を達成するために、本発明に係るアノテーション装置は、機械学習に用いられる第1の学習データを取得する取得部と、前記取得部によって取得された前記第1の学習データを複数のアノテータに配信する第1配信部と、各アノテータによって前記第1の学習データにそれぞれ付与された第1の正解ラベルの信頼度に基づいて、前記第1の学習データを分類する分類部と、前記分類部によって分類された前記第1の学習データの分類結果を配信する第2配信部とを備えることを特徴とする。
(【0011】以降は省略されています)

この特許をJ-PlatPatで参照する
Flag Counter

関連特許

日本電信電話株式会社
量子鍵配送装置
2日前
日本電信電話株式会社
光線路特性解析装置
3日前
日本電信電話株式会社
演算装置、演算方法及びプログラム
2日前
日本電信電話株式会社
エネルギー関数の最小値探索装置、エネルギー関数の最小値探索方法、及びプログラム。
2日前
日本電信電話株式会社
信号処理装置、信号処理方法及び信号処理プログラム
4日前
個人
非正規コート
12日前
個人
人物再現システム
9日前
個人
AI飲食最適化プラグイン
2日前
個人
電話管理システム及び管理方法
3日前
有限会社ノア
データ読取装置
10日前
個人
広告提供システムおよびその方法
12日前
株式会社ザメディア
出席管理システム
17日前
個人
日誌作成支援システム
9日前
ミサワホーム株式会社
情報処理装置
16日前
トヨタ自動車株式会社
作業評価装置
23日前
トヨタ自動車株式会社
工程計画装置
17日前
トヨタ自動車株式会社
作業判定方法
18日前
個人
ポイント還元付き配送システム
10日前
株式会社タクテック
商品取出集品システム
16日前
オベック実業株式会社
接続構造
9日前
ゼネラル株式会社
RFIDタグ付き物品
19日前
株式会社村田製作所
動き検知装置
16日前
トヨタ自動車株式会社
情報処理システム
18日前
個人
公益寄付インタラクティブシステム
23日前
株式会社国際電気
支援システム
19日前
トヨタ自動車株式会社
情報処理方法
18日前
個人
コンテンツ配信システム
16日前
株式会社実身美
ワーキングシェアリングシステム
10日前
株式会社ドクター中松創研
生成AIの適切使用法
9日前
富士通株式会社
画像生成方法
22日前
個人
プラットフォームシステム
16日前
株式会社エスシーシー
置き配システム
10日前
ブラザー工業株式会社
ラベルプリンタ
18日前
株式会社 喜・扇
緊急事態対応円滑化システム
9日前
株式会社K-model
運用設計資料作成装置
12日前
トヨタ自動車株式会社
作業支援システム
16日前
続きを見る