TOP
|
特許
|
意匠
|
商標
特許ウォッチ
Twitter
他の特許を見る
10個以上の画像は省略されています。
公開番号
2025088711
公報種別
公開特許公報(A)
公開日
2025-06-11
出願番号
2024155470
出願日
2024-09-10
発明の名称
機械学習のための情報処理装置および情報処理方法
出願人
楽天グループ株式会社
代理人
個人
,
個人
,
個人
主分類
G06N
20/00 20190101AFI20250604BHJP(計算;計数)
要約
【課題】データに対して複数のラベルを高精度に付す機械学習のための情報処理装置および情報処理方法を提供する。
【解決手段】情報処理装置10は、タッチポイント作成部と、学習部と、を含む。タッチポイント作成部は、複数の質問セットであるタッチポイントを作成する。該複数の質問セットのそれぞれは、質問と当該質問に対して選択可能な答えを示す複数のラベルから構成される。学習部は、該複数の質問セットを用いて複数の学習モデルを学習させる。
【選択図】図1
特許請求の範囲
【請求項1】
複数の質問セットを作成する作成部であって、前記複数の質問セットのそれぞれは、質問と当該質問に対して選択可能な答えを示す複数のラベルから構成される、作成部と、
前記複数の質問セットを用いて複数の学習モデルを学習させる学習部と、
を有する、情報処理装置。
続きを表示(約 820 文字)
【請求項2】
ラベル付けする対象の複数のアイテムを含むデータセットを取得する取得部と、
前記複数のアイテムに前記複数の学習モデルを適用することにより、前記複数の質問セットに対するラベルを予測する予測部と、
を更に有する、請求項1に記載の情報処理装置。
【請求項3】
前記予測部により予測されたラベルをユーザに提示する提示部を更に有し、
前記学習部は、前記提示されたラベルに対する前記ユーザによる検証結果に基づいて、前記複数の学習モデルを学習させる、
請求項2に記載の情報処理装置。
【請求項4】
前記複数の質問セットそれぞれに対して、前記複数の学習モデルのいずれかを割り当てる割当部を更に有し、
前記予測部は、前記割り当てた学習モデルを用いて、前記複数の質問セットに対するラベルを予測する、
請求項2に記載の情報処理装置。
【請求項5】
前記複数の学習モデルは、前記データセットと異なるデータセットを用いて予め学習された学習モデルを含む、請求項2に記載の情報処理装置。
【請求項6】
前記複数の学習モデルは、前記データセットに基づいて設定された1つ以上のラベリングルールを含む、請求項5に記載の情報処理装置。
【請求項7】
前記作成部は、質問のタイプが異なる前記複数の質問セットを作成し、当該質問のタイプは、3つ以上の値をとる第1タイプと、2つの値をとる第2タイプを含む、
請求項1に記載の情報処理装置。
【請求項8】
複数の質問セットを作成することであって、前記複数の質問セットのそれぞれは、質問と当該質問に対して選択可能な答えを示す複数のラベルから構成されることと、
前記複数の質問セットを用いて複数の学習モデルを学習させること、
を含む、情報処理方法。
発明の詳細な説明
【技術分野】
【0001】
本発明は、機械学習のための情報処理装置および情報処理方法に関する。
続きを表示(約 1,600 文字)
【背景技術】
【0002】
近年、様々な課題の解決のために機械学習の技術が利用されている。機械学習は、汎用的もしくは特定のタスクを解決可能な学習済みの学習モデル(機械学習モデル)を用いることにより、行われる。学習モデルは、大量の教師データを用いて学習され、ここで、教師データは、データと当該データに対するラベルから構成されている。データに対してラベルを付す作業はアノテーションと呼ばれ、従来では、当該アノテーションは、人間により手作業で行われていた。しかしながら、大量の教師データを準備するためには、このような手作業では効率が悪く、また、品質も担保できない可能性がある。
【0003】
このような課題に対し、効率よくアノテーションするために、自動でラベリングを行うように構成された、無料または有料のアノテーションツールが普及している。また、生成された教師データの品質を担保する(アノテーションの精度を上げる)ための技術として、特許文献1には、生成された教師データの精度を評価するための情報処理装置が開示されている。
【先行技術文献】
【特許文献】
【0004】
特開2022-085670号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
従来のアノテーション技術によれば、データに対するラベル付けを、高精度で効率よく生成することが期待されるが、データに対して複数の種類のラベルを高精度に付すようには構成されていなかった。
【0006】
本発明は上記課題に鑑みてなされたものであり、データに対して複数のラベルを高精度に付すための仕組みを提供することを目的とする。
【課題を解決するための手段】
【0007】
上記課題を解決するために、本発明による情報処理装置の一態様は、複数の質問セットを作成する作成部であって、前記複数の質問セットのそれぞれは、質問と当該質問に対して選択可能な答えを示す複数のラベルから構成される、作成部と、前記複数の質問セットを用いて複数の学習モデルを学習させる学習部と、を有する。
【0008】
上記課題を解決するために、本発明による情報処理方法の一態様は、複数の質問セットを作成することであって、前記複数の質問セットのそれぞれは、質問と当該質問に対して選択可能な答えを示す複数のラベルから構成されることと、前記複数の質問セットを用いて複数の学習モデルを学習させること、を含む。
【発明の効果】
【0009】
本発明によれば、データに対して複数のラベルを高精度に付すための仕組みが提供される。
上記した本発明の目的、態様および効果並びに上記されなかった本発明の目的、態様および効果は、当業者であれば添付図面および請求の範囲の記載を参照することにより下記の発明を実施するための形態から理解できるであろう。
【図面の簡単な説明】
【0010】
図1は、実施形態による情報処理装置の機能構成例を示す。
図2は、実施形態による情報処理装置のハードウェア構成例を示す。
図3は、アノテーション処理のフローチャートを示す。
図4は、機械によるアノテーションと人間によるアノテーションの流れを示す。
図5Aは、表示部に表示される画面例を示す。
図5Bは、表示部に表示される画面例を示す。
図5Cは、表示部に表示される画面例を示す。
図5Dは、表示部に表示される画面例を示す。
図5Eは、表示部に表示される画面例を示す。
図5Fは、表示部に表示される画面例を示す。
図5Gは、表示部に表示される画面例を示す。
【発明を実施するための形態】
(【0011】以降は省略されています)
この特許をJ-PlatPatで参照する
関連特許
個人
対話装置
4日前
個人
物品給付年金
1か月前
個人
政治のAI化
27日前
個人
情報処理装置
4日前
個人
プラグインホームページ
18日前
個人
情報入力装置
4日前
個人
物価スライド機能付生命保険
4日前
キヤノン株式会社
通信装置
1か月前
個人
マイホーム非電子入札システム
4日前
個人
全アルゴリズム対応型プログラム
28日前
キヤノン株式会社
画像処理装置
25日前
サクサ株式会社
カードの制動構造
6日前
シャープ株式会社
電子機器
27日前
大同特殊鋼株式会社
輝線検出方法
27日前
個人
決済手数料0%のクレジットカード
7日前
パテントフレア株式会社
交差型バーコード
20日前
トヨタ自動車株式会社
情報処理装置
10日前
ミサワホーム株式会社
宅配ロッカー
24日前
トヨタ自動車株式会社
欠け検査装置
27日前
村田機械株式会社
割当補助システム
10日前
ミサワホーム株式会社
情報処理装置
1か月前
株式会社アジラ
データ転送システム
27日前
オベック実業株式会社
端末用スタンド
28日前
応研株式会社
業務支援システム
18日前
トヨタ自動車株式会社
管理装置
24日前
Sansan株式会社
組織図生成装置
13日前
西日本電信電話株式会社
評価装置
19日前
株式会社mov
情報処理システム
4日前
シャープ株式会社
通信装置
17日前
株式会社カプコン
データおよびシステム
26日前
シャープ株式会社
通信装置
4日前
株式会社豆蔵
ピッキング装置
6日前
西日本電信電話株式会社
分析装置
19日前
ミサワホーム株式会社
荷物搬送システム
24日前
個人
株管理システム
21日前
株式会社大林組
施工管理システム
20日前
続きを見る
他の特許を見る