TOP
|
特許
|
意匠
|
商標
特許ウォッチ
Twitter
他の特許を見る
10個以上の画像は省略されています。
公開番号
2024175596
公報種別
公開特許公報(A)
公開日
2024-12-18
出願番号
2023093502
出願日
2023-06-06
発明の名称
機械学習プログラム、機械学習方法及び機械学習装置
出願人
富士通株式会社
代理人
弁理士法人酒井国際特許事務所
主分類
G06F
40/253 20200101AFI20241211BHJP(計算;計数)
要約
【課題】文章分類の信頼性を向上させる機械学習プログラム、機械学習方法及び機械学習装置を提供する。
【解決手段】第1文章を複数の第2文章に分割し、前記第1文章に適切とラベル付けし、前記第2文章に不適切とラベル付けし、ラベル付けされた前記第1文章及び前記第2文章それぞれを用いて第1機械学習モデルに学習させて、入力された文章が適切か不適切かを判別する前記第1機械学習モデルを生成する処理をコンピュータに実行させる。
【選択図】図2
特許請求の範囲
【請求項1】
第1文章を複数の第2文章に分割し、
前記第1文章に適切とラベル付けし、
前記第2文章に不適切とラベル付けし、
ラベル付けされた前記第1文章及び前記第2文章それぞれを用いて第1機械学習モデルに学習させて、入力された文章が適切か不適切かを判別する前記第1機械学習モデルを生成する
処理をコンピュータに実行させることを特徴とする機械学習プログラム。
続きを表示(約 930 文字)
【請求項2】
前記分割の処理は、前記第1文章として完結した文章を取得し、前記第1文章を分割して前記第2文章として未完結な文章を生成することを特徴とする請求項1に記載の機械学習プログラム。
【請求項3】
前記分割の処理は、前記第1文章を句点で分割して前記第2文章を生成することを特徴とする請求項2に記載の機械学習プログラム。
【請求項4】
前記第1文章を用いて第2機械学習モデルに学習させて、入力された文章を予め決められた複数のクラスのいずれかへの分類を行う前記第2機械学習モデルを生成する
処理を前記コンピュータにさらに実行させることを特徴とする請求項1に記載の機械学習プログラム。
【請求項5】
分類対象の文章の入力を受け付け、
前記第2機械学習モデルを用いて前記分類対象の文章の前記複数のクラスへの分類を実行し、
前記第1機械学習モデルを用いて前記分類対象の文章が適切か不適切かの判定を実行し、
前記分類の結果及び前記判定の結果を出力する
処理を前記コンピュータにさらに実行させることを特徴とする請求項4に記載の機械学習プログラム。
【請求項6】
機械学習装置が、
第1文章を複数の第2文章に分割し、
前記第1文章に適切とラベル付けし、
前記第2文章に不適切とラベル付けし、
ラベル付けされた前記第1文章及び前記第2文章それぞれを用いて第1機械学習モデルに学習させて、入力された文章が適切か不適切かを判別する前記第1機械学習モデルを生成する
処理を実行することを特徴とする機械学習方法。
【請求項7】
第1文章を複数の第2文章に分割する分割文章生成部と、
前記第1文章に適切とラベル付けし、前記第2文章に不適切とラベル付けする適不適ラベル付部と、
ラベル付けされた前記第1文章及び前記第2文章それぞれを用いて第1機械学習モデルに学習させて、入力された文章が適切か不適切かを判別する前記第1機械学習モデルを生成する学習処理部と
を備えたことを特徴とする機械学習装置。
発明の詳細な説明
【技術分野】
【0001】
本発明は、機械学習プログラム、機械学習方法及び機械学習装置に関する。
続きを表示(約 1,500 文字)
【背景技術】
【0002】
コールセンター等における電話の応対業務において、通話内容を音声認識にて文字起こしし、その文字起こしされた文章を自然言語処理により内容に応じて分類するといった技術が存在する。このような文章分類に関する技術として、予め定義されたラベルを用いて分類を行い、定義されたラベルのいずれにも該当しない場合は、未分類とする技術が存在する。
【0003】
他にも、発話を質問または要求として分類するために、キーワード分析と連動させて発話の解析木及びテンプレートによる言語分析を利用し、分類が難しい場合には不明として分類する技術が提案されている。また、基本的表現リストに加えて、否定又は肯定の含意を含む連語を利用して、文書を肯定的内容又は否定的内容のカテゴリーに分類するための分類基準の学習を行わせる技術が提案されている。
【先行技術文献】
【特許文献】
【0004】
特開2011-170786号公報
特表2020-537223号公報
特開2006-113746号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
しかしながら、野外活動のように無線器を用いて連絡を取り合う場合、電波状況等の影響で通信内容が途絶するケースが発生する。通信が途絶した場合、音声認識により文字起こししても、文章としては未完結なものとなるため、従来の自然言語処理により内容を分類しようとした場合に、正常な分類が難しくなる。そのため、文章分類の信頼性を向上させることは困難である。
【0006】
明確な分類が難しい文章を未分類として分類する技術では、文章が未完結であるために未分類となるのか、あるいは文章自体は完結しているが、あらかじめ定義されたラベルのいずれにも属さないために未分類となるのか判別することが困難である。例えば、この技術を用いた場合、「スポーツ」、「グルメ」という分類ができるモデルに対し、「政治」に関する文章を入力すると「未分類」との出力が得られる。この場合、文章の内容が分類可能なラベル外であることは分かるが、その文章が未完結であるか否かは不明である。
【0007】
キーワード分析と連動して解析木及びテンプレートによる言語分析を利用して分類を行う技術や否定及び肯定の含意を含む連語を利用して分類モデルの学習を行う技術のいずれでも、文章が未完結か否かを判定することは困難である。このように、いずれの技術を用いても文章分類の信頼性を向上させることは困難である。
【0008】
開示の技術は、上記に鑑みてなされたものであって、文章分類の信頼性を向上させる機械学習プログラム、機械学習方法及び機械学習装置を提供することを目的とする。
【課題を解決するための手段】
【0009】
本願の開示する機械学習プログラム、機械学習方法及び機械学習装置の一つの態様において、第1文章を複数の第2文章に分割し、前記第1文章に適切とラベル付けし、前記第2文章に不適切とラベル付けし、ラベル付けされた前記第1文章及び前記第2文章それぞれを用いて第1機械学習モデルに学習させて、入力された文章が適切か不適切かを判別する前記第1機械学習モデルを生成する処理をコンピュータに実行させる。
【発明の効果】
【0010】
1つの側面では、本発明は、文章分類の信頼性を向上させることができる。
【図面の簡単な説明】
(【0011】以降は省略されています)
この特許をJ-PlatPatで参照する
関連特許
富士通株式会社
プロセッサ
3日前
富士通株式会社
異常な挙動の検出
4日前
富士通株式会社
異常検知装置および異常検知方法
3日前
富士通株式会社
画像視角変化類型検出装置と方法
4日前
富士通株式会社
機械学習方法および情報処理装置
4日前
富士通株式会社
ネットワーク装置及びモデル学習方法
3日前
富士通株式会社
支援プログラム、支援方法及び情報処理装置
3日前
富士通株式会社
推定プログラム、推定方法、及び情報処理装置
3日前
富士通株式会社
制御プログラム、制御方法および制御システム
10日前
富士通株式会社
データ処理装置、データ処理プログラム及びデータ処理方法
3日前
富士通株式会社
機械学習パイプライン部品判定プログラム、方法、及び装置
4日前
富士通株式会社
レポート作成プログラム、レポート作成方法、レポート作成装置
3日前
富士通株式会社
データ管理プログラム、データ管理装置、およびデータ管理システム
4日前
個人
情報提示方法
18日前
個人
プログラム
10日前
個人
プログラム
17日前
個人
自動精算システム
26日前
個人
RFタグ読取装置
1か月前
個人
アカウントマップ
11日前
個人
売買システム
1か月前
個人
発想支援方法及びシステム
21日前
個人
市場受発注システム
24日前
日本精機株式会社
車両用表示装置
1か月前
日本精機株式会社
車両用表示装置
1か月前
個人
学習装置及び推論装置
10日前
個人
分類処理プログラム及び方法
21日前
個人
VRによる人体各部位の立体化
1か月前
井関農機株式会社
ロボット作業車両
26日前
株式会社発明屋
電池指向の構造設計
4日前
富士通株式会社
金融システム
18日前
トヨタ自動車株式会社
管理装置
5日前
株式会社プレニーズ
仲介システム
11日前
富士通株式会社
プロセッサ
3日前
トヨタ自動車株式会社
作業評価装置
1か月前
個人
販売支援システム
26日前
トヨタ自動車株式会社
作業管理装置
24日前
続きを見る
他の特許を見る