TOP
|
特許
|
意匠
|
商標
特許ウォッチ
Twitter
他の特許を見る
10個以上の画像は省略されています。
公開番号
2025034410
公報種別
公開特許公報(A)
公開日
2025-03-13
出願番号
2023140773
出願日
2023-08-31
発明の名称
情報処理装置、情報処理方法、及びプログラム
出願人
キヤノン株式会社
代理人
弁理士法人谷・阿部特許事務所
主分類
G06V
30/418 20220101AFI20250306BHJP(計算;計数)
要約
【課題】文書画像の文書種別を特定する際の負担を減らす情報処理装置、情報処理方法及びプログラムを提供する。
【解決手段】情報処理システム100において、情報処理サーバ103は、処理対象の文書の画像に対して文字認識処理を行う文字画像解析部154と、文字認識処理の結果に基づいて、処理対象の文書が示す文書種別を大規模言語モデルに回答させるための指示文を生成し、指示文に対する回答を大規模言語モデルから得るために、指示文を送信する指示文生成部155と、大規模言語モデルによる指示文に対する回答を受信する回答受信部156と、を有する。
【選択図】図1
特許請求の範囲
【請求項1】
処理対象の文書の画像に対して文字認識処理を行う文字認識手段と、
前記文字認識処理の結果に基づいて、前記処理対象の文書が示す文書種別を大規模言語モデルに回答させるための指示文を生成する生成手段と、
前記指示文に対する回答を前記大規模言語モデルから得るために、前記指示文を送信する送信手段と、
前記大規模言語モデルによる前記指示文に対する回答を受信する受信手段と、
を有することを特徴とする情報処理装置。
続きを表示(約 1,100 文字)
【請求項2】
前記生成手段は、前記文字認識処理の結果得られた文字列が含まれる文書の文書種別を前記大規模言語モデルに回答させる前記指示文を生成する
ことを特徴とする請求項1に記載の情報処理装置。
【請求項3】
前記文字認識処理の結果得られた文字列から、少なくとも所定の項目に対応する文字列を抽出する抽出手段をさらに有し、
前記生成手段は、前記所定の項目に対応する文字列が含まれる文書の文書種別を前記大規模言語モデルに回答させる前記指示文を生成する
ことを特徴とする請求項1に記載の情報処理装置。
【請求項4】
前記所定の項目はタイトルである
ことを特徴とする請求項3に記載の情報処理装置。
【請求項5】
前記所定の項目は複数の項目で構成される
ことを特徴とする請求項3に記載の情報処理装置。
【請求項6】
前記抽出手段は、前記文字認識処理の結果得られた文字列群を学習済みモデルに入力することで得られた結果に基づいて、前記文字列群から前記所定の項目を含む項目に対応する文字列である項目値を抽出し、
前記生成手段は、前記項目値から前記所定の項目に対応する文字列を取得して、前記指示文を生成する
ことを特徴とする請求項3に記載の情報処理装置。
【請求項7】
前記指示文には、前記処理対象の文書が示す文書種別が、予め設定された複数の文書種別のうちの何れかに該当するかを回答させる第1の設問が含まれる
ことを特徴とする請求項1に記載の情報処理装置。
【請求項8】
前記指示文には、前記処理対象の文書が示す文書種別が、前記複数の文書種別のうちの何れにも該当しない場合、前記処理対象の文書が示す文書種別として前記複数の文書種別以外の文書種別を回答させる第2の設問が含まれる
ことを特徴とする請求項7に記載の情報処理装置。
【請求項9】
前記指示文には、前記第1の設問および前記第2の設問において回答した理由を回答させる第3の設問が含まれる
ことを特徴とする請求項8に記載の情報処理装置。
【請求項10】
前記文字認識処理の結果得られた文字列群を学習済みモデルに入力すること得られた結果に基づいて、前記処理対象の文書が示す文書種別を決定する決定手段をさらに有し、
前記学習済みモデルは、前記複数の文書種別のうちの何れかの文書種別を示す情報を出力するように学習された学習済みモデルである
ことを特徴とする請求項8に記載の情報処理装置。
(【請求項11】以降は省略されています)
発明の詳細な説明
【技術分野】
【0001】
本開示は、文書画像から情報を抽出する処理に関する。
続きを表示(約 1,900 文字)
【背景技術】
【0002】
入力された文書画像の文書種別を決定する技術がある。請求書、見積書、納品書のような文書種別を決定する方法として、複数の文書画像を機械学習することにより得られた学習済みモデルを用いる方法がある。
【0003】
特許文献1には、学習済みの文書種別へ分類することができる分類器(学習済みモデル)を用いて、入力された文書画像の文書種別を決定する方法が開示されている。この特許文献1では、入力された文書画像に対して複数の文書種別それぞれの信頼度を算出し、信頼度が第1の閾値を超える文書種別が存在する場合はその文書種別を分類先とする。また、信頼度が第1の閾値以下でかつ第2の閾値を超える文書種別が複数存在する場合は、その文書種別を分類先候補として提示してユーザから正しい文書種別の指示を受け付ける。さらに、信頼度が第2の閾値を超える文書種別が存在しない場合は、ユーザから新しい文書種別の指定を受け付け可能にすることも開示されている。
【先行技術文献】
【特許文献】
【0004】
特開2017-107455号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
しかしながら、特許文献1の手法では、信頼度が第2の閾値を超える文書種別が存在しない場合に、ユーザが新しい文書種別の入力を行う必要があり、ユーザにとっては新しい文書種別を示す文字列を入力するという手間がかかる。
【0006】
また、一般的に追加学習には多くの類似データの収集と学習時間が必要である。このため、学習済みモデルが新たな文書種別を分類できるようになるまでは、分類に失敗するたびにユーザは新しい文書種別を入力したり、複数の選択肢から適切なものを選択して修正したりしなければならず、ユーザに掛かる負荷が大きくなってしまう。
【課題を解決するための手段】
【0007】
本開示の情報処理装置は、処理対象の文書の画像に対して文字認識処理を行う文字認識手段と、前記文字認識処理の結果に基づいて、前記処理対象の文書が示す文書種別を大規模言語モデルに回答させるための指示文を生成する生成手段と、前記指示文に対する回答を前記大規模言語モデルから得るために、前記指示文を送信する送信手段と、前記大規模言語モデルによる前記指示文に対する回答を受信する受信手段と、を有することを特徴とする。
【発明の効果】
【0008】
本開示によれば、文書画像の文書種別を特定する際の負担を減らすことができる。
【図面の簡単な説明】
【0009】
情報処理システムの構成例を示す図。
情報処理システムを構成する各装置のハードウェア構成例を示す図。
情報処理システムのシーケンス図。
機械学習モデルの生成処理の詳細を説明するフローチャート。
文書種別をユーザに表示する処理の詳細を説明するフローチャート。
機械学習モデルによる文書解析処理の詳細を説明するフローチャート。
処理対象の文書画像の一例を示す図。
大規模言語モデルからの回答取得処理の詳細を説明するフローチャート。
指示文を説明するための図。
文書種別確認画面の一例を示す図。
情報処理システムのシーケンス図。
オプション設定画面および文書種別確認画面を示す図。
文書種別をユーザに表示する処理の詳細を説明するフローチャート。
大規模言語モデルからの回答取得処理の詳細を説明するフローチャート。
指示文を説明するための図。
情報処理システムのシーケンス図。
設定画面および文書種別確認画面を示す図。
文書種別をユーザに表示する処理の詳細を説明するフローチャート。
大規模言語モデルからの回答取得処理の詳細を説明するフローチャート。
情報処理システムの構成例を示す図。
情報処理システムのシーケンス図。
設定画面および文書種別確認画面を示す図。
文書種別をユーザに表示する処理の詳細を説明するフローチャート。
機械学習モデルによる文書解析処理の詳細を説明するフローチャート。
【発明を実施するための形態】
【0010】
以下、本開示の技術の実施形態について図面を用いて説明する。なお、以下の実施形態に記載された構成要素は例示であって、本開示の技術の範囲を限定する趣旨のものではない。
(【0011】以降は省略されています)
この特許をJ-PlatPatで参照する
関連特許
キヤノン株式会社
記録装置
1日前
キヤノン株式会社
撮像装置
今日
キヤノン株式会社
表示装置
今日
キヤノン株式会社
記録装置
1日前
キヤノン株式会社
画像形成装置
今日
キヤノン株式会社
画像形成装置
今日
キヤノン株式会社
画像形成装置
今日
キヤノン株式会社
画像形成装置
1日前
キヤノン株式会社
液体吐出装置
1日前
キヤノン株式会社
画像形成装置
今日
キヤノン株式会社
画像処理装置
今日
キヤノン株式会社
画像形成装置
今日
キヤノン株式会社
画像形成装置
1日前
キヤノン株式会社
画像形成装置
今日
キヤノン株式会社
画像形成装置
今日
キヤノン株式会社
無線送電装置
今日
キヤノン株式会社
画像形成装置
今日
キヤノン株式会社
画像形成装置
今日
キヤノン株式会社
液体吐出ヘッド
今日
キヤノン株式会社
振動型駆動装置
今日
キヤノン株式会社
測距装置および機器
今日
キヤノン株式会社
吐出ヘッドの製造方法
今日
キヤノン株式会社
記録装置及び払拭方法
今日
キヤノン株式会社
光学系および撮像装置
今日
キヤノン株式会社
検品装置、検査システム
今日
キヤノン株式会社
インクジェット記録装置
今日
キヤノン株式会社
表示光学系および表示装置
今日
キヤノン株式会社
情報提供システム及び方法
1日前
キヤノン株式会社
撮像システムおよび移動体
今日
キヤノン株式会社
プリントシステム及び方法
今日
キヤノン株式会社
記録装置およびプログラム
今日
キヤノン株式会社
回折光学素子及び光学機器
今日
キヤノン株式会社
記録装置およびプログラム
今日
キヤノン株式会社
光学機器およびその制御方法
今日
キヤノン株式会社
情報処理装置及びプログラム
1日前
キヤノン株式会社
無端ベルト及び画像形成装置
今日
続きを見る
他の特許を見る