TOP特許意匠商標
特許ウォッチ Twitter
公開番号2025179839
公報種別公開特許公報(A)
公開日2025-12-10
出願番号2025089291
出願日2025-05-28
発明の名称情報処理システム、情報処理方法、及びプログラム
出願人株式会社リチェルカ
代理人個人,個人
主分類G06V 30/412 20220101AFI20251203BHJP(計算;計数)
要約【課題】帳票のフォーマットに依存せず、非定型の帳票に対しても高精度に情報を抽出できるようにすることを課題とする。
【解決手段】情報処理システムを構成する管理サーバ1のCPU11では、OCR部33が、ユーザ端末により読み取られた帳票の帳票データに対してOCR処理を実行し、項目抽出部34が、OCR処理の処理結果から対象項目を抽出し、出力制御部35が、抽出された対象項目を所定形式で出力させる。これにより、上記の課題を解決する。
【選択図】図3
特許請求の範囲【請求項1】
帳票を読み取る帳票読取手段と、
前記帳票の読取結果に対してOCR処理を実行するOCR処理手段と、
前記OCR処理の処理結果から対象項目を抽出する項目抽出手段と、
抽出された前記対象項目を所定形式で出力させる出力制御手段と、
を有することを特徴とする情報処理システム。
続きを表示(約 1,000 文字)【請求項2】
前記読取結果を記憶する帳票記憶手段と、
前記OCR処理の処理結果を記憶するOCR結果記憶手段と、
前記対象項目の抽出結果を記憶する抽出結果記憶手段とをさらに有することを特徴とする、
請求項1に記載の情報処理システム。
【請求項3】
前記OCR処理手段は、前記帳票の全体に対するOCR処理により文字情報及び座標情報を抽出し、
前記項目抽出手段は、読取座標を指定することなく自然言語により指定された取得項目に基づき前記対象項目を抽出することを特徴とする、
請求項1に記載の情報処理システム。
【請求項4】
抽出された前記文字情報及び前記座標情報に基づいて、近接した当該座標情報を持つ文字情報をグルーピングするグルーピング手段をさらに有することを特徴とする、
請求項3に記載の情報処理システム。
【請求項5】
前記文字情報にナンバリングを行うナンバリング手段をさらに有することを特徴とする、
請求項3に記載の情報処理システム。
【請求項6】
前記項目抽出手段は、生成AIに正解例を示して当該生成AIに前記対象項目を抽出させることを特徴とする、
請求項1に記載の情報処理システム。
【請求項7】
前記項目抽出手段は、複数の前記生成AIの各々の特性に合わせた形式の前記正解例をそれぞれ示すことを特徴とする、
請求項6に記載の情報処理システム。
【請求項8】
文字の形状的特徴を考慮して表記揺れを吸収するマッチング手段をさらに有することを特徴とする、
請求項1に記載の情報処理システム。
【請求項9】
抽出された前記対象項目を予め指定された識別情報に変換する変換手段をさらに有することを特徴とする、
請求項1に記載の情報処理システム。
【請求項10】
前記帳票読取手段は、フォーマットが異なる複数の前記帳票を一括で読み取り、
前記OCR処理手段は、読み取られた前記複数の前記帳票に対する前記OCR処理を一括で実行し、
前記項目抽出手段は、前記OCR処理の処理結果から前記対象項目を一括で抽出し、
前記出力制御手段は、抽出された前記対象項目を前記所定形式で一括で出力することを特徴とする、
請求項1に記載の情報処理システム。
(【請求項11】以降は省略されています)

発明の詳細な説明【技術分野】
【0001】
本発明は、情報処理システム、情報処理方法、及びプログラムに関する。
続きを表示(約 1,500 文字)【背景技術】
【0002】
スキャナ等で読み取られた文書の読取画像から文字の配置や構造を解析し、解析した文字をコンピュータで利用できる文字コードに変換するOCR技術が知られている(例えば、特許文献1)。
【先行技術文献】
【特許文献】
【0003】
特開2024-025219号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
従来のOCR技術では、帳票のフォーマットごとに読み取る場所の座標設定が必要であった。このため、非定型の帳票に対応するためには、個別の設定作業が発生し、煩雑で時間がかかるという問題があった。
【0005】
本発明は、このような状況に鑑みてなされたものであり、帳票のフォーマットに依存せず、非定型の帳票に対しても高精度に情報を抽出できるようにすることを目的とする。
【課題を解決するための手段】
【0006】
上記目的を達成するため、本発明の一態様は、
帳票を読み取る帳票読取手段と、前記帳票の読取結果に対してOCR処理を実行するOCR処理手段と、前記OCR処理の処理結果から対象項目を抽出する項目抽出手段と、抽出された前記対象項目を所定形式で出力させる出力制御手段と、を有することを特徴とする情報処理システムである。
【0007】
本発明の一態様の上記情報処理システムに対応する情報処理装置、情報処理方法、及びプログラムも、本発明の一態様の情報処理システムに対応する情報処理装置、情報処理方法、及びプログラムとして提供される。
【発明の効果】
【0008】
本発明によれば、帳票のフォーマットに依存せず、非定型の帳票に対しても高精度に情報を抽出できるようにすることができる。
【図面の簡単な説明】
【0009】
本発明の一実施形態にかかる情報処理システムの全体構成の一例を示す図である。
図1の情報処理システムを構成する管理サーバのハードウェア構成の一例を示すブロック図である。
管理サーバの機能的構成の一例を示す機能ブロック図である。
(A)は、図1の情報処理システムの処理のうち、帳票読取処理の流れの一例を示すフローチャートである。(B)は、図1の情報処理システムの処理のうち、帳票学習処理の流れの一例を示すフローチャートである。
(A)は、図1の情報処理システムの処理のうち、生成AI処理の流れの一例を示すフローチャートである。(B)は、図1の情報処理システムの処理のうち、ユーザインターフェース処理の流れの一例を示すフローチャートである。
ユーザインターフェース処理によりユーザ端末に表示された画面の具体例を示す図である。
【発明を実施するための形態】
【0010】
以下、本実施形態について、図面を用いて説明する。
<情報処理システムS>
図1は、本発明の一実施形態にかかる情報処理システムSの全体構成の一例を示す図である。
情報処理システムSは、管理サーバ1と、管理者端末2と、ユーザ端末3-1乃至3-n(nは1以上の整数値)とがネットワークNを介して接続されることを含むように構成された情報処理システムである。なお、以下において、ユーザ端末3-1乃至3-nの各々を個別に説明する必要がない場合、これらをまとめて「ユーザ端末3」と呼ぶ。
(【0011】以降は省略されています)

この特許をJ-PlatPat(特許庁公式サイト)で参照する

関連特許

株式会社リチェルカ
情報処理システム、情報処理方法、及びプログラム
1日前
株式会社リチェルカ
情報処理システム、情報処理方法、及びプログラム
1日前
個人
詐欺保険
1か月前
個人
縁伊達ポイン
1か月前
個人
5掛けポイント
1か月前
個人
RFタグシート
1か月前
個人
職業自動販売機
27日前
個人
ペルソナ認証方式
1か月前
個人
地球保全システム
2か月前
個人
QRコードの彩色
2か月前
個人
情報処理装置
1か月前
個人
自動調理装置
1か月前
個人
立体グラフの利用方法
6日前
個人
残土処理システム
2か月前
個人
生体情報の登録システム
今日
個人
農作物用途分配システム
1か月前
個人
タッチパネル操作指代替具
1か月前
個人
サービス情報提供システム
29日前
NISSHA株式会社
入力装置
7日前
個人
データ復元システム
1日前
個人
知的財産出願支援システム
2か月前
個人
インターネットの利用構造
1か月前
個人
学習用データ生成装置
8日前
個人
スケジュール調整プログラム
1か月前
個人
携帯端末障害問合せシステム
1か月前
個人
食品レシピ生成システム
2か月前
株式会社キーエンス
受発注システム
2か月前
個人
ナショナルブランド共同ストア
今日
株式会社キーエンス
受発注システム
2か月前
株式会社キーエンス
受発注システム
2か月前
個人
エリアガイドナビAIシステム
1か月前
キヤノン株式会社
情報処理装置
21日前
キヤノン株式会社
印刷システム
1か月前
株式会社ケアコム
項目選択装置
1か月前
株式会社ケアコム
項目選択装置
1か月前
エッグス株式会社
情報処理装置
1か月前
続きを見る