TOP
|
特許
|
意匠
|
商標
特許ウォッチ
Twitter
他の特許を見る
10個以上の画像は省略されています。
公開番号
2025133148
公報種別
公開特許公報(A)
公開日
2025-09-11
出願番号
2024030905
出願日
2024-03-01
発明の名称
ベリファイシステム
出願人
サンネット株式会社
代理人
弁理士法人河野国際特許商標事務所
,
個人
,
個人
,
個人
主分類
G06V
30/196 20220101AFI20250904BHJP(計算;計数)
要約
【課題】
この発明は、データ入力において、手描き文字で成るアナログデータをテキストデータ化の対象とする場合に、高い認識精度でテキストデータ化することができる手段を得ることを課題とする。
【解決手段】
手描き文字イメージデータと、手描き文字イメージデータに対応するテキストデータの組み合わせに基づいて手描き文字イメージデータを分類するAI機能によってAI認識テキストデータを取得することによって課題を解決する。そのような分類を、手描き文字イメージデータの周辺に存するデジタル情報であって手描き文字に相当するデジタル情報以外のデジタル情報を取り除く処理であって、手描き文字イメージデータの認識精度を向上させるための認識精度向上処理が施されたデータについて行うことによって課題を解決する。
【選択図】図3
特許請求の範囲
【請求項1】
アナログデータの文字から、アナログデータの文字に対応するテキストデータを取得するベリファイシステムであって、
アナログデータの文字は手描き文字であり、
第一次作業者によって記録される第一次テキストデータを取得するための第一次テキストデータ取得手段と、
第二次作業者によって記録される第二次テキストデータを取得するための第二次テキストデータ取得手段と、
アナログデータの手描き文字をデジタル化したデータである手描き文字イメージデータを分類し、前記手描き文字イメージデータに対応するテキストデータと認識されたデータであるAI認識テキストデータを取得するAI認識テキストデータ取得手段とを備え、
前記第一次テキストデータ取得手段は、
前記手描き文字イメージデータと前記AI認識テキストデータとが比較され、
前記AI認識テキストデータのうち前記手描き文字イメージデータと一致すると判断されたものをそのまま第一次テキストデータとして取得し、
前記AI認識テキストデータのうち前記手描き文字イメージデータと一致しないと判断されたものは前記手描き文字イメージデータと一致するよう正された状態で第一次テキストデータとして取得し、
前記第二次テキストデータ取得手段は、
前記手描き文字イメージデータと
前記第一次テキストデータとが比較され、
前記第一次テキストデータのうち前記手描き文字イメージデータと一致すると判断されたものをそのまま第二次テキストデータとして取得し、
前記第一次テキストデータのうち前記手描き文字イメージデータと一致しないと判断されたものは前記手描き文字イメージデータと一致するよう修正されて第二次テキストデータとして取得し、
前記AI認識テキストデータ取得手段は、
前記手描き文字イメージデータと、前記手描き文字イメージデータに対応するテキストデータの組み合わせに基づいて手描き文字イメージデータを分類するAI機能によってAI認識テキストデータが取得され、
前記AI機能は、手描き文字イメージデータの周辺に存するデジタル情報であって手描き文字に相当するデジタル情報以外のデジタル情報を取り除く処理であって、手描き文字イメージデータの認識精度を向上させるための認識精度向上処理が施されたデータについて分類を行うベリファイシステム。
続きを表示(約 810 文字)
【請求項2】
前記AI認識テキストデータ取得手段において、
前記手描き文字を構成する文字のうちの一文字であって
手描き文字イメージデータを分割して得られる一文字の手描き文字イメージデータと、
当該一文字の手描き文字イメージデータに対応するテキストデータの組み合わせに基づいて、
一文字の手描き文字イメージデータを分類するAI機能によって
一文字に対応するAI認識テキストデータが取得されることを特徴とする請求項1に記載のベリファイシステム。
【請求項3】
前記AI認識テキストデータ取得手段において、
一文字の数字についての手描き文字イメージデータと
当該一文字の数字についての手描き文字イメージデータに対応するテキストデータの組み合わせに基づいて、
一文字の数字についての手描き文字イメージデータを分類するAI機能によって
一文字の数字についてのAI認識テキストデータが取得されることを特徴とする請求項1に記載のベリファイシステム。
【請求項4】
第一次テキストデータ取得手段において、
前記手描き文字イメージデータと前記AI認識テキストデータの比較は、
前記手描き文字イメージデータにおける各文字の位置情報に基づいて
各文字に対応するAI認識テキストデータが並べられて行われることを特徴とする請求項1に記載のベリファイシステム。
【請求項5】
前記認識精度向上処理において、
手描き文字に相当するデジタル情報以外のデジタル情報であって
位置情報を備えた情報については、
前記位置情報に基づき、手描き文字に相当するデジタル情報以外のデジタル情報が存する箇所のピクセルを白色のピクセルと置換することを特徴とする請求項1に記載のベリファイシステム。
発明の詳細な説明
【技術分野】
【0001】
テキストデータ化されていない文字をテキストデータ化するデータ入力あるいはベリファイ入力と称される役務で用いる技術に関する。特にテキストデータ化されていない文字が手描き文字である場合のデータ入力あるいはベリファイ入力と称される役務で用いる技術に関する。
続きを表示(約 3,800 文字)
【背景技術】
【0002】
市場にはテキストデータ化されていない文字(アナログデータの文字)で構成される書類が大量にあるところ、アナログデータで成る文字情報の正確なテキストデータ化を請け負う「データ入力」という役務が存在する。
【0003】
データ入力は、通常、第一次作業者による第一次テキストデータ取得と、第二次作業者による第二次テキストデータ取得により行われる。まず、テキストデータ化の対象書類から、アナログデータの文字より取得した画像情報でなる文字イメージデータと、文字イメージデータより取得した認識テキストデータを取得する。第一次作業者は、文字イメージデータと認識テキストデータとを比較し、認識テキストデータのうち文字イメージデータと一致すると判断されたものをそのまま第一次テキストデータとする一方、認識テキストデータのうち文字イメージデータと一致しないと判断されたものを文字イメージデータと一致するよう正して第一次テキストデータとする。第二次作業者は、文字イメージデータと、第一次作業者が取得した第一次テキストデータとを比較し、第一次テキストデータのうち文字イメージデータと一致すると判断されたものをそのまま第二次テキストデータとする一方、第一次テキストデータのうち文字イメージデータと一致しないと判断されたものを文字イメージデータと一致するよう修正して第二次テキストデータとする。データ入力の作業では、第二次作業者による第二次テキストデータを、アナログデータで成る文字情報をテキストデータ化したものとして用いる。データ入力の作業では、このように第一次作業者による判断と第二次作業者による判断を重ねることにより、アナログデータで成る文字情報の正確なテキストデータ化が実現される。
【先行技術文献】
【特許文献】
【0004】
特開2013-97393
特開2008-152357
【発明の概要】
【発明が解決しようとする課題】
【0005】
データ入力では、第一次作業者が用いる認識テキストデータを、OCR処理により得ている。OCR処理による場合、対象が活字の場合には、テキストの認識精度は90%を超え非常に高い。第一次作業者による作業を、認識精度が90%を超える状態からスタートできることにより、アナログデータで成る文字情報の正確なテキストデータ化が実現されている。
【0006】
一方、テキストデータ化の対象が手描き文字の場合には、OCR処理によるテキストの認識精度は非常に低い。数桁の金額に関する手描きの項目に関し、項目全体についてOCR処理により認識テキストデータを得た場合、文字認識率は27.0%であった。従って、データ対象が手描きの場合には、テキストデータ化は慎重に行う必要があり、費やす時間と労力の点で問題があった。この発明は、データ入力において、手描き文字で成るアナログデータをテキストデータ化の対象とする場合に、高い認識精度でテキストデータ化することができる手段を得ることを課題とする。
【0007】
手描き文字を正確にテキスト文字に変換する技術の開発は、データ入力の分野に限らず、各分野で実現されておらず、開発が望まれている。特許文献1に、ノートに記入された手描き文字の高精度な読み取りが可能な手書き文字テキスト化システムが記載されている。このシステムでは、スマートフォンに搭載したデジタルカメラにより撮影した文字画像データを、通信回線網を利用してセンタのサーバに送信し、ここで文字画像データをテキストデータに変換する。テキストデータへの変換は、二人以上のオペレータがノートの手描きスペースに記入された手描き文字を読み取り、その読み取り結果をオペレータ端末から送信(入力)することで行っている。また、手描きスペースの手描き文字を光学的に読み取ってOCRによるテキストデータ化と、上記オペレータによる入力を併存させている。
【0008】
特許文献2に、手書き入力情報の認識を効率化するテキスト認識システムが記載されている。このシステムでは、例えば投票用紙に記載された候補者の氏名等の手描き文字のイメージデータはOCRを利用してテキストデータ化に変換することを基本とし、変換できず判別不能となったデータについては担当者に送信され、担当者は目視により手描き文字から候補者を選択する。
【課題を解決するための手段】
【0009】
(1)アナログデータの文字から、アナログデータの文字に対応するテキストデータを取得するベリファイシステムであって、アナログデータの文字は手描き文字であり、第一次作業者によって記録される第一次テキストデータを取得するための第一次テキストデータ取得手段と、第二次作業者によって記録される第二次テキストデータを取得するための第二次テキストデータ取得手段と、アナログデータの手描き文字をデジタル化したデータである手描き文字イメージデータを分類し、前記手描き文字イメージデータに対応するテキストデータと認識されたデータであるAI認識テキストデータを取得するAI認識テキストデータ取得手段とを備え、前記第一次テキストデータ取得手段は、前記手描き文字イメージデータと前記AI認識テキストデータとが比較され、前記AI認識テキストデータのうち前記手描き文字イメージデータと一致すると判断されたものをそのまま第一次テキストデータとして取得し、前記AI認識テキストデータのうち前記手描き文字イメージデータと一致しないと判断されたものは前記手描き文字イメージデータと一致するよう正された状態で第一次テキストデータとして取得し、前記第二次テキストデータ取得手段は、前記手描き文字イメージデータと前記第一次テキストデータとが比較され、前記第一次テキストデータのうち前記手描き文字イメージデータと一致すると判断されたものをそのまま第二次テキストデータとして取得し、前記第一次テキストデータのうち前記手描き文字イメージデータと一致しないと判断されたものは前記手描き文字イメージデータと一致するよう修正されて第二次テキストデータとして取得し、前記AI認識テキストデータ取得手段は、前記手描き文字イメージデータと、前記手描き文字イメージデータに対応するテキストデータの組み合わせに基づいて手描き文字イメージデータを分類するAI機能によってAI認識テキストデータが取得され、前記AI機能は、手描き文字イメージデータの周辺に存するデジタル情報であって手描き文字に相当するデジタル情報以外のデジタル情報を取り除く処理であって、手描き文字イメージデータの認識精度を向上させるための認識精度向上処理が施されたデータについて分類を行うベリファイシステムによって課題を解決する。
(2)前記AI認識テキストデータ取得手段において、前記手描き文字を構成する文字のうちの一文字であって手描き文字イメージデータを分割して得られる一文字の手描き文字イメージデータと、当該一文字の手描き文字イメージデータに対応するテキストデータの組み合わせに基づいて、一文字の手描き文字イメージデータを分類するAI機能によって一文字に対応するAI認識テキストデータが取得されることを特徴とする(1)に記載のベリファイシステムによって課題を解決する。
(3)前記AI認識テキストデータ取得手段において、一文字の数字についての手描き文字イメージデータと当該一文字の数字についての手描き文字イメージデータに対応するテキストデータの組み合わせに基づいて、一文字の数字についての手描き文字イメージデータを分類するAI機能によって一文字の数字についてのAI認識テキストデータが取得されることを特徴とする(1)に記載のベリファイシステムによって課題を解決する。
(4)第一次テキストデータ取得手段において、前記手描き文字イメージデータと前記AI認識テキストデータの比較は、前記手描き文字イメージデータにおける各文字の位置情報に基づいて各文字に対応するAI認識テキストデータが並べられて行われることを特徴とする(1)に記載のベリファイシステムによって課題を解決する。
(5)前記認識精度向上処理において、手描き文字に相当するデジタル情報以外のデジタル情報であって位置情報を備えた情報については、前記位置情報に基づき、手描き文字に相当するデジタル情報以外のデジタル情報が存する箇所のピクセルを白色のピクセルと置換することを特徴とする(1)に記載のベリファイシステムによって課題を解決する。
【0010】
アナログデータの文字が手描き文字である場合について、手描き文字のイメージデータと、その手描き文字に対応する正しいテキストデータの組み合わせを教師データとして、AIに学習させることを検討した。AIの機能により、手描き文字の多様なイメージデータを、その手描き文字に対応するテキストデータに分類することができる。そのような分類により、手描き文字イメージデータに対応するテキストデータと認識されたデータであるAI認識テキストデータを取得することができる。
(【0011】以降は省略されています)
この特許をJ-PlatPat(特許庁公式サイト)で参照する
関連特許
個人
詐欺保険
1か月前
個人
縁伊達ポイン
1か月前
個人
5掛けポイント
14日前
個人
RFタグシート
25日前
個人
職業自動販売機
7日前
個人
QRコードの彩色
1か月前
個人
地球保全システム
1か月前
個人
ペルソナ認証方式
22日前
個人
情報処理装置
17日前
個人
自動調理装置
24日前
個人
農作物用途分配システム
1か月前
個人
残土処理システム
1か月前
個人
サービス情報提供システム
9日前
個人
インターネットの利用構造
21日前
個人
タッチパネル操作指代替具
1か月前
個人
知的財産出願支援システム
1か月前
個人
携帯端末障害問合せシステム
1か月前
個人
スケジュール調整プログラム
1か月前
株式会社キーエンス
受発注システム
1か月前
株式会社キーエンス
受発注システム
1か月前
個人
エリアガイドナビAIシステム
22日前
個人
食品レシピ生成システム
1か月前
個人
海外支援型農作物活用システム
2か月前
株式会社キーエンス
受発注システム
1か月前
個人
未来型家系図構築システム
2か月前
株式会社ケアコム
項目選択装置
17日前
キヤノン株式会社
画像認識装置
1日前
キヤノン株式会社
情報処理装置
1日前
株式会社ケアコム
項目選択装置
17日前
キヤノン株式会社
情報処理装置
15日前
株式会社ワコム
電子ペン
16日前
個人
音声・通知・再配達UX制御構造
1か月前
大同特殊鋼株式会社
疵判定方法
1か月前
株式会社ワコム
電子ペン
16日前
個人
帳票自動生成型SaaSシステム
1か月前
キヤノン株式会社
情報処理装置
1日前
続きを見る
他の特許を見る