TOP
|
特許
|
意匠
|
商標
特許ウォッチ
Twitter
他の特許を見る
10個以上の画像は省略されています。
公開番号
2022176360
公報種別
公開特許公報(A)
公開日
2022-11-25
出願番号
2022161861,2021021837
出願日
2022-10-06,2021-02-15
発明の名称
認識処理装置、認識処理プログラム、認識処理方法、及び認識処理システム
出願人
アイタックソリューションズ株式会社
,
株式会社ワコム
代理人
個人
,
個人
,
個人
主分類
G06V
30/19 20220101AFI20221117BHJP(計算;計数)
要約
【課題】 より効率的にオンライン文字入力の特徴量を得て機械学習する。
【解決手段】 本発明は、認識処理装置に関する。そして、本発明の認識処理装置は、入力文字ごとに電子ペンによるストロークの時系列順の入力パターンを示す入力ストロークデータを取得し、取得した入力ストロークデータを、固定サンプル数の入力パターンに正規化して正規化ストロークデータを取得する正規化手段と、正規化手段が正規化した正規化ストロークデータを、固定サンプル数の特徴量で表現した入力ベクトルデータに変換する入力ベクトルデータ取得手段と、入力ベクトルデータ取得手段が取得した入力ベクトルデータを用いて機械学習した学習モデルを用いて、入力ベクトルデータ取得手段が取得した入力ベクトルデータについて文字認識処理を行う文字認識処理手段とを有することを特徴とする。
【選択図】 図1
特許請求の範囲
【請求項1】
入力文字ごとに電子ペンによるストロークの時系列順の入力パターンを示す入力ストロークデータを取得し、取得した入力ストロークデータを、固定サンプル数の入力パターンに正規化して正規化ストロークデータを取得する正規化手段と、
前記正規化手段が正規化した正規化ストロークデータを、前記固定サンプル数の特徴量で表現した入力ベクトルデータに変換する入力ベクトルデータ取得手段と、
前記入力ベクトルデータ取得手段が取得した入力ベクトルデータを用いて機械学習した学習モデルを用いて、前記入力ベクトルデータ取得手段が取得した入力ベクトルデータについて文字認識処理を行う文字認識処理手段とを有する
ことを特徴とする認識処理装置。
続きを表示(約 1,900 文字)
【請求項2】
前記正規化手段は、入力ストロークデータを構成するストローク単位で前記入力ストロークデータを構成するサンプルを正規化し、正規化した各ストロークのサンプルを接続して前記正規化ストロークデータを生成して取得することを特徴とする請求項1に記載の認識処理装置。
【請求項3】
入力ベクトルデータを構成する各特徴量は、当該特徴量の時系列に対応する座標を示す座標パラメータと、当該特徴量の直前の時系列からの動きベクトルを示す動きベクトルパラメータと、当該特徴量の時系列に対応する前記電子ペンのペン先の状態を示すペン先状態パラメータとを含むことを特徴とする請求項1又は2に記載の認識処理装置。
【請求項4】
入力ベクトルデータを構成する各特徴量は、前記特徴量の時系列に対応する前記電子ペンのペン先の状態を示すペン先状態パラメータを含むことを特徴とする請求項3に記載の認識処理装置。
【請求項5】
前記入力ベクトルデータ取得手段は、さらに前記入力ストロークデータに基づいて描画した入力画像データを生成し、
前記文字認識処理手段は、過去に入力ベクトルデータを用いて機械学習した第1の学習モデルを用いて、前記入力ベクトルデータ取得手段が取得した入力ベクトルデータについて文字認識処理を行って第1の文字認識結果を取得し、さらに、過去に入力画像を用いて機械学習した第2の学習モデルを用いて、前記入力ベクトルデータ取得手段が取得した入力画像データについて文字認識処理を行って第2の文字認識結果を取得し、
前記文字認識処理手段による第1の文字認識結果と第2の文字認識結果のうちいずれかを選択して最終的な文字認識処理結果として出力する文字認識結果出力手段をさらに有する
ことを特徴とする請求項1~4のいずれかに記載の認識処理装置。
【請求項6】
前記文字認識処理手段は、前記第1の文字認識結果又は前記第2の文字認識結果を取得する際にその信頼度を取得し、
前記文字認識結果出力手段は、前記文字認識処理手段による第1の文字認識結果と第2の文字認識結果のうち信頼度の高い方を選択して最終的な文字認識処理結果として出力する
ことを特徴とする請求項5に記載の認識処理装置。
【請求項7】
コンピュータを、
入力文字ごとに電子ペンによるストロークの時系列順の入力パターンを示す入力ストロークデータを取得し、取得した入力ストロークデータを、固定サンプル数の入力パターンに正規化して正規化ストロークデータを取得する正規化手段と、
前記正規化手段が正規化した正規化ストロークデータを、前記固定サンプル数の特徴量で表現した入力ベクトルデータに変換する入力ベクトルデータ取得手段と、
前記入力ベクトルデータ取得手段が取得した入力ベクトルデータを用いて機械学習した学習モデルを用いて、前記入力ベクトルデータ取得手段が取得した入力ベクトルデータについて文字認識処理を行う文字認識処理手段として機能させる
ことを特徴とする認識処理プログラム。
【請求項8】
認識処理装置が行う認識処理方法において、
前記認識処理装置は、正規化手段、文字認識処理手段、及び文字認識結果出力手段を有し、
前記正規化手段は、入力文字ごとに電子ペンによるストロークの時系列順の入力パターンを示す入力ストロークデータを取得し、取得した入力ストロークデータを、固定サンプル数の入力パターンに正規化して正規化ストロークデータを取得し、
前記入力ベクトルデータ取得手段は、前記正規化手段が正規化した正規化ストロークデータを、前記固定サンプル数の特徴量で表現した入力ベクトルデータに変換し、
前記文字認識処理手段は、前記入力ベクトルデータ取得手段が取得した入力ベクトルデータを用いて機械学習した学習モデルを用いて、前記入力ベクトルデータ取得手段が取得した入力ベクトルデータについて文字認識処理を行う
ことを特徴とする認識処理方法。
【請求項9】
電子ペンと前電子ペンを用いた入力を受けることができるペンタブレットと、ユーザにより前記電子ペンで前記ペンタブレットに書きこまれた文字を認識する認識処理装置とを有する認識処理システムにおいて、前記認識処理装置として請求項1~5のいずれかに記載された認識処理装置を適用したことを特徴とする認識処理システム。
発明の詳細な説明
【技術分野】
【0001】
この発明は、認識処理装置、認識処理プログラム、認識処理方法、及び認識処理システムに関し、例えば、オンライン手書き文字認識処理に適用し得る。
続きを表示(約 1,400 文字)
【背景技術】
【0002】
従来、オンライン手書き文字認識処理では、文字入力の際のストローク(筆跡)から特徴量を取得し、取得した特徴量に基づいて機械学習を行って学習モデルを取得し、取得した学習モデルを用いて入力文字の認識を行う手法が提案されている。
【0003】
上記のようなストロークの特徴量について機械学習を行って、文字認識処理を行う手法としては、特許文献1のような記載技術が存在する。
【0004】
特許文献1の記載技術では、各文字について、時系列ごとのストロークの位置(以下、「入力パターン」と呼ぶ)をサンプルとして取得し、サンプルとして取得した入力パターンと標準パターン(標準的な筆跡で入力した場合の入力パターン)との間で特徴点(ストロークを構成する各位置)を対応付け、対応付けられた特徴点間の差分を、文字認識処理に用いる特徴値として取得している。
【0005】
そして、特許文献1の記載技術では、学習用に取得された特徴値を教師データとして機械学習を行い、学習モデルを取得する。そして、特許文献1の記載技術では、文字認識処理の際には、サンプルの入力パターンについて、全ての標準パターンと特徴点間の差異を演算して特徴量として取得し、取得した全ての標準パターンとの特徴量を学習モデルに入力して文字認識処理を行う。
【先行技術文献】
【特許文献】
【0006】
特開2018-112521号公報
【発明の概要】
【発明が解決しようとする課題】
【0007】
しかしながら、特許文献1の記載技術では、学習モデルを得るために好適な標準パターンを文字毎に用意しなければならないので学習モデルの作成コストが高い。また、特許文献1の記載技術では、文字認識処理の際にサンプルの入力パターンと全ての標準パターンとの間の特徴量を取得して認識処理しなければならないので、非常に処理負荷が高い。
【0008】
特許文献1の記載技術では、文字入力の特徴量について、より多くの情報量を確保する観点から、上記のように標準パターンとの差分を特徴値として用いたが、上記の通り、特許文献1の記載技術では、学習モデルの作成や認識処理に多大なリソース(例えば、作業コストやハードウェア資源等)を必要とする。
【0009】
そのため、より効率的にオンライン文字入力の特徴量を得て機械学習することができる認識処理装置、認識処理プログラム、認識処理方法、及び認識処理システムが望まれている。
【課題を解決するための手段】
【0010】
第1の本発明の認識処理装置は、(1)入力文字ごとに電子ペンによるストロークの時系列順の入力パターンを示す入力ストロークデータを取得し、取得した入力ストロークデータを、固定サンプル数の入力パターンに正規化して正規化ストロークデータを取得する正規化手段と、(2)前記正規化手段が正規化した正規化ストロークデータを、前記固定サンプル数の特徴量で表現した入力ベクトルデータに変換する入力ベクトルデータ取得手段と、(3)前記入力ベクトルデータ取得手段が取得した入力ベクトルデータを用いて機械学習した学習モデルを用いて、前記入力ベクトルデータ取得手段が取得した入力ベクトルデータについて文字認識処理を行う文字認識処理手段とを有することを特徴とする。
(【0011】以降は省略されています)
特許ウォッチbot のツイート
この特許をJ-PlatPatで参照する
関連特許
他の特許を見る