TOP特許意匠商標
特許ウォッチ Twitter
公開番号2024094101
公報種別公開特許公報(A)
公開日2024-07-09
出願番号2022210853
出願日2022-12-27
発明の名称類似度判定方法および類似度判定プログラム
出願人富士通株式会社
代理人個人
主分類G06F 16/383 20190101AFI20240702BHJP(計算;計数)
要約【課題】数詞を含む文字列同士の類似度を精度よく判定できること。
【解決手段】類似度判定装置100は、起案伝票のデータAと、請求書のデータBとを突合させて類似度を判定する。類似度判定装置100は、データAとデータBを取得し、データAとデータBの文字列からそれぞれ数詞を抽出し、当該数詞の一致度を判定し、数詞突合結果S1として出力する。また、類似度判定装置100は、データAとデータBの文字列の類似度%を判定し、AI突合結果S2として出力する。ここで、類似度判定装置100は、判定した数詞が一致しなければ、判定した文字列の類似度%をより低い値に変更し、AI突合結果S2として出力する。
【選択図】図1
特許請求の範囲【請求項1】
第1のデータと第2のデータとを突合させて類似度を判定する類似度判定方法において、
前記第1のデータと前記第2のデータを取得し、
前記第1のデータと前記第2のデータの文字列からそれぞれ数詞を抽出し、当該数詞の一致度を判定し、
前記第1のデータと前記第2のデータの文字列の類似度を判定し、
判定した前記数詞の一致度と、前記文字列の類似度とに基づき、前記第1のデータと前記第2のデータとの類似度を決定する、
処理をコンピュータが実行することを特徴とする類似度判定方法。
続きを表示(約 780 文字)【請求項2】
前記決定の処理は、
判定した前記数詞の一致度が一致すれば、判定した前記文字列の類似度の値を変更せず、
判定した前記数詞の一致度が不一致であれば、判定した前記文字列の類似度の値をより低く変更する、
ことを特徴とする請求項1に記載の類似度判定方法。
【請求項3】
前記決定の処理は、
判定した前記数詞の一致度と、前記文字列の類似度とを組み合わせた類似度に関する総合判定結果を生成する、
処理を含むことを特徴とする請求項1に記載の類似度判定方法。
【請求項4】
決定した前記類似度の情報を照合結果リストに出力する、
処理を含むことを特徴とする請求項1に記載の類似度判定方法。
【請求項5】
前記取得の処理は、
前記第1のデータと、前記第2のデータとを、それぞれに対応する書類の電子データあるいは、書類をOCR処理して取得し、
前記類似度の決定の処理は、
前記第1のデータと、第2のデータの項目毎の文字列を抽出する処理を含む、
ことを特徴とする請求項1に記載の類似度判定方法。
【請求項6】
第1のデータと第2のデータとを突合させて類似度を判定する類似度判定プログラムにおいて、
前記第1のデータと前記第2のデータを取得し、
前記第1のデータと前記第2のデータの文字列からそれぞれ数詞を抽出し、当該数詞の一致度を判定し、
前記第1のデータと前記第2のデータの文字列の類似度を判定し、
判定した前記数詞の一致度と、前記文字列の類似度とに基づき、前記第1のデータと前記第2のデータとの類似度を決定する、
処理をコンピュータに実行させることを特徴とする類似度判定プログラム。

発明の詳細な説明【技術分野】
【0001】
本発明は、類似度判定方法および類似度判定プログラムに関する。
続きを表示(約 1,700 文字)【背景技術】
【0002】
例えば、自治体等の財務会計では、物品購入にかかる起案伝票と、物品購入後の請求書とを突合させて内容一致の審査を行っている。突合の処理では、請求日や債権者等の各種の項目毎の文字列の一致を確認している。例えば、突合する起票伝票と請求書の項目「件名」の文字列が「ボールペンの購入」と「筆記具の購入」である場合、単純な文字列の突合では、同一の内容であっても一致であるとの判定が行えない。
【0003】
これに対し、人工知能(AI)による意味類似度判定を行うことで、起票伝票と請求書とが同一のものであるか否かの判定材料となる意味類似度を得ることができ、審査の効率化を図ることができる。
【0004】
類似度判定の先行技術としては、例えば、証憑データを画像認識し、文字認識AIで文字認識し、取引明細情報項目の「金額」を判定し、仕訳AIで取引明細情報と対応する勘定科目の組み合わせの判定を行う技術がある。また、入力された検索対象の文書を形態素解析し、解析結果に基づいて、数値と単位と範囲を含めた数詞範囲を抽出することで、検索条件に数詞や数詞範囲が含まれる場合に対応した検索結果を得る技術がある。また、通帳の画像データから通帳の記載形式を含めた読取要素を抽出し、勘定科目と補助科目とをそれぞれの仕訳AIを用いて選定して仕訳データを生成し、補助科目に相当する事項を選定できる技術がある(例えば、下記特許文献1~3参照。)。
【先行技術文献】
【特許文献】
【0005】
特開2021-165967号公報
特開2020-187533号公報
国際公開第2019/146118号明細書
【発明の概要】
【発明が解決しようとする課題】
【0006】
従来技術において、AIを用いた意味類似度判定では、一般的に文字列全体の類似度を判定する。ここで、突合する起票伝票と請求書の項目「件名」の文字列に数詞が含まれ、「ボールペンの購入(10月度)」と、「筆記具の購入(11月度)」であるとする。この場合、AIを用いた意味類似度判定では、文字列に含まれている数詞の一致/不一致を正確に判定することができないことが多い。財務会計の審査では、数詞の一致/不一致が重要であるが、現状、AIに対し数詞の一致/不一致に関する再学習やチューニングを行うことは困難である。
【0007】
一つの側面では、本発明は、数詞を含む文字列同士の類似度を精度よく判定できることを目的とする。
【課題を解決するための手段】
【0008】
本発明の一側面によれば、第1のデータと第2のデータとを突合させて類似度を判定する類似度判定方法において、前記第1のデータと前記第2のデータを取得し、前記第1のデータと前記第2のデータの文字列からそれぞれ数詞を抽出し、当該数詞の一致度を判定し、前記第1のデータと前記第2のデータの文字列の類似度を判定し、判定した前記数詞の一致度と、前記文字列の類似度とに基づき、前記第1のデータと前記第2のデータとの類似度を決定する、ことを要件とする。
【発明の効果】
【0009】
本発明の一態様によれば、数詞を含む文字列同士の類似度を精度よく判定できるという効果を奏する。
【図面の簡単な説明】
【0010】
図1は、実施の形態にかかる類似度判定方法の概要を示す説明図である。
図2は、類似度判定装置を用いた財務会計の処理の流れを示す説明図である。
図3は、類似度判定装置のハードウェア構成例を示す図である。
図4は、突合の類似度判定に用いる請求書の記載例を示す図である。
図5は、請求書のOCR結果のデータ例を示す図である。
図6は、請求書照合結果リストの出力例を示す図である。
図7は、類似度判定装置が実行する処理例を示すフローチャートである。
【発明を実施するための形態】
(【0011】以降は省略されています)

この特許をJ-PlatPatで参照する

関連特許

個人
情報検索装置
28日前
個人
ノートPC寝台
1か月前
個人
ドットパターン
27日前
個人
環境情報処理装置
1か月前
個人
外食予約システム
1か月前
個人
電子文書の閲覧用電子機器
1か月前
個人
家計支援システム2
9日前
個人
海外在住支援システム
1か月前
コクヨ株式会社
収納ケース
7日前
ニデック株式会社
冷却装置
1か月前
個人
モノ造りプロトコルレイヤー
19日前
個人
サービス提供システム
1か月前
キヤノン電子株式会社
携帯情報端末
29日前
中国電力株式会社
販売支援方法
今日
株式会社ワコム
電子ペン
1か月前
個人
施解錠制御システム
5日前
個人
施術スタッフ育成システム
1か月前
個人
生活困窮者相談業務支援システム
2日前
大和製衡株式会社
組合せ計数装置
1か月前
東洋電装株式会社
操作装置
1か月前
株式会社アジラ
行動推定システム
7日前
東洋電装株式会社
操作装置
1か月前
東洋電装株式会社
操作装置
1か月前
株式会社COLORS
表示制御装置
15日前
株式会社SUBARU
操作制御装置
1か月前
有限会社カツミ工業
管理装置
1か月前
株式会社カロニマ
情報発信システム
1か月前
株式会社ゼロワン
ケア支援システム
29日前
株式会社ゼロワン
ケア支援システム
29日前
ブラザー工業株式会社
印刷制御装置
1か月前
学校法人修道学園
農地集約システム
1か月前
トヨタ自動車株式会社
画像処理装置
6日前
トヨタ自動車株式会社
画像処理装置
1日前
個人
人流データ取得システム
6日前
株式会社SUBARU
画像処理装置
1か月前
トヨタ自動車株式会社
図面表示装置
12日前
続きを見る