TOP特許意匠商標
特許ウォッチ Twitter
10個以上の画像は省略されています。
公開番号2024071158
公報種別公開特許公報(A)
公開日2024-05-24
出願番号2022181962
出願日2022-11-14
発明の名称類似文書検索装置及びプログラム
出願人大日本印刷株式会社
代理人個人,個人,個人
主分類G06F 16/90 20190101AFI20240517BHJP(計算;計数)
要約【課題】新たな手法を用いて一の文書に類似する既存の文書を検索する類似文書検索装置及びプログラムを提供する。
【解決手段】類似文書検索装置1は、複数の既存質問文を記憶したFAQ記憶部22と、新規質問文を受け付ける新規文書受付部12と、新規文書受付部12が受け付けた新規質問文に有する各単語の重みを算出する新規重み算出部13と、記憶部20に有し、FAQ記憶部22に記憶された複数の既存質問文の各々に有する各単語の重みと、新規重み算出部13が算出した新規質問文に有する各単語の重みとを用いて、複数の既存質問文のうち新規質問文に類似する既存質問文を取得する類似文書取得部15と、類似文書取得部15による取得結果を出力する結果出力部16と、を備える。
【選択図】図1
特許請求の範囲【請求項1】
複数の既存文書を記憶した文書記憶部と、
新規文書を受け付ける文書受付手段と、
文書に有する各単語の出現傾向を示す重みを算出する重み算出手段と、
前記重み算出手段を用いて、前記文書受付手段が受け付けた前記新規文書に有する各単語の前記重みを算出する新規重み算出手段と、
記憶部に有し、前記文書記憶部に記憶された複数の前記既存文書の各々に有する各単語の出現傾向を示す重みと、前記新規重み算出手段が算出した前記新規文書に有する各単語の前記重みとを用いて、複数の前記既存文書のうち前記新規文書に類似する前記既存文書を取得する類似文書取得手段と、
前記類似文書取得手段による取得結果を出力する結果出力手段と、
を備える、類似文書検索装置。
続きを表示(約 1,300 文字)【請求項2】
請求項1に記載の類似文書検索装置において、
類義語を記憶した類義語記憶部を備え、
前記重み算出手段は、前記類義語記憶部から各単語の前記類義語を取得し、取得した前記類義語を含む各単語の前記重みを算出する、類似文書検索装置。
【請求項3】
請求項1に記載の類似文書検索装置において、
前記重み算出手段は、前記文書に対して形態素解析をして得られた形態素の前記重みを算出する、類似文書検索装置。
【請求項4】
請求項1に記載の類似文書検索装置において、
前記重み算出手段は、前記文書に有する各単語の出現頻度を用いて各単語の前記重みを算出する、類似文書検索装置。
【請求項5】
請求項1に記載の類似文書検索装置において、
前記重み算出手段を用いて、前記文書記憶部に記憶された複数の前記既存文書の各々に有する各単語の前記重みを算出する既存重み算出手段と、
前記既存重み算出手段が算出した複数の前記既存文書の各々に有する各単語の前記重みを前記記憶部に記憶する記憶手段と、
を備える、類似文書検索装置。
【請求項6】
請求項1から請求項5までのいずれかに記載の類似文書検索装置において、
前記新規重み算出手段が算出した前記新規文書に有する各単語の前記重みと、前記記憶部に有する前記複数の既存文書の各々に有する各単語の前記重みとを用いて、前記新規文書と各既存文書との類似度を算出する類似度算出手段を備え、
前記類似文書取得手段は、前記類似度算出手段が算出した前記類似度が第1規定値以上の前記既存文書を取得する、類似文書検索装置。
【請求項7】
請求項6記載の類似文書検索装置において、
前記類似文書取得手段は、前記類似度算出手段が算出した前記類似度が前記第1規定値以上かつ指定数以内の前記既存文書を取得する、類似文書検索装置。
【請求項8】
請求項6記載の類似文書検索装置において、
前記類似度算出手段が算出した前記新規文書と各既存文書との前記類似度が、いずれも前記第1規定値よりも低い第2規定値以下である場合に、前記新規文書の前記文書記憶部への登録を促すメッセージを出力するメッセージ出力手段を備える、類似文書検索装置。
【請求項9】
請求項6記載の類似文書検索装置において、
前記類似度算出手段が算出した前記新規文書と各既存文書との前記類似度が、いずれも前記第1規定値よりも低い第2規定値以下である場合に、前記新規文書を前記文書記憶部に登録する文書登録手段を備える、類似文書検索装置。
【請求項10】
請求項1から請求項5までのいずれか記載の類似文書検索装置において、
前記既存文書は、回答文に対応した質問文であり、
前記結果出力手段は、前記既存文書と、前記既存文書に対応する回答文とを対応付けて出力する、類似文書検索装置。
(【請求項11】以降は省略されています)

発明の詳細な説明【技術分野】
【0001】
本発明は、類似文書検索装置及びプログラムに関する。
続きを表示(約 3,700 文字)【背景技術】
【0002】
例えば、顧客からの質問に対して回答をする業務においては、マニュアルや、よくある質問を質問回答形式にまとめたFAQ(Frequently Asked Questions)等を用いて、誰が対応しても同じ回答を行えるように、画一的な対応を行うことが求められる。FAQ等に載っている質問に対しては、誰でも同じ回答を行うことができる。しかし、FAQ等に載っている質問であることが探せないと、FAQ等に記載された回答を行うことができない。また、FAQ等に載っていないイレギュラーな質問に対しては、個々に対応する必要がある。
【0003】
そこで、目的の文書を検索するためのものとして、「複数の検索対象文書を記憶する検索対象文書記憶手段と、前記検索対象文書を導き出すキーとなる複数の検索キー文書を記憶する検索キー文書記憶手段と、入力された検索文字列に基づいて前記複数の検索対象文書から所定の文書を検索する検索手段と、前記検索手段により検索された前記所定の文書を出力する出力手段とを有する類似文書検索装置であって、前記検索手段は、入力された検索文字列と前記検索キー文書記憶部に記憶された各検索キー文書との類似度と、入力された検索文字列と前記検索対象文書記憶部に記憶された各検索対象文書との類似度とに基づいて、前記検索キー文書と前記検索対象文書との組合せに対する類似度を算出し、算出された前記検索キー文書と前記検索対象文書の組合せに対する類似度に基づいて、所定の検索キー文書と所定の検索対象文書との組合せを検索し、前記出力手段は、検索された前記所定の検索対象文書を出力することを特徴とする類似文書検索装置。」が開示されている(例えば、特許文献1参照)。
【先行技術文献】
【特許文献】
【0004】
特開2020-119171号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
特許文献1に記載の手法では、検索文字列と質問文書との類似度と、検索文字列と回答文書との類似度とを用いて、質問文書と回答文書との組み合わせに対する類似度を算出した上で、当該組み合わせの類似度に基づいて回答文書を出力している。特許文献1では、検索文字列として質問文書を入力した場合に回答文書を出力させる。これは、質問文書と回答文書とでは、文書の種類が異なることを特許文献1の出願人が考慮した手法である。
一方で、質問文書が類似していれば、回答文書は同じようなものになると考えられる。つまり、質問文書と回答文書との文書の種類の違いを考慮せずとも、質問文書の類似を算出して用いればよいという考え方もある。その場合、質問文書同士の類似を算出する手法の工夫が求められる。
【0006】
そこで、本発明は、新たな手法を用いて一の文書に類似する既存の文書を検索する類似文書検索装置及びプログラムを提供することを目的とする。
【課題を解決するための手段】
【0007】
本発明は、以下のような解決手段により、前記課題を解決する。
第1の発明は、複数の既存文書を記憶した文書記憶部と、新規文書を受け付ける文書受付手段と、文書に有する各単語の出現傾向を示す重みを算出する重み算出手段と、前記重み算出手段を用いて、前記文書受付手段が受け付けた前記新規文書に有する各単語の前記重みを算出する新規重み算出手段と、記憶部に有し、前記文書記憶部に記憶された複数の前記既存文書の各々に有する各単語の出現傾向を示す重みと、前記新規重み算出手段が算出した前記新規文書に有する各単語の前記重みとを用いて、複数の前記既存文書のうち前記新規文書に類似する前記既存文書を取得する類似文書取得手段と、前記類似文書取得手段による取得結果を出力する結果出力手段と、を備える、類似文書検索装置である。
第2の発明は、第1の発明の類似文書検索装置において、類義語を記憶した類義語記憶部を備え、前記重み算出手段は、前記類義語記憶部から各単語の前記類義語を取得し、取得した前記類義語を含む各単語の前記重みを算出する、類似文書検索装置である。
第3の発明は、第1の発明又は第2の発明の類似文書検索装置において、前記重み算出手段は、前記文書に対して形態素解析をして得られた形態素の前記重みを算出する、類似文書検索装置である。
第4の発明は、第1の発明から第3の発明までのいずれかの類似文書検索装置において、前記重み算出手段は、前記文書に有する各単語の出現頻度を用いて各単語の前記重みを算出する、類似文書検索装置である。
第5の発明は、第1の発明から第4の発明までのいずれかの類似文書検索装置において、前記重み算出手段を用いて、前記文書記憶部に記憶された複数の前記既存文書の各々に有する各単語の前記重みを算出する既存重み算出手段と、前記既存重み算出手段が算出した複数の前記既存文書の各々に有する各単語の前記重みを前記記憶部に記憶する記憶手段と、を備える、類似文書検索装置である。
第6の発明は、第1の発明から第5の発明までのいずれかの類似文書検索装置において、前記新規重み算出手段が算出した前記新規文書に有する各単語の前記重みと、前記記憶部に有する前記複数の既存文書の各々に有する各単語の前記重みとを用いて、前記新規文書と各既存文書との類似度を算出する類似度算出手段を備え、前記類似文書取得手段は、前記類似度算出手段が算出した前記類似度が第1規定値以上の前記既存文書を取得する、類似文書検索装置である。
第7の発明は、第6の発明の類似文書検索装置において、前記類似文書取得手段は、前記類似度算出手段が算出した前記類似度が前記第1規定値以上かつ指定数以内の前記既存文書を取得する、類似文書検索装置である。
第8の発明は、第6の発明又は第7の発明の類似文書検索装置において、前記類似度算出手段が算出した前記新規文書と各既存文書との前記類似度が、いずれも前記第1規定値よりも低い第2規定値以下である場合に、前記新規文書の前記文書記憶部への登録を促すメッセージを出力するメッセージ出力手段を備える、類似文書検索装置である。
第9の発明は、第6の発明又は第7の発明の類似文書検索装置において、前記類似度算出手段が算出した前記新規文書と各既存文書との前記類似度が、いずれも前記第1規定値よりも低い第2規定値以下である場合に、前記新規文書を前記文書記憶部に登録する文書登録手段を備える、類似文書検索装置である。
第10の発明は、第1の発明から第9の発明までのいずれかの類似文書検索装置において、前記既存文書は、回答文に対応した質問文であり、前記結果出力手段は、前記既存文書と、前記既存文書に対応する回答文とを対応付けて出力する、類似文書検索装置である。
第11の発明は、第1の発明から第10の発明までのいずれかの類似文書検索装置としてコンピュータを機能させるためのプログラムである。
【発明の効果】
【0008】
本発明によれば、新たな手法を用いて一の文書に類似する既存の文書を検索する類似文書検索装置及びプログラムを提供することができる。
【図面の簡単な説明】
【0009】
本実施形態に係る類似文書検索システムの全体構成図及び類似文書検索装置の機能ブロック図である。
本実施形態に係る類似文書検索装置の記憶部に記憶された各記憶部の例を示す図である。
本実施形態に係る類似文書検索装置の既存質問文の重み算出処理を示すフローチャートである。
本実施形態に係る既存質問文の重み算出処理を説明するための図である。
本実施形態に係る文書に有する各単語の重みの算出に係る説明のための図である。
本実施形態に係る類似文書検索装置の類似文書検索処理を示すフローチャートである。
本実施形態に係る類似文書検索処理を説明するための図である。
本実施形態に係る文書の類似度の算出に係る説明のための図である。
本実施形態に係る端末での画面例を示す図である。
【発明を実施するための形態】
【0010】
以下、本発明を実施するための形態について、図を参照しながら説明する。なお、これは、あくまでも一例であって、本発明の技術的範囲はこれに限られるものではない。
(実施形態)
図1は、本実施形態に係る類似文書検索システム100の全体構成図及び類似文書検索装置1の機能ブロック図である。
図2は、本実施形態に係る類似文書検索装置1の記憶部20に記憶された各記憶部の例を示す図である。
(【0011】以降は省略されています)

この特許をJ-PlatPatで参照する

関連特許

大日本印刷株式会社
薬剤分配方法および薬剤分配機
3日前
大日本印刷株式会社
真贋判定装置、およびプログラム
3日前
大日本印刷株式会社
真贋判定装置、およびプログラム
3日前
大日本印刷株式会社
発泡性接着シートおよび物品の製造方法
3日前
大日本印刷株式会社
キャリアフィルム付き銅箔、銅箔、銅張積層板およびプリント配線基板
6日前
大日本印刷株式会社
蓄電デバイス、及び、蓄電デバイスの製造方法
5日前
大日本印刷株式会社
チューブ容器およびキャップ付きチューブ容器
5日前
大日本印刷株式会社
液体収容容器、液体入り容器、所定量の薬液を製造する方法、組合体、組合体の製造方法、及び液体入り容器の製造方法
5日前
大日本印刷株式会社
液体収容容器、液体入り容器、所定量の薬液を製造する方法、組合体、組合体の製造方法、及び液体入り容器の製造方法
5日前
個人
乗降調査装置
2か月前
個人
暗号化記憶媒体
24日前
個人
プロジェクター
1か月前
個人
管理装置
1か月前
日本精機株式会社
投影装置
2か月前
個人
求人支援システム
13日前
日本精機株式会社
投影システム
2か月前
キヤノン電子株式会社
周辺機器
1か月前
個人
求人マッチングサーバ
1か月前
カゴメ株式会社
営農支援プログラム
1か月前
17LIVE株式会社
サーバ
2か月前
カゴメ株式会社
営農支援プログラム
1か月前
カゴメ株式会社
営農支援プログラム
1か月前
カゴメ株式会社
営農支援プログラム
1か月前
株式会社ワコム
電子ペン
27日前
シャープ株式会社
情報出力装置
11日前
株式会社ゼロボード
価格決定システム
2か月前
アスエネ株式会社
水管理の方法
1か月前
株式会社ワコム
電子ペン
25日前
トヨタ自動車株式会社
検査装置
1か月前
株式会社寺岡精工
システム
27日前
株式会社アジラ
姿勢推定システム
1か月前
株式会社NGA
画像投稿システム
1か月前
CKD株式会社
遠隔支援システム
1か月前
大日本印刷株式会社
作業台
1か月前
株式会社カロニマ
情報発信システム
3日前
日本信号株式会社
料金精算システム
9日前
続きを見る