TOP特許意匠商標
特許ウォッチ Twitter
10個以上の画像は省略されています。
公開番号2025079075
公報種別公開特許公報(A)
公開日2025-05-21
出願番号2023191502
出願日2023-11-09
発明の名称検索式作成装置および検索式作成方法
出願人株式会社日立製作所
代理人ポレール弁理士法人
主分類G06F 16/33 20250101AFI20250514BHJP(計算;計数)
要約【課題】
入力テキストに対して、類似する文書を全文検索可能な検索式の作成を容易にすることを目的とする。
【解決手段】
入力テキスト1000に基づいて文書を検索するための検索式の作成を支援する検索式作成装置100において、前記入力テキストから抽出したキーワードを用いて検索式を作成する検索式作成部111と、前記検索式を用いて文書を検索して第1の文書集合を作成する検索実行部112と、前記第1の文書集合に対する評価結果に応じて、検索式を修正して検索式修正候補を作成する検索式修正候補作成部114と、前記第1の文書集合と、前記検索式修正候補を用いて作成される第2の文書集合の差分を示す差分集合であって、当該検索式作成装置のユーザに提示された差分集合に対する確認結果であるフィードバックを受け付け、当該確認結果に応じて、前記検索式修正候補から修正検索式を特定するフィードバック部115を有する。
【選択図】 図1
特許請求の範囲【請求項1】
入力テキストに基づいて文書を検索するための検索式の作成を支援する検索式作成装置において、
前記入力テキストから抽出したキーワードを用いて検索式を作成する検索式作成部と、
前記検索式を用いて文書を検索して第1の文書集合を作成する検索実行部と、
前記第1の文書集合に対する評価結果に応じて、検索式を修正して検索式修正候補を作成する検索式修正候補作成部と、
前記第1の文書集合と、前記検索式修正候補を用いて作成される第2の文書集合の差分を示す差分集合であって、当該検索式作成装置のユーザに提示された差分集合に対する確認結果であるフィードバックを受け付け、当該確認結果に応じて、前記検索式修正候補から修正検索式を特定するフィードバック部を有する検索式作成装置。
続きを表示(約 1,100 文字)【請求項2】
請求項1に記載の検索式作成装置において、
前記検索式、検索論理和ごとの前記第1の文書集合、前記検索式修正候補および検索論理和ごとの前記第2の文書集合を含む検索情報を作成する検索情報可視化部113をさらに有する検索式作成装置。
【請求項3】
請求項2に記載の検索式作成装置において、
前記検索式修正候補作成部は、前記差分集合に対するユーザからの前記フィードバックに応じて、前記評価結果を算出する検索式作成装置。
【請求項4】
請求項1に記載の検索式作成装置において、
前記検索実行部は、ベクトル検索を実行して、前記第1の文書集合、前記第2の文書集合および前記差分集合を作成し、
前記検索式修正候補作成部は、前記差分集合に含まれる前記入力テキストに対する類似度に応じて、前記評価結果を算出する検索式作成装置。
【請求項5】
入力テキストに基づいて文書を検索するための検索式の作成を支援する検索式作成装置による検索式作成方法において、
検索式作成部により、前記入力テキストから抽出したキーワードを用いて検索式を作成し、
検索実行部により、前記検索式を用いて文書を検索して第1の文書集合を作成し、
検索式修正候補作成部により、前記第1の文書集合に対する評価結果に応じて、検索式を修正して検索式修正候補を作成し、
フィードバック部により、前記第1の文書集合と、前記検索式修正候補を用いて作成される第2の文書集合の差分を示す差分集合であって、当該検索式作成装置のユーザに提示された差分集合に対する確認結果であるフィードバックを受け付け、当該確認結果に応じて、前記検索式修正候補から修正検索式を特定する検索式作成方法。
【請求項6】
請求項5に記載の検索式作成方法において、
検索情報可視化部により、前記検索式、検索論理和ごとの前記第1の文書集合、前記検索式修正候補および検索論理和ごとの前記第2の文書集合を含む検索情報を作成する検索式作成方法。
【請求項7】
請求項6に記載の検索式作成方法において、
前記検索式修正候補作成部により、前記差分集合に対するユーザからの前記フィードバックに応じて、前記評価結果を算出する検索式作成方法。
【請求項8】
請求項5に記載の検索式作成方法において、
前記検索実行部により、ベクトル検索を実行して、前記第1の文書集合、前記第2の文書集合および前記差分集合を作成し、
前記検索式修正候補作成部により、前記差分集合に含まれる前記入力テキストに対する類似度に応じて、前記評価結果を算出する検索式作成方法。

発明の詳細な説明【技術分野】
【0001】
本発明は、文書の検索を支援するための技術に関する。
続きを表示(約 1,900 文字)【背景技術】
【0002】
現在、文書データベースを検索する方法は複数存在する。1つはキーワードを入力してそのキーワードマッチングよりテキストを検索する方法であり、他にはテキストを入力してベクトルを作成し、文書データベース内の文書をベクトル化したものとの類似度に基づいて検索を行う方法がある。
【0003】
前者の方法は一般的にキーワード検索や全文検索と呼ばれ、広く用いられている。特に、特許検索においては、キーワードの論理式(検索論理式)を用いて全文検索する方法が一般的である。キーワード検索を採用している検索システムは、一般的にユーザの入力キーワードに対して同義語は考慮することがないため、例えば検索キーワードとして「窓」を入力して検索したとしても、同義語である「ウィンドウ」を「窓」と同義で用いている文書は検索されない。
【0004】
後者の手法は一般的にベクトル検索と呼ばれ、そのベクトル化手法にはTF-IDF、BM-25、BERT等が存在する。この検索方法では入力キーワードや入力テキストと、検索対象の文書内のキーワードが必ずしも一致している必要はなく、入力テキストと検索対象文書の類似度を測定し、類似度順に表示する形式となっている。このため、ベクトル検索はキーワード検索と比較して検索精度が高い傾向にある。
【0005】
しかしながら、上記のようなベクトルを用いた検索方式では、入力されたテキストに対してなぜその文書が検索されたのかというエビデンスを得ることが難しいため、検索式を用いて全文検索を行うことへの需要は依然として高い。一方で、ユーザが入力テキストから検索式を作成することは、キーワードの選定や同義語の考慮漏れを生じやすく、試行錯誤的な検索を行う必要があり、難易度が高い。以上のような検索に関しては、特許文献1が提案されている。特許文献1では、入力テキストを構成単位に分解し、検索クエリとして構成単位に含まれるキーワードに基づく構成単位ごとの検索式を作成する技術を開示している。
【先行技術文献】
【特許文献】
【0006】
国際公開第2021/245814号
【発明の概要】
【発明が解決しようとする課題】
【0007】
特許文献1では、入力テキストから生成された検索式に対してユーザがキーワードを追加したり、検索範囲を変更したりといった編集を行うことが可能である。このように、文書検索においては、検索式を変更しながら試行錯誤的に、また、繰り返し実行されることが多い。試行錯誤的に検索を実行する場合、当初の検索式は粗削りであることが多く、精錬させより適切な検索式に変更する必要がある。
【0008】
しかしながら、検索式を変更した場合、必ずしもユーザが意図した文書集合が検索されるように変更されるとは限らない。例えば、経験の少ないユーザの場合、検索式を変更した結果、意図した文書が検索結果である文書集合から外れることがある。このため、検索式を変更する場合、より適切なもの、つまり、所望の文書が含まれる可能性がより高い文書集合を検索できるよう変更することが望まれる。しかしながら、特許文献1ではこの点について考慮されていなかった。
【0009】
なお、このように検索式をより適切なものに変更する場合、例えば、その前後での検索結果(文書集合)がどのように変化したか、つまり、意図した文書集合に近づいているかを確認することでも実現できる。しかしながら、特許文献1では、生成検索式はその入力テキストで表示されるのみであり、どのような文書集合が検索されるのかは把握できない。このため、その検索式の妥当性の判断がつかないまま、検索された文書一覧を確認することとなり、検索式を修正することのユーザ負担は大きい。そこで、本発明では、文書検索において、より適切な検索式の作成を支援することを目的とする。
【課題を解決するための手段】
【0010】
本発明では、入力テキストから作成した検索式での第1の文書集合に対する評価結果に応じて、検索式を修正ないし変更した検索式修正候補を作成し、第1の文書集合と、検索式修正候補での第2の文書集合の差分を示す差分集合を提示し、提示された差分集合に対する確認結果(フィードバック)に応じて、検索式修正候補から修正検索式を特定する。なお、本発明での「差分」とは、その相違が示されるものであればよく、変化など、他の表現も含まれる。
(【0011】以降は省略されています)

この特許をJ-PlatPatで参照する

関連特許

株式会社日立製作所
軌条車両
5日前
株式会社日立製作所
軌条車両
5日前
株式会社日立製作所
電力変換器
3日前
株式会社日立製作所
情報処理装置
6日前
株式会社日立製作所
電力変換装置
9日前
株式会社日立製作所
設計支援装置
24日前
株式会社日立製作所
情報処理装置
10日前
株式会社日立製作所
電力変換装置
9日前
株式会社日立製作所
撮像システム
13日前
株式会社日立製作所
荷電粒子線装置
19日前
株式会社日立製作所
鉄道車両用台車
25日前
株式会社日立製作所
電力調整システム
18日前
株式会社日立製作所
融通取引提案システム
16日前
株式会社日立製作所
埋設物判別装置及び方法
10日前
株式会社日立製作所
塗装装置、及び塗装方法
13日前
株式会社日立製作所
電池診断装置、電池診断方法
18日前
株式会社日立製作所
水処理システム、及び水処理方法
6日前
株式会社日立製作所
匿名化システムおよび匿名化方法
16日前
株式会社日立製作所
ネットワーク可視化装置及び方法
17日前
株式会社日立製作所
設計支援装置および設計支援方法
12日前
株式会社日立製作所
部材管理装置、及び部材管理方法
18日前
株式会社日立製作所
窒化処理部品およびその製造方法
5日前
株式会社日立製作所
開発支援システム及び開発支援方法
12日前
株式会社日立製作所
通信中継システム及び通信中継装置
10日前
株式会社日立製作所
計画分析方法及び計画分析システム
10日前
株式会社日立製作所
電力授受システム及び電力授受方法
23日前
株式会社日立製作所
情報処理システム及び指標算出方法
4日前
株式会社日立製作所
情報処理システム及び情報処理方法
19日前
株式会社日立製作所
物体検出方法及び物体検出システム
19日前
株式会社日立製作所
分析システムおよび分析プログラム
3日前
株式会社日立製作所
運行管理システムおよび運行管理方法
6日前
株式会社日立製作所
データ出力装置およびデータ出力方法
13日前
株式会社日立製作所
EMC対策システム及びEMC対策方法
5日前
株式会社日立製作所
故障予兆診断装置及び故障予兆診断方法
4日前
株式会社日立製作所
ロボット制御装置及びロボット制御方法
20日前
株式会社日立製作所
移動体管制装置、車両管制方法、及び車両
16日前
続きを見る