TOP特許意匠商標
特許ウォッチ Twitter
10個以上の画像は省略されています。
公開番号2025000431
公報種別公開特許公報(A)
公開日2025-01-07
出願番号2023100282
出願日2023-06-19
発明の名称文書検索プログラム、文書検索装置および文書検索方法
出願人株式会社東芝
代理人弁理士法人鈴榮特許綜合事務所
主分類G06F 16/83 20190101AFI20241224BHJP(計算;計数)
要約【課題】検索キーワードを用いた文書検索において、適切な検索キーワードの候補を提示できる文書検索装置、文書検索方法および文書検索プログラムを提供することである。
【解決手段】
実施形態の文書検索プログラムは、文書検索機能と、ワードグループ生成機能と、ワードグループ選択機能を、コンピュータに実現させる。文書検索機能は、複数の文書が格納された文書データベースの中から、ユーザが入力した検索テキストに関連する文書を検索する。ワードグループ生成機能は、文書構造に関する情報または単語の意味に基づく分類情報を用いて、前記検索された文書から抽出したサジェストワードを分類した複数のワードグループを生成する。ワードグループ選択機能は、前記複数のワードグループの中から、ユーザに提示するワードグループを選択する。
【選択図】 図2


特許請求の範囲【請求項1】
コンピュータに、
複数の文書が格納された文書データベースの中から、ユーザが入力した検索テキストに含まれる単語を含む文書を検索する文書検索機能と、
前記検索された文書のそれぞれを、文書構造に関する情報に基づいて複数の文書ブロックに分割するブロック分割機能と、
文書の絞り込みに用いるサジェストワードを前記文書ブロックごとに抽出し、前記サジェストワードにより構成されるワードグループを前記文書ブロックごとに生成するワードグループ生成機能と、
前記サジェストワードの文書絞り込み性能を示すスコアに基づいて、ユーザに提示するワードグループを選択するワードグループ選択機能と、
を実現させるための文書検索プログラム。
続きを表示(約 1,300 文字)【請求項2】
コンピュータに、
複数の文書が格納された文書データベースの中から、ユーザが入力した検索テキストに含まれる単語を含む文書を検索する文書検索機能と、
前記検索された文書から文書の絞り込みに用いるサジェストワードを抽出するサジェストワード抽出機能と、
単語の意味に基づく分類情報を用いて前記抽出された複数のサジェストワードを分類した複数のワードグループを生成するワードグループ生成機能と、
前記サジェストワードの文書絞り込み性能を示すスコアに基づいて、ユーザに提示するワードグループを選択するワードグループ選択機能と、
を実現させるための文書検索プログラム。
【請求項3】
前記文書構造に関する情報は、HTMLタグ、文章の順番、または文章の段落番号を含む、
請求項1に記載の文書検索プログラム。
【請求項4】
前記分類情報は、単語の意味、単語の上下関係、単語の階層関係、単語の概念階層の上下関係、または単語の包含関係に基づく上下関係を含む、
請求項2に記載の文書検索プログラム。
【請求項5】
前記ワードグループ選択機能は、前記ワードグループのそれぞれについて、前記スコアの合計値、平均値、最大値または中央値を算出し、算出結果に基づいて前記ユーザに提示するワードグループを選択する、
請求項1または2に記載の文書検索プログラム。
【請求項6】
前記ワードグループ選択機能は、前記ユーザに提示するワードグループとして、1つのワードグループを選択する、
請求項1または2に記載の文書検索プログラム。
【請求項7】
前記ワードグループ選択機能は、前記ユーザに提示するワードグループとして、複数のワードグループを選択する、
請求項1または2に記載の文書検索プログラム。
【請求項8】
選択されたワードグループに属するサジェストワードをユーザへ提示するサジェストワード提示機能をさらに実現させるための、
請求項1または2に記載の文書検索プログラム。
【請求項9】
前記サジェストワード提示機能は、前記選択されたワードグループに属するサジェストワードに加えて、当該サジェストワードが属するワードグループを示す情報をユーザへ提示する、
請求項8に記載の文書検索プログラム。
【請求項10】
コンピュータに、
複数の文書が格納された文書データベースの中から、ユーザが入力した検索テキストに関連する文書を検索する文書検索機能と、
文書構造に関する情報または単語の意味に基づく分類情報を用いて、前記検索された文書から抽出したサジェストワードを分類した複数のワードグループを生成するワードグループ生成機能と、
前記複数のワードグループの中から、ユーザに提示するワードグループを選択するワードグループ選択機能と、
を実現させるための文書検索プログラム。
(【請求項11】以降は省略されています)

発明の詳細な説明【技術分野】
【0001】
本発明の実施形態は、文書検索プログラム、文書検索装置および文書検索方法に関する。
続きを表示(約 2,200 文字)【背景技術】
【0002】
文書検索システムは、検索キーワードや質問文などの検索テキストをユーザからの問い合わせとして受け付け、文書DB(文書データベース)を参照して文書を出力するシステムである。文書検索システムは、インターネット上で提供され、ユーザによって入力された検索キーワードや質問文に基づいて、文書DBに保管されている文書の中から関連する文書を検索して出力する。
【0003】
従来の文書検索システムは、インターネット上で公開されている文書を自動的に取集し、文書毎に、文書中に出現する単語と、各単語の文書中での出現確率を記憶している。そして、ユーザから問い合わせを受け付けた場合に、記憶した文書集合の中から、受け付けた入力文に含まれる単語の出現確率が高い順に文書を抽出し、抽出した文書や、抽出した文書中において当該単語が含まれる文や段落を出力している。また、入力文として受け付けた自然文を形態素解析し、入力文に含まれるキーワードを識別して検索要求を自動的に作成する手法も知られている。
【0004】
しかし、上記のような文書検索システムでは、ユーザは、知りたい情報が書かれている文書を検索するための適切なキーワードや文章を自分で考える必要がある。このため、検索結果の文書中から抽出した単語を検索キーワードの候補として推薦することで、ユーザのキーワード入力を支援する方法がある。このような方法では、ユーザが知りたい情報が含まれると考えられるキーワードを推薦することで、ユーザは、知りたい情報が書かれている文書を検索するための適切なキーワードや文章を自分で考える必要がなくなるため、知りたい情報に効率的に到達することができる。このような検索キーワードの候補は、サジェストワードとも呼ばれる。
【0005】
このような検索キーワードの候補は、文書中の全ての文章から選出される。また、文書には、表題、章、段落など様々な文書構成要素が含まれる。このため、検索キーワードとして、文書中の様々な文書構成要素から選出された雑多なキーワードが推薦される。この場合、ユーザが検索キーワード同士を比較するのが難しくなり、知りたい情報が書かれている文書に到達できるキーワードを選択することが困難となる。
【先行技術文献】
【特許文献】
【0006】
特開2020-123131号公報
【発明の概要】
【発明が解決しようとする課題】
【0007】
本発明が解決しようとする課題は、検索キーワードを用いた文書検索において、適切な検索キーワードの候補を提示できる文書検索装置、文書検索方法および文書検索プログラムを提供することである。
【課題を解決するための手段】
【0008】
このような課題を解決するため、実施形態の文書検索プログラムは、文書検索機能と、ワードグループ生成機能と、ワードグループ選択機能を、コンピュータに実現させる。文書検索機能は、複数の文書が格納された文書データベースの中から、ユーザが入力した検索テキストに関連する文書を検索する。ワードグループ生成機能は、文書構造に関する情報または単語の意味に基づく分類情報を用いて、前記検索された文書から抽出したサジェストワードを分類した複数のワードグループを生成する。ワードグループ選択機能は、前記複数のワードグループの中から、ユーザに提示するワードグループを選択する。
【図面の簡単な説明】
【0009】
第1の実施形態に係る文書検索システムの構成の一例を示す図。
第1の実施形態に係る文書検索装置の構成の一例を示す図。
第1の実施形態に係る文書検索処理の処理手順を例示するフローチャート。
第1の実施形態に係る文書検索処理におけるデータの流れの一例を示す図。
第1の実施形態で検索対象として用いる文書の一例を示す図。
図3のステップS303の一例を説明するための図。
図3のステップS304の一例を説明するための図。
第1の実施形態の変形例に係るサジェストワードの提示方法を説明するための図。
第2の実施形態に係る文書検索装置の構成の一例を示す図。
第2の実施形態に係る文書検索処理の処理手順を例示するフローチャート。
第2の実施形態に係る文書検索処理におけるデータの流れの一例を示す図。
図10のステップS1002の一例を説明するための図。
図10のステップS1003、S1004の一例を説明するための図。
図10のステップS1003で用いるシソーラス情報の一例を説明するための図。
図10のステップS1003で用いるシソーラス情報の変形例を説明するための図。
第3の実施形態に係る文書検索装置の構成の一例を示す図。
第3の実施形態に係る文書検索処理におけるデータの流れの一例を示す図。
【発明を実施するための形態】
【0010】
以下、図面を参照しながら、文書検索プログラム、文書検索装置および文書検索方法の実施形態について詳細に説明する。以下の説明において、略同一の機能及び構成を有する構成要素については、同一符号を付し、重複説明は必要な場合にのみ行う。
(【0011】以降は省略されています)

この特許をJ-PlatPatで参照する
Flag Counter

関連特許

株式会社東芝
22日前
株式会社東芝
半導体装置
5日前
株式会社東芝
半導体装置
5日前
株式会社東芝
半導体装置
5日前
株式会社東芝
半導体装置
5日前
株式会社東芝
半導体装置
5日前
株式会社東芝
半導体装置
5日前
株式会社東芝
半導体装置
5日前
株式会社東芝
半導体装置
5日前
株式会社東芝
半導体装置
5日前
株式会社東芝
半導体装置
5日前
株式会社東芝
半導体装置
5日前
株式会社東芝
半導体装置
12日前
株式会社東芝
電力変換装置
21日前
株式会社東芝
空調制御装置
5日前
株式会社東芝
ディスク装置
12日前
株式会社東芝
対策提示装置
1か月前
株式会社東芝
原子炉用制御棒
5日前
株式会社東芝
投込式水位伝送器
22日前
株式会社東芝
組電池及び電池盤
5日前
株式会社東芝
半導体モジュール
9日前
株式会社東芝
一括保護システム
5日前
株式会社東芝
粒子線照射システム
9日前
株式会社東芝
植物栽培装置及び方法
9日前
株式会社東芝
変換回路及び通信装置
9日前
株式会社東芝
接続確認制御システム
20日前
株式会社東芝
リモートステーション装置
12日前
株式会社東芝
診断システム及び診断方法
12日前
株式会社東芝
半導体装置及びその製造方法
5日前
株式会社東芝
プラズマ源及びスイッチ装置
9日前
株式会社東芝
発電システムおよび発電方法
13日前
株式会社東芝
情報処理装置及び通信システム
22日前
株式会社東芝
紙葉類処理装置および補正方法
13日前
株式会社東芝
電力変換装置および送電システム
22日前
株式会社東芝
レーダ装置、および信号処理方法
9日前
株式会社東芝
交通管制装置および交通管制方法
13日前
続きを見る