TOP
|
特許
|
意匠
|
商標
特許ウォッチ
Twitter
他の特許を見る
公開番号
2025013554
公報種別
公開特許公報(A)
公開日
2025-01-24
出願番号
2024194874,2023005549
出願日
2024-11-07,2023-01-18
発明の名称
情報処理装置、制御方法、プログラム
出願人
キヤノンマーケティングジャパン株式会社
,
キヤノンITソリューションズ株式会社
代理人
個人
,
個人
主分類
G06F
16/31 20190101AFI20250117BHJP(計算;計数)
要約
【課題】本発明では、文書データの検索において検索者にとって望ましい検索結果が得られる仕組みを提供することを目的とする。
【解決手段】本発明は、文書に含まれるセクションを検索する情報処理装置であって、検索条件である複数の文字列に対し、前記複数の文字列を含む文書に含まれる前記複数の文字列の少なくとも1つを含むセクションを出力するよう制御する出力制御手段、を備えることを特徴とする。
【選択図】図1
特許請求の範囲
【請求項1】
文書に含まれるセクションを検索する情報処理装置であって、
検索条件である複数の文字列に対し、前記複数の文字列を含む文書に含まれる前記複数の文字列の少なくとも1つを含むセクションを出力するよう制御する出力制御手段、
を備えることを特徴とする情報処理装置。
続きを表示(約 840 文字)
【請求項2】
検索条件となる文字列と文書とを対応付ける第1索引情報と、検索条件となる文字列とセクションとを対応付ける第2索引情報とを管理する管理手段を備え、
前記出力制御手段は、前記第1索引情報により特定される文書に含まれるセクションのうち、前記第2索引情報により特定されるセクションを出力するよう制御することを特徴とする請求項1に記載の情報処理装置。
【請求項3】
前記出力制御手段は、前記第1索引情報を用いて決定される文書に係る評価値、および、前記第2索引情報を用いて決定されるセクションに係る評価値に基づく順序に従って、前記特定されるセクションを出力するよう制御することを特徴とする請求項2に記載の情報処理装置。
【請求項4】
前記文書は複数のセクションで構成されることを特徴とする請求項1に記載の情報処理装置。
【請求項5】
前記出力制御手段は、前記複数の文字列を含む文書に含まれる前記複数の文字列の少なくとも1つを含むセクションを識別表示すべく出力するよう制御することを特徴とする請求項1に記載の情報処理装置。
【請求項6】
文書に含まれるセクションを検索する情報処理装置の制御方法であって、
出力制御手段が、検索条件である複数の文字列に対し、前記複数の文字列を含む文書に含まれる前記複数の文字列の少なくとも1つを含むセクションを出力するよう制御する表示制御ステップ、
を備えることを特徴とする情報処理装置の制御方法。
【請求項7】
文書に含まれるセクションを検索する情報処理装置において実行可能なプログラムであって、
前記情報処理装置を、
検索条件である複数の文字列に対し、前記複数の文字列を含む文書に含まれる前記複数の文字列の少なくとも1つを含むセクションを出力するよう制御する出力制御手段、
として機能させるためのプログラム。
発明の詳細な説明
【技術分野】
【0001】
文書データを検索する技術に関する。
続きを表示(約 1,400 文字)
【背景技術】
【0002】
文書検索において、一つの文書を複数の文書セクションに分割したうえで文書セクションごとの検索を行う課題が存在する。特に、検索の目的が特定の文書セクションを見つけることである場合に文書セクションごとの検索が行われる。
【0003】
例えば会議を文字起こしした文書を検索するにあたり、一回の会議の文字起こし全体を一文書とみなし、個々の発言の文字起こしを文書セクションとみなすことができる。ここで、発言とは一人の話者による連続した発話であり、話者交代や息継ぎなどの適当なマーカーにより会議全体を複数の発言に分割することができる。一回の会議が雑多な話題を含んでいる場合に、会議全体を検索するよりも発言単位で検索したい場面があり、その際に発言単位での検索が有用である。
【0004】
非特許文献1に示された国会審議映像検索システムは、国会審議における発言の全文検索を行い、検索結果として得られた発言からその発言周辺の審議映像を閲覧することが可能なシステムである。検索は発言単位で行われ、検索結果の一覧においては会議名や発言者が表示される。
【0005】
特許文献1は、Webページのように1文書に多様な話題が含まれる文書を、複数の文章ブロックに分割し、検索クエリを全て含む文章ブロックを検索する方法について示している。さらに、検索結果として出力する文章ブロックの順序を決定する際に、文章ブロックの言語的特徴を用いている。
【0006】
特許文献2は、文書全体の検索インデックスによって文書を検索した後、検索された各文書について、文内部分構造に基づいて検索語を含む文内部分文を抽出して検索結果として表示する方法について示している。文内部分文の抽出処理は検索時の処理として行われ、検索結果として得られた文書を動的に解析している。さらに、特許文献2では文内部分構造を用いて検索語の文脈を簡潔に表示する方法も示している。
【先行技術文献】
【特許文献】
【0007】
特開2010-257155号公報
特開2003-242175号公報
【非特許文献】
【0008】
増山幹高,"国会審議映像検索システムの機能開発状況",GRIPS Discussion Paper 20-11,GRIPS Policy Research Center,2020年12月
【発明の開示】
【発明が解決しようとする課題】
【0009】
特許文献1のように複数の検索キーワードを含む検索クエリが与えられた時に検索キーワードを全て含む文書セクションを検索する方法では、文書内のいくつかの文書セクションを総合的に見れば検索者の意図に合致している文書でも、文書セクション単位では検索キーワードを全て含むものが存在しない場合には検索にヒットしないという課題がある。特に、文書セクションが短い単位で区切られている場合に、ヒットしない事象が発生しやすい。
【0010】
一方で、文書セクション中に検索キーワードのいずれか1個でも含めば検索にヒットする方法では、検索者の意図に合致しない文書セクションがヒットしてしまうという課題もある。
(【0011】以降は省略されています)
この特許をJ-PlatPatで参照する
関連特許
個人
情報提示方法
11日前
個人
自動精算システム
19日前
個人
アカウントマップ
4日前
個人
プログラム
10日前
個人
自動精算システム
1か月前
個人
プログラム
3日前
個人
RFタグ読取装置
28日前
個人
売買システム
25日前
個人
救急搬送システム
2か月前
個人
管理サーバ
1か月前
個人
市場受発注システム
17日前
個人
発想支援方法及びシステム
14日前
日本精機株式会社
車両用表示装置
27日前
日本精機株式会社
車両用表示装置
27日前
個人
分類処理プログラム及び方法
14日前
キヤノン株式会社
印刷装置
1か月前
個人
学習装置及び推論装置
3日前
個人
VRによる人体各部位の立体化
1か月前
個人
生成AIとの常時接続システム
2か月前
富士通株式会社
金融システム
11日前
井関農機株式会社
ロボット作業車両
19日前
個人
コンテンツ開示順位判定システム
1か月前
キヤノン株式会社
情報処理装置
1か月前
トヨタ自動車株式会社
推定装置
1か月前
個人
未来型家系図構築システム
1か月前
株式会社COLORS
表示装置
1か月前
株式会社SEKT
文字認識装置
1か月前
株式会社プレニーズ
仲介システム
4日前
トヨタ自動車株式会社
表認識装置
1か月前
キヤノン電子株式会社
業務管理システム
1か月前
ブラザー工業株式会社
無線通信装置
17日前
トヨタ自動車株式会社
記号識別方法
1か月前
トヨタ自動車株式会社
情報通知方法
17日前
個人
販売支援システム
19日前
トヨタ自動車株式会社
作業評価装置
1か月前
トヨタ自動車株式会社
作業評価装置
26日前
続きを見る
他の特許を見る