TOP特許意匠商標
特許ウォッチ Twitter
10個以上の画像は省略されています。
公開番号2025173845
公報種別公開特許公報(A)
公開日2025-11-28
出願番号2024079648
出願日2024-05-15
発明の名称コンピュータプログラム、情報処理装置及び情報処理方法
出願人株式会社内田洋行
代理人個人,個人
主分類G06F 16/908 20190101AFI20251120BHJP(計算;計数)
要約【課題】ドキュメントデータの検索に係るコンピュータプログラム、情報処理装置及び情報処理方法を提供する。
【解決手段】コンピュータプログラムは、コンピュータに、ストレージに記憶されている写真、図、表、グラフ又はテキストを含む複数のドキュメントデータそれぞれについて、前記ドキュメントデータの特徴量を取得し、前記ドキュメントデータを識別する識別データに対応付けて、前記特徴量を記憶部に記憶しておき、前記ストレージに対する問い合わせを受け付け、受け付けた前記問い合わせと、前記特徴量に基づき抽出されるドキュメントデータとを言語モデルに与えることによって前記問い合わせに対する回答を出力する処理を実行させる。
【選択図】図1
特許請求の範囲【請求項1】
コンピュータに、
ストレージに記憶されている写真、図、表、グラフ又はテキストを含む複数のドキュメントデータそれぞれについて、前記ドキュメントデータの特徴量を取得し、
前記ドキュメントデータを識別する識別データに対応付けて、前記特徴量を記憶部に記憶しておき、
前記ストレージに対する問い合わせを受け付け、
受け付けた前記問い合わせと、前記特徴量に基づき抽出されるドキュメントデータとを言語モデルに与えることによって前記問い合わせに対する回答を出力する
処理を実行させるコンピュータプログラム。
続きを表示(約 1,900 文字)【請求項2】
前記コンピュータに、
前記ドキュメントデータに含まれる複数の部分をそれぞれ画像へ変換し、
変換された画像の内容を説明する説明テキストを、言語モデルを用いて取得し、
前記説明テキスト及び/又は前記説明テキストのベクトルデータを前記特徴量として前記記憶部に記憶しておく
処理を実行させる請求項1に記載のコンピュータプログラム。
【請求項3】
前記コンピュータに、
前記ドキュメントデータを構成するページ単位で画像へ変換し、
各ページの説明テキストを、前記言語モデルに前記画像を与えることによって前記言語モデルから取得し、
前記説明テキストのベクトルデータを前記特徴量として前記記憶部に記憶しておく
処理を実行させる請求項2に記載のコンピュータプログラム。
【請求項4】
前記コンピュータに、
受け付けた前記問い合わせの特徴量と類似する特徴量が対応付けられたドキュメントデータを抽出し、
受け付けた前記問い合わせと、抽出した前記ドキュメントデータとを前記言語モデルに与える
処理を実行させる請求項1から3のいずれか1項に記載のコンピュータプログラム。
【請求項5】
前記コンピュータに、
取得したドキュメントデータに含まれる複数の部分についてそれぞれ特徴量を取得し、
前記ドキュメントデータ及び前記複数の部分を識別する識別データに対応付けて、各部分の特徴量を前記記憶部に記憶しておき、
受け付けた前記問い合わせの特徴量と類似する特徴量が対応付けられたドキュメントデータ又はドキュメントデータの部分を抽出し、
受け付けた前記問い合わせと、抽出された前記ドキュメントデータ又はドキュメントデータの部分とを前記言語モデルに与えることによって前記回答を出力する
処理を実行させる請求項1から3のいずれか1項に記載のコンピュータプログラム。
【請求項6】
前記コンピュータに、
前記ドキュメントデータ及び前記ドキュメントデータに含まれる複数の部分それぞれの特徴量を、前記ドキュメントデータ及び前記複数の部分を識別する識別データに対応付けて格納するテーブルを記憶しておく処理を実行させ、
前記テーブルは、前記ドキュメントデータの前記ストレージ内の場所を示す情報、前記複数の部分の前記ドキュメントデータとの親子関係を示す情報、前記複数の部分の前記ドキュメントデータ内の位置を示す情報を、前記特徴量と共に格納する
請求項1から3のいずれか1項に記載のコンピュータプログラム。
【請求項7】
前記複数のドキュメントデータは、前記ストレージ内の記憶領域又は前記ドキュメントデータの種類に応じて複数のグループに分類されており、
前記コンピュータに、
前記問い合わせを受け付ける際にグループの指定を受け付け、
指定されたグループ内で前記ドキュメントデータを抽出する
処理を実行させる請求項1から3のいずれか1項に記載のコンピュータプログラム。
【請求項8】
前記コンピュータに、
受け付けた前記問い合わせと、前記特徴量に基づき抽出されるドキュメントデータとに加え、前記問い合わせに関する分野の指定と、前記問い合わせへの回答を指示するテキストとを言語モデルに与えることによって前記問い合わせに対する回答を出力する
処理を実行させる請求項1から3のいずれか1項に記載のコンピュータプログラム。
【請求項9】
前記コンピュータに、
前記回答に加え、抽出されたドキュメントデータ又は前記ドキュメントデータの部分のサムネイル画像と、前記ドキュメントデータ又は前記部分に関連するテキストとを含む画面情報を出力する
処理を実行させる請求項1から3のいずれか1項に記載のコンピュータプログラム。
【請求項10】
ストレージに記憶されている写真、図、表、グラフ又はテキストを含む複数のドキュメントデータそれぞれについて、前記ドキュメントデータの特徴量を取得し、
前記ドキュメントデータを識別する識別データに対応付けて、前記特徴量を記憶部に記憶しておき、
前記ストレージに対する問い合わせを受け付け、
受け付けた前記問い合わせと、前記特徴量に基づき抽出されるドキュメントデータとを言語モデルに与えることによって前記問い合わせに対する回答を出力する
処理を実行する処理部を備える情報処理装置。
(【請求項11】以降は省略されています)

発明の詳細な説明【技術分野】
【0001】
本発明は、ドキュメントデータの検索に係るコンピュータプログラム、情報処理装置及び情報処理方法に関する。
続きを表示(約 1,900 文字)【背景技術】
【0002】
企業や団体などの組織では日々、種々のドキュメントデータを作成し、保存している。これらのドキュメントデータは、組織内の機密情報を除けば、組織内の共有知的財産であり、有効に活用することによって、引継ぎの効率化や、組織内の前提知識やノウハウなどの暗黙知をベースとした業務の効率化に繋げることが可能である。
【0003】
ドキュメントデータが膨大となると、必要なデータを見つけ出すことが難しい。そこでドキュメントデータをデータベースに格納し、格納されたドキュメントデータ内の特徴語等を抽出することで、検索することが可能な検索システムが提案されている(特許文献1等)。
【先行技術文献】
【特許文献】
【0004】
特開2013-174988号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
組織内の共有知的財産として活用する対象のドキュメントデータは、定義された属性や項目名に対してデータを持つ表計算ソフトウェア形式のデータなどの構造化データに限られない。ドキュメントデータは、自然言語で自由な文言を用いて記述された文書に加え、画像や図表とテキストとを自由に配置したプレゼンテーション用のドキュメントデータ、画像データ化されたものなども含み得る。プレゼンテーション用のドキュメントデータや画像データは、そのドキュメントを用いて表現された内容をテキストとして含まない場合がある。このような場合、テキストでの検索ができず、特許文献1に開示されたように属性や項目を抽出することも困難である。
【0006】
本開示は、ドキュメントデータの検索に係るコンピュータプログラム、情報処理装置及び情報処理方法を提供することを目的とする。
【課題を解決するための手段】
【0007】
本開示の一実施形態のコンピュータプログラムは、コンピュータに、ストレージに記憶されている写真、図、表、グラフ又はテキストを含む複数のドキュメントデータそれぞれについて、前記ドキュメントデータの特徴量を取得し、前記ドキュメントデータを識別する識別データに対応付けて、前記特徴量を記憶部に記憶しておき、前記ストレージに対する問い合わせを受け付け、受け付けた前記問い合わせと、前記特徴量に基づき抽出されるドキュメントデータとを言語モデルに与えることによって前記問い合わせに対する回答を出力する処理を実行させる。
【発明の効果】
【0008】
本開示によれば、非構造化データを含むドキュメントデータに対して検索が可能となり、組織などで共有されるデータから必要なデータを効率的に参照可能となる。
【図面の簡単な説明】
【0009】
検索システムの概要図である。
情報処理装置の構成を示すブロック図である。
情報処理装置にて使用されるモデルの概要図である。
端末装置の構成を示すブロック図である。
情報処理装置による事前処理の手順の一例を示すフローチャートである。
検索用テーブルの説明図である。
検索の受付処理手順の一例を示すフローチャートである。
端末装置に表示されるWebページの一例を示す図である。
端末装置に表示されるWebページの一例を示す図である。
端末装置に表示されるWebページの一例を示す図である。
端末装置に表示されるWebページの一例を示す図である。
端末装置に表示されるWebページの一例を示す図である。
端末装置に表示されるWebページの一例を示す図である。
端末装置に表示されるWebページの一例を示す図である。
第2実施形態の情報処理装置による事前処理の手順の一例を示すフローチャートである。
第2実施形態における検索用テーブルの説明図である。
第2実施形態における検索の受付処理手順の一例を示すフローチャートである。
第2実施形態における処理の説明図である。
【発明を実施するための形態】
【0010】
本開示をその実施の形態を示す図面を参照して具体的に説明する。以下の実施の形態では、本開示のコンピュータプログラムに基づく処理を実行する情報処理装置を含む検索システムについて説明する。
(【0011】以降は省略されています)

この特許をJ-PlatPat(特許庁公式サイト)で参照する

関連特許

株式会社内田洋行
中継装置及び給電システム
1日前
敷島金属工業株式会社
ダイヤル錠
1か月前
大建工業株式会社
吸音体及び音環境調整構造
1か月前
株式会社内田洋行
コンピュータプログラム、情報処理装置及び情報処理方法
1日前
個人
詐欺保険
1か月前
個人
縁伊達ポイン
1か月前
個人
RFタグシート
1か月前
個人
5掛けポイント
22日前
個人
職業自動販売機
15日前
個人
ペルソナ認証方式
1か月前
個人
QRコードの彩色
1か月前
個人
地球保全システム
1か月前
個人
自動調理装置
1か月前
個人
情報処理装置
25日前
個人
農作物用途分配システム
1か月前
個人
残土処理システム
1か月前
個人
インターネットの利用構造
29日前
個人
タッチパネル操作指代替具
1か月前
個人
サービス情報提供システム
17日前
個人
知的財産出願支援システム
1か月前
個人
スケジュール調整プログラム
1か月前
個人
携帯端末障害問合せシステム
1か月前
株式会社キーエンス
受発注システム
1か月前
個人
エリアガイドナビAIシステム
1か月前
個人
食品レシピ生成システム
1か月前
株式会社キーエンス
受発注システム
1か月前
株式会社キーエンス
受発注システム
1か月前
株式会社ケアコム
項目選択装置
25日前
トヨタ自動車株式会社
通知装置
1か月前
キヤノン株式会社
印刷システム
1か月前
キヤノン株式会社
情報処理装置
23日前
株式会社ワコム
電子ペン
24日前
エッグス株式会社
情報処理装置
1か月前
株式会社ワコム
電子ペン
24日前
個人
帳票自動生成型SaaSシステム
1か月前
個人
音声・通知・再配達UX制御構造
1か月前
続きを見る