TOP特許意匠商標
特許ウォッチ Twitter
10個以上の画像は省略されています。
公開番号2025161176
公報種別公開特許公報(A)
公開日2025-10-24
出願番号2024064145
出願日2024-04-11
発明の名称テキスト分類システム
出願人株式会社野村総合研究所
代理人個人
主分類G06F 16/35 20250101AFI20251017BHJP(計算;計数)
要約【課題】大量の文書やテキストデータをLLMにより効率的かつ効果的に分類する。
【解決手段】文書DB14に蓄積された文書をカテゴリに分類するテキスト分類システム1であって、ユーザから指定された分類方針に基づいてLLM2に1つ以上のカテゴリを提案させる分類処理部12と、提案された各カテゴリに属する文書を文書DB14から検索する検索処理部13と、各カテゴリと各カテゴリに属する文書の件数をユーザに提示するUI処理部11とを有する。
【選択図】図1
特許請求の範囲【請求項1】
文書データベースに蓄積された文書をカテゴリに分類するテキスト分類システムであって、
ユーザから指定された分類方針に基づいて大規模言語モデル(以下「LLM」という)に1つ以上のカテゴリを提案させる分類処理部と、
提案された前記各カテゴリに属する文書を前記文書データベースから検索する検索処理部と、
前記各カテゴリと前記各カテゴリに属する文書の件数を前記ユーザに提示するUI処理部と、を有する、テキスト分類システム。
続きを表示(約 680 文字)【請求項2】
請求項1に記載のテキスト分類システムにおいて、
前記分類処理部は、前記各カテゴリと前記各カテゴリに属する文書との関連付けに係る情報を分類データベースに記録する、テキスト分類システム。
【請求項3】
請求項1に記載のテキスト分類システムにおいて、
前記分類処理部は、前記各カテゴリのうち前記ユーザにより指定されたカテゴリについて、前記LLMに1つ以上のサブカテゴリを提案させる、テキスト分類システム。
【請求項4】
請求項1に記載のテキスト分類システムにおいて、
前記分類処理部は、前記各カテゴリのうち前記ユーザにより指定されたカテゴリについて、前記LLMに1つ以上のサブカテゴリを既存のサブカテゴリに対して追加的に提案させる、テキスト分類システム。
【請求項5】
請求項1に記載のテキスト分類システムにおいて、
前記分類処理部は、前記各カテゴリに属する文書の本文テキストに基づいて前記LLMに1つ以上のサブカテゴリを提案させる、テキスト分類システム。
【請求項6】
請求項1に記載のテキスト分類システムにおいて、
前記分類処理部は、前記LLMにカテゴリを提案させる際に、前記ユーザにより指定された分類の方向性に係る指示を入力する、テキスト分類システム。
【請求項7】
請求項1に記載のテキスト分類システムにおいて、
前記分類処理部は、前記LLMに前記各カテゴリに該当するキーワードを提案させる、テキスト分類システム。

発明の詳細な説明【技術分野】
【0001】
本発明は、自然言語データの処理技術に関し、特に、自然言語による文書を分類するテキスト分類システムに適用して有効な技術に関するものである。
続きを表示(約 1,300 文字)【背景技術】
【0002】
例えば、社内に蓄積された文書やテキストデータなどのデータソースを分析対象とするため、文書やテキストデータを分類・カテゴリー分けすることが行われる。
【0003】
文書の分類・分析に関する技術として、例えば、特開2023-62700号公報(特許文献1)には、複数の文書の各々から意味構造を抽出し意味構造のインデックスを作成し、インデックスを基にユーザが知りたい観点に基づく意味構造条件の指定をユーザから受け付けるか又は自動で指定し、ルールベースもしくは機械学習ベースの処理に基づいて、指定した意味構造条件に適合する文書をユーザへ表示し、一つ以上の文書の選択と、文書へのタグである分類タグの指定とをユーザから受け付け、選択された一つ以上の文書の各々に、指定された分類タグを関連付け、その後、複数の文書のうち少なくとも分類タグが関連付けられていない文書から、指定された分類タグが関連付けられている少なくとも一つの文書と類似する文書を検索し、類似する文書があればユーザへ表示し、類似する文書について、文書の選択と分類タグの指定とを受け付けることが記載されている。
【先行技術文献】
【特許文献】
【0004】
特開2023-62700号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
社内等に蓄積されたような膨大な文書やテキストデータを分類する場合、従来技術のようなルールベースでの分類では、分類の方向性やキーワード等のルールを人手により整備しなければならないなど作業負荷が高い。また、分類に機械学習を用いる場合でも、教師あり学習では十分な量の教師データを揃える必要があり、やはりハードルは高い。
【0006】
一方で、近年利用が急速に拡大しているChatGPT(登録商標)を始めとする生成AI(Artificial Intelligence)・大規模言語モデル(LLM:Large Language Models)(以下ではこれらを「LLM」と総称する場合がある)を利用して分類することも検討されている。
【0007】
しかし、膨大な文書やテキストデータをLLMにより分類するためには、対象のテキストデータを個別にプロンプトに記述してLLMに仕分けさせる必要があり、従来技術のルールベースや機械学習を用いた分類と比較しても処理効率は高くない。大量のテキストデータを一度にLLMに渡して一括で分類結果を得ることも可能ではあるが、プロンプトが長く複雑になるほどLLMの処理精度は安定しないことが知られている。
【0008】
そこで本発明の目的は、大量の文書やテキストデータをLLMにより効率的かつ効果的に分類するテキスト分類システムを提供することにある。
【0009】
本発明の前記ならびにその他の目的と新規な特徴は、本明細書の記載および添付図面から明らかになるであろう。
【課題を解決するための手段】
【0010】
本願において開示される発明のうち、代表的なものの概要を簡単に説明すれば、以下のとおりである。
(【0011】以降は省略されています)

この特許をJ-PlatPat(特許庁公式サイト)で参照する

関連特許

個人
詐欺保険
18日前
個人
縁伊達ポイン
18日前
個人
RFタグシート
5日前
個人
地球保全システム
1か月前
個人
QRコードの彩色
22日前
個人
ペルソナ認証方式
2日前
個人
自動調理装置
4日前
個人
為替ポイント伊達夢貯
1か月前
個人
冷凍食品輸出支援構造
1か月前
個人
残土処理システム
24日前
個人
農作物用途分配システム
17日前
個人
表変換編集支援システム
1か月前
個人
タッチパネル操作指代替具
11日前
個人
知財出願支援AIシステム
1か月前
個人
知的財産出願支援システム
25日前
個人
インターネットの利用構造
1日前
個人
行動時間管理システム
1か月前
個人
AIによる情報の売買の仲介
2か月前
個人
パスワード管理支援システム
1か月前
個人
スケジュール調整プログラム
10日前
個人
携帯端末障害問合せシステム
10日前
日本精機株式会社
施工管理システム
2か月前
個人
食品レシピ生成システム
1か月前
株式会社キーエンス
受発注システム
1か月前
株式会社キーエンス
受発注システム
1か月前
個人
システム及びプログラム
1か月前
株式会社アジラ
進入判定装置
2か月前
個人
パスポートレス入出国システム
2か月前
個人
AIキャラクター制御システム
1か月前
個人
海外支援型農作物活用システム
1か月前
個人
エリアガイドナビAIシステム
2日前
株式会社キーエンス
受発注システム
1か月前
エッグス株式会社
情報処理装置
11日前
大同特殊鋼株式会社
疵判定方法
1か月前
個人
社会還元・施設向け供給支援構造
1か月前
個人
人格進化型対話応答制御システム
1か月前
続きを見る