TOP特許意匠商標
特許ウォッチ Twitter
10個以上の画像は省略されています。
公開番号2024131461
公報種別公開特許公報(A)
公開日2024-09-30
出願番号2023041733
出願日2023-03-16
発明の名称情報処理システム、情報処理装置、情報処理方法、およびプログラム
出願人三菱電機株式会社,三菱電機インフォメーションシステムズ株式会社
代理人個人,個人,個人,個人
主分類G06F 16/383 20190101AFI20240920BHJP(計算;計数)
要約【課題】キーワード抽出におけるユーザの利便性を向上させること。
【解決手段】情報処理システムは、学習用学習テキストデータから疑似的なキーワードである第一疑似キーワードを抽出する疑似キーワード抽出部と、前記第一疑似キーワードを前記学習テキストデータに付与する疑似キーワード付与部と、前記学習テキストデータにおける文脈と前記第一疑似キーワードとの対応関係を学習した学習モデルを生成する学習モデル生成部と、を備える。
【選択図】図2
特許請求の範囲【請求項1】
学習用の学習テキストデータから疑似的なキーワードである第一疑似キーワードを抽出する疑似キーワード抽出部と、
前記第一疑似キーワードを特定する情報を前記学習テキストデータに付与する疑似キーワード付与部と、
前記学習テキストデータにおける文脈と前記第一疑似キーワードとの対応関係を学習した学習モデルを生成する学習モデル生成部と、
を備える情報処理システム。
続きを表示(約 1,000 文字)【請求項2】
前記学習モデルを用いてテキストデータからキーワードを抽出するキーワード抽出部と、
をさらに備える請求項1に記載の情報処理システム。
【請求項3】
前記学習テキストデータに出現する前記第一疑似キーワードを、所定規則に従って生成された第二疑似キーワードに置換することで疑似文章を生成する疑似文書生成部、
をさらに備え、
前記学習モデル生成部は、前記第二疑似キーワードと前記疑似文章との対応関係をさらに学習する、
請求項1に記載の情報処理システム。
【請求項4】
前記キーワードを編集可能にユーザに提示する提示部、
をさらに備え、
前記学習モデル生成部は、前記ユーザに編集されたキーワードと前記編集されたキーワードが出現する文章の文脈との対応関係をさらに学習した学習モデルを生成する、
請求項2に記載の情報処理システム。
【請求項5】
学習用の学習テキストデータから疑似的なキーワードである第一疑似キーワードを抽出する疑似キーワード抽出部と、
前記第一疑似キーワードを前記学習テキストデータに付与する疑似キーワード付与部と、
前記学習テキストデータにおける文脈と前記第一疑似キーワードとの対応関係を学習した学習モデルを生成する学習モデル生成部と、
を備える情報処理装置。
【請求項6】
コンピュータが実行する情報処理方法であって、
学習用の学習テキストデータから疑似的なキーワードである第一疑似キーワードを抽出する疑似キーワード抽出過程と、
前記第一疑似キーワードを前記学習テキストデータに付与する疑似キーワード付与過程と、
前記学習テキストデータにおける文脈と前記第一疑似キーワードとの対応関係を学習した学習モデルを生成する学習モデル生成過程と、
を有する情報処理方法。
【請求項7】
コンピュータに、
学習用の学習テキストデータから疑似的なキーワードである第一疑似キーワードを抽出する疑似キーワード抽出ステップと、
前記第一疑似キーワードを前記学習テキストデータに付与する疑似キーワード付与ステップと、
前記学習テキストデータにおける文脈と前記第一疑似キーワードとの対応関係を学習した学習モデルを生成する学習モデル生成ステップと、
を実行させるためのプログラム。

発明の詳細な説明【技術分野】
【0001】
本発明は、情報処理システム、情報処理装置、情報処理方法、およびプログラムに関する。
続きを表示(約 2,000 文字)【背景技術】
【0002】
文章からキーワードを抽出する技術がある。キーワードの抽出には、辞書が用いられる。
例えば、特許文献1には、未登録単語抽出部が認識辞書に登録されていない未登録単語を抽出し、未登録単語特徴量抽出部が共起頻度ベクトルを生成し、認識結果特徴量抽出部が単語頻度ベクトルを生成し、タスク関連度算出部がタスク関連度を算出し、暫定認識辞書を用いて暫定認識結果を生成し、認識信頼度算出部が認識信頼度を算出し、登録優先度算出部が信頼度重みを用いて登録優先度を算出し、認識辞書登録部が追加登録単語を抽出し、認識辞書に追加登録単語等生かして拡張辞書を生成することが開示されている。
【先行技術文献】
【特許文献】
【0003】
特開2013-171222号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
専門用語などのキーワードの抽出精度を向上させるためには、専門用語が登録された専門用語辞書が必要である。
しかしながら、特許文献1に記載の技術は、文中に出現する単語の係り受けや単語の出現頻度に基づいてキーワードを抽出する。そのため、専門用語の出現頻度が低いキーワードである場合には、当該キーワードが抽出されず、実際の専門用語とは異なるキーワードが抽出される場合があった。また、機械学習を用いたキーワード抽出では、抽出精度を向上させるために、テキストデータと、正しいキーワードとの対応関係を大量に学習させる必要があり、また、データ選別やデータ収集に手間やコストを要する。
そのため、キーワードの抽出精度を向上させることができないという課題があった。このように、キーワード抽出におけるユーザの利便性が十分でないという課題があった。
【0005】
本発明は、上記の点に鑑みてなされたものでありキーワード抽出におけるユーザの利便性を向上させることができる情報処理システム、情報処理装置、情報処理方法、およびプログラムを提供することを課題とする。
【課題を解決するための手段】
【0006】
本発明は上記の課題を解決するためになされたものであり、本発明の一態様は、情報処理システムであって、学習用の学習テキストデータを取得する学習テキストデータ取得部と、前記学習テキストデータから疑似的なキーワードである第一疑似キーワードを抽出する疑似キーワード抽出部と、前記第一疑似キーワードを前記学習テキストデータに付与する疑似キーワード付与部と、前記学習テキストデータにおける文脈と前記第一疑似キーワードとの対応関係を学習した学習モデルを生成する学習モデル生成部と、を備える情報処理システムである。
【0007】
また、本発明の一態様は、情報処理装置であって、学習用の学習テキストデータを取得する学習テキストデータ取得部と、前記学習テキストデータから疑似的なキーワードである第一疑似キーワードを抽出する疑似キーワード抽出部と、前記第一疑似キーワードを前記学習テキストデータに付与する疑似キーワード付与部と、前記学習テキストデータにおける文脈と前記第一疑似キーワードとの対応関係を学習した学習モデルを生成する学習モデル生成部と、を備える情報処理装置である。
【0008】
また、本発明の一態様は、コンピュータが実行する情報処理方法であって、学習用の学習テキストデータを取得する学習テキストデータ取得過程と、前記学習テキストデータから疑似的なキーワードである第一疑似キーワードを抽出する疑似キーワード抽出過程と、前記第一疑似キーワードを前記学習テキストデータに付与する疑似キーワード付与過程と、前記学習テキストデータにおける文脈と前記第一疑似キーワードとの対応関係を学習した学習モデルを生成する学習モデル生成過程と、を有する情報処理方法である。
【0009】
また、本発明の一態様は、プログラムであって、コンピュータに、学習用の学習テキストデータを取得する学習テキストデータ取得ステップと、前記学習テキストデータから疑似的なキーワードである第一疑似キーワードを抽出する疑似キーワード抽出ステップと、前記第一疑似キーワードを前記学習テキストデータに付与する疑似キーワード付与ステップと、前記学習テキストデータにおける文脈と前記第一疑似キーワードとの対応関係を学習した学習モデルを生成する学習モデル生成ステップと、を実行させるためのプログラムである。
【発明の効果】
【0010】
本発明によれば、キーワード抽出におけるユーザの利便性を向上させることができる。
【図面の簡単な説明】
(【0011】以降は省略されています)

この特許をJ-PlatPatで参照する

関連特許

個人
GPSロガー
11日前
個人
防災情報システム
1か月前
個人
デトろぐシステム
10日前
個人
情報処理システム
1か月前
日本精機株式会社
表示装置
24日前
個人
管理装置
3日前
個人
指先受の付いたマウス。
27日前
個人
介護者指名システム
1か月前
個人
都市経営シミュレーション
16日前
個人
管理装置
5日前
個人
契約管理サーバ
2日前
個人
特徴検討支援システム
3日前
有限会社マイコム
制御盤のAI見積
1か月前
キヤノン株式会社
情報処理装置
1か月前
國立臺灣大學
操作補助システム
17日前
株式会社Haul
採用支援方法
1か月前
個人
施解錠制御システム
2か月前
個人
支援システム及び支援方法
18日前
個人
生活困窮者相談業務支援システム
2か月前
中国電力株式会社
販売支援方法
2か月前
株式会社テクロス
情報処理装置
9日前
エムケー精工株式会社
洗車場システム
1か月前
トヨタ自動車株式会社
表認識方法
1か月前
個人
災害情報表示システム
1か月前
個人
すべて大吉となるおみくじ制作装置
23日前
株式会社にしがき
会員権システム
1か月前
トヨタ自動車株式会社
車両
3日前
株式会社美好屋商店
広告システム
16日前
株式会社奥村組
削孔位置検出方法
2日前
株式会社野村総合研究所
検証装置
9日前
株式会社Asuka
本人認証方法
1か月前
トヨタ自動車株式会社
記号認識装置
6日前
トヨタ自動車株式会社
情報処理装置
6日前
日本信号株式会社
料金精算システム
23日前
トヨタ自動車株式会社
画像処理装置
2か月前
トヨタ自動車株式会社
情報処理装置
1か月前
続きを見る