TOP特許意匠商標
特許ウォッチ Twitter
10個以上の画像は省略されています。
公開番号2025025678
公報種別公開特許公報(A)
公開日2025-02-21
出願番号2023130701
出願日2023-08-10
発明の名称テキスト変換方法及びテキスト変換システム
出願人株式会社日立製作所
代理人弁理士法人サンネクスト国際特許事務所
主分類G06F 40/151 20200101AFI20250214BHJP(計算;計数)
要約【課題】生成AIに問合せる際の入力テキストを適切に書換えることで、質問に対する生成AIの回答の精度を向上させる。
【解決手段】テキスト変換方法では、入力テキストに含まれる単語の組合せの関係を示す関係情報又はフレーズの組合せの関係を示す関係情報に基づいて、入力テキストにおいて変換対象とする単語の組合せ又はフレーズの組合せを特定する。そして単語の組合せの関係情報又はフレーズの組合せの関係情報に基づいて、単語を変換した後の変換先単語又はフレーズを変換した後の変換先フレーズを特定する。そして入力テキストに含まれる単語又はフレーズを、変換先単語又は変換先フレーズで変換した変換後入力テキストを生成する。そして変換後入力テキストを回答生成システムへ入力し、回答生成システムから変換後入力テキストに対して出力された出力テキストを取得する。
【選択図】図2

特許請求の範囲【請求項1】
質問を含んだ入力テキストが入力されると該質問に対する回答を含んだ出力テキストを出力する回答生成システムに入力する該入力テキストを変換するテキスト変換システムが実行するテキスト変換方法であって、
前記テキスト変換システムは、メモリとプロセッサとを有し、
前記プロセッサが、
前記入力テキストから所定条件を充足する複数の単語又は複数のフレーズを抽出し、該単語の組合せの関係を示す関係情報又は該フレーズの組合せの関係を示す関係情報を抽出し、該単語の組合せの該関係情報又は該フレーズの組合せの該関係情報に基づいて、該入力テキストにおいて変換対象とする該単語の組合せ又は該フレーズの組合せを特定し、
前記単語の組合せの前記関係情報又は前記フレーズの組合せの前記関係情報に基づいて、該単語を変換した後の変換先単語又は該フレーズを変換した後の変換先フレーズを特定し、
前記入力テキストに含まれる前記単語又は前記フレーズを、前記変換先単語又は前記変換先フレーズで変換した変換後入力テキストを生成し、
前記変換後入力テキストを前記回答生成システムへ入力し、
前記回答生成システムから前記変換後入力テキストに対して出力された前記出力テキストを取得し、
前記出力テキストに含まれる前記変換先単語又は前記変換先フレーズを、変換前の前記単語又は前記フレーズへ変換する
各処理を含んだことを特徴とするテキスト変換方法。
続きを表示(約 3,900 文字)【請求項2】
請求項1に記載のテキスト変換方法であって、
前記プロセッサが、
前記入力テキストを該入力テキストのトピックに関して該入力テキストを補完する補完テキストを第1外部情報源から収集し、
前記変換後入力テキストと共に前記補完テキストを前記回答生成システムへ入力し、該回答生成システムから該変換後入力テキスト及び該補完テキストに対する前記出力テキストを取得する
各処理を含んだことを特徴とするテキスト変換方法。
【請求項3】
請求項1に記載のテキスト変換方法であって、
前記プロセッサが、
第2外部情報源から収集した前記単語又は前記フレーズから前記所定条件を充足する複数の前記単語又は複数の前記フレーズを抽出し、該単語の組合せの前記関係情報又は該フレーズの組合せの前記関係情報を抽出し、該単語の組合せと該単語の組合せの前記関係情報とを対応付けた単語の変換パターンのレコード、又は、該フレーズの組合せと該フレーズの組合せの前記関係情報とを対応付けたフレーズの変換パターンのレコード、を生成し、
第3外部情報源から質問テキストと該質問テキストに対する回答テキストとを収集し、
前記質問テキストと前記回答テキストとから前記所定条件を充足する前記単語又は前記フレーズを抽出し、該単語の組合せの前記関係情報又は該フレーズの組合せの前記関係情報を抽出し、該質問テキストと該回答テキストと該単語の組合せと該単語の組合せの前記関係情報とを対応付けた単語のテンプレートのレコード、又は、該質問テキストと該回答テキストと該フレーズの組合せと該フレーズの組合せの前記関係情報とを対応付けたフレーズのテンプレートのレコード、を生成し、
前記変換パターンと同一の前記関係情報を有するレコードを前記テンプレートから抽出し、該レコードにおける変換前の前記質問テキスト及び変換前の前記回答テキストに対応付けられている前記単語の組合せ又は前記フレーズの組合せを、同一の該関係情報を有する該変換パターンのレコードの該単語の組合せ又は該フレーズの組合せへ変換した変換後の前記質問テキストを生成して前記回答生成システムへ入力し、
変換後の前記質問テキストに対して前記回答生成システムから出力された変換後の前記回答テキストと変換前の前記回答テキストとの比較結果に基づいて、該変換パターンによる変換前の前記質問テキストにおける前記単語の組合せ又は前記フレーズの組合せの変換が前記回答生成システムにより出力される前記回答テキストを改善する改善度合いを表す確信度を計測し、
前記確信度を前記変換パターンに対応付けて保存し、
前記変換パターンにおいて対応付けられている前記単語の組合せ又は前記フレーズの組合せから前記確信度に基づいて前記変換先単語又は前記変換先フレーズを特定する
各処理を含んだことを特徴とするテキスト変換方法。
【請求項4】
請求項3に記載のテキスト変換方法であって、
前記所定条件の充足は、前記単語又は前記フレーズが特定の品詞に該当すること及び前記単語又は前記フレーズが一般的であることの何れか一方又は両方である
ことを特徴とするテキスト変換方法。
【請求項5】
請求項3に記載のテキスト変換方法であって、
前記プロセッサが、
前記第3外部情報源から、数量に関する推論を含んだ前記質問テキストと該質問テキストに対する前記回答テキストとを収集し、
前記数量に関する推論に係る数量表現の間に存在する論理的関係を推定し、
前記数量表現を変数化し、
前記数量表現を変数化した前記質問テキストと前記回答テキストから前記所定条件を充足する前記単語又は前記フレーズを抽出する
各処理を含んだことを特徴とするテキスト変換方法。
【請求項6】
請求項1に記載のテキスト変換方法であって、
前記プロセッサが、
前記回答生成システムから出力される複数の前記出力テキストの候補を所定の表示画面上でユーザに対して可視化し、
前記ユーザによる前記所定の表示画面上での選択操作に応じて、前記候補から、前記回答生成システムから出力される前記出力テキストを決定する
各処理を含んだことを特徴とするテキスト変換方法。
【請求項7】
質問を含んだ入力テキストが入力されると該質問に対する回答を含んだ出力テキストを出力する回答生成システムに入力する該入力テキストを変換するテキスト変換システムであって、
前記テキスト変換システムは、メモリとプロセッサとを有し、
前記プロセッサは、
前記入力テキストから所定条件を充足する複数の単語又は複数のフレーズを抽出し、該単語の組合せの関係を示す関係情報又は該フレーズの組合せの関係を示す関係情報を抽出し、該単語の組合せの該関係情報又は該フレーズの組合せの該関係情報に基づいて、該入力テキストにおいて変換対象とする該単語の組合せ又は該フレーズの組合せを特定し、
前記単語の組合せの前記関係情報又は前記フレーズの組合せの前記関係情報に基づいて、該単語を変換した後の変換先単語又は該フレーズを変換した後の変換先フレーズを特定し、
前記入力テキストに含まれる前記単語又は前記フレーズを、前記変換先単語又は前記変換先フレーズで変換した変換後入力テキストを生成し、
前記変換後入力テキストを前記回答生成システムへ入力し、
前記回答生成システムから前記変換後入力テキストに対して出力された前記出力テキストを取得し、
前記出力テキストに含まれる前記変換先単語又は前記変換先フレーズを、変換前の前記単語又は前記フレーズへ変換する
ことを特徴とするテキスト変換システム。
【請求項8】
請求項7に記載のテキスト変換システムであって、
前記プロセッサは、
前記入力テキストを該入力テキストのトピックに関して該入力テキストを補完する補完テキストを第1外部情報源から収集し、
前記変換後入力テキストと共に前記補完テキストを前記回答生成システムへ入力し、該回答生成システムから該変換後入力テキスト及び該補完テキストに対する前記出力テキストを取得する
ことを特徴とするテキスト変換システム。
【請求項9】
請求項7に記載のテキスト変換システムであって、
前記プロセッサは、
第2外部情報源から収集した前記単語又は前記フレーズから前記所定条件を充足する複数の前記単語又は複数の前記フレーズを抽出し、該単語の組合せの前記関係情報又は該フレーズの組合せの前記関係情報を抽出し、該単語の組合せと該単語の組合せの前記関係情報とを対応付けた単語の変換パターンのレコード、又は、該フレーズの組合せと該フレーズの組合せの前記関係情報とを対応付けたフレーズの変換パターンのレコード、を生成し、
第3外部情報源から質問テキストと該質問テキストに対する回答テキストとを収集し、
前記質問テキストと前記回答テキストとから前記所定条件を充足する前記単語又は前記フレーズを抽出し、該単語の組合せの前記関係情報又は該フレーズの組合せの前記関係情報を抽出し、該質問テキストと該回答テキストと該単語の組合せと該単語の組合せの前記関係情報とを対応付けた単語のテンプレートのレコード、又は、該質問テキストと該回答テキストと該フレーズの組合せと該フレーズの組合せの前記関係情報とを対応付けたフレーズのテンプレートのレコード、を生成し、
前記変換パターンと同一の前記関係情報を有するレコードを前記テンプレートから抽出し、該レコードにおける変換前の前記質問テキスト及び変換前の前記回答テキストに対応付けられている前記単語の組合せ又は前記フレーズの組合せを、同一の該関係情報を有する該変換パターンのレコードの該単語の組合せ又は該フレーズの組合せへ変換した変換後の前記質問テキストを生成して前記回答生成システムへ入力し、
変換後の前記質問テキストに対して前記回答生成システムから出力された変換後の前記回答テキストと変換前の前記回答テキストとの比較結果に基づいて、該変換パターンによる変換前の前記質問テキストにおける前記単語の組合せ又は前記フレーズの組合せの変換が前記回答生成システムにより出力される前記回答テキストを改善する改善度合いを表す確信度を計測し、
前記確信度を前記変換パターンに対応付けて保存し、
前記変換パターンにおいて対応付けられている前記単語の組合せ又は前記フレーズの組合せから前記確信度に基づいて前記変換先単語又は前記変換先フレーズを特定する
ことを特徴とするテキスト変換システム。
【請求項10】
請求項9に記載のテキスト変換システムであって、
前記所定条件の充足は、前記単語又は前記フレーズが特定の品詞に該当すること及び前記単語又は前記フレーズが一般的であることの何れか一方又は両方である
ことを特徴とするテキスト変換システム。
(【請求項11】以降は省略されています)

発明の詳細な説明【技術分野】
【0001】
本発明は、テキスト変換方法及びテキスト変換システムに関する。
続きを表示(約 2,100 文字)【背景技術】
【0002】
ChatGPTやGPT-3をはじめとする生成AI(Artificial Intelligence)を用いて、ユーザからの質問文のテキストデータを受け付け、回答文のテキストデータを取得する方法が開示されている。また、これら生成AIに対して、追加の学習データを与えたり、検索器や電卓など外部ツールを組合せたりすることで利便性を改善する方法が開示されている。
【先行技術文献】
【非特許文献】
【0003】
稲葉達郎, 清丸寛一, Fei Cheng, 黒橋禎夫,“大規模言語モデルに基づく複数の外部ツールを利用した推論フレームワーク”,[online],2023年,言語処理学会第29回年次大会講演論文集,[令和5年7月10日検索],インターネット<URL:https://www.anlp.jp/proceedings/annual_meeting/2023/pdf_dir/Q8-10.pdf
Aitor Lewkowycz,et al. , “Solving quantitative reasoning problems with language models.”,[online],2022年,arXiv preprint arXiv:2206.14858,[令和5年7月10日検索],インターネット<URL:https://arxiv.org/pdf/2206.14858.pdf
【発明の概要】
【発明が解決しようとする課題】
【0004】
ここで上記非特許文献2は、四則演算を要する問い合わせに対して、生成AIの回答能力が人間に劣ると報告している。
【0005】
例えば「那覇空港から沖縄エアポートシャトルなら30分、ゆいレールなら15分で首里に行けます。沖縄美ら海水族館は、首里から徒歩で20分です。沖縄美ら海水族館までの最短所要時間は?」という質問を考える。この質問に対する正しい答えは、那覇空港からゆいレールを利用し15分で首里に行き、首里から徒歩で20分を要するため、合計35分である。
【0006】
一方で、この問い合わせをGPT-3へ入力すると、必ずしも正しく回答せず、例えば「45分」と回答する場合がある。このような質問を、「那覇空港から、バスなら30分、電車なら15分で、首里に行くことができます。水族館は、首里から徒歩で20分です。水族館までの最短所要時間は?」と書換えてGPT-3へ入力すると、「バスで50分、電車で35分」という回答に変化する。
【0007】
上記のように例示した質問のほかに、GPT-3に対して「月曜日、火曜日、水曜日、木曜日、金曜日、土曜日、日曜日のうち、開館日は月曜日、火曜日である。閉館日は?」という質問を与えると、「日曜日」のみ、と回答する。一方、「月曜日、火曜日、水曜日、木曜日、金曜日、土曜日、日曜日のうち、開業日は月曜日、火曜日である。休業日は?」と問合せを書換えてGPT-3に対して入力すると、「休業日は水曜日、木曜日、金曜日、土曜日、日曜日です。」という回答に変化する。
【0008】
本発明は、上述の事情を考慮して、生成AIに問合せる際の入力テキストを適切に書換えることで、質問に対する生成AIの回答の精度を向上させることを目的とする。
【課題を解決するための手段】
【0009】
上記課題を解決する一態様として、質問を含んだ入力テキストが入力されると該質問に対する回答を含んだ出力テキストを出力する回答生成システムに入力する該入力テキストを変換するテキスト変換システムが実行するテキスト変換方法であって、前記テキスト変換システムは、メモリとプロセッサとを有し、前記プロセッサが、前記入力テキストから所定条件を充足する複数の単語又は複数のフレーズを抽出し、該単語の組合せの関係を示す関係情報又は該フレーズの組合せの関係を示す関係情報を抽出し、該単語の組合せの該関係情報又は該フレーズの組合せの該関係情報に基づいて、該入力テキストにおいて変換対象とする該単語の組合せ又は該フレーズの組合せを特定し、前記単語の組合せの前記関係情報又は前記フレーズの組合せの前記関係情報に基づいて、該単語を変換した後の変換先単語又は該フレーズを変換した後の変換先フレーズを特定し、前記入力テキストに含まれる前記単語又は前記フレーズを、前記変換先単語又は前記変換先フレーズで変換した変換後入力テキストを生成し、前記変換後入力テキストを前記回答生成システムへ入力し、前記回答生成システムから前記変換後入力テキストに対して出力された前記出力テキストを取得し、前記出力テキストに含まれる前記変換先単語又は前記変換先フレーズを、変換前の前記単語又は前記フレーズへ変換する各処理を含んだことを特徴とする。
【発明の効果】
【0010】
本発明によれば、質問に対する生成AIの回答の精度を向上させることができる。
【図面の簡単な説明】
(【0011】以降は省略されています)

この特許をJ-PlatPatで参照する
Flag Counter

関連特許

個人
情報提示方法
1か月前
株式会社理研
演算装置
4日前
個人
アカウントマップ
1か月前
個人
プログラム
1か月前
個人
プログラム
1か月前
個人
日本語入力支援システム
4日前
個人
AI旅行最適化プラグイン
3日前
個人
発想支援方法及びシステム
1か月前
個人
学習装置及び推論装置
1か月前
個人
分類処理プログラム及び方法
1か月前
個人
案件管理装置および端末装置
18日前
富士通株式会社
金融システム
1か月前
株式会社発明屋
電池指向の構造設計
25日前
トヨタ自動車株式会社
管理装置
26日前
キヤノン株式会社
情報処理装置
4日前
株式会社イズミ
総合代行システム
14日前
富士通株式会社
プロセッサ
24日前
トヨタ自動車株式会社
電気自動車
10日前
個人
ダブルオークションシステム
14日前
株式会社プレニーズ
仲介システム
1か月前
富士通株式会社
予測
17日前
トヨタ自動車株式会社
生成装置
1か月前
株式会社SUBARU
車両用操作装置
10日前
合同会社IPマネジメント
料金収受システム
17日前
ローム株式会社
半導体集積回路
今日
個人
株式投資コンペティションシステム
17日前
株式会社アジラ
行動体存在推定システム
24日前
マクセル株式会社
リーダライタ用ホルダ
17日前
西日本電信電話株式会社
分析装置
17日前
個人
収納装置および収納システム
3日前
トヨタ自動車株式会社
電池性能推定方法
17日前
株式会社野村総合研究所
寄付支援システム
1か月前
トヨタ自動車株式会社
情報処理装置
4日前
株式会社野村総合研究所
寄付支援システム
1か月前
トヨタ自動車株式会社
駐車場発電システム
1か月前
富士通株式会社
画像符号化
4日前
続きを見る