TOP特許意匠商標
特許ウォッチ Twitter
10個以上の画像は省略されています。
公開番号2024085139
公報種別公開特許公報(A)
公開日2024-06-26
出願番号2022199510
出願日2022-12-14
発明の名称テキスト生成方法、テキスト生成装置
出願人株式会社日立製作所
代理人弁理士法人サンネクスト国際特許事務所
主分類G06F 40/56 20200101AFI20240619BHJP(計算;計数)
要約【課題】指示された論理構造に基づいたテキストを生成できる。
【解決手段】あらかじめ訓練されたテキスト生成モデルが格納される記憶部を備えるコンピュータが実行するテキスト生成方法は、処理対象文章を示す言語情報を取得する言語情報取得処理と、論理テキストを取得する論理テキスト取得処理と、テキスト生成モデルに処理対象文章および論理テキストを入力し、出力テキストを得るテキスト出力処理と、を含み、テキスト生成モデルは、文章間の論理構造である指定論理構造を示す論理テキストおよび処理対象文章を入力とし、処理対象文章から指定論理構造に従ったテキストである出力テキストを出力する。
【選択図】図1
特許請求の範囲【請求項1】
あらかじめ訓練されたテキスト生成モデルが格納される記憶部を備えるコンピュータが実行するテキスト生成方法であって、
前記テキスト生成モデルは、文章間の論理構造である指定論理構造を示す論理テキストおよび処理対象文章を入力とし、前記処理対象文章から前記指定論理構造に従ったテキストである出力テキストを出力し、
前記処理対象文章を示す言語情報を取得する言語情報取得処理と、
前記論理テキストを取得する論理テキスト取得処理と、
前記テキスト生成モデルに前記処理対象文章および前記論理テキストを入力し、前記出力テキストを得るテキスト出力処理と、を含むテキスト生成方法。
続きを表示(約 1,300 文字)【請求項2】
請求項1に記載のテキスト生成方法であって、
前記テキスト出力処理において前記テキスト生成モデルに入力される前記論理テキストは、ユーザの選択により決定される、テキスト生成方法。
【請求項3】
請求項1に記載のテキスト生成方法であって、
ユーザが入力する文章から前記論理テキストを生成するユーザ起源論理テキスト生成処理をさらに含み、
前記テキスト出力処理において前記テキスト生成モデルに入力される前記論理テキストは、前記ユーザ起源論理テキスト生成処理により生成された前記論理テキストである、テキスト生成方法。
【請求項4】
請求項1に記載のテキスト生成方法であって、
前記論理テキストを前記テキスト生成モデルに対して最適化する最適化処理をさらに含み、
前記テキスト出力処理では、前記最適化処理により最適化された前記論理テキストが前記テキスト生成モデルに入力される、テキスト生成方法。
【請求項5】
請求項4に記載のテキスト生成方法であって、
前記記憶部には複数の前記テキスト生成モデルが格納され、
前記最適化処理では、前記テキスト出力処理において用いられる前記テキスト生成モデルに対して前記論理テキストが最適化される、テキスト生成方法。
【請求項6】
請求項1に記載のテキスト生成方法であって、
前記論理テキスト取得処理により取得された前記論理テキストを評価し、評価値が所定の閾値よりも低いと前記テキスト出力処理を停止させる評価処理をさらに含む、テキスト生成方法。
【請求項7】
請求項1に記載のテキスト生成方法であって、
ユーザの入力に基づき前記論理テキストを決定する第1決定処理と、
前記テキスト出力処理により得られた前記出力テキストをユーザに提示する提示処理と、
前記提示処理の後のユーザの入力に基づき前記論理テキストを決定する第2決定処理と、
前記第2決定処理により決定された前記論理テキスト、および前記処理対象文章と直前に実行された前記テキスト出力処理により出力された前記出力テキストとを結合したテキストを前記テキスト生成モデルに入力して、新たな前記出力テキストを得る第2テキスト出力処理と、をさらに含み、
前記第2テキスト出力処理の後にユーザから入力があると、前記第2決定処理および前記第2テキスト出力処理を繰り返し、前記出力テキストを更新するテキスト生成方法。
【請求項8】
処理対象文章を示す言語情報を取得する言語情報取得部と、
文章間の論理構造である指定論理構造を示す文字列である論理テキストを取得する論理テキスト取得部と、
前記処理対象文章および前記論理テキストを入力とし、前記処理対象文章から前記指定論理構造に従ったテキストを生成するように訓練されたテキスト生成モデルを格納する記憶部と、
前記テキスト生成モデルを用いて、前記処理対象文章から前記指定論理構造に従ったテキストを取得するテキスト生成部と、を備えるテキスト生成装置。

発明の詳細な説明【技術分野】
【0001】
本発明は、テキスト生成方法、およびテキスト生成装置に関する。
続きを表示(約 2,600 文字)【背景技術】
【0002】
自動要約に代表されるように、与えられたテキストを読み手に対して適切なテキストに変換する技術、すなわちテキスト生成技術が知られている。近年の深層学習の発展により、自動要約や機械翻訳などのテキスト生成技術の精度が向上している。特に、テキスト生成の機能を備えた言語モデルであるテキスト生成言語モデルが登場し、テキスト生成の精度はさらに向上している。テキスト生成の精度向上に伴い、今まで取り組まれてこなかったような生成対象へテキスト生成技術が活用され始めている。たとえば自動要約は、これまでニュースの見出しを生成対象とされることが多かったが、近年では論文や特許文書の要約などが対象とされており、今後は企業が発行するレポートなど対象がさらに広がることが予想される。特許文献1には、第1の言語の入力テキストを第2の言語の出力テキストに翻訳するコンピュータ実施方法であって、入力テキストに基づいて入力論理形式を生成するステップと、少なくとも入力論理フォームの一部分とマッチングする1つまたはそれ以上の変換マッピングの1組をあらかじめ定められた尺度に基づいて選択するステップと、前記1組の変換マッピングを目的論理形式と結合するステップと、前記目的論理形式に基づいて出力テキストを生成するステップとを備えたことを特徴とするコンピュータ実施方法が開示されている。
【先行技術文献】
【特許文献】
【0003】
特開2003-050797号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
特許文献1に記載されている発明では、指示された論理構造に基づいたテキストの生成ができない。
【課題を解決するための手段】
【0005】
本発明の第1の態様によるテキスト生成方法は、あらかじめ訓練されたテキスト生成モデルが格納される記憶部を備えるコンピュータが実行するテキスト生成方法であって、前記テキスト生成モデルは、文章間の論理構造である指定論理構造を示す論理テキストおよび処理対象文章を入力とし、前記処理対象文章から前記指定論理構造に従ったテキストである出力テキストを出力し、前記処理対象文章を示す言語情報を取得する言語情報取得処理と、前記論理テキストを取得する論理テキスト取得処理と、前記テキスト生成モデルに前記処理対象文章および前記論理テキストを入力し、前記出力テキストを得るテキスト出力処理と、を含む。
本発明の第2の態様によるテキスト生成装置は、処理対象文章を示す言語情報を取得する言語情報取得部と、文章間の論理構造である指定論理構造を示す文字列である論理テキストを取得する論理テキスト取得部と、前記処理対象文章および前記論理テキストを入力とし、前記処理対象文章から前記指定論理構造に従ったテキストを生成するように訓練されたテキスト生成モデルを格納する記憶部と、前記テキスト生成モデルを用いて、前記処理対象文章から前記指定論理構造に従ったテキストを取得するテキスト生成部と、を備える。
【発明の効果】
【0006】
本発明によれば、指示された論理構造に基づいたテキストを生成できる。
【図面の簡単な説明】
【0007】
第1の実施の形態におけるテキスト生成装置の機能構成図
テキスト生成装置のハードウエア構成図
学習フェーズにおけるテキスト生成装置の動作を示す図
第1の実施の形態におけるテキスト生成装置の推論フェーズの動作を示す図
要約文、論理テンプレート、および論理テキストの具体例を示す図
第2の実施の形態におけるテキスト生成装置の推論フェーズの動作を示す図
第3の実施の形態におけるテキスト生成装置の推論フェーズの動作を示す図
第4の実施の形態におけるテキスト生成装置の推論フェーズの動作を示す図
第4の実施の形態の変形例におけるテキスト生成装置の推論フェーズの動作を示す図
第5の実施の形態におけるテキスト生成装置の推論フェーズの動作を示す図
第6の実施の形態におけるテキスト生成装置の推論フェーズの動作を示す図
テキスト生成部への入力および出力を示す概念図
【発明を実施するための形態】
【0008】
―第1の実施の形態―
以下、図1~図5を参照して、テキスト生成方法およびテキスト生成装置の第1の実施の形態を説明する。
【0009】
図1は、テキスト生成装置1の機能構成図である。テキスト生成装置1は、言語情報取得部11と、論理テンプレート生成部12と、論理テキスト生成部13と、テキスト生成部14と、論理テンプレート取得部15と、論理テキスト取得部16と、を備える。テキスト生成装置1に備えられる記憶部6には、入力文章61と、論理テンプレート62と、論理テキスト63と、テキスト生成モデル64と、要約文65と、が格納される。ただし図1において記憶部6に格納されるデータは、テキスト生成装置1が動作を開始する前から全て格納されるわけではない。以下では、テキスト生成装置1を使用する人間を「ユーザ」と呼ぶ。ユーザは同一人物でもよいし、場面により異なる人物でもよい。
【0010】
入力文章61は、予め生成され複数の文を含む文章である。入力文章61は常にテキスト生成装置1の外部で作成される。入力文章61はテキスト生成装置1の処理対象となる文章なので、「処理対象文章」とも呼ばれる。本実施の形態では、入力文章61は、文字列で構成されるテキストとして説明するが、入力文章61は、音声、書類、および図面などの様々な種別のデータを用いることができる。このとき、書類は電子書類でもよいし、紙や板などの物理的に記録された書類でもよい。また、図面は電子図面でもよいし、紙や板などの物理的に記録された書類でもよい。さらに、書類および図面には、文字列や図形、および写真などといった様々な情報が含まれていてもよい。なお、入力文章61の言語は特に限定されず、様々な言語を用いることができる。また、文字列は言語だけでなく、図形や記号を含んでいてもよい。
(【0011】以降は省略されています)

この特許をJ-PlatPatで参照する

関連特許

個人
暗号化記憶媒体
1か月前
個人
プロジェクター
1か月前
個人
環境情報処理装置
9日前
個人
求人支援システム
26日前
個人
外食予約システム
9日前
キヤノン電子株式会社
周辺機器
1か月前
ニデック株式会社
冷却装置
3日前
個人
サービス提供システム
2日前
個人
海外在住支援システム
9日前
個人
求人マッチングサーバ
1か月前
カゴメ株式会社
営農支援プログラム
1か月前
カゴメ株式会社
営農支援プログラム
1か月前
カゴメ株式会社
営農支援プログラム
1か月前
カゴメ株式会社
営農支援プログラム
1か月前
株式会社ワコム
電子ペン
1か月前
株式会社ワコム
電子ペン
1か月前
株式会社ワコム
電子ペン
12日前
アスエネ株式会社
水管理の方法
1か月前
シャープ株式会社
情報出力装置
24日前
東洋電装株式会社
操作装置
12日前
東洋電装株式会社
操作装置
12日前
大日本印刷株式会社
作業台
1か月前
CKD株式会社
遠隔支援システム
1か月前
東洋電装株式会社
操作装置
12日前
株式会社寺岡精工
システム
1か月前
学校法人修道学園
農地集約システム
2日前
株式会社カロニマ
情報発信システム
16日前
トヨタ紡織株式会社
検査装置
1か月前
株式会社SUBARU
操作制御装置
2日前
日本信号株式会社
料金精算システム
22日前
個人
ポイント増量アプリ「太陽光銭サー」
1か月前
株式会社アジラ
異常行動検出システム
1か月前
株式会社小野測器
移動量計測システム
1か月前
旭精工株式会社
管理装置および管理システム
2日前
BH株式会社
商品販売システム
1か月前
個人
スマートフォンにおける使用料金削減方法
23日前
続きを見る