TOP特許意匠商標
特許ウォッチ Twitter
10個以上の画像は省略されています。
公開番号2024165175
公報種別公開特許公報(A)
公開日2024-11-28
出願番号2023081096
出願日2023-05-16
発明の名称テキスト生成システム
出願人株式会社日立製作所
代理人青稜弁理士法人
主分類G06F 8/73 20180101AFI20241121BHJP(計算;計数)
要約【課題】テキスト生成システムにおいて、数万から数百万行のプログラムコードを抽象的に要約してレポジトリ全体に関するドキュメンテーションを生成する。
【解決手段】プログラムコードからプログラムコード部分を特定する代表プログラムコード特定部と、プログラムコード部分とモデル情報に基づいてプログラムコードの説明テキストを生成するコンテンツ生成部を有する。
【選択図】図1
特許請求の範囲【請求項1】
プロセッサによりプログラムコードから前記プログラムコードの説明テキストを生成するテキスト生成システムであって、
前記プログラムコードからプログラムの代表的な処理が記載されている前記プログラムコードの一部分であるプログラムコード部分を特定する代表プログラムコード特定部と、
前記プログラムコード部分と、モデル情報としての少なくとも一つの設定値に基づいて、前記プログラムコードの前記説明テキストを生成するコンテンツ生成部と、
を有することを特徴とするテキスト生成システム。
続きを表示(約 1,200 文字)【請求項2】
前記代表プログラムコード特定部は、
前記プログラムコード部分として、前記プログラムコードの断片を構成するプログラムコード断片を特定することを特徴とする請求項1に記載のテキスト生成システム。
【請求項3】
前記代表プログラムコード特定部は、
前記プログラムの前記代表的な処理として、前記プログラムの抽象的な全体処理が記載されているプログラムコード部分を特定し、
前記プログラムコード部分として、ファイル、パッケージ、関数、クラス、コードブロック及びユーザーインターフェースコンポーネントの少なくとも一つを特定することを特徴とする請求項1に記載のテキスト生成システム。
【請求項4】
前記代表プログラムコード特定部は、
前記プログラムコードの内容に基づいて、前記プログラムコードから前記プログラムコード部分を特定することを特徴とする請求項1に記載のテキスト生成システム。
【請求項5】
前記代表プログラムコード特定部は、
前記プログラムコードを複数のプログラムコード部分に分割し、
分割された複数の前記プログラムコード部分の内容及び分割された複数の前記プログラムコード部分の間の構造的な関係性の少なくとも一つに基づいて、前記プログラムコード部分を特定することを特徴とする請求項1に記載のテキスト生成システム。
【請求項6】
前記コンテンツ生成部は、
前記設定値として、アフィン変換又は非線形変換のパラメータ値を用いて、前記アフィン変換又は前記非線形変換によって前記説明テキストを生成することを特徴とする請求項1に記載のテキスト生成システム。
【請求項7】
前記コンテンツ生成部の生成内容を制御する少なくとも一つの文字列を保持するプロンプトテンプレートデータベースを更に有し、
前記コンテンツ生成部は、
前記プロンプトテンプレートデータベースから前記文字列の入力受け付け、前記設定値と前記文字列に基づいて前記説明テキストを生成することを特徴とする請求項1に記載のテキスト生成システム。
【請求項8】
前記代表プログラムコード特定部で特定された前記プログラムコード部分から前記モデル情報を学習し、学習した前記モデル情報に基づいて前記設定値を生成するモデル学習部を更に有することを特徴とする請求項1に記載のテキスト生成システム。
【請求項9】
前記コンテンツ生成部は、
前記プログラムコードの前記説明テキストを複数生成することを特徴とする請求項1に記載のテキスト生成システム。
【請求項10】
複数の前記説明テキストに対して所定の順序を付与する出力ランキング部を更に有することを特徴とする請求項9に記載のテキスト生成システム。
(【請求項11】以降は省略されています)

発明の詳細な説明【技術分野】
【0001】
本発明は、テキスト生成システムに関する。
続きを表示(約 1,200 文字)【背景技術】
【0002】
近年は、ローコード・ノーコード開発に代表されるようにソフトウェア開発の自動化の進展が著しい。一方、プログラムコードと同程度に重要な、readmeなどレポジトリ全体に関する説明テキスト(ドキュメンテーション)については、多くの開発者の悩みの種であるにもかかわらず、人手での作成に頼っているのが現状である。
【0003】
レポジトリ全体に関するドキュメンテーションの作成を支援する手段として、静的なテンプレートを開発者に提示し、ユーザの入力に基づきテンプレートを埋めるシステムが知られている。しかし、これらの手段は、あくまでもドキュメンテーション作成の要件を開発者に示すにすぎず、実際に開発者がドキュメンテーションの内容を書くことを支援できない。
【0004】
これに関連する技術として、例えば、特許文献1、非特許文献1がある。
【0005】
特許文献1は、プログラムコードから1つ以上のコードコメントを収集し、該コードコメントを結合することで、レポジトリ全体に関するドキュメンテーションを作成する方法を開示している。
【0006】
非特許文献1は、大規模言語モデルを活用することにより、クラスないしは関数のプログラムコードから該クラスないしは関数のコードコメントを生成するシステムを開示している。
【先行技術文献】
【特許文献】
【0007】
特開2000-163260号公報
【非特許文献】
【0008】
Yue Wang, Weishi Wang, Shafiq Joty and Steven C.H. Hoi. 2021. CodeT5: Identifier-aware Unified Pre-trained Encoder-Decoder Models for Code Understanding and Generation. In Proceedings of the 2021 Conference on Empirical Methods in Natural Language Processing, pp. 8696-8708. Association for Computational Linguistics.
【発明の概要】
【発明が解決しようとする課題】
【0009】
特許文献1は、開発者が記述済みのコードコメントを編纂するに過ぎず、プログラムコード自体からレポジトリ全体に関するドキュメンテーションを作成する方法を開示していない。
【0010】
非特許文献1は、クラスないしは関数のコードコメントの生成は、数十行のプログラムコードから、高々数行の具体性の高い説明テキストを生成することに過ぎない。
(【0011】以降は省略されています)

この特許をJ-PlatPatで参照する
Flag Counter

関連特許

個人
情報提示方法
1か月前
株式会社理研
演算装置
3日前
個人
プログラム
1か月前
個人
プログラム
1か月前
個人
自動精算システム
1か月前
個人
RFタグ読取装置
1か月前
個人
アカウントマップ
1か月前
個人
売買システム
1か月前
個人
管理サーバ
2か月前
個人
日本語入力支援システム
3日前
個人
市場受発注システム
1か月前
個人
AI旅行最適化プラグイン
2日前
個人
発想支援方法及びシステム
1か月前
個人
分類処理プログラム及び方法
1か月前
日本精機株式会社
車両用表示装置
1か月前
個人
案件管理装置および端末装置
17日前
日本精機株式会社
車両用表示装置
1か月前
個人
学習装置及び推論装置
1か月前
富士通株式会社
金融システム
1か月前
井関農機株式会社
ロボット作業車両
1か月前
株式会社発明屋
電池指向の構造設計
24日前
個人
VRによる人体各部位の立体化
2か月前
キヤノン株式会社
情報処理装置
3日前
トヨタ自動車株式会社
管理装置
25日前
個人
ダブルオークションシステム
13日前
富士通株式会社
プロセッサ
23日前
トヨタ自動車株式会社
電気自動車
9日前
株式会社プレニーズ
仲介システム
1か月前
株式会社イズミ
総合代行システム
13日前
個人
販売支援システム
1か月前
トヨタ自動車株式会社
作業評価装置
1か月前
富士通株式会社
予測
16日前
村田機械株式会社
人員配置システム
1か月前
個人
情報処理装置およびプログラム
2か月前
トヨタ自動車株式会社
情報通知方法
1か月前
トヨタ自動車株式会社
作業管理装置
1か月前
続きを見る