TOP
|
特許
|
意匠
|
商標
特許ウォッチ
Twitter
他の特許を見る
公開番号
2025130744
公報種別
公開特許公報(A)
公開日
2025-09-09
出願番号
2024027989
出願日
2024-02-28
発明の名称
特許調査システム及び特許調査システムの性能評価方法
出願人
国立大学法人静岡大学
,
合同会社MODE・CREATE
代理人
弁理士法人コスモス国際特許商標事務所
,
個人
主分類
G06Q
50/18 20120101AFI20250902BHJP(計算;計数)
要約
【課題】特許公報の明細書テキストを学習して、特許公報間の一致度や類似度を評価する特許公報専用の言語モデルを作成する場合、熟練の特許技術者の知見を活用して大量に学習用のデータを用意する必要がある。
【解決手段】着目した特許公報80の特許請求の範囲の請求項毎のテキストと、調査対象特許公報90の特許請求の範囲の請求項ごとのテキストとの類似度を計算する言語モデルに基づく文章エンコーダ1を用いた特許調査システム10において、文章エンコーダ1は、着目した特許公報80の筆頭に記載されたIPC分類のセクション記号が同一である多数の特許公報の請求の範囲と明細書のテキストから、分割部20でストップワードを削除し、言語モデルの入力制限のトークン数の1/4以下の句読点毎で分割されたセグメントに分割し、セグメントを用いて再学習する。
【選択図】図4
特許請求の範囲
【請求項1】
着目した特許公報の特許請求の範囲の請求項ごとのテキストと、調査対象特許公報の特許請求の範囲の請求項ごとのテキストとの類似度を計算する言語モデルに基づく文章エンコーダを用いた特許調査システムにおいて、前記文章エンコーダは、前記着目した特許公報の筆頭に記載されたIPC分類のセクション記号が同一である多数の特許公報の請求の範囲と明細書のテキストを、分割部で、ストップワードを削除し、言語モデルの入力制限のトークン数の1/4以下の句読点ごとで分割されたセグメントに分割し、前記セグメントを用いて再学習されたことを特徴とする特許調査システム。
続きを表示(約 760 文字)
【請求項2】
前記着目した特許公報及び前記調査対象特許公報の特許請求の範囲のテキストを請求項ごとに、セグメント及び対応するセグメント記号を作成する前記分割部と、前記セグメントから前記文章エンコーダを用いて文章ベクトルの集合を生成するベクトル生成部と、前記着目した特許公報のセグメントごとの文章ベクトルの集合と、前記調査対象特許公報のセグメントごとの文章ベクトルの集合との組み合わせごとのcos類似度を演算する類似度演算部と、前記セグメントの組み合わせと対応する前記cos類似度に基づく前記類似度を、前記セグメント記号の組み合わせごとに表示する表示部と、を備えたことを特徴とする請求項1に記載の特許調査システム。
【請求項3】
前記調査対象特許公報が複数件である場合、前記着目した特許公報と前記調査対象特許公報の1件ごとに前記類似度に基づくスコアを計算し、前記調査対象特許公報を、前記スコアに基づいて表示する表示部を備えたことを特徴とする請求項1または請求項2に記載の特許調査システム。
【請求項4】
前記請求項3に記載の特許調査システムの性能評価方法おいて、着目した特許公報を選定し、拒絶理由通知書または検索報告書など特許情報プラットフォームにおいて、前記着目した特許公報と引用または被引用の関係で関係づけられた複数の特許公報を選定して調査対象特許公報の正解データとし、更に前記調査対象特許公報の検査データとして、前記着目した特許公報の筆頭に記載されたIPC分類のセクション、クラス、サブクラス、及びメイングループが同一の複数の特許公報を選定し、前記着目した特許公報、前記正解データ、及び前記検査データからなるテストセットを用いることを特徴とする特許調査システムの性能評価方法。
発明の詳細な説明
【技術分野】
【0001】
製造業の技術部での製品設計や、研究所での研究開発においては、新規に開発する製品や要素技術との関連性が高い他社の国内外の特許公報を把握する上では、過去に遡って調査する遡及調査(テーマ調査、または技術動向調査とも言う)に加えて、毎週、毎月の定期的なSDI(Selective Dissemination of Information)検索などによる定期調査が欠かせない。本発明は、特定の技術テーマとの関連性ある国内外の第三者の特許公報を、調査する特許調査システムにおいて、新規の第三者特許を調査する実務を効率化するための、言語モデルに基づく文章エンコーダを用いた「特許調査システム、及び特許調査システムの性能評価方法」に関する。
続きを表示(約 2,100 文字)
【背景技術】
【0002】
近年、言語モデルの急速な発展に伴って、これを特許調査に利用しようとする様々な試みが行われている。例えば、言語モデルの1つとして、BERT(Bidirectional Encoder Representations from Transformers)が知られている。BERTは、トランスフォーマー(Transformer)と呼ばれるアーキテクチャが組み込まれた汎用的な大規模言語モデルであり、テキストを対象とする様々なタスクを実現するための自然言語処理技術の一つであり、Wikipedia(登録商標)などの特定の分野に偏らないテキストで構成された汎用的なデータを用いて事前学習された言語モデルが公開されている。実用上は、特定の専門分野への適合性を高めるために、その特定の専門分野に関する相対的に少量のデータにより再学習(これをファインチューニングともいう)して利用される。
【0003】
特許文献1では、言語モデルBERTを利用して文献調査の対象である特許請求の範囲の請求項(以下「対象文」という)を取り込んで、トークン単位(単語やフレーズなどのテキスト単位)に分解し、これらのトークン単位で一致点を検出して、対象文と引用文献の候補である特許文献の参照文とを比較して、対象文のトークンのうち、参照文に記載されている部分を一致点と判定する調査支援方法が紹介されている。
【0004】
この言語モデルのファインチューニングには特許審決書類が用いられている。特許審決書類には特許審査における本願と引例との(一致点)、(相違点)が明確に記載されているため、BERTモデルに入力するための対象箇所の抽出が容易であるというメリットがある。しかし、特許審決書類は出願公開されている特許公報の量に比して多くないため、ファインチューニングを行うには十分な量とは言い難い。
【0005】
また、特許審査書類を学習データとして利用する上では、特許審決書類のように(一致点)、(相違点)の見出しがないため多くの人手によるコストと手間を要するため、BERTモデルをファインチューニングして十分な性能を発揮するための学習データの確保に難がある。
【0006】
特許文献2は、特許文献の請求項文書を分析し、特許明細書間の類似性を評価する方法であり、特許明細書の請求項テキストを形態素解析して単語単位に分割し、分割された単語の分散表現を利用してベクトル化した後、LSTM(Long Short-Term Memory)によって請求項テキストをテンソル(多次元配列)に変換して特許公報の類似度を評価する試みが述べられている。しかし、特許公報は大きく8個のIPC分類に分かれているように技術内容が多岐にわたり、同じ単語でもIPC分類が異なれば、違った意味で使われることもあるため、単語のベクトル化だけで特許公報の類似性を評価するには十分とは言い難い。ここで、特許公報とは特許公報(特許公報がない場合は特許公開公報)をいう。
【先行技術文献】
【特許文献】
【0007】
特開2020-181529号公報
特開2022-052212号公報
【発明の概要】
【発明が解決しようとする課題】
【0008】
以上、特許公報の明細書テキストを学習して、その意味と内容を理解する手法はいくつか提案されているが、特許公報間の類似度を評価する特許公報専用の言語モデルを作成する場合、特許公報のもつ高度な専門性を踏まえて単語や文節の意味を理解させる上で、これらの言語モデルの学習には、熟練の特許技術者の知見も活用して大量に学習用のデータを用意する必要があり、人手によるコストがかかるのが難点である。
【0009】
そこで、本開示では、国際特許分類(以下、IPC分類という)に着目し、熟練の特許技術者の知見や手間を必要としないで機械的に多数の特許公報を収集し、8個のIPC分類別に多数の特許公報で言語モデルをファインチューニングした各々8個の文章エンコーダを用いた特許調査システムを提案する。
【課題を解決するための手段】
【0010】
上記課題を解決するためになされた本開示の一形態は、着目した特許公報の特許請求の範囲の請求項ごとのテキストと、調査対象特許公報の特許請求の範囲の請求項ごとのテキストとの類似度を計算する言語モデルに基づく文章エンコーダを用いた特許調査システムにおいて、文章エンコーダは、着目した特許公報の筆頭に記載されたIPC分類のセクション記号が同一である多数の特許公報の請求の範囲と明細書のテキストを、分割部で、ストップワードを削除し、言語モデルの入力制限のトークン数の1/4以下の句読点ごとで分割されたセグメントに分割し、セグメントを用いて再学習されたことを特徴とする特許調査システムを特徴とする。
(【0011】以降は省略されています)
この特許をJ-PlatPat(特許庁公式サイト)で参照する
関連特許
国立大学法人静岡大学
半導体装置を製造する方法
2日前
国立大学法人静岡大学
画像処理システム及び画像処理方法
3か月前
国立大学法人静岡大学
情報処理装置、方法、プログラム、及びシステム
18日前
国立大学法人静岡大学
推定システム、推定プログラム、および推定方法
1か月前
横河電機株式会社
ガス測定装置およびガス測定方法
3か月前
国立大学法人静岡大学
特許調査システム及び特許調査システムの性能評価方法
3日前
国立大学法人静岡大学
還元型酸化グラフェン膜の形成方法、還元型酸化グラフェン膜及び物品
3か月前
KDDI株式会社
報酬設定装置、報酬設定方法、及び報酬設定プログラム
2か月前
国立大学法人静岡大学
貴金属含有材料を製造する方法、貴金属含有材料、膜電極接合体及び燃料電池
3か月前
高圧ガス工業株式会社
CNT製品の製造方法
3日前
KDDI株式会社
メッセージ配信装置、メッセージ配信方法、及びメッセージ配信プログラム
2か月前
ダイキン工業株式会社
有機化合物の製造方法
2か月前
国立大学法人広島大学
ライトフィールド三次元トラッキング制御装置、方法およびプログラムならびにライトフィールド顕微鏡システム
9日前
個人
裁判のAI化
1か月前
個人
フラワーコートA
1か月前
個人
情報処理システム
2か月前
個人
工程設計支援装置
28日前
個人
検査システム
2か月前
個人
介護情報提供システム
1か月前
個人
冷凍食品輸出支援構造
8日前
個人
為替ポイント伊達夢貯
8日前
個人
表変換編集支援システム
1日前
個人
携帯情報端末装置
29日前
個人
設計支援システム
1か月前
個人
設計支援システム
1か月前
個人
不動産売買システム
2か月前
キヤノン電子株式会社
携帯装置
2か月前
個人
知財出願支援AIシステム
8日前
個人
結婚相手紹介支援システム
25日前
株式会社サタケ
籾摺・調製設備
2か月前
個人
パスワード管理支援システム
1日前
個人
AIによる情報の売買の仲介
10日前
株式会社カクシン
支援装置
1か月前
個人
行動時間管理システム
3日前
個人
アンケート支援システム
1か月前
個人
AIキャラクター制御システム
1日前
続きを見る
他の特許を見る