TOP特許意匠商標
特許ウォッチ Twitter
10個以上の画像は省略されています。
公開番号2024085624
公報種別公開特許公報(A)
公開日2024-06-27
出願番号2022200233
出願日2022-12-15
発明の名称複数の手順を表す文書についての構造化データを生成する装置及び方法
出願人株式会社日立製作所
代理人弁理士法人サンネクスト国際特許事務所
主分類G06F 16/23 20190101AFI20240620BHJP(計算;計数)
要約【課題】複数の手順を表す文書について精度の良い構造化データを生成する。
【解決手段】データ処理装置は、複数の手順を表す文書についての構造化データの更新後構造化データを生成する処理である構造化更新処理を行う。構造化データは、複数のエンティティノードと一つ又は複数のエッジとを含むグラフを表すグラフデータである。複数のエンティティノードの各々は、文書におけるエンティティを表現したノードである。構造化更新処理は、タクソノミを用いた表現でノード及びエッジの少なくとも一つの更新を定義したデータである更新定義データと、前記構造化データ又はその複製が表すグラフである構造化グラフにおける少なくとも一つのエンティティノードのタクソノミとを基に、当該構造化グラフを更新することを含む。更新後構造化データは、構造化グラフの更新後のグラフを表すデータである。
【選択図】図25

特許請求の範囲【請求項1】
複数の手順を表す文書についての構造化データが格納された記憶装置と
前記記憶装置に接続されており、更新後構造化データを生成する処理である構造化更新処理を行う演算装置と
を備え、
前記構造化データは、複数のエンティティノードと一つ又は複数のエッジとを含むグラフを表すグラフデータであり、
前記複数のエンティティノードの各々は、文書におけるエンティティを表現したノードであり、
前記構造化更新処理は、タクソノミを用いた表現でノード及びエッジの少なくとも一つの更新を定義したデータである更新定義データと、前記構造化データ又はその複製が表すグラフである構造化グラフにおける少なくとも一つのエンティティノードのタクソノミとを基に、当該構造化グラフを更新することを含み、
前記更新後構造化データは、前記構造化グラフの更新後のグラフを表すデータである、
データ処理装置。
続きを表示(約 2,800 文字)【請求項2】
タクソノミは、エンティティのタクソノミであるエンティティタクソノミと、エンティティタクソノミのタクソノミである関係性タクソノミとのうちのいずれかであり、
前記更新定義データは、一つ又は複数のグラフパターンを表すグラフパターンデータを含み、
前記一つ又は複数のグラフパターンの各々は、当該グラフパターンに該当のグラフ構造又はそのサマリであるパターン条件と、前記該当のグラフ構造の補完処理とを含み、
前記構造化更新処理は、グラフ汎化処理とグラフ更新処理とを含み、
前記グラフ汎化処理は、前記構造化データが表すグラフを、複数の汎化ノードと一つ又は複数のエッジとを含む汎化グラフに変換することを含み、
前記複数の汎化ノードの各々は、エンティティノードが表現するエンティティのエンティティタクソノミ又は関係性タクソノミを表現したノード、或いは、エンティティノードの複製であり、
前記グラフ更新処理は、
前記汎化グラフが適合するパターン条件を含んだグラフパターンにおける補完処理を前記汎化グラフに行うことで前記汎化グラフを更新することと、
前記構造化グラフのグラフ構造を更新後の汎化グラフ通りのグラフ構造とすることで前記更新後構造化データを生成することと
を含む、
請求項1に記載のデータ処理装置。
【請求項3】
前記構造化更新処理は、前記構造化グラフに一つ又は複数のタクソノミノードを関連付けた統合グラフを生成するグラフ統合処理を含み、
前記構造化グラフが表す複数のエンティティノードの各々について、当該エンティティノードが表現するエンティティについて一つ以上のタクソノミがある場合に、前記統合グラフにおいて、当該一つ以上のタクソノミノードが関連付けられており、
各タクソノミノードは、タクソノミを表現したノードであり、
前記演算装置は、前記グラフ統合処理の後に、前記グラフ汎化処理を行い、
各エンティティノードについて、前記汎化グラフにおける汎化ノードは、前記統合グラフにおいて当該エンティティノードに関連付けられているタクソノミノードに対応する、
請求項2に記載のデータ処理装置。
【請求項4】
エンティティタクソノミと関係性タクソノミが関連付けられたエンティティについて、前記統合グラフでは、
当該エンティティのエンティティノードの子ノードが、エンティティタクソノミのタクソノミノードであり、
当該タクソノミノードの子ノードが、当該エンティティの関係性タクソノミのタクソノミノードであり、
前記汎化グラフのグラフ構造は、前記統合グラフのグラフ構造に基づく、
請求項3に記載のデータ処理装置。
【請求項5】
エンティティタクソノミ及び関係性タクソノミの少なくとも一つについて複数種類のタクソノミがあり、
汎化グラフに関する複数種類の補完処理の各々について、使用されるタクソノミの種類が定義されており、
前記グラフ汎化処理は、前記複数種類の補完処理の各々について、前記構造化グラフを、当該補完処理に対応の種類に属するタクソノミを表現した汎化ノードを含む汎化グラフに変換することを含む、
請求項2に記載のデータ処理装置。
【請求項6】
前記複数のグラフパターンの各々について、当該グラフパターンが、前記複数種類の補完処理のうちのいずれかの種類の補完処理を含み、
前記複数種類の補完処理は、下記のうちの二種類以上の補完処理を含む、
・汎化グラフを分離する分離処理、
・或る手順に対応の汎化ノードの親ノード又は子ノードとして当該或る手順の前手順に対応の汎化ノードの複製を採用する複製処理、
・汎化ノードの親ノード又は子ノードとして新たな汎化ノードを追加する追加処理、
・同一の分類メタタクソノミが関連付けられている異なる汎化ノード又はその子汎化ノードを統合する統合処理、
・エッジの接続先又は接続元の汎化ノードを別の汎化ノードとするエッジ張り替え処理、
請求項5に記載のデータ処理装置。
【請求項7】
前記汎化グラフが適合するパターン条件とは、前記汎化グラフと当該パターン条件との類似度が類似度の閾値以上であることである、
請求項2に記載のデータ処理装置。
【請求項8】
前記更新定義データは、文書部分間又は文書間の主従関係を表す主従関係データと、主の文書部分又は文書と従属の文書部分又は文書との差分に従うグラフ更新方法を前記従属の文書部分又は文書について表す更新方法データとを含み、
前記構造化データが前記主の文書部分又は文書に対応している場合、前記構造化更新処理は、
前記主の文書部分又は文書に対応の前記従属の文書部分又は文書を前記主従関係データから特定することと、
前記構造化データの複製が表す構造化グラフを、前記更新方法データが表す前記グラフ更新方法に従い更新することで、前記更新後構造化データを生成することと
を含む、
請求項1に記載のデータ処理装置。
【請求項9】
前記更新定義データは、名寄せ種類毎に名寄せ前のエンティティと名寄せ後のタクソノミとを表す名寄せ定義データを含み、
前記構造化更新処理は、前記構造化データの複製が表す構造化グラフのうち、前記名寄せ前のエンティティに対応のエンティティノードを、前記名寄せ後のタクソノミを表現したノードに更新することで、前記更新後構造化データを生成することを含む、
請求項1に記載のデータ処理装置。
【請求項10】
前記演算装置が、
前記文書から、前記複数の手順に関連する表現をエンティティとして抽出し、
前記エンティティのカテゴリを分類し、
一つ以上の前記エンティティから構成され、一つの前記手順に対応するエンティティグループを複数生成し、
前記エンティティグループの各々について、前記エンティティグループに含まれる一つ以上の前記エンティティのカテゴリに基づいて、前記エンティティグループに対応する前記手順を特徴づける前記エンティティである主エンティティを特定し、
前記主エンティティ間の関係性に基づいて、前記複数の手順の順序を判定する第1順序判定処理を実行し、
前記第1順序判定処理の結果に基づいて、前記複数の手順の順序を決定し、
前記構造化データとして、順序づけされた前記エンティティグループに関する情報を生成する、
請求項1に記載のデータ処理装置。
(【請求項11】以降は省略されています)

発明の詳細な説明【技術分野】
【0001】
本発明は、概して、複数の手順を表す文書についての構造化データの生成に関する。
続きを表示(約 1,300 文字)【背景技術】
【0002】
近年、様々な分野において、複数の手順からなる業務プロセスを、AIを用いて支援、効率化、及び最適化等をしたいというニーズが顕在化している。例えば、産業分野では、装置の操作手順のリコメンド、及び装置の故障に対するプロセスのリコメンドを行うAIが実用化され、医療分野では、診断、治療、及び投薬行為の支援を行うAIが実用化され、素材分野では、新素材の合成プロセスのリコメンドを行うAIが実用化されている。
【0003】
AIを用いた業務プロセスの支援等を実現するためには、一般に業務プロセスを情報処理が可能なデータを用意する必要がある。しかし、業務プロセスに関わる情報は、自然言語で記載された文書(装置の保守報告書、医療カルテ、実験報告書など)として蓄積されている場合が多いため、そのままでは情報処理が困難である。したがって、文書に記載された情報を情報処理が可能な構造化データに変換する必要がある。
【0004】
図24A及び図24Bは、業務プロセスの構造化のイメージを記す図である。図24Aは保守に係る業務プロセスの構造化のイメージを表し、図24Bは物質製造に係る業務プロセスの構造化のイメージを表す。
【0005】
手動で文書から構造化データを生成するためには、莫大な時間と専門知識とが必要である。そのため、自動で文書から構造化データを生成する技術が望まれている。これに対して、特許文献1及び非特許文献1に記載の技術が知られている。
【0006】
特許文献1には、「語句抽出条件学習部と、語句抽出部と、語句関係抽出条件学習部と、語句関係抽出部と、出力部と、を備える」文書理解支援装置が記載されている。また、「語句抽出条件学習部は、各語句に付与された特徴量に基づく学習により、支援用電子文書から語句を抽出するための語句抽出条件を生成する」こと、「語句抽出部は、語句抽出条件を満たす語句を抽出する」こと、「語句関係抽出条件学習部は、抽出対象語句関係に対する特徴量に基づく学習により、支援用電子文書から関係語句を抽出するための語句関係抽出条件を生成する」こと、「語句関係抽出部は、語句関係抽出条件を満たす語句関係を抽出する」ことが記載されている。
【0007】
非特許文献1には、食材と操作の係り受けや手順番号などを特徴としたルールを用いて順序を認識することにより、構造化した料理のレシピにおける状態遷移、及び情報補完をする方法が記載されている。
【先行技術文献】
【特許文献】
【0008】
特開2019-79321号公報
【非特許文献】
【0009】
Cooking Scenario-レシピのScenario化とその応用,情報処理学会研究報告データベースシステム(DBS),2003(71(2003-DBS-131)),pp.25-31
【発明の概要】
【発明が解決しようとする課題】
【0010】
特許文献1の技術では、精度を確保するために大量の学習データが必要となる。そのため、学習データが少ない分野では適用が難しい。
(【0011】以降は省略されています)

この特許をJ-PlatPatで参照する

関連特許

個人
暗号化記憶媒体
1か月前
個人
環境情報処理装置
13日前
個人
外食予約システム
13日前
個人
求人支援システム
1か月前
キヤノン電子株式会社
周辺機器
1か月前
個人
求人マッチングサーバ
1か月前
個人
サービス提供システム
6日前
ニデック株式会社
冷却装置
7日前
個人
海外在住支援システム
13日前
カゴメ株式会社
営農支援プログラム
1か月前
カゴメ株式会社
営農支援プログラム
1か月前
カゴメ株式会社
営農支援プログラム
1か月前
カゴメ株式会社
営農支援プログラム
1か月前
個人
施術スタッフ育成システム
今日
株式会社ワコム
電子ペン
1か月前
株式会社ワコム
電子ペン
1か月前
アスエネ株式会社
水管理の方法
1か月前
シャープ株式会社
情報出力装置
28日前
株式会社ワコム
電子ペン
16日前
大日本印刷株式会社
作業台
1か月前
東洋電装株式会社
操作装置
16日前
東洋電装株式会社
操作装置
16日前
株式会社寺岡精工
システム
1か月前
東洋電装株式会社
操作装置
16日前
CKD株式会社
遠隔支援システム
1か月前
学校法人修道学園
農地集約システム
6日前
株式会社SUBARU
操作制御装置
6日前
株式会社SUBARU
画像処理装置
今日
トヨタ紡織株式会社
検査装置
1か月前
株式会社カロニマ
情報発信システム
20日前
日本信号株式会社
料金精算システム
26日前
旭精工株式会社
管理装置および管理システム
6日前
株式会社アジラ
異常行動検出システム
1か月前
BH株式会社
商品販売システム
1か月前
ローム株式会社
電源制御集積回路
13日前
個人
スマートフォンにおける使用料金削減方法
27日前
続きを見る