TOP
|
特許
|
意匠
|
商標
特許ウォッチ
Twitter
他の特許を見る
10個以上の画像は省略されています。
公開番号
2025006320
公報種別
公開特許公報(A)
公開日
2025-01-17
出願番号
2023107033
出願日
2023-06-29
発明の名称
情報処理システム
出願人
AICRO株式会社
代理人
個人
主分類
G06F
40/117 20200101AFI20250109BHJP(計算;計数)
要約
【課題】前後の文脈を含めた構造化及び/又は時間の経過に伴う内容の変化等の把握が容易にできるように非構造化テキスト情報を構造化するための情報処理システムを提供する。
【解決手段】情報処理システムは、構造化手段と、表示処理手段とを含み、構造化手段は、非構造テキスト情報に構造化モデルを適用して構造化された単語を抽出し、構造化された単語に対し、当該単語の情報の種類を分類した情報種別を付与し、さらに文の構成における単語の役割又は機能によって分類した複数のラベルの何れかを付与し、非構造テキスト情報内に含まれる構造化された単語を複数のラベルのそれぞれに対応した複数のセルを含むテーブルに格納し、テーブルを一つのデータ単位として記憶する。表示処理手段は、複数のデータ単位の間で、同一又は共通の構造化された単語が含まれている場合、同一又は共通の構造化された単語が揃うように複数のデータ単位を並べて表示する。
【選択図】図12
特許請求の範囲
【請求項1】
同一又は共通の事象に関する記載が存在しうる複数の非構造テキスト情報を構造化するための情報処理システムであって、
構造化手段と、表示処理手段とを含み、
前記構造化手段は、
前記非構造テキスト情報に構造化モデルを適用して構造化された単語を抽出し、
前記構造化された単語に対し、当該単語の情報の種類を分類した情報種別を付与し、さらに文の構成における単語の役割又は機能によって分類した複数のラベルの何れかを付与し、
前記非構造テキスト情報内に含まれる構造化された単語を複数のラベルのそれぞれに対応した複数のセルを含むテーブルに格納し、前記テーブルを一つのデータ単位として記憶し、
前記表示処理手段は、前記構造化された単語を前記データ単位ごとに表示するものであって、
さらに、複数のデータ単位の間で、同一又は共通の構造化された単語が含まれている場合、前記同一又は共通の構造化された単語が揃うように前記複数のデータ単位を並べて表示する、
情報処理システム。
続きを表示(約 1,500 文字)
【請求項2】
前記複数のラベルは、主題のラベルを含むことを特徴とする、請求項1に記載の情報処理システム。
【請求項3】
非構造化テキスト情報を構造化するための情報処理システムであって、
構造化手段と、表示処理手段とを含み、
前記構造化手段は、
前記非構造テキスト情報に構造化モデルを適用して構造化された単語を抽出し、
前記構造化された単語に対し、当該単語の情報の種類を分類した情報種別を付与し、さらに主題のラベルを含む複数のラベルの何れかを付与し、
前記非構造テキスト情報内に含まれる構造化された単語の中で、前記主題のラベル以外のラベルを付与された単語(主題以外の単語)を、前記主題のラベルを付与された単語(主題の単語)の何れか一つに関連付けて格納し、前記主題の単語と、それに関連付けられた前記主題以外の単語とを一つのデータ単位として記憶し、
前記表示処理手段は、前記構造化された単語を前記データ単位ごとに表示する、
情報処理システム。
【請求項4】
前記非構造テキスト情報は、同一又は共通の事象に関する記載が存在しうる複数の非構造テキスト情報を有し、
前記構造化手段は、前記主題の単語と、それに関連付けられた前記主題以外の単語とを前記複数のラベルのそれぞれに対応した複数のセルを含むテーブルに格納し、
前記表示処理手段は、複数のデータ単位の間で、同一又は共通の構造化された単語が含まれている場合、前記同一又は共通の構造化された単語が揃うように前記複数のデータ単位を並べて表示する、請求項3に記載の情報処理システム。
【請求項5】
前記表示処理手段は、前記主題の単語に関し、出現回数が多いものを含むデータ単位から順に並び替えて表示する、又は出現回数が多いものを含むデータ単位を別に表示する、請求項4に記載の情報処理システム。
【請求項6】
前記表示処理手段は、前記主題の単語に関し、出現回数が少ないものを含むデータ単位を表示対象から削除する、又は出現回数が少ないものを含むデータ単位を別に表示する、請求項3に記載の情報処理システム。
【請求項7】
前記非構造化テキスト情報は、医療関係の文書情報の一部であり、
前記複数のラベルは、
(1)主題のラベルと、
(2)値のラベル、評価のラベル、回数のラベル及び/又は部位のラベルと、並びに
(3)時制のラベル、及び/又は日時のラベルと、
を含む、請求項1乃至6の何れか1項に記載の情報処理システム。
【請求項8】
前記表示処理手段は、出現回数が多い単語を含むデータ単位から順に並び替えて表示する、又は出現回数が多い単語を含むデータ単位を区別して表示する、請求項1乃至6の何れか1項に記載の情報処理システム。
【請求項9】
前記表示処理手段は、単語、情報種別、ラベル及びデータ単位の一つ又は複数に対して設定された表示設定に基づいて、前記データ単位の順番を並び替えて表示する、前記データ単位を区別して表示する、又は前記データ単位を表示対象から削除する、請求項1乃至6の何れか1項に記載の情報処理システム。
【請求項10】
前記情報種別の少なくとも一部に対し、複数の情報種別を包含する大分類が設定されており、
前記表示処理手段は、前記大分類に分けてデータ単位を表示する、請求項1乃至6の何れか1項に記載の情報処理システム。
(【請求項11】以降は省略されています)
発明の詳細な説明
【技術分野】
【0001】
本発明は、自由入力されるテキスト情報のような非構造化テキスト情報を構造化するための情報処理システムに関し、特に同一又は共通の事象に関するテキスト情報であって、時間の経過を伴って複数回自由入力されるテキスト情報を構造化する情報処理システムに関する。
続きを表示(約 3,700 文字)
【背景技術】
【0002】
近年、様々な医療機関において作成される電子カルテ情報をビッグデータとして蓄積し、統計情報データベースとして、医療分野の研究開発に利用したり、他の医療機関における処置や検査内容を参考情報として利用したりする試みがなされている。しかし、現状、収集・活用できる医療情報は元々構造化されて電子カルテ等に入力された項目(病名、薬剤情報、検査情報等)に限られており、テキスト情報として自由入力される症状の経過や状態を表した非構造化情報は活用できる状況となっていない。病名、薬剤情報、検査情報等は、保険請求等にも使用されるものであり、画一的なものであるから、入力内容が予め固定されており、主にプルダウンメニューなどによる選択や、マスタからの選択などによって行われ、情報が構造化されており、多数の電子カルテから収集した情報が共通しているため利活用が容易である。一方、症状の経過や状態は、患者の主訴及び医師の所見として自由なテキスト情報として入力されており、入力者によって表現が違うこと、独自の略称が使用されていること、入力内容が定まっていないこと等、電子カルテの診療録の入力において記載のルールがなく、利活用できる形式で整理されていない。
【0003】
かかる状況を踏まえ、非構造化医療情報を活用するための取り組みがなされてはいる。例えば、特許文献1には、電子カルテの自由入力欄に自由入力されたテキスト情報に対し、あらかじめ定めた情報種別を検出することで切り出したテキスト情報について、その情報種別に対応する対象情報を、係り受け解析、文脈解析、若しくはニューラルネットワークを用いた学習モデルによる機械学習のいずれか一以上の自然言語解析処理、又は照合辞書を用いて抽出し、抽出した対象情報を情報種別ごとにテーブル形式で格納して構造化情報とすることが開示されている。
【0004】
医療情報の利活用の一つとして、特に医薬品や医療機器等の臨床開発においてレジストリデータが注目されている。レジストリとは、特定の疾患や健康状態等について、治療内容、治療経過などの医療情報や健康情報を収集するデータベースであり、医薬品研究開発に係るコストの低減や期間の短縮を目的として、レジストリデータを二次利用した研究開発のニーズが高まっている。レジストリデータとしては、登録単位が患者である患者レジストリ(patient registry)が知られており、患者が何の疾患でどのような状態かなど、特定の病気、疾患群、治療等の医療情報が収集される。患者レジストリは疾患レジストリ(disease registry)と呼ばれることもある。また、医療情報の利活用の一つとして、医療機関の業務に、医療関係の文書(電子カルテ、診断書、紹介状、介護の計画書、指示書など)作成がある。それらの文書は、医師や医療機関従事者が電子カルテ等に記載される情報をもとに、作成をしている。それらの業務は現状手作業で作成をしており時間がかかっており、医療従事者の業務時間を圧迫している要因にもなっている。
【0005】
また、ビッグデータは、医療分野以外にも様々な分野において利用され始めている。ビッグデータは、様々な事業に役立つ知見を導出するためのデータであり、出所が多様なデータ群である。ビッグデータは、例えば、各地域における天候、気温、湿度のデータ、オンラインショッピングサイトやブログサイトにおいて蓄積される購入履歴やエントリー履歴、ウェブ上の配信サイトで提供される音楽や動画等のマルチメディアデータ、ソーシャルメディアにおいて参加者が書き込むプロフィールやコメント等のソーシャルメディアデータ、GPS、ICカードやRFIDにおいて検知される、位置、乗車履歴、温度等のセンサーデータ、CRM(Customer Relationship Management)システムにおいて管理されるダイレクトメールのデータや会員カードデータ等カスタマーデータなどがある。
【先行技術文献】
【特許文献】
【0006】
特開2020-086541号公報
【発明の概要】
【発明が解決しようとする課題】
【0007】
特許文献1では、ある患者のある診察時に入力された電子カルテの中に自由入力されたテキスト情報から、重要と判断された特定の対象情報(例えば、情報種別として「現病歴」、「既往歴」、「内服薬」、「身体所見」、「来院後経過」などがあり、それらに対応する対象情報として、情報種別「現病歴」には「症状」、情報種別「既往歴」には既往歴としての「病名」、情報種別「内服薬」には「薬剤名」、情報種別「来院後経過」には診断名としての「病名」など)を情報種別ごとに抽出して構造化しているだけである。このため、自由入力されたテキスト情報の中に特定の対象情報が含まれているか否かを単に検索するだけであれば可能であるが、自由入力されたテキスト情報の内容や意味、対象情報同士の関係等の情報の一部又は全部が失われてしまう虞があり、治療の内容や経過が把握できなくなる場合があった。例えば、ある治療法Aに関する記載であっても、治療法Aを「実施した」のか、「過去に実施した」のか、「将来実施することを決定した」のか、「実施することを検討した」のか、「ある条件を満たせば実施する」のかと様々な文脈で使用されるため、構造化することにより「治療法A」という単語が電子カルテに記載されていることが認識できたとしても、それだけでは、医療情報として不十分・不確実なものであり、利用が困難であった。また、特許文献1には、対象情報として、症状や病名に対する陽性陰性表現や付加情報を備考欄に症状や病名に対応付けて格納することも記載されているが、備考欄に格納される情報には情報種別が付与されておらず、構造化されていなかった。
【0008】
さらに、特許文献1には、ある診察時のテキスト情報を構造化することしか開示されていない。実際の電子カルテは、ある患者について、これまでの診察の内容や治療の経緯が時系列に蓄積されているところ、構造化されても時系列に変化する治療内容、治療経過などを把握できることが望ましい。例えば、癌などに代表される長期間の治療や経過観察が必要な疾患では、数年に渡って治療が継続することが珍しくないため、そのカルテ診療録は膨大で複雑なものとなる。このため、膨大な情報の中から、必要とする情報を選択して整理するのは非常に手間のかかる作業であった。また、上記のとおり、過去に実施したことが記載されていたり、将来実施する予定のものが記載されていたりするため、単に医療上重要そうなキーワードだけを抽出しても、必ずしも実際の治療の経緯を把握することができず、各キーワードの時間軸を正しく理解して正しく構造化することが困難であった。最終的に求められるレジストリやフォーマットに必要な情報を抽出するにあたっても、構造化した情報を共通又は関連する事象ごとに時系列に整理することが望まれる。しかし、特許文献1には、時系列に変化する内容に関する特別な配慮はされておらず、時系列推移を伴う非構造化情報を、時系列の整理を踏まえて構造化する方法は開示されていなかった。
【0009】
また、電子カルテに限らず、他のビッグデータにおいても、自由入力されたテキスト情報の中に同一又は共通する事象について、時間の経過を伴って定期的又は不定期に複数回にわたって入力されることがある。そのようなテキスト情報について、単に特定の単語を抽出して、規格化又は標準化して構造化するだけではなく、前後の文脈を含めた構造化及び/又は時間の経過に伴う内容の変化等の把握が容易にできるような構造化が求められている。
【0010】
本発明は、前述した問題に鑑みてなされてものであって、前後の文脈を含めた構造化及び/又は時間の経過に伴う内容の変化等の把握が容易にできるように非構造化テキスト情報を構造化するための情報処理システムを提供することを目的の一つとする。また、本発明は、電子カルテを含む医療関係の文書情報(電子カルテに限定されず診断書、紹介状、介護の計画書、指示書等の文書ならびに電子カルテ以外に保存された非構造テキストも含む)に入力された非構造化テキスト情報を構造化し、レジストリデータとして利用しやすくするため、臨床研究や治験で必要なデータフォーマットに再抽出すること、構造化した情報をもとに医療関係の文書を作成するなど、カルテ情報を利活用する際に重要な情報を別システムやニューラルネットワークを用いたテキスト生成モデルなどで利活用が容易な情報処理システムを提供することを目的の一つとする。
【課題を解決するための手段】
(【0011】以降は省略されています)
この特許をJ-PlatPatで参照する
関連特許
個人
情報提示方法
28日前
個人
自動精算システム
1か月前
個人
RFタグ読取装置
1か月前
個人
プログラム
27日前
個人
プログラム
20日前
個人
アカウントマップ
21日前
個人
売買システム
1か月前
個人
管理サーバ
1か月前
個人
発想支援方法及びシステム
1か月前
個人
市場受発注システム
1か月前
個人
学習装置及び推論装置
20日前
個人
分類処理プログラム及び方法
1か月前
個人
案件管理装置および端末装置
7日前
日本精機株式会社
車両用表示装置
1か月前
日本精機株式会社
車両用表示装置
1か月前
個人
VRによる人体各部位の立体化
1か月前
井関農機株式会社
ロボット作業車両
1か月前
富士通株式会社
金融システム
28日前
株式会社発明屋
電池指向の構造設計
14日前
トヨタ自動車株式会社
管理装置
15日前
株式会社プレニーズ
仲介システム
21日前
個人
ダブルオークションシステム
3日前
富士通株式会社
プロセッサ
13日前
株式会社イズミ
総合代行システム
3日前
ブラザー工業株式会社
無線通信装置
1か月前
富士通株式会社
予測
6日前
個人
情報処理装置およびプログラム
1か月前
トヨタ自動車株式会社
作業管理装置
1か月前
個人
販売支援システム
1か月前
トヨタ自動車株式会社
作業評価装置
1か月前
トヨタ自動車株式会社
情報通知方法
1か月前
村田機械株式会社
人員配置システム
1か月前
トヨタ自動車株式会社
生成装置
28日前
大王製紙株式会社
RFIDタグ
1か月前
AICRO株式会社
情報処理システム
1か月前
トヨタ自動車株式会社
習熟度判定装置
1か月前
続きを見る
他の特許を見る