TOP
|
特許
|
意匠
|
商標
特許ウォッチ
Twitter
他の特許を見る
10個以上の画像は省略されています。
公開番号
2025019754
公報種別
公開特許公報(A)
公開日
2025-02-07
出願番号
2023123553
出願日
2023-07-28
発明の名称
集計表統合システムおよびプログラム
出願人
株式会社アンド・ディ
代理人
個人
主分類
G06Q
99/00 20060101AFI20250131BHJP(計算;計数)
要約
【課題】どのような作業者でも手間や時間をかけることなく、容易に集計表の統合を行うことができる集計表統合システムを提供する。
【解決手段】集計表統合システム10では、要素間類似度算出手段24により、異なる時点の集計表について、表頭要素間および表側要素間の類似度を算出することで、意味内容が対応している表頭要素や表側要素を決定し、その後、集合間類似度算出手段25により、意味内容が対応している表頭要素や表側要素を同一要素とみなして表頭要素集合間および表側要素集合間の類似度を算出し、異なる時点の集計表の統合の可否を判断し、統合可能と判断された場合には、統合手段26により、統合集計表を作成する。
【選択図】図1
特許請求の範囲
【請求項1】
異なる時点の集計表を統合する処理を実行するコンピュータにより構成された集計表統合システムであって、
集計表ファイルに書き込まれている統合対象の前記異なる時点の集計表のそれぞれの表頭部を構成する複数の表頭要素の各々の文字列間の類似度を示す表頭要素間類似度を算出し、算出した表頭要素間類似度と予め設定した閾値とを比較することにより、前記異なる時点の集計表間で意味内容が対応している表頭要素どうしを決定するとともに、統合対象の前記異なる時点の集計表のそれぞれの表側部を構成する複数の表側要素の各々の文字列間の類似度を示す表側要素間類似度を算出し、算出した表側要素間類似度と予め設定した閾値とを比較することにより、前記異なる時点の集計表間で意味内容が対応している表側要素どうしを決定する要素間類似度算出手段と、
この要素間類似度算出手段により決定した、前記異なる時点の集計表間で意味内容が対応している表頭要素どうしを同一要素とみなし、前記表頭部を構成する複数の表頭要素からなる表頭要素集合間の類似度を示す表頭要素集合間類似度を算出し、算出した表頭要素集合間類似度と予め設定した閾値とを比較するとともに、前記異なる時点の集計表間で意味内容が対応している表側要素どうしを同一要素とみなし、前記表側部を構成する複数の表側要素からなる表側要素集合間の類似度を示す表側要素集合間類似度を算出し、算出した表側要素集合間類似度と予め設定した閾値とを比較し、前記表頭要素集合間類似度および前記表側要素集合間類似度の双方が高いか否かにより前記異なる時点の集計表の統合の可否を判断する集合間類似度算出手段と、
この集合間類似度算出手段により統合可能と判断した前記異なる時点の集計表のそれぞれの集計データのうち、表頭要素および表側要素の双方について前記異なる時点の集計表間で意味内容が対応している場合の当該表頭要素および当該表側要素についての集計データどうしを、縦方向または横方向に隣接配置することにより統合集計表を作成する統合処理を実行する統合手段と
を備えたことを特徴とする集計表統合システム。
続きを表示(約 4,100 文字)
【請求項2】
前記集計表ファイルに書き込まれている前記異なる時点のそれぞれについて複数存在する集計表の中から、統合対象とする前記異なる時点の集計表を検出する統合対象検出手段を備え、
この統合対象検出手段は、
(1)前記異なる時点の集計表のそれぞれについて、前記表頭部を構成する複数の表頭要素の各々の文字列を連結した表頭要素連結文字列および/または表頭タイトルの文字列を含む表頭部文字列と、前記表側部を構成する複数の表側要素の各々の文字列を連結した表側要素連結文字列および/または表側タイトルの文字列を含む表側部文字列とを連結した表頭部・表側部連結文字列を作成し、作成した前記異なる時点の集計表の表頭部・表側部連結文字列を用いて、前記集合間類似度算出手段で使用する類似度算出用のアルゴリズムとは異なるアルゴリズムにより、前記異なる時点の集計表の表頭部および表側部の類似度を示す表頭部・表側部類似度を算出し、算出した表頭部・表側部類似度と予め設定した閾値とを比較し、前記表頭部・表側部類似度が高いか否かにより、統合対象とする前記異なる時点の集計表を検出するか、または、
(2)前記異なる時点の集計表のそれぞれの前記表頭部を構成する複数の表頭要素の各々の文字列を連結した表頭要素連結文字列および/または表頭タイトルの文字列を含む表頭部文字列を用いて、前記集合間類似度算出手段で使用する類似度算出用のアルゴリズムとは異なるアルゴリズムにより、前記異なる時点の集計表の表頭部の類似度を示す表頭部類似度を算出し、算出した表頭部類似度と予め設定した閾値とを比較するとともに、前記異なる時点の集計表のそれぞれの前記表側部を構成する複数の表側要素の各々の文字列を連結した表側要素連結文字列および/または表側タイトルの文字列を含む表側部文字列を用いて、前記異なるアルゴリズムにより、前記異なる時点の集計表の表側部の類似度を示す表側部類似度を算出し、算出した表側部類似度と予め設定した閾値とを比較し、前記表頭部類似度および前記表側部類似度の双方が高いか否かにより、統合対象とする前記異なる時点の集計表を検出する構成とされ、
前記要素間類似度算出手段は、
前記統合対象検出手段により検出した前記異なる時点の集計表を統合対象として処理を実行する構成とされている
ことを特徴とする請求項1に記載の集計表統合システム。
【請求項3】
異なる時点の集計表を統合する処理を実行するコンピュータにより構成された集計表統合システムであって、
集計表ファイルに書き込まれている前記異なる時点のそれぞれについて複数存在する集計表の中から、統合対象とする前記異なる時点の集計表を検出する統合対象検出手段と、
この統合対象検出手段により検出した統合対象の前記異なる時点の集計表のそれぞれの表頭部を構成する複数の表頭要素の各々の文字列間の類似度を示す表頭要素間類似度を算出し、算出した表頭要素間類似度と予め設定した閾値とを比較することにより、前記異なる時点の集計表間で意味内容が対応している表頭要素どうしを決定するとともに、統合対象の前記異なる時点の集計表のそれぞれの表側部を構成する複数の表側要素の各々の文字列間の類似度を示す表側要素間類似度を算出し、算出した表側要素間類似度と予め設定した閾値とを比較することにより、前記異なる時点の集計表間で意味内容が対応している表側要素どうしを決定する要素間類似度算出手段と、
前記統合対象検出手段により検出した統合対象の前記異なる時点の集計表のそれぞれの集計データのうち、表頭要素および表側要素の双方について前記異なる時点の集計表間で意味内容が対応している場合の当該表頭要素および当該表側要素についての集計データどうしを、縦方向または横方向に隣接配置することにより統合集計表を作成する統合処理を実行する統合手段とを備え、
前記統合対象検出手段は、
(1)前記異なる時点の集計表のそれぞれについて、前記表頭部を構成する複数の表頭要素の各々の文字列を連結した表頭要素連結文字列またはこの表頭要素連結文字列に表頭タイトルの文字列を加えた表頭部文字列と、前記表側部を構成する複数の表側要素の各々の文字列を連結した表側要素連結文字列またはこの表側要素連結文字列に表側タイトルの文字列を加えた表側部文字列とを連結した表頭部・表側部連結文字列を作成し、作成した前記異なる時点の集計表の表頭部・表側部連結文字列を用いて、前記異なる時点の集計表の表頭部および表側部の類似度を示す表頭部・表側部類似度を算出し、算出した表頭部・表側部類似度と予め設定した閾値とを比較し、前記表頭部・表側部類似度が高いか否かにより、統合対象とする前記異なる時点の集計表を検出するか、または、
(2)前記異なる時点の集計表のそれぞれの前記表頭部を構成する複数の表頭要素の各々の文字列を連結した表頭要素連結文字列またはこの表頭要素連結文字列に表頭タイトルの文字列を加えた表頭部文字列を用いて、前記異なる時点の集計表の表頭部の類似度を示す表頭部類似度を算出し、算出した表頭部類似度と予め設定した閾値とを比較するとともに、前記異なる時点の集計表のそれぞれの前記表側部を構成する複数の表側要素の各々の文字列を連結した表側要素連結文字列またはこの表側要素連結文字列に表側タイトルの文字列を加えた表側部文字列を用いて、前記異なる時点の集計表の表側部の類似度を示す表側部類似度を算出し、算出した表側部類似度と予め設定した閾値とを比較し、前記表頭部類似度および前記表側部類似度の双方が高いか否かにより、統合対象とする前記異なる時点の集計表を検出する構成とされていることを特徴とする集計表統合システム。
【請求項4】
前記集計表ファイルには、異なる時点のそれぞれについて複数の集計表からなる集計表群が書き込まれるとともに、これらの集計表群のそれぞれの目次情報として、前記集計表群を構成する各集計表について前記表頭部を構成する表頭タイトルと、前記表側部を構成する表側タイトルと、集計表識別情報とが対応付けられて書き込まれ、
前記目次情報を用いて、前記集計表群の中に分割可能な集計表としての合体集計表が含まれている場合に、この合体集計表を、分割することができない集計表としての単位集計表に分割する分割手段を備え、
この分割手段は、
前記目次情報の中で、同一の集計表識別情報に対応付けられた状態で、同一の表頭タイトルに複数の表側タイトルが対応付けられているか、または同一の表側タイトルに複数の表頭タイトルが対応付けられているか否かを判断することにより、前記集計表群の中に前記合体集計表が含まれているか否かを判断し、前記合体集計表が含まれていると判断した場合には、前記目次情報のうちの前記合体集計表の部分を、前記目次情報内で、1つの表頭タイトルおよび1つの表側タイトルに対応付けられた前記単位集計表に分割し、
前記異なる時点のうちの一方の時点の前記集計表群の中に含まれている前記合体集計表を前記目次情報内で分割して得られた前記単位集計表の表頭タイトルおよび表側タイトルの各文字列を連結した連結タイトル文字列と、他方の時点の前記集計表群の中に含まれている前記合体集計表を前記目次情報内で分割して得られた前記単位集計表または最初から前記単位集計表の状態になっている集計表の表頭タイトルおよび表側タイトルの各文字列を連結した連結タイトル文字列とを用いて、前記目次情報内のタイトルレベルでの前記単位集計表の類似度を示す目次内タイトル類似度を算出し、算出した目次内タイトル類似度と予め設定した閾値とを比較することにより、他方の時点の前記集計表群の中に、目次内タイトル類似度が高い前記単位集計表があるか否かを判断し、目次内タイトル類似度が高い前記単位集計表がある場合には、前記目次情報内での前記合体集計表から前記単位集計表への分割に従って、一方の時点の前記集計表群の中に含まれている前記合体集計表のデータを前記単位集計表のデータに分割する構成とされている
ことを特徴とする請求項1~3のいずれかに記載の集計表統合システム。
【請求項5】
前記要素間類似度算出手段は、
前記集合間類似度算出手段により前記異なる時点の集計表を統合することができないと判断された場合に、
前記異なる時点の集計表のうちの一方の時点の集計表について前記表頭部と前記表側部とを縦横入れ替えた状態についても、前記表頭要素間類似度および前記表側要素間類似度を算出し、算出した前記表頭要素間類似度および前記表側要素間類似度と予め設定したそれぞれの閾値とを比較することにより、前記異なる時点の集計表間で意味内容が対応している表頭要素どうしおよび表側要素どうしを決定する構成とされている
ことを特徴とする請求項1または2に記載の集計表統合システム。
【請求項6】
表頭要素または表側要素となり得る文字列であって、互いに包含関係にある上位および下位の文字列を対応付けて記憶する包含関係記憶手段を備え、
前記統合手段は、
統合する集計表の表頭要素または表側要素の中に、前記包含関係記憶手段に記憶されている互いに包含関係にある上位および下位の文字列の双方が存在する場合には、これらの上位および下位の文字列を、前記統合集計表の表頭要素として横方向に隣接配置するか、または表側要素として縦方向に隣接配置する構成とされている
ことを特徴とする請求項1~3のいずれかに記載の集計表統合システム。
【請求項7】
請求項1~3のいずれかに記載の集計表統合システムとして、コンピュータを機能させるためのプログラム。
発明の詳細な説明
【技術分野】
【0001】
本発明は、異なる時点の集計表を統合する処理を実行するコンピュータにより構成された集計表統合システムおよびプログラムに係り、例えば、集計表作成システムにより異なる時点のローデータ(raw data)からそれぞれ自動作成された異なる時点の集計表のデータがあるときに、それらの集計表のデータを比較することができるように配置して統合する場合等に利用できる。
続きを表示(約 3,300 文字)
【背景技術】
【0002】
一般に、アンケート調査や物件調査等の各種の調査で収集したデータを用いて、幾つのサンプル(何人の人または何個の物)が該当するのかを示す度数表示による集計表や、何%のサンプル(何%の人または物)が該当するのかを示す割合表示による集計表が作成される。
【0003】
例えば、図16に示すように、調査後には、先ず、ローデータ(raw data)が作成される。ローデータとは、何も加工されていない状態の調査結果を示す生データという意味であり、図16の例では、1サンプル(1人の回答者)についての各調査項目に対する回答データが1行で表現され、横方向に並んでいる。具体的には、例えば、1番上の行(調査項目を記載したタイトル行を除く。)には、サンプルID=S0001(特許太郎)の回答データが並んでいて、Q1=「はじめに、あなたについて教えてください 出身高校の所在地はどちらですか」という調査項目に対し、12(東京都)という回答データが記載され、Q2=「あなた自身の、進路選びについて教えてください 偏差値の高さ」という調査項目に対し、1(大変重視していた)という回答データが記載され、Q3=「あなた自身の、進路選びについて教えてください 知名度の高さ」という調査項目に対し、3(どちらでもない)という回答データが記載され、Q4=「〇〇大学で合格した学科」という調査項目に対し、複数選択可であるから、各学科に合格したか否かを示すフラグ形式(1,0形式)の回答データが記載されている。
【0004】
また、その下側には、集計表ID(集計表識別情報)=[N0001]の集計表の例が示されている。この集計表は、表中の上端部に設けられた表頭(ひょうとう)要素および表頭タイトルにより構成される表頭部(表頭タイトルがないこともあるが、その場合でも表頭部と呼ぶものとする。)と、表中の左端部に設けられた表側(ひょうそく)要素および表側タイトルにより構成される表側部(表側タイトルがないこともあるが、その場合でも表側部と呼ぶものとする。)とを備えている。そして、横方向に並ぶ各表頭要素(青森県、東京都等)と、縦方向に並ぶ各表側要素(児童学科、英文学科等)とで形成されるマトリックス(行列)を埋める各データは、いずれも集計データであり、本願では、これらの集計データの集合またはその配置位置を、表頭部や表側部と区別して、集計データ部と呼ぶことがある。また、「集計データ」ではなく、「集計表のデータ」(「統合集計表のデータ」、「合体集計表のデータ」等も同様である。)というときは、表頭部、表側部、集計データ部を合わせた集計表全体のデータを指す。なお、この集計表は、度数表示(人数表示)による集計表の例であるが、割合表示(人数の%表示)としても、表頭部、表側部、集計データ部の呼び名は同じである。
【0005】
さらに、ローデータから作成される集計表には、単純集計表と、クロス集計表とがあり、図16の集計表は、クロス集計表の例である。
【0006】
前者の単純集計表は、アンケート調査等により収集したデータ(各調査項目に対する回答データ)を、調査項目毎に集計するものである。具体的には、図16のローデータを使用し、例えば、ある1つの集計対象の調査項目として、Q1=「はじめに、あなたについて教えてください 出身高校の所在地はどちらですか」を選択したとすると、これに対する回答データが、1(青森県)の人は何人、2(岩手県)の人は何人、3(宮城県)の人は何人、…といった集計データを作成するのが、単純集計(Grand Total)であり、それを表形式で現したものが、単純集計表(GT表)である。従って、この単純集計表の場合、表頭要素または表側要素のいずれか一方として、1(青森県)、2(岩手県)、3(宮城県)等が並ぶだけであり、表頭要素が横方向に並び、かつ、表側要素が縦方向に並ぶ状態にはならないため、本発明の適用対象の集計表にはならない。
【0007】
後者のクロス集計表は、アンケート調査等により収集したデータ(各調査項目に対する回答データ)を用いて、複数の調査項目(に対する回答)をかけ合せて集計するものである。従って、表頭要素は、ある調査項目に対する回答であり、表側要素も、別の調査項目に対する回答である。具体的には、図16の集計表に示すように、表頭要素である「千葉県」、「東京都」等は、ある調査項目に対する回答であり、表側要素である「児童学科」、「食物学科」等も、別の調査項目に対する回答であり、これらをかけ合わせた集計データが作成される。出身高校の所在地が「千葉県」の人が、全体で103人いて、そのうち「児童学科」に合格した人が14人いて、「食物学科」に合格した人が3人いる等である。また、出身高校の所在地が「東京都」の人が、全体で326人いて、そのうち「児童学科」に合格した人が28人いて、「食物学科」に合格した人が7人いる等である。
【0008】
ところで、このようなアンケート調査等は、時間の経過に伴う変化を計測するために行われるものであるから、例えば、毎年、毎月、四半期ごとに行われる等、繰り返し行われることが多く、毎回の調査目的、調査方法、調査項目等は、殆ど変わらない場合が多い。従って、時点(時期)を変えて繰り返し行われる集計表のデータを統合し、それらの異なる時点のデータを、人が目で見て比較し易いように配置した統合集計表を作成できれば便利である。
【0009】
一方、従来より、異なる時点のローデータを統合してから、集計表を作成する作業が行われている。異なる時点のローデータを統合すると、各時点のサンプル(図16の例では、回答者)が縦方向に並び、行数(サンプル数)が増えた状態になる。この場合、各時点のサンプルに重なりがないか、または重なりがあっても、違うサンプルとみなして(図16の例では、2019年のサンプルである特許太郎と、2020年のサンプルである浪人した特許太郎とは、別のサンプルであるとみなして)統合することになる。従って、統合された単純集計表(GT表)を作成する場合には、集計処理が容易になる。但し、ここで容易になると言っている集計処理は、複数の時点のローデータを通算する処理であり、例えば、2019年と2020年とのローデータとを縦方向に並べて連結し、2年間を1つにまとめた通算の人数を求めるための集計処理である。しかし、2019年の集計人数と、2020年の集計人数とを比較するための統合集計表を作成する場合には、結局、時点毎(図16の例では、年度毎)の集計処理が必要になるので、複数の時点のローデータを縦方向に並べて統合しても、効果的な集計処理を行うことができるわけではない。つまり、統合という用語の意味に、データの通算と、データの対比表示とがあるとすれば、後者の意味の統合を行う場合は、ローデータを縦方向に並べる統合は、殆ど役に立たない。
【0010】
また、各時点の集計表が、単純集計表(GT表)ではなく、クロス集計表の場合には、複数の調査項目をかけ合わせた集計を行うので、この場合も同様に、複数の時点のローデータを通算する処理を行うのであれば、複数の時点のローデータを縦方向に並べて連結してから(例えば、2019年と2020年とのローデータとを縦方向に並べて連結してから)、クロス集計表を作成する意味はある。しかし、異なる時点のクロス集計表のデータ、例えば、2019年のクロス集計表のデータと、2020年のクロス集計表のデータとを比較するための統合集計表を作成する場合には、結局、時点毎(図16の例では、年度毎)の集計処理が必要になるので、複数の時点のローデータを縦方向に並べて統合しても、効果的な集計処理を行うことができるわけではない。
(【0011】以降は省略されています)
この特許をJ-PlatPatで参照する
関連特許
個人
情報提示方法
20日前
個人
自動精算システム
28日前
個人
プログラム
19日前
個人
RFタグ読取装置
1か月前
個人
自動精算システム
2か月前
個人
アカウントマップ
13日前
個人
プログラム
12日前
個人
売買システム
1か月前
個人
管理サーバ
1か月前
個人
発想支援方法及びシステム
23日前
個人
市場受発注システム
26日前
日本精機株式会社
車両用表示装置
1か月前
個人
分類処理プログラム及び方法
23日前
個人
学習装置及び推論装置
12日前
キヤノン株式会社
印刷装置
2か月前
日本精機株式会社
車両用表示装置
1か月前
井関農機株式会社
ロボット作業車両
28日前
株式会社発明屋
電池指向の構造設計
6日前
富士通株式会社
金融システム
20日前
個人
VRによる人体各部位の立体化
1か月前
個人
未来型家系図構築システム
1か月前
キヤノン株式会社
情報処理装置
1か月前
トヨタ自動車株式会社
推定装置
1か月前
トヨタ自動車株式会社
管理装置
7日前
株式会社SEKT
文字認識装置
1か月前
株式会社プレニーズ
仲介システム
13日前
富士通株式会社
プロセッサ
5日前
トヨタ自動車株式会社
表認識装置
1か月前
トヨタ自動車株式会社
作業管理装置
26日前
ブラザー工業株式会社
無線通信装置
26日前
個人
販売支援システム
28日前
トヨタ自動車株式会社
情報通知方法
26日前
トヨタ自動車株式会社
作業評価装置
1か月前
トヨタ自動車株式会社
作業評価装置
1か月前
富士通株式会社
情報処理プログラム
1か月前
トヨタ自動車株式会社
画像処理装置
1か月前
続きを見る
他の特許を見る