TOP
|
特許
|
意匠
|
商標
特許ウォッチ
Twitter
他の特許を見る
公開番号
2024157930
公報種別
公開特許公報(A)
公開日
2024-11-08
出願番号
2023072607
出願日
2023-04-26
発明の名称
知識データ生成装置及びプログラム
出願人
日本放送協会
代理人
個人
主分類
G06F
16/36 20190101AFI20241031BHJP(計算;計数)
要約
【課題】様々なコンテンツの連携を実現し、精度の高いコンテンツを提示するためのデータを生成する。
【解決手段】知識データ生成装置1の候補対選択部30は、階層データを用いて、キーワード等の間の距離を算出し、最短距離の対を候補対として選択する。重心位置算出部31は、候補対のスコアに基づいて重心位置Gを算出する。クラスタリング処理部32は、候補対の重心位置Gに偏りがあると判定した場合、重心位置Gから遠い候補を削除し、偏りがないと判定した場合、新たなクラスタを生成し、階層データを更新する。クラスタリング処理部32は、階層データに含まれるキーワード及びクラスタの数が1個に減少するまで前述の処理を繰り返し、クラスタリング結果を生成する。キーワード選択処理部23は、予め設定された制限数に応じて、クラスタリング結果からクラスタリング後のキーワードを選択し、知識データを生成する。
【選択図】図3
特許請求の範囲
【請求項1】
コンテンツに関するキーワードを求め、所望のコンテンツを検索する際に用いる知識データを生成する知識データ生成装置において、
前記コンテンツが複数種類のデータにより構成されるものとして、
前記複数種類のデータのそれぞれについて、当該データに応じた所定の処理にて文章の文字列を検出し、前記文章の文字列から前記キーワードを求めるデータ処理部と、
前記データ処理部により前記複数種類のデータについて求めた前記キーワードをスコア化し、同一のキーワード毎に、全ての前記所定の処理を統合したスコアを算出するスコア算出部と、
階層構造化された複数のワードから構成され、かつ前記データ処理部により求めた複数のキーワードを含む階層データを用いて、前記スコア算出部により算出された前記スコアに基づき、前記複数のキーワードのそれぞれについて当該キーワードを削除するか、クラスタを生成するか、または前記クラスタを削除するか、の階層クラスタリング処理を行い、前記階層データを構成する前記複数のキーワードを含む前記複数のワードから、クラスタリング後のキーワードを選択し、前記クラスタリング後のキーワードを含む前記知識データを生成するキーワード選択部と、
を備えたことを特徴とする知識データ生成装置。
続きを表示(約 1,900 文字)
【請求項2】
前記キーワード選択部は、
前記階層クラスタリング処理を行い、前記階層データに含まれる前記複数のキーワードから、前記クラスタリング後のキーワードを選択し、前記知識データを生成する、ことを特徴とする請求項1に記載の知識データ生成装置。
【請求項3】
前記キーワード選択部は、
前記階層クラスタリング処理を行い、前記階層データに含まれる前記複数のキーワードについての上位概念の複数のワードから、前記クラスタリング後のキーワードを選択し、前記知識データを生成する、ことを特徴とする請求項1に記載の知識データ生成装置。
【請求項4】
前記キーワード選択部は、
前記階層クラスタリング処理が行われた1または複数のキーワード及び1または複数のクラスタにおけるそれぞれの間の前記階層データ上の距離を算出し、前記距離が最短となる前記1または複数のキーワード及び前記1または複数のクラスタのうちの2つを候補対として選択する候補対選択部と、
前記候補対選択部により選択された前記候補対の前記スコアに基づいて、前記候補対の重心位置を算出する重心位置算出部と、
前記重心位置算出部により算出された前記重心位置に基づいて、前記候補対のうち当該重心位置から遠い方の候補を前記階層データから削除するか、または前記候補対をクラスタ化して新たなクラスタを生成するか、の前記階層クラスタリング処理を行い、前記階層データを更新し、
前記階層データ内に1つの前記キーワードまたは1つの前記クラスタが残るまで、前記候補対選択部による前記候補対を選択する処理、前記重心位置算出部による前記重心位置を算出する処理、及び前記階層クラスタリング処理を行って前記階層データを更新する処理を繰り返し、更新後の前記階層データに基づいてクラスタリング結果を求めるクラスタリング処理部と、
前記クラスタリング処理部により求めた前記クラスタリング結果から、前記クラスタリング後のキーワードを選択し、前記知識データを生成するキーワード選択処理部と、
を備えたことを特徴とする請求項1に記載の知識データ生成装置。
【請求項5】
前記クラスタリング処理部は、
前記階層クラスタリング処理を行う際に、
前記重心位置から前記候補対の一方までの第1距離を求めると共に、前記重心位置から前記候補対の他方までの第2距離を求め、
前記第1距離及び前記第2距離のうちの長い方が予め設定された第1設定値以上であり、かつ前記第1距離及び前記第2距離のうちの短い方が予め設定された第2設定値以下である場合、偏りがあると判定し、前記候補対のうち前記長い方に対応する候補を前記階層データから削除し、
前記長い方が前記第1設定値未満であるか、または前記短い方が前記第2設定値よりも大きい場合、偏りがないと判定し、前記候補対をクラスタ化して新たなクラスタを生成する、ことを特徴とする請求項4に記載の知識データ生成装置。
【請求項6】
前記キーワード選択処理部は、
予め設定された制限数に応じて、前記クラスタリング結果から前記クラスタリング後のキーワードを選択し、前記知識データを生成する、ことを特徴とする請求項4に記載の知識データ生成装置。
【請求項7】
コンテンツに関するキーワードを求め、所望のコンテンツを検索する際に用いる知識データを生成する知識データ生成装置を構成するコンピュータを、
前記コンテンツが複数種類のデータにより構成されるものとして、
前記複数種類のデータのそれぞれについて、当該データに応じた所定の処理にて文章の文字列を検出し、前記文章の文字列から前記キーワードを求めるデータ処理部、
前記データ処理部により前記複数種類のデータについて求めた前記キーワードをスコア化し、同一のキーワード毎に、全ての前記所定の処理を統合したスコアを算出するスコア算出部、及び、
階層構造化された複数のワードから構成され、かつ前記データ処理部により求めた複数のキーワードを含む階層データを用いて、前記スコア算出部により算出された前記スコアに基づき、前記複数のキーワードのそれぞれについて当該キーワードを削除するか、クラスタを生成するか、または前記クラスタを削除するか、の階層クラスタリング処理を行い、前記階層データを構成する前記複数のキーワードを含む前記複数のワードから、クラスタリング後のキーワードを選択し、前記クラスタリング後のキーワードを含む前記知識データを生成するキーワード選択部として機能させるためのプログラム。
発明の詳細な説明
【技術分野】
【0001】
本発明は、コンテンツを検索するためのデータベースを生成する技術に関する。
続きを表示(約 1,100 文字)
【背景技術】
【0002】
従来、コンテンツ同士を意味的に結び付けることでコンテンツを連携させ、ユーザの所望するコンテンツを提示する技術の開発が進められている。コンテンツを連携させる技術とは、コンテンツ同士を繋げる技術である。
【0003】
例えば教育分野において、ユーザによる自発的な学習を補助するために、現在使用しているコンテンツに関連するコンテンツを提示する手法が開示されている(例えば、特許文献1及び非特許文献1を参照)。
【0004】
一般に、指導者がユーザの習熟度を完全にかつ適切に把握することは困難であり、ユーザ自身の習熟度に合わせて、ユーザの自発的な学習が求められる。一方で、学習に使用するコンテンツも電子教材の普及に伴い、多種多様なものが作られている。
【0005】
ユーザは、自学自習する際に、多様なコンテンツの中から自分に合ったものを検索する必要があり、習熟度に応じたコンテンツ検索方法が所望されていた。つまり、ユーザの自発的な学習を補助するために、現在の学習に使用しているコンテンツから、これに関連するコンテンツを提示することが可能な手法が所望されていた。
【0006】
このような手法の例として、特許文献1には、学習指導要領を元に学習領域を定め、その中から学年、教科及び教科書単元に基づいて、レコメンド教材のコンテンツをユーザへ提示する手法が開示されている。
【0007】
また、非特許文献1には、教科書に記載されている各単元の導入部に基づいて、学習順序及び学習系統を構造化し、構造化されたデータを用いてユーザに学習支援を行う手法が開示されている。
【0008】
このようなコンテンツ提示手法は、ユーザの学習に対する習熟度の差が大きいという状況を考慮したものである。例えば、一斉授業のような画一的な教育方法では、ユーザの習熟度に合った教育を提供することができないため、このコンテンツ提示手法が用いられる。
【0009】
一方で、コンテンツを連携させるためのキーワードを生成する手法が開示されている(例えば、非特許文献2,3を参照)。この手法は、画像、音声及び字幕を入力データとしてオブジェクトを抽出し、オブジェクトから算出したメタデータのリスト化及びスコア化を行い、スコアが最大のキーワードを選択するものである。
【先行技術文献】
【特許文献】
【0010】
特開2015-18159号公報
【非特許文献】
(【0011】以降は省略されています)
この特許をJ-PlatPatで参照する
関連特許
日本放送協会
ルータ
10か月前
日本放送協会
受信装置
12か月前
日本放送協会
撮像装置
9か月前
日本放送協会
撮像装置
10か月前
日本放送協会
撮像装置
5か月前
日本放送協会
撮像装置
6か月前
日本放送協会
撮像素子
11か月前
日本放送協会
衛星追尾装置
9か月前
日本放送協会
液晶表示装置
2か月前
日本放送協会
視聴予測装置
9か月前
日本放送協会
符号化撮像装置
9か月前
日本放送協会
光制御デバイス
3か月前
日本放送協会
カメラ正対治具
6か月前
日本放送協会
バックプレーン
9か月前
日本放送協会
磁性細線メモリ
10か月前
日本放送協会
機械学習システム
9か月前
日本放送協会
レンズアダプター
10日前
日本放送協会
情報提示システム
5か月前
日本放送協会
有機光電変換素子
3か月前
日本放送協会
360度撮影装置
5か月前
日本放送協会
垂直分離型撮像素子
2か月前
日本放送協会
LDM送信システム
5か月前
日本放送協会
撮像素子の製造方法
11か月前
日本放送協会
3次元映像表示装置
6か月前
日本放送協会
データ管理システム
7か月前
日本放送協会
三次元撮像システム
8か月前
日本放送協会
光バイパススイッチ
11か月前
日本放送協会
撮像装置及び撮像方法
5か月前
日本放送協会
撮像素子及び撮像装置
3か月前
日本放送協会
送信装置及び受信装置
8か月前
日本放送協会
送出装置及び受信装置
3か月前
日本放送協会
送信装置及び受信装置
3か月前
日本放送協会
送信装置及び受信装置
2か月前
日本放送協会
送信装置及び受信装置
9か月前
日本放送協会
表示端末、プログラム
7か月前
日本放送協会
送信装置及び受信装置
10か月前
続きを見る
他の特許を見る