TOP
|
特許
|
意匠
|
商標
特許ウォッチ
Twitter
他の特許を見る
10個以上の画像は省略されています。
公開番号
2025019630
公報種別
公開特許公報(A)
公開日
2025-02-07
出願番号
2023123337
出願日
2023-07-28
発明の名称
話者位置検出方法、話者位置検出装置、およびプログラム
出願人
ヤマハ株式会社
代理人
弁理士法人 楓国際特許事務所
主分類
H04N
23/611 20230101AFI20250131BHJP(電気通信技術)
要約
【課題】話者位置を一意に求めることができる話者位置検出方法を提供する。
【解決手段】話者位置検出方法は、話者の音声をマイクで取得し、取得した前記話者の音声に基づいて、前記話者の方向情報を求めて、前記方向情報に基づいて、カメラで取得した画像から前記話者の顔画像を取得し、取得した前記話者の顔画像に基づいて、前記話者の高さ情報を含む位置情報を検出する。
【選択図】図4
特許請求の範囲
【請求項1】
話者の音声をマイクで取得し、
取得した前記話者の音声に基づいて、前記話者の方向情報を求めて、
前記方向情報と、カメラで取得した画像と、に基づいて前記話者の顔画像を取得し、
取得した前記話者の顔画像に基づいて、前記話者の高さ情報を含む位置情報を検出する、
話者位置検出方法。
続きを表示(約 1,200 文字)
【請求項2】
検出した前記話者の位置情報を表示器に表示する、
請求項1に記載の話者位置検出方法。
【請求項3】
前記カメラまたは前記マイクのフォーカス領域を受け付けて、
受け付けた前記フォーカス領域のうち前記方向情報に対応するフォーカス領域に基づいて、前記話者の画像を取得する、
請求項1または請求項2に記載の話者位置検出方法。
【請求項4】
検出した前記話者の位置情報に基づいて、前記カメラまたは前記マイクのフォーカス領域を求めて、
求めた前記フォーカス領域、または前記フォーカス領域以外の非フォーカス領域を表示器に表示する、
請求項1または請求項2に記載の話者位置検出方法。
【請求項5】
検出した前記話者の位置情報に基づいて、前記カメラまたは前記マイクのフォーカス領域を求めて、
求めた前記フォーカス領域に基づいて、前記カメラまたは前記マイクのフォーカス制御を行う、
請求項1または請求項2に記載の話者位置検出方法。
【請求項6】
前記カメラまたは前記マイクのフォーカス制御は、話者以外の顔画像または音声をマスキングする制御を含む、
請求項5に記載の話者位置検出方法。
【請求項7】
前記カメラと前記マイクの相対位置情報を取得し、
前記相対位置情報および前記方向情報に基づいて、前記カメラの画像における前記話者の方向を求め、
前記カメラの画像における前記話者の方向に基づいて、前記カメラで取得した画像から前記話者の顔画像を取得する、
請求項1または請求項2に記載の話者位置検出方法。
【請求項8】
前記カメラと前記マイクの相対位置情報を取得し、
前記方向情報は、前記マイクからの仰角および水平角を含み、
前記方向情報、前記相対位置情報、および前記高さ情報に基づいて、前記カメラの仰角、水平角、および拡大量を求める、
請求項1または請求項2に記載の話者位置検出方法。
【請求項9】
前記話者の位置情報は、複数の話者の位置情報を含む、
請求項1または請求項2に記載の話者位置検出方法。
【請求項10】
イベントの開始および終了を検知し、
前記イベントの終了を検知した時、前記位置情報をリセットし、
前記イベントの開始を検知した時、その時点で取得した前記話者の音声に基づいて、前記話者の方向情報を求めて、前記方向情報に基づいて、カメラで取得した画像から前記話者の顔画像を取得し、取得した前記話者の顔画像に基づいて、前記話者の高さ情報を含む位置情報を検出する、
請求項1または請求項2に記載の話者位置検出方法。
(【請求項11】以降は省略されています)
発明の詳細な説明
【技術分野】
【0001】
本発明の一実施形態は、話者位置検出方法、話者位置検出装置、およびプログラムに関する。
続きを表示(約 1,300 文字)
【背景技術】
【0002】
特許文献1には、テレビカメラ・超音波センサ・赤外線センサ等のいずれか1つのセンサからの入力信号を処理して人物位置を検出し、マイクロホンアレイからの入力信号を処理して音源位置を検出し、前記2種類の情報を合わせて処理することにより、話者位置を判定する、話者位置の判定方法が開示されている。
【先行技術文献】
【特許文献】
【0003】
特開平11-41577号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
特許文献1の判定方法は、話者の高さ情報を考慮していないため、カメラ画像上に話者位置を一意に求めることができていない。
【0005】
そこで、本発明の一実施形態は、話者位置を一意に求めることができる話者位置検出方法を提供することを目的とする。
【課題を解決するための手段】
【0006】
話者位置検出方法は、話者の音声をマイクで取得し、取得した前記話者の音声に基づいて、前記話者の方向情報を求めて、前記方向情報に基づいて、カメラで取得した画像から前記話者の顔画像を取得し、取得した前記話者の顔画像に基づいて、前記話者の高さ情報を含む位置情報を検出する。
【発明の効果】
【0007】
本発明の一実施形態によれば、話者位置を一意に求めることができる。
【図面の簡単な説明】
【0008】
話者位置検出装置1の構成を示すブロック図である。
話者位置検出装置1が設置された室内の立面図である。
話者位置検出装置1が設置された室内の平面図である。
制御部12の動作を示すフローチャートである。
表示器に表示されるユーザインタフェースの一例を示す図である。
変形例1に係るユーザインタフェースの一例を示す図である。
非フォーカス領域を表示する場合のユーザインタフェースの一例を示す図である。
変形例2に係るユーザインタフェースの一例を示す図である。
変形例3に係るユーザインタフェースの一例を示す図である。
変形例4に係るユーザインタフェースの一例を示す図である。
変形例5における話者位置検出装置1が設置された室内の立面図である。
変形例5における話者位置検出装置1が設置された室内の立平面図である。
変形例11に係るユーザインタフェースの一例を示す図である。
変形例11に係るユーザインタフェースの一例を示す図である。
表示器に表示されるユーザインタフェースの一例を示す図である。
【発明を実施するための形態】
【0009】
図1は、話者位置検出装置1の構成を示すブロック図である。図2は、話者位置検出装置1が設置された室内の立面図模式であり、図3は平面模式図である。
【0010】
話者位置検出装置1は、カメラ11、制御部12、フラッシュメモリ14、RAM15、ユーザインタフェース(I/F)16、スピーカ17、複数のマイク18A~18D、および通信I/F19を備えている。
(【0011】以降は省略されています)
この特許をJ-PlatPatで参照する
関連特許
個人
インターホンシステム
20日前
個人
ヘッドホンカバー
2か月前
株式会社奥村組
通信設備
27日前
オムロン株式会社
通信装置
27日前
BoCo株式会社
聴音装置
2か月前
キヤノン株式会社
電子機器
29日前
キヤノン株式会社
撮像装置
3か月前
キヤノン株式会社
電子機器
1か月前
キヤノン株式会社
電子機器
1か月前
BoCo株式会社
聴音装置
2か月前
日本精機株式会社
車両用の撮像装置
1か月前
キヤノン電子株式会社
画像読取装置
28日前
キヤノン電子株式会社
画像読取装置
1か月前
キヤノン電子株式会社
画像読取装置
3か月前
キヤノン電子株式会社
画像読取装置
28日前
キヤノン株式会社
画像読取装置
6日前
個人
電子透かし埋め込み及び抽出方法
10日前
日本放送協会
無線伝送システム
1か月前
株式会社ベアリッジ
携帯無線機
3か月前
日本無線株式会社
無線受信装置
10日前
キヤノン株式会社
映像表示装置
2か月前
リオン株式会社
聴取装置
1か月前
株式会社小糸製作所
画像照射装置
1か月前
キヤノン電子株式会社
画像読取システム
1か月前
キヤノン電子株式会社
画像読取システム
28日前
シャープ株式会社
表示装置
2か月前
株式会社アーク
情報処理システム
2か月前
株式会社Move
イヤホン
1か月前
日本放送協会
送信装置及び受信装置
24日前
日本放送協会
送信装置及び受信装置
24日前
個人
共鳴管型スピーカーエンクロージャー
24日前
株式会社国際電気
無線通信システム
1か月前
株式会社オカムラ
電子機器支持什器
1か月前
株式会社JVCケンウッド
撮像装置
2か月前
キヤノン株式会社
画像形成システム
2か月前
株式会社日立国際電気
試験システム
2か月前
続きを見る
他の特許を見る