TOP
|
特許
|
意匠
|
商標
特許ウォッチ
Twitter
他の特許を見る
10個以上の画像は省略されています。
公開番号
2025155703
公報種別
公開特許公報(A)
公開日
2025-10-14
出願番号
2024196060
出願日
2024-11-08
発明の名称
画像読み上げシステム、装置、および方法、ならびに応答出力システム
出願人
マクセル株式会社
代理人
弁理士法人筒井国際特許事務所
主分類
G06F
3/16 20060101AFI20251002BHJP(計算;計数)
要約
【課題】より好適に使用できる画像読み上げ技術を提供する。
【解決手段】ユーザに携帯または装着され、カメラで撮像した画像から対象物を音声で読み上げるデバイス、を備える画像読み上げシステムであって、デバイスが自動的にカメラの映像から所定のタイミングで繰り返し画像をキャプチャし(ステップS2)、キャプチャされた画像を解析して画像内の対象物を表すテキストを含む情報を取得し(ステップS3)、取得した情報に基づいて、所定の判断で、読み上げの対象となる対象物およびテキストを決定し(ステップS4)、決定した対象物を表すテキストの音声読み上げを、デバイスから自動的に所定のタイミングで繰り返し行う(ステップS5)。
【選択図】図4
特許請求の範囲
【請求項1】
ユーザに携帯または装着され、カメラで撮像した画像から対象物を音声で読み上げるデバイス、を備える画像読み上げシステムであって、
前記デバイスが自動的に前記カメラの映像から所定のタイミングで繰り返し画像をキャプチャし、
キャプチャされた画像を解析して画像内の対象物を表すテキストを含む情報を取得し、
取得した情報に基づいて、所定の判断で、読み上げの対象となる対象物およびテキストを決定し、
決定した対象物を表すテキストの音声読み上げを、前記デバイスから自動的に所定のタイミングで繰り返し行う、
画像読み上げシステム。
続きを表示(約 1,500 文字)
【請求項2】
請求項1記載の画像読み上げシステムにおいて、
前記所定のタイミングで繰り返しの画像のキャプチャは、前記ユーザの操作が無くても所定の第1の時間間隔で連続的に実行され、
前記所定のタイミングで繰り返しの音声読み上げは、前記ユーザの操作が無くても所定の第2の時間間隔で連続的に実行される、
画像読み上げシステム。
【請求項3】
請求項1記載の画像読み上げシステムにおいて、
時間軸上、キャプチャされた複数の画像の間での前記対象物の変化を判断し、変化が相対的に大きい対象物を優先するように、前記読み上げの対象となる対象物を決定する、
画像読み上げシステム。
【請求項4】
請求項1記載の画像読み上げシステムにおいて、
前記画像の解析に基づいて、前記デバイスと前記画像内の対象物との相対的な距離または速度を判断し、前記相対的な距離が閾値以内、または前記相対的な速度が閾値以上である対象物を優先するように、前記読み上げの対象となる対象物を決定する、
画像読み上げシステム。
【請求項5】
請求項1記載の画像読み上げシステムにおいて、
前記画像の解析に基づいて、前記対象物の移動方向を考慮して、前記ユーザと前記対象物との接触の可能性を判断し、当該接触を避けるために、前記対象物との接触の可能性が低い空きスペースへ移動させる方向を判断し、前記ユーザを前記空きスペースに移動させる方向に移動させるように前記ユーザにガイドする、
画像読み上げシステム。
【請求項6】
請求項4記載の画像読み上げシステムにおいて、
前記相対的な距離が小さい、または前記相対的な速度が大きいほど、前記ユーザに対する前記対象物の近付き度合いが大きいと判断し、
前記近付き度合いが大きい対象物について、前記近付き度合いに応じて、前記音声読み上げの音量を大きくする、または、音色を変更する、または、アラート音を付与する、
画像読み上げシステム。
【請求項7】
請求項1記載の画像読み上げシステムにおいて、
前記読み上げの対象となる対象物として、予め、特定の対象物が設定され、
前記特定の対象物を優先するように、前記読み上げの対象となる対象物を決定し、
前記特定の対象物は、横断歩道、信号機、および道路標識を有する、
画像読み上げシステム。
【請求項8】
請求項7記載の画像読み上げシステムにおいて、
前記画像の解析に基づいて、前記特定の対象物として前記信号機の信号の状態を判断し、
前記信号が変化したと判断した場合には、前記信号の変化を表す音声読み上げを前記デバイスから行う、
画像読み上げシステム。
【請求項9】
請求項1記載の画像読み上げシステムにおいて、
前記対象物の音声読み上げを所定のタイミングで繰り返し行う際に、時間軸上で同じ対象物について顕著な変化が無い場合には、当該同じ対象物についての音声読み上げを行わないように制御する、
画像読み上げシステム。
【請求項10】
請求項1記載の画像読み上げシステムにおいて、
前記対象物の音声読み上げを所定のタイミングで繰り返し行う際に、時間軸上で同じ対象物について顕著な変化が無い場合には、当該同じ対象物について、変化が無い旨を表す音声読み上げを行うように制御する、
画像読み上げシステム。
(【請求項11】以降は省略されています)
発明の詳細な説明
【技術分野】
【0001】
本開示は、画像・映像からテキスト・文字列等に変換して音声で読み上げる技術に関する。
続きを表示(約 1,700 文字)
【背景技術】
【0002】
カメラで撮影した画像・映像(静止画や動画等を含む)を、AI(人工知能)によって認識・解析し、テキスト・文字列等に変換(言い換えると文章化)して、音声で読み上げる技術(画像読み上げまたは音声読み上げ等と記載する場合がある)がある。そのような技術として、例えば、非特許文献1に示されるような、マイクロソフト社のiphone用のアプリである“Seeing AI”アプリが提供されている。“Seeing AI”アプリでは、カメラで取得した映像をキャプチャした写真画像を、AIによって分析し、テキストに変換して、音声で読み上げる。このような技術は、例えば視覚障碍者の支援等に有効である。
【0003】
また、先行技術例として、特開2000-325389号公報(特許文献1)、特開2006-251596号公報(特許文献2)、特開2017-77446号公報(特許文献3)などがある。
【先行技術文献】
【特許文献】
【0004】
特開2000-325389号公報
特開2006-251596号公報
特開2017-77446号公報
【非特許文献】
【0005】
<URL:https://www.microsoft.com/ja-jp/ai/seeing-ai>,“Seeing AI”
【発明の概要】
【発明が解決しようとする課題】
【0006】
例えば上記“Seeing AI”アプリでは、ユーザがキャプチャ操作をして得られた画像に関して、テキストへの変換が行われる。また、“Seeing AI”アプリでは、「シーン」として、写真を撮影し、キャプチャしたシーンを説明する機能があるとされている。
【0007】
しかしながら、このような技術では、ユーザの歩行時などに、より好適に使用できることに関して、考慮が十分ではなく、改善余地がある。例えば、ユーザによるキャプチャ操作などの操作入力の手間が大きい。ユーザの歩行時に周囲状況が経時的に変化するが、カメラ画像の音声読み上げによって周囲状況を経時的に把握するためには、ユーザが何回も操作入力をしなければならない。また、ユーザの歩行時に、ユーザの前後左右等の方向に様々な対象物がある等、周囲状況が複雑である場合があり、カメラ画像の音声読み上げによって複雑な周囲状況を把握するためには、1つのカメラでは対応が難しい。
【0008】
特許文献1等の先行技術例では、例えばスマートフォンの1つのカメラについて、ユーザによるキャプチャ操作に応じて、画像読み上げ等を行う旨が記載されている。しかしながら、先行技術例では、カメラで撮影した画像から、どのように視覚障碍者を支援すれば好適であるか等について、具体的な実施形態は示されていない。また、先行技術例では、人がカメラを装着して使う場合の好適な実施形態については考慮されていない。また、先行技術例では、それらの実施形態に関して、視覚障碍者支援などの利用シーンに合わせた好適な機能や処理や、ユーザの使い勝手について、考慮が不十分である。
【0009】
本開示の目的は、上記画像読み上げ技術に関して、より好適に使用できる技術を提供することである。
【課題を解決するための手段】
【0010】
本開示のうち代表的な実施の形態は以下に示す構成を有する。一実施の形態は、ユーザに携帯または装着され、カメラで撮像した画像から対象物を音声で読み上げるデバイス、を備える画像読み上げシステムであって、前記デバイスが自動的に前記カメラの映像から所定のタイミングで繰り返し画像をキャプチャし、キャプチャされた画像を解析して画像内の対象物を表すテキストを含む情報を取得し、取得した情報に基づいて、所定の判断で、読み上げの対象となる対象物およびテキストを決定し、決定した対象物を表すテキストの音声読み上げを、前記デバイスから自動的に所定のタイミングで繰り返し行う。
【発明の効果】
(【0011】以降は省略されています)
この特許をJ-PlatPat(特許庁公式サイト)で参照する
関連特許
マクセル株式会社
電源装置
7日前
マクセル株式会社
扁平形電池
14日前
マクセル株式会社
粘着テープ
2日前
マクセル株式会社
放送信号の処理方法
21日前
マクセル株式会社
空中浮遊映像表示装置
1日前
マクセル株式会社
空中浮遊映像表示システム
10日前
マクセル株式会社
応答出力装置およびシステム
8日前
マクセル株式会社
郵便ポストと郵便物取集システム
27日前
マクセル株式会社
応答出力装置および応答出力システム
2日前
マクセル株式会社
樹脂発泡糸の製造方法及びラム押出成形機
1日前
マクセル株式会社
扁平形非水電解液電池およびその製造方法
28日前
マクセル株式会社
放送システム、放送受信装置、放送局装置および放送方法
13日前
マクセル株式会社
情報処理装置
20日前
マクセル株式会社
表示制御方法
20日前
マクセル株式会社
表示制御方法
23日前
マクセル株式会社
伝送波の処理方法
22日前
マクセル株式会社
ヘッドライト装置
23日前
マクセル株式会社
印刷用メタルマスク
13日前
マクセル株式会社
空間浮遊映像表示装置
23日前
マクセル株式会社
画像読み上げシステム、装置、および方法、ならびに応答出力システム
23日前
マクセル株式会社
コンテンツ保護処理方法
23日前
マクセル株式会社
コンテンツ保護処理方法
23日前
マクセル株式会社
アプリケーション起動方法
15日前
マクセル株式会社
デジタル放送変調波の処理方法
23日前
マクセル株式会社
情報表示装置およびその表示方法
23日前
マクセル株式会社
ヘッドマウントディスプレイ装置
23日前
マクセル株式会社
軽度認知障害スクリーニング方法、該方法を伴うコンピュータプログラム及びスクリーニング装置
27日前
マクセル株式会社
近赤外用結像レンズ系、カメラモジュール、車載システム、移動体
20日前
マクセル株式会社
連携通報システム、携帯型通信装置、及び携帯型通信装置における連携通報方法
15日前
マクセル株式会社
電磁ノイズ抑制シート及びその製造方法、並びに電磁ノイズ抑制シートを用いたケーブル
13日前
個人
詐欺保険
23日前
個人
縁伊達ポイン
23日前
個人
RFタグシート
10日前
個人
ペルソナ認証方式
7日前
個人
地球保全システム
1か月前
個人
QRコードの彩色
27日前
続きを見る
他の特許を見る