TOP特許意匠商標
特許ウォッチ Twitter
10個以上の画像は省略されています。
公開番号2024071951
公報種別公開特許公報(A)
公開日2024-05-27
出願番号2022182491
出願日2022-11-15
発明の名称情報処理装置、情報処理方法、及びプログラム
出願人キヤノン株式会社
代理人弁理士法人谷・阿部特許事務所
主分類G10L 13/08 20130101AFI20240520BHJP(楽器;音響)
要約【課題】墨消しされた文字列が読み上げられる代わりに墨消しされた文字列の項目が識別可能な音声が再生される音声データを生成すること。
【解決手段】
情報処理装置は、文書画像における文字列を音声に変換して得られた第1の音声データと、前記文書画像における墨消し処理の対象となる所定の項目をユーザに識別させるための第2の音声データと、を取得する取得手段と、前記文書画像における文字列を読み上げる読み上げ音声データを生成する生成手段と、を有し、前記生成手段は、前記文書画像における前記所定の項目の文字列に対応する部分については、前記所定の項目の文字列が読み上げられる代わりに前記第2の音声データに基づく音声が再生されるように、前記第1の音声データと前記第2の音声データとを用いて前記読み上げ音声データを生成する。
【選択図】図9
特許請求の範囲【請求項1】
文書画像における文字列を音声に変換して得られた第1の音声データと、前記文書画像における墨消し処理の対象となる所定の項目をユーザに識別させるための第2の音声データと、を取得する取得手段と、
前記文書画像における文字列を読み上げる読み上げ音声データを生成する生成手段と、を有し、
前記生成手段は、
前記文書画像における前記所定の項目の文字列に対応する部分については、前記所定の項目の文字列が読み上げられる代わりに前記第2の音声データに基づく音声が再生されるように、前記第1の音声データと前記第2の音声データとを用いて前記読み上げ音声データを生成する
ことを特徴とする情報処理装置。
続きを表示(約 1,000 文字)【請求項2】
前記第2の音声データは、前記所定の項目を示す音声を含む音声のデータである
ことを特徴とする請求項1に記載の情報処理装置。
【請求項3】
前記第2の音声データは、前記所定の項目のカテゴリを示す音声を含む音声のデータである
ことを特徴とする請求項1に記載の情報処理装置。
【請求項4】
前記第2の音声データは、個人情報であることを示す音声を含む音声のデータである
ことを特徴とする請求項3に記載の情報処理装置。
【請求項5】
前記第2の音声データは、機密情報であることを示す音声を含む音声のデータである
ことを特徴とする請求項3に記載の情報処理装置。
【請求項6】
前記第2の音声データは、前記所定の項目であることを示すビープ音のデータである
ことを特徴とする請求項1に記載の情報処理装置。
【請求項7】
前記取得手段は、
前記所定の項目をユーザに識別させるための複数の音のうちから選択された音のデータを、前記第2の音声データとして取得する
ことを特徴とする請求項1に記載の情報処理装置。
【請求項8】
前記複数の音のうちの何れかの音をユーザが選択するための第1の設定画面を表示部に表示させる表示制御手段をさらに有し、
前記取得手段は、前記第1の設定画面を介して選択された音のデータを、前記第2の音声データとして取得する
ことを特徴とする請求項7に記載の情報処理装置。
【請求項9】
前記墨消し処理の対象とする項目を選択するための第2の設定画面を表示部に表示させる表示制御手段をさらに有し、
前記所定の項目は、前記第2の設定画面を介してユーザが選択した項目である
ことを特徴とする請求項1に記載の情報処理装置。
【請求項10】
前記文書画像に含まれる文字列を認識する認識手段と、
前記文書画像から認識された文字列から、前記所定の項目の文字列を抽出する抽出手段と、
前記抽出された文字列が前記文書画像に表示されないように、前記墨消し処理がされる前の前記文書画像に前記墨消し処理する処理手段と、
前記墨消し処理された前記文書画像を表示部に表示させる表示制御手段と、
をさらに有することを特徴とする請求項1に記載の情報処理装置。
(【請求項11】以降は省略されています)

発明の詳細な説明【技術分野】
【0001】
本開示は、文字列データを音声データに変換する技術に関する。
続きを表示(約 1,800 文字)【背景技術】
【0002】
スキャンまたはFAX等で文書を読み取ることで得られた文書画像の中には、個人情報(例えば、氏名、住所)または機密情報(例えば、取引先の会社名)を示す文字列が含まれる場合がある。このような文書画像に対して、個人情報または機密情報を示す文字列を墨消し(不可視化)するように加工して出力する技術が知られている。また、文書画像に対してOCR処理を実行し、その結果得られた文字列を音声データに変換して出力する技術が知られている。
【0003】
特許文献1は、文書画像における墨消しされた文字列が読み上げられる際にはBGMを流すことが開示されている。
【先行技術文献】
【特許文献】
【0004】
特開2012-231268号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
文書画像内の墨消しされた文字列が読み上げられる代わりにBGMが再生されると、ユーザは、どの項目の文字列が墨消しされたかを判別できなくなることがある。
【0006】
例えば、音声データを使用するユーザには、運転中、歩行中、または外出先にいるユーザのようなPC等の画面を閲覧できない環境に置かれたユーザがいる。または、PCの操作ができないユーザ、目の不自由なユーザ、小さい文字が読めない高齢者のユーザがいる。これらのユーザは、音声のみによって文書の内容を理解するために、文書画像から生成された音声データを利用することが考えらえる。即ち、文書画像を表示させずに、文書画像から生成された音声データを再生することが考えらえる。この場合、墨消しされた文字列の音声の代わりにBGMが再生されると、ユーザは、どの項目が墨消しされたかを前後関係や文脈から予測しなければならない。
【0007】
また、PC等の画面に文書画像を表示しながら文書画像内の文字列の音声を聴くために、音声データが用いられる場合がある。例えば、PC等の画面を閲覧できる環境下に置かれたユーザが、画面に表示された文書画像を目視で確認しながら音声で文書の内容を理解するために音声データが用いられる。この場合、項目を表す文字列(例えば、「氏名」の文字列)の記載がない当該項目に対応する文字列(例えば、「山田太郎」の文字列)が墨消しされると、どの項目の文字列が墨消しされたかを文書画像からも判別することが困難となる場合がある。
【課題を解決するための手段】
【0008】
本開示の情報処理装置は、文書画像における文字列を音声に変換して得られた第1の音声データと、前記文書画像における墨消し処理の対象となる所定の項目をユーザに識別させるための第2の音声データと、を取得する取得手段と、前記文書画像における文字列を読み上げる読み上げ音声データを生成する生成手段と、を有し、前記生成手段は、前記文書画像における前記所定の項目の文字列に対応する部分については、前記所定の項目の文字列が読み上げられる代わりに前記第2の音声データに基づく音声が再生されるように、前記第1の音声データと前記第2の音声データとを用いて前記読み上げ音声データを生成することを特徴とする。
【発明の効果】
【0009】
本開示によれば、墨消しされた文字列が読み上げられる代わりに墨消しされた文字列の項目が識別可能な音声が再生される音声データを生成できる。
【図面の簡単な説明】
【0010】
情報処理システムの構成を示す図である。
画像形成装置、学習装置、情報処理装置のハードウェア構成を示す図である。
情報処理システムの利用シーケンスを説明するための図である。
文書の一例および墨消し処理の設定画面の一例を示す図である。
固有表現ラベルに対応した文字列群の一例を示す図である。
文字列群をグループ分けの方法の一例を説明するための概念図である。
文字列抽出器を生成する方法を説明するためのフローチャートである。
墨消し処理の流れを説明するためのフローチャートである。
音声変換処理の流れを説明するためのフローチャートである。
墨消し対象の文字列の代わりに挿入する音を説明するための図である。
【発明を実施するための形態】
(【0011】以降は省略されています)

特許ウォッチbot のツイートを見る
この特許をJ-PlatPatで参照する

関連特許

個人
三味線の部品
19日前
株式会社エフノート
電子ドラム
17日前
株式会社大貴
吸音材の施工方法
18日前
株式会社エフノート
電子打楽器
17日前
アルス株式会社
ペダル式入力装置
1か月前
株式会社小泉製作所
ベル装置
21日前
エイドス セラピューティクス,インコーポレイティド
AG10の製剤
3日前
エイドス セラピューティクス,インコーポレイティド
AG10を使用するTTRアミロイドーシスの治療方法
21日前
株式会社総合車両製作所
吸音パネル
17日前
ヤマハ株式会社
楽器用ナット
21日前
株式会社レゾナック
吸音材及び車両部材
今日
ヤマハ株式会社
プログラム
14日前
清水建設株式会社
音低減・増幅装置
1か月前
トヨタ自動車株式会社
情報処理装置
4日前
株式会社第一興商
カラオケ端末
24日前
カシオ計算機株式会社
鍵盤楽器
1か月前
住友理工株式会社
防音放熱カバー
1か月前
株式会社イノアックコーポレーション
防音材及び車両構造
14日前
岐阜プラスチック工業株式会社
遮音パネル及び遮音壁用ユニット
1か月前
シナプティクス インコーポレイテッド
半適応性ビームフォーマ
1か月前
カシオ計算機株式会社
鍵盤装置及び鍵盤楽器
1か月前
株式会社第一興商
カラオケ装置、カラオケシステム
14日前
日本放送協会
音場評価装置、音場評価システム、及びプログラム
今日
株式会社レゾナック
吸音構造体及び吸音構造体の製造方法
4日前
ローランド株式会社
鍵盤装置および駆動装置の冷却方法
24日前
沖電気工業株式会社
音声処理装置、音声処理プログラム及び音声処理方法
18日前
株式会社スクウェア・エニックス
音声生成プログラム及び音声生成システム
1か月前
ブラザー工業株式会社
カラオケ装置、カラオケ再生方法及びカラオケ用プログラム
1か月前
株式会社竹中工務店
情報処理装置及び情報処理プログラム
11日前
日産自動車株式会社
車両の情報提示方法及び情報提示装置
1か月前
学校法人立命館
叫び声検知システム、音声分類方法、及び、音声分類モデルの生成方法
18日前
キヤノン株式会社
情報処理装置、情報処理方法、及びプログラム
28日前
三菱重工業株式会社
音声認識装置、音声認識方法及びプログラム
5日前
トヨタ自動車株式会社
情報処理装置、情報処理方法、及び、プログラム
4日前
日本放送協会
音声認識モデルに用いる学習データを作成する学習データ作成装置及びプログラム
21日前
株式会社アドバンスト・メディア
情報処理装置、情報処理システム、情報処理方法及びプログラム
4日前
続きを見る