TOP特許意匠商標
特許ウォッチ Twitter
公開番号2024118841
公報種別公開特許公報(A)
公開日2024-09-02
出願番号2023025385
出願日2023-02-21
発明の名称文書校正装置、方法およびプログラム
出願人エヌ・ティ・ティ・コミュニケーションズ株式会社
代理人弁理士法人鈴榮特許綜合事務所
主分類G10L 15/22 20060101AFI20240826BHJP(楽器;音響)
要約【課題】音声認識装置により言語化されたデータから、用途に応じた適切な品質の文書データを作成できるようにする。
【解決手段】音声認識装置の後段に文書校正装置を配置する。そして、この文書校正装置により、先ず校正辞書生成モードが設定された状態で、音声認識装置から出力される誤認識単語列に対しその出現頻度を表す情報と正解単語列とを対応付けた誤認識パターン情報を生成すると共に、誤認識パターン情報に対しその用途を識別する情報を対応付けた用途パターン情報を生成して、これらを校正辞書として記憶する。そして、文書校正モードが設定された状態で、音声データの入力に応じて音声認識装置から出力される単語列と上記音声データの用途を表す情報とをもとに、上記校正辞書の誤認識パターン情報および用途パターン情報を参照して、上記単語列に対応する正解単語列を選択し出力する。
【選択図】図3
特許請求の範囲【請求項1】
入力された音声データを単語列に変換する音声認識装置から出力される前記単語列を校正する文書校正装置であって、
前記音声認識装置から出力される複数の誤認識単語列の各々に対し、その出現頻度を表す情報と正解単語列とを対応付けた複数の誤認識パターン情報を生成すると共に、生成した前記誤認識パターン情報の各々に対し、その用途を識別するための情報を対応付けた用途パターン情報を生成し、生成した前記誤認識パターン情報および前記用途パターン情報を校正辞書として記憶する校正辞書生成処理部と、
前記音声データの入力に応じて前記音声認識装置から出力される前記誤認識単語列と、前記音声データの用途を表す情報とをもとに、前記校正辞書として記憶された前記誤認識パターン情報および前記用途パターン情報を参照して、前記誤認識単語列に対応する正解単語列を選択し、選択した前記正解単語列を校正済単語列として出力する校正処理部と
を備える文書校正装置。
続きを表示(約 880 文字)【請求項2】
前記校正処理部は、
入力された前記音声データの用途を表す情報を取得し、取得した前記用途を表す情報をもとに前記用途パターン情報を参照して対応する前記誤認識パターン情報を少なくとも1つ特定する処理と、
特定された前記誤認識パターン情報のうち、前記音声認識装置から出力される前記単語列を含みかつその出現頻度が最も高い前記誤認識パターン情報を選択する処理と、
選択された前記誤認識パターン情報から前記正解単語列を読み出し、読み出した前記正解単語列を前記校正済単語列として出力する処理と
を行う、請求項1に記載の文書校正装置。
【請求項3】
前記校正辞書生成処理部は、予め用意された複数の用途の一覧リストにおいて、前記誤認識パターン情報に対応する用途にフラグを設定したものを前記用途パターン情報とする、請求項1に記載の文書校正装置。
【請求項4】
情報処理装置が実行する文書校正方法であって、
音声認識装置から出力される複数の誤認識単語列の各々に対し、その出現頻度を表す情報と正解単語列とを対応付けた複数の誤認識パターン情報を生成すると共に、生成した前記誤認識パターン情報の各々に対し、その用途を識別するための情報を対応付けた用途パターン情報を生成し、生成した前記誤認識パターン情報および前記用途パターン情報を校正辞書として記憶する校正辞書生成過程と、
音声データの入力に応じて前記音声認識装置から出力される前記誤認識単語列と、前記音声データの用途を表す情報とをもとに、前記校正辞書として記憶された前記誤認識パターン情報および前記用途パターン情報を参照して、前記誤認識単語列に対応する正解単語列を選択し、選択した前記正解単語列を校正済単語列として出力する校正過程と
を備える文書校正方法。
【請求項5】
請求項1乃至3のいずれかに記載の文書校正装置が備える各部が実行する処理の少なくとも1つを、前記文書校正装置が備えるプロセッサに実行させるプログラム。

発明の詳細な説明【技術分野】
【0001】
この発明の一態様は、例えば音声認識により言語化された文書を校正するために使用される文書校正装置、方法およびプログラムに関する。
続きを表示(約 1,700 文字)【背景技術】
【0002】
例えば、会議や、コールセンター等の接客現場等において、発言者や来客の音声データをテキストデータ等の文書データに変換して保存することは、後に会議内容や接客内容を確認する上で非常に重要である。
【0003】
音声データを文書化する手法のうち、最も一般的な手法は人が音声を聞いて手作業で文書を書き起こす手法である。この手法は、品質が良好な文書データを作成することができる反面、人手による作業であるため作成に時間を要し、人件費が発生するという課題がある。また、人手を要することで情報の秘匿性が損なわれることが懸念される。
【0004】
一方、音声データを文書化する別の手法として、音声認識技術を用いる手法がある。音声認識技術を用いる手法は、例えば特許文献1に記載されるように、マイクロフォンにより収音された音声信号から一定時間長ごとに音声特徴量を抽出し、予め用意された音響モデルおよび言語モデルを用いて、上記音声特徴量に対し最も類似度の高い単語列を生成し、生成した単語列を所定の形式、例えばテキスト形式の文書データとして出力するものである。この手法は、人手を要しないことから、音声データを短時間で効率良く安価に文書化することができ、かつ情報の秘匿性を高く維持できるという利点がある。
【先行技術文献】
【特許文献】
【0005】
特開2019-35786号公報
【発明の概要】
【発明が解決しようとする課題】
【0006】
ところが、音声認識技術を用いる既存の手法は、用途(ユースケース)によっては、音声の認識率が低下して、必要とされる品質の文書データを作成することができない。また、どのような用途でも高品質の文書データを作成しようとすると、高精度の言語モデルを用意する必要があり、言語モデルの作成に多大な開発コストが掛かる。
【0007】
この発明は上記事情に着目してなされたもので、音声認識装置により言語化されたデータから、用途に応じた適切な品質の文書データを作成できるようにする技術を提供しようとするものである。
【課題を解決するための手段】
【0008】
上記課題を解決するためにこの発明に係る文書校正装置または方法の一態様は、入力された音声データを単語列に変換する音声認識装置から出力される前記単語列を校正する際に、先ず校正辞書生成モードにおいて、前記音声認識装置から出力される複数の誤認識単語列の各々に対し、その出現頻度を表す情報と正解単語列とを対応付けた複数の誤認識パターン情報を生成すると共に、生成した前記誤認識パターン情報の各々に対し、その用途を識別するための情報を対応付けた用途パターン情報を生成し、生成した前記誤認識パターン情報および前記用途パターン情報を校正辞書として記憶する。次に、文書校正モードにおいて、前記音声データの入力に応じて前記音声認識装置から出力される前記単語列と、前記音声データの用途を表す情報とをもとに、前記校正辞書として記憶された前記誤認識パターン情報および前記用途パターン情報を参照して、前記単語列に対応する正解単語列を選択し、選択した前記正解単語列を前記校正済単語列として出力するようにしたものである。
【0009】
この発明の一態様によれば、誤認識単語列に対し正解単語列を対応付けた誤認識パターン情報を生成し、これらの誤認識パターン情報に対しその用途を表す用途パターン情報を紐付けておくことで、用途ごとにその用途で発生しやすい誤認識単語列を適切に特定して正解単語列に置換することができる。このため、音声認識装置がすべての用途に対応可能な高精度の言語モデルを備えていなくても、用途に応じた適切な品質の単語列からなる文書データを作成することが可能となる。
【発明の効果】
【0010】
すなわちこの発明の一態様によれば、音声認識装置により言語化されたデータから、用途に応じた適切な品質の文書データを作成できるようにする技術を提供することができる。
【図面の簡単な説明】
(【0011】以降は省略されています)

この特許をJ-PlatPatで参照する
Flag Counter

関連特許

個人
非電子的残響スピーカー
1か月前
個人
ハリセン
12日前
個人
管部材の製造方法
12日前
個人
ギター演奏用ピック
21日前
ヤマハ株式会社
ヘルムホルツ共鳴器
5日前
ブラザー工業株式会社
カラオケ装置
9日前
ヤマハ株式会社
電子楽器
9日前
ブラザー工業株式会社
カラオケ装置
9日前
カシオ計算機株式会社
蓋部材および鍵盤楽器
14日前
オンキヨー株式会社
音声認識システム、及び、音声認識方法
12日前
ヤマハ株式会社
シンバルワッシャ
12日前
株式会社イノアックコーポレーション
遮音カバー
12日前
株式会社第一興商
カラオケ装置
12日前
株式会社第一興商
カラオケ装置
5日前
株式会社ファーストスター・ヘルスケア
音楽提供システム
1か月前
株式会社第一興商
カラオケ装置
1か月前
株式会社エクシング
カラオケシステム、及び、カラオケ装置
12日前
本田技研工業株式会社
能動型騒音低減装置
5日前
トヨタ自動車株式会社
制御装置及び制御方法
9日前
株式会社アナザーウェア
鍵盤画面表示プログラム及びそのシステム
5日前
ヤマハ株式会社
検出システムおよび楽器
12日前
トヨタ自動車株式会社
異音診断システム
5日前
京セラ株式会社
音出力装置、音出力方法、及びプログラム
1か月前
ローランド株式会社
打楽器および張力の付与方法
12日前
ヤマハ株式会社
低音強調方法及び低音強調装置
1か月前
株式会社SOKEN
遮音部
9日前
ローランド株式会社
打楽器およびロッドの締付方法
12日前
ローランド株式会社
楽音処理装置、及び楽音処理方法
20日前
ローランド株式会社
鍵盤装置および鍵のガイド方法
20日前
ローランド株式会社
鍵盤装置および鍵のガイド方法
20日前
ローランド株式会社
鍵盤装置および鍵のガイド方法
20日前
ソフトバンクグループ株式会社
行動制御システム
21日前
株式会社日立プラントコンストラクション
作業記録作成支援システム
1か月前
カシオ計算機株式会社
電子楽器及び電子鍵盤楽器
14日前
カシオ計算機株式会社
電子楽器及び電子鍵盤楽器
14日前
カシオ計算機株式会社
電子楽器及び電子鍵盤楽器
14日前
続きを見る