TOP特許意匠商標
特許ウォッチ Twitter
10個以上の画像は省略されています。
公開番号2025076139
公報種別公開特許公報(A)
公開日2025-05-15
出願番号2023187900
出願日2023-11-01
発明の名称情報処理装置、情報処理方法
出願人キヤノン株式会社
代理人弁理士法人大塚国際特許事務所
主分類G06V 10/40 20220101AFI20250508BHJP(計算;計数)
要約【課題】適切な大きさの局所的な受容野を有する特徴変換処理によりアテンション機構を実現するための情報処理装置を提供する。
【解決手段】機能構成に、人物の顔を含む画像を入力画像として取得する取得部、取得した入力画像に含まれている人物の顔の特徴ベクトル(顔特徴ベクトル)を算出する演算部及び演算部が算出した顔特徴ベクトルと、取得部が取得した他の入力画像について演算部が算出した顔特徴ベクトルとを照合する照合部を有する情報処理装置において、演算部で用いるニューラルネットワークに適用可能な特徴変換処理部300は、入力データを取得する入力取得部301と、入力データに対して局所的な受容野を有する特徴変換処理を行うことで、アテンションベクトルを求める特徴変換処理部304と、該入力データと該アテンションベクトルとに基づいて該入力データに対してアテンションを適用する適用部303と、を備える。
【選択図】図3
特許請求の範囲【請求項1】
入力データを取得する取得手段と、
前記入力データに対して局所的な受容野を有する特徴変換処理を行うことで、アテンションベクトルを求め、該入力データと該アテンションベクトルとに基づいて該入力データに対してアテンションを適用する適用手段と
を備えることを特徴とする情報処理装置。
続きを表示(約 1,200 文字)【請求項2】
前記取得手段は、画像もしくは該画像から抽出した顔の領域内の画像を入力データとして取得することを特徴とする請求項1に記載の情報処理装置。
【請求項3】
前記適用手段は、前記入力データに対して前記特徴変換処理を一回もしくは二回以上行うことを特徴とする請求項1に記載の情報処理装置。
【請求項4】
前記アテンションベクトルは、前記特徴変換処理の結果得られたベクトルに活性化関数による非線形変換を行ったベクトルであり、前記適用手段は、該アテンションベクトルと前記入力データとの要素積を求めることを特徴とする請求項1に記載の情報処理装置。
【請求項5】
前記適用手段のパラメータは学習により取得することを特徴とする請求項1に記載の情報処理装置。
【請求項6】
前記特徴変換処理は、convolution、point wise convolution、depth wise convolution、group convolution、max pooling、average pooling、batch normalization、layer normalization、のうち、1つ以上を含むことを特徴とする請求項1に記載の情報処理装置。
【請求項7】
前記アテンションベクトルは、前記入力データと同じ次元数を有するベクトルであることを特徴とする請求項1に記載の情報処理装置。
【請求項8】
さらに、
前記入力データと、前記適用の結果と、を加算する第1加算手段と、
前記加算の結果を正規化し、該正規化の結果を特徴量として取得する正規化手段と、
前記特徴量を線形変換により変換することで、該特徴量の次元数をチャネル方向に拡張する第1変換手段と、
前記変換した特徴量に対して活性化関数を適用する活性化手段と、
前記活性化関数を適用した特徴量を線形変換し、該特徴量の次元数をチャネル方向に縮小する第2変換手段と、
前記加算の結果と、前記線形変換の結果と、加算する第2加算手段と
を備えることを特徴とする請求項1に記載の情報処理装置。
【請求項9】
情報処理装置が行う情報処理方法であって、
前記情報処理装置の取得手段が、入力データを取得する取得工程と、
前記情報処理装置の適用手段が、前記入力データに対して局所的な受容野を有する特徴変換処理を行うことで、アテンションベクトルを求め、該入力データと該アテンションベクトルとに基づいて該入力データに対してアテンションを適用する適用工程と
を備えることを特徴とする情報処理方法。
【請求項10】
コンピュータを、請求項1ないし8のいずれか1項に記載の情報処理装置の各手段として機能させるためのコンピュータプログラム。

発明の詳細な説明【技術分野】
【0001】
本発明は、情報処理技術に関する。
続きを表示(約 2,200 文字)【背景技術】
【0002】
従来のConvolutional Neural Networks(CNN)の各層では、固定の重みを用いて特徴抽出が行われる。これに対し、入力に応じて特徴抽出時の重みを動的に調節するアテンション機構が提案されている。例えば、特徴チャンネルごとの重要度を求め、特徴チャンネルのゲインを調整する手法がある。空間方向の次元圧縮をしてから重要なチャンネルを計算している(非特許文献1)。また例えば、入力データを複数の領域に分割して領域間の関連度を調べ、関連度に基づいてどの要素のどの特徴を抽出するかを決定するSelf-attention機構がある(特許文献1)。また例えば、Self-attentionにおいて全領域の組み合わせを処理せず、一部の領域ペアのみでアテンション処理を行う手法がある(非特許文献2)。
【先行技術文献】
【特許文献】
【0003】
特許第06884871号公報
【非特許文献】
【0004】
Hu, Jie, Li Shen, and Gang Sun. ”Squeeze-and-excitation networks.” Proceedings of the IEEE Conference on Computer vision and Pattern Recognition. 2018.
Dong, Xiaoyi, et al. ”Cswin transformer: A general vision transformer backbone with cross-shaped windows.” Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition. 2022.
【発明の概要】
【発明が解決しようとする課題】
【0005】
特許文献1の手法では、全ての領域間の関係性を求めるため、計算量とパラメータ数に関して処理コストが高く、また、ハードウェア上の計算コストの高い行列形状変換処理が含まれる。他方、非特許文献1の手法では、入力データを空間方向に圧縮・削減することで少ないコストでアテンションの係数を計算する。また、非特許文献2の手法では、領域の組み合わせを限定することで処理量を削減する。このような削減により、アテンション処理の効率が上がる。ただし、複数の領域且つ複数の特徴次元にまたがるような複合的な関係性の抽出が漏れて推論精度が劣化することがある。このようにアテンションの処理量と推論精度との間にはトレードオフの関係性がある。本発明では、適切な大きさの局所的な受容野を有する特徴変換処理によりアテンション機構を実現するための技術を提供する。
【課題を解決するための手段】
【0006】
本発明の一様態は、入力データを取得する取得手段と、前記入力データに対して局所的な受容野を有する特徴変換処理を行うことで、アテンションベクトルを求め、該入力データと該アテンションベクトルとに基づいて該入力データに対してアテンションを適用する適用手段とを備えることを特徴とする。
【発明の効果】
【0007】
本発明によれば、適切な大きさの局所的な受容野を有する特徴変換処理によりアテンション機構を実現することができる。
【図面の簡単な説明】
【0008】
情報処理装置に適用可能なコンピュータ装置のハードウェア構成例を示すブロック図。
情報処理装置の機能構成例を示すブロック図。
特徴変換処理部300の構成例を示す図。
特徴変換処理部300の適用例を示すブロック図。
局所的な受容野を有する特徴変換処理の効果を説明する図。
特徴変換処理部300の適用例を示すブロック図。
局所的な受容野を有する特徴変換処理を複数回繰り返す効果を説明する図。
特徴変換処理部300の適用例を示すブロック図。
情報処理装置の動作を示すフローチャート。
【発明を実施するための形態】
【0009】
以下、添付図面を参照して実施形態を詳しく説明する。尚、以下の実施形態は特許請求の範囲に係る発明を限定するものではない。実施形態には複数の特徴が記載されているが、これらの複数の特徴の全てが発明に必須のものとは限らず、また、複数の特徴は任意に組み合わせられてもよい。さらに、添付図面においては、同一若しくは同様の構成に同一の参照番号を付し、重複した説明は省略する。
【0010】
[第1の実施形態]
まずは、推論装置として機能する本実施形態に係る情報処理装置の機能構成例について、図2のブロック図を用いて説明する。本実施形態では、一方の画像に含まれている人物の顔と他方の画像に含まれている人物の顔とが同一人物の顔であるか否かを判定する顔認証タスクを行うケースについて説明するが、以下の説明は他の種類のタスクについても同様に適用可能である。
(【0011】以降は省略されています)

この特許をJ-PlatPatで参照する

関連特許

キヤノン株式会社
現像装置
2日前
キヤノン株式会社
現像装置
2日前
キヤノン株式会社
撮像装置
1日前
キヤノン株式会社
通信装置
2日前
キヤノン株式会社
清掃装置
1日前
キヤノン株式会社
現像装置
2日前
キヤノン株式会社
液体吐出装置
3日前
キヤノン株式会社
画像形成装置
今日
キヤノン株式会社
画像形成装置
1日前
キヤノン株式会社
画像処理装置
3日前
キヤノン株式会社
画像形成装置
1日前
キヤノン株式会社
静電捕集装置
1日前
キヤノン株式会社
静電捕集装置
1日前
キヤノン株式会社
情報処理装置
3日前
キヤノン株式会社
画像形成装置
3日前
キヤノン株式会社
液体吐出ヘッド
1日前
キヤノン株式会社
液体吐出ヘッド
1日前
キヤノン株式会社
液体吐出ヘッド
2日前
キヤノン株式会社
液体吐出ヘッド
2日前
キヤノン株式会社
光電変換装置、移動体
1日前
キヤノン株式会社
光学装置及び撮像装置
1日前
キヤノン株式会社
成形体及び硬化性組成物
3日前
キヤノン株式会社
光電変換素子の製造方法
3日前
キヤノン株式会社
光電変換素子の製造方法
3日前
キヤノン株式会社
光電変換素子の製造方法
3日前
キヤノン株式会社
レンズ装置および撮像装置
1日前
キヤノン株式会社
清掃装置及び画像形成装置
1日前
キヤノン株式会社
レンズ装置および撮像装置
1日前
キヤノン株式会社
清掃装置および画像形成装置
1日前
キヤノン株式会社
情報処理装置、情報処理方法
1日前
キヤノン株式会社
画像処理装置、画像処理方法
2日前
キヤノン株式会社
有機化合物及び有機発光素子
2日前
キヤノン株式会社
画像読取装置および記録装置
3日前
キヤノン株式会社
カートリッジ及び画像形成装置
3日前
キヤノン株式会社
画像記録装置及びその制御方法
今日
キヤノン株式会社
光電変換素子及び光電変換装置
3日前
続きを見る