TOP
|
特許
|
意匠
|
商標
特許ウォッチ
Twitter
他の特許を見る
10個以上の画像は省略されています。
公開番号
2024077425
公報種別
公開特許公報(A)
公開日
2024-06-07
出願番号
2022189517
出願日
2022-11-28
発明の名称
プロセッサ
出願人
株式会社Preferred Networks
,
国立大学法人神戸大学
代理人
個人
,
個人
主分類
G06F
9/38 20180101AFI20240531BHJP(計算;計数)
要約
【課題】命令により明示的にデータのバイパスが指示される場合に、データのバイパスを正常に実施してプロセッサの処理性能の低下を抑制する。
【解決手段】プロセッサは、バイパス情報を含む命令をデコードし、前記バイパス情報に基づいてバイパス制御信号を生成する命令デコーダと、命令の実行に使用するデータを保持するデータ保持部と、命令を実行し、演算結果データを出力する演算器と、前記データ保持部に保持されたデータ又は前記演算結果データを前記バイパス制御信号に基づいて選択して前記演算器に出力する第1セレクタと、を有する。
【選択図】図1
特許請求の範囲
【請求項1】
バイパス情報を含む命令をデコードし、前記バイパス情報に基づいてバイパス制御信号を生成する命令デコーダと、
命令の実行に使用するデータを保持するデータ保持部と、
命令を実行し、演算結果データを出力する演算器と、
前記データ保持部に保持されたデータ又は前記演算結果データを前記バイパス制御信号に基づいて選択して前記演算器に出力する第1セレクタと、を有する
プロセッサ。
続きを表示(約 2,000 文字)
【請求項2】
前記演算結果データを保持するラッチと、
前記演算器の出力と前記ラッチとの間に配置され、前記演算器の出力又は前記ラッチの出力を保持制御信号に基づいて前記ラッチの入力に接続する第2セレクタと、を有し、
前記命令デコーダは、先行命令と、前記先行命令の実行に基づいて前記演算器からバイパスされる前記演算結果データを使用して実行される後続命令との間にバブルが挿入されることを検出した場合、バブルの挿入サイクルに対応して前記保持制御信号を生成する
請求項1に記載のプロセッサ。
【請求項3】
命令を保持する命令キューと、
前記命令キューに保持された命令を取り出して前記命令デコーダに供給する命令取り出し部と、を有し、
前記命令キューに保持される命令は、さらに、命令パイプラインにおいて自命令の直前の命令と前記自命令との間へのバブルの挿入の禁止又は許可を示すバブル挿入禁止情報を含み、
前記命令取り出し部は、
前記命令キューから取り出す対象命令に含まれる前記バブル挿入禁止情報がバブルの挿入禁止を示す場合、前記対象命令を取り出して前記命令デコーダに供給し、
前記対象命令に含まれる前記バブル挿入禁止情報がバブルの挿入許可を示す場合、前記命令キューに保持された命令の量に応じて、前記対象命令を取り出して前記命令デコーダに供給するか、ノーオペレーション命令を前記命令デコーダに供給するかを判定する
請求項1に記載のプロセッサ。
【請求項4】
前記命令取り出し部は、前記対象命令に含まれる前記バブル挿入禁止情報がバブルの挿入許可を示す場合、
前記命令キューに保持された命令の量が第1しきい値より少ない場合、前記命令キューに保持された命令の量が前記第1しきい値以上になるまでノーオペレーション命令を前記命令デコーダに供給し、
前記命令キューに保持された命令の量が第1しきい値以上の場合、前記対象命令を前記命令キューから取り出して前記命令デコーダに供給する
請求項3に記載のプロセッサ。
【請求項5】
前記第1セレクタを介して前記演算器からバイパスされる前記演算結果データを使用して演算を実行する命令に含まれるバブル挿入禁止情報は、バブルの挿入禁止に設定され、
前記演算器からバイパスされる前記演算結果データを使用せずに演算を実行する命令に含まれるバブル挿入禁止情報は、バブルの挿入許可に設定される
請求項3又は請求項4に記載のプロセッサ。
【請求項6】
命令を保持する命令キューと、
前記命令キューに保持された命令を取り出して前記命令デコーダに供給する命令取り出し部と、
前記命令キューに供給される命令の前記演算器による演算が、前記第1セレクタを介して前記演算器からバイパスされる前記演算結果データを使用して実行されるか否かを判定する判定部と、
前記命令キューに保持される命令に対応して前記判定部の判定結果を保持し、前記命令キューの更新とともに更新される先読みキューと、を有し、
前記命令取り出し部は、
前記先読みキューの先頭が、前記演算器からバイパスされる前記演算結果データの非使用を示す非使用情報を保持し、前記先読みキューの2番目以降の全てが、前記演算器からバイパスされる前記演算結果データの使用を示す使用情報を保持する場合、ノーオペレーション命令を前記命令デコーダに供給し、
その後、前記先読みキューの2番目以降に連続して保持された前記使用情報の後に前記非使用情報が格納された場合、前記先読みキューの先頭から最後の前記使用情報までに対応して前記命令キューに保持された命令を前記命令デコーダに順次供給する
請求項1に記載のプロセッサ。
【請求項7】
前記命令取り出し部は、前記先読みキューの2番目が前記非使用情報を保持する場合、前記命令キューの先頭に保持された命令を前記命令デコーダに供給する
請求項6に記載のプロセッサ。
【請求項8】
選択制御信号に基づいて、前記命令デコーダから供給される命令で使用するデータ又は前記演算器から出力される前記演算結果データを選択して前記データ保持部に出力する第3セレクタを有し、
前記命令デコーダがデコードする命令は、さらに選択情報を含み、
前記命令デコーダは、前記選択情報に基づいて前記選択制御信号を生成する
請求項1から請求項4、請求項6及び請求項7のいずれか1項に記載のプロセッサ。
【請求項9】
前記演算結果データを前記第1セレクタに選択させる前記バイパス情報を含む命令は、前記第3セレクタによる前記演算結果データの選択を禁止させる前記選択情報を含む
請求項8に記載のプロセッサ。
発明の詳細な説明
【技術分野】
【0001】
本開示は、プロセッサに関する。
続きを表示(約 1,900 文字)
【背景技術】
【0002】
プロセッサにおいて、演算により得られた演算結果データが次の演算で使用される場合、レジスタに格納される前の演算結果データを演算器にバイパスして次の演算に使用することで、演算器の使用効率を向上し、プロセッサの性能を向上する技術が知られている。
【0003】
この種のプロセッサは、命令キューに保持された命令をデコードするときにデータの依存性を判定し、演算結果データを演算器にバイパスするか否かを判定する。演算結果データのバイパスは、隣接した命令間で実施される必要があり、演算結果データのバイパスを実施する命令間にバブルが入ると、正しい演算を実施することができない。
【0004】
また、プロセッサは、演算結果データを演算器にバイパスする場合、演算結果データをレジスタにも格納する。レジスタに格納されたデータがその後の演算で使用されない場合、レジスタの使用効率は低下し、プロセッサの処理性能が低下する場合がある。
【発明の概要】
【発明が解決しようとする課題】
【0005】
本開示では、命令により明示的にデータのバイパスが指示される場合に、データのバイパスを正常に実施してプロセッサの処理性能の低下を抑制する。
【課題を解決するための手段】
【0006】
本発明の実施形態のプロセッサは、バイパス情報を含む命令をデコードし、前記バイパス情報に基づいてバイパス制御信号を生成する命令デコーダと、命令の実行に使用するデータを保持するデータ保持部と、命令を実行し、演算結果データを出力する演算器と、前記データ保持部に保持されたデータ又は前記演算結果データを前記バイパス制御信号に基づいて選択して前記演算器に出力する第1セレクタと、を有する。
【図面の簡単な説明】
【0007】
本発明の一実施形態におけるプロセッサの構成の一例を示すブロック図である。
図2のプロセッサが実行する命令列と動作タイミングの一例を示す説明図である。
本発明の別の実施形態におけるプロセッサの構成の一例を示すブロック図である。
図3のプロセッサが実行する命令列と動作タイミングの一例を示す説明図である。
本発明の別の実施形態におけるプロセッサの構成の一例を示すブロック図である。
図5の命令取り出し部の動作の一例を示すフロー図である。
図5の命令取り出し部の動作の一例を示す説明図である。
本発明の別の実施形態におけるプロセッサの構成の一例を示すブロック図である。
図8のバブル判定部の動作の一例を示すフロー図である。
図8の命令取り出し部の動作の一例を示すフロー図である。
図8の命令取り出し部の動作の一例を示す説明図である。
図1に示したプロセッサが搭載される計算機のハードウェア構成の一例を示すブロック図である。
【発明を実施するための形態】
【0008】
以下、本発明の実施形態について、図面を参照しながら詳細に説明する。以下では、信号が伝達される信号線には、信号名と同じ符号を使用する。特に限定されないが、以下で説明するプロセッサは、サーバ等のコンピュータに搭載され、プログラムを実行することで、ディープニューラルネットワークの訓練又は推論において畳み込み演算等を実行してもよい。なお、以下で説明するプロセッサは、科学技術計算などに使用されてもよい。
【0009】
図1は、本発明の一実施形態におけるプロセッサの構成の一例を示すブロック図である。図1に示すプロセッサ100は、命令供給部10及び演算ユニット20を有してもよい。命令供給部10は、命令発生部11及び命令デコーダ14を有してもよい。演算ユニット20は、レジスタファイル21、演算器22、セレクタSEL0、SEL1及びラッチLTを有してもよい。セレクタSEL0は、第3セレクタの一例であり、セレクタSEL1は、第1セレクタの一例である。プロセッサ100は、クロックに同期して動作してもよいが、クロックの記載は省略される。例えば、レジスタファイル21及びラッチLTに示す三角印は、クロック入力端子を示す。
【0010】
なお、プロセッサ100は、デコード処理、演算の実行処理及び演算結果の格納処理等を複数のステージに分けて実施するために、複数の命令を並列に処理する命令パイプラインを有してもよい。しかしながら、ステージを区切るラッチ又はレジスタ等の記載は、ラッチLTを除いて省略される。
(【0011】以降は省略されています)
特許ウォッチbot のツイートを見る
この特許をJ-PlatPatで参照する
関連特許
個人
認証システム
13日前
個人
マウス用テーブル
1か月前
個人
保証金管理システム
7日前
個人
管理装置
2か月前
個人
鑑定証明システム
13日前
アズビル株式会社
防爆装置
1か月前
個人
特徴検討支援システム
2か月前
個人
業界地図作成システム
1か月前
個人
人的価値発掘システム
1か月前
個人
契約管理サーバ
2か月前
個人
管理装置
2か月前
株式会社セガフェイブ
遊戯機
1か月前
株式会社宗建
SNSサーバー
1か月前
株式会社MRC
集客システム
7日前
キヤノン電子株式会社
情報処理装置
1か月前
個人
技術マッチングシステム
19日前
個人
配送システムおよび同包箱
1か月前
キヤノン株式会社
印刷管理装置
5日前
ミサワホーム株式会社
管理装置
1か月前
株式会社ネットブリッジ
展示販売装置
14日前
個人
選択操作音声出力システム
1か月前
ミサワホーム株式会社
システム
1か月前
トヨタ自動車株式会社
分析装置
7日前
株式会社ジール
文章の分析装置
1か月前
キヤノン株式会社
印刷制御装置
28日前
オムロン株式会社
認証中継サーバ
1か月前
ミサワホーム株式会社
プログラム
13日前
個人
動作のデザイン評価の方法及び装置
1か月前
大同特殊鋼株式会社
棒材計数装置
1か月前
個人
文字入力方法、文字入力プログラム
20日前
トヨタ自動車株式会社
車両
2か月前
アスエネ株式会社
森林管理の方法
1か月前
株式会社奥村組
削孔位置検出方法
2か月前
日本電気株式会社
システム及び方法
2か月前
株式会社LIFE
送迎管理システム
6日前
株式会社八咲
イベント管理システム
1か月前
続きを見る
他の特許を見る