[go: up one dir, main page]

JP7200507B2 - 半導体装置及び演算器の制御方法 - Google Patents

半導体装置及び演算器の制御方法 Download PDF

Info

Publication number
JP7200507B2
JP7200507B2 JP2018108572A JP2018108572A JP7200507B2 JP 7200507 B2 JP7200507 B2 JP 7200507B2 JP 2018108572 A JP2018108572 A JP 2018108572A JP 2018108572 A JP2018108572 A JP 2018108572A JP 7200507 B2 JP7200507 B2 JP 7200507B2
Authority
JP
Japan
Prior art keywords
data
circuit
instruction
arithmetic
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2018108572A
Other languages
English (en)
Other versions
JP2019212101A (ja
Inventor
祥照 大貫
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2018108572A priority Critical patent/JP7200507B2/ja
Priority to US16/413,641 priority patent/US11294629B2/en
Publication of JP2019212101A publication Critical patent/JP2019212101A/ja
Application granted granted Critical
Publication of JP7200507B2 publication Critical patent/JP7200507B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F7/00Methods or arrangements for processing data by operating upon the order or content of the data handled
    • G06F7/38Methods or arrangements for performing computations using exclusively denominational number representation, e.g. using binary, ternary, decimal representation
    • G06F7/48Methods or arrangements for performing computations using exclusively denominational number representation, e.g. using binary, ternary, decimal representation using non-contact-making devices, e.g. tube, solid state device; using unspecified devices
    • G06F7/50Adding; Subtracting
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F7/00Methods or arrangements for processing data by operating upon the order or content of the data handled
    • G06F7/38Methods or arrangements for performing computations using exclusively denominational number representation, e.g. using binary, ternary, decimal representation
    • G06F7/48Methods or arrangements for performing computations using exclusively denominational number representation, e.g. using binary, ternary, decimal representation using non-contact-making devices, e.g. tube, solid state device; using unspecified devices
    • G06F7/57Arithmetic logic units [ALU], i.e. arrangements or devices for performing two or more of the operations covered by groups G06F7/483 – G06F7/556 or for performing logical operations
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Pure & Applied Mathematics (AREA)
  • Computational Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Optimization (AREA)
  • Power Sources (AREA)
  • Semiconductor Integrated Circuits (AREA)
  • Advance Control (AREA)
  • Electronic Switches (AREA)

Description

開示の技術は、半導体装置及び演算器の制御方法に関する。
演算器を備えたプロセッサ等の半導体装置において、回路電流の変動に伴って発生する電源ノイズを抑制する技術として、以下の技術が知られている。
例えば、クロック生成回路と、命令を実行する命令実行状態と命令を停止する命令停止状態との間で状態遷移可能な命令実行回路と、を備えた演算処理装置が知られている。この演算処理装置は、第1のクロック抑止指示が入力された場合、内蔵する第1の内部回路へのクロックの印加を抑止する第1の回路と、第2のクロック抑止指示が入力された場合、内蔵する第2の内部回路へのクロックの印加を抑止する第2の回路とを含む。演算処理装置は、命令実行回路が命令実行状態から命令停止状態に遷移した場合、第1の回路に第1のクロック抑止指示を出力した後に第2の回路に第2のクロック抑止指示を出力する制御回路を含む(特許文献1参照)。
また、演算命令に対応するプリアクセス命令を受けて演算部が有する回路資源に対する省電力制御を段階的に無効化して演算部の回路資源の一部を動作させる電力制御命令制御部と、演算部に演算処理を実行させる制御部と、を備えた半導体集積回路が知られている(特許文献2参照)。
特開2013-205905号公報 特開2014-59761号公報
プロセッサ等の演算器を備えた半導体装置において、演算器が演算処理を行うと回路電流が増加し、演算処理が停止すると回路電流が低下する。このような回路電流の増減に伴って電源電圧のレベルが一次的に上昇したり、下降したりする(図1参照)。この回路電流の変動に伴う電源電圧のレベルの変動を電源ノイズと呼ぶ。電源ノイズによって電源電圧のレベルが動作保証電圧範囲から外れると、回路が誤動作するおそれがある。
例えば、電力が150W、そのうち回路動作に使用される電流成分であるダイナミック成分が60W、回路動作とは関係のない漏れ電流の電流成分であるリーク成分が90W、動作電圧が0.8Vである、過去のテクノロジを用いた8コアのプロセッサとして、を想定する。このプロセッサにおいて、全てのコアの演算器が、一斉に停止状態から稼働状態または稼働状態から停止状態に移行すると、75A(60W÷0.8V)の電流変動が生じる。
次に、電力が120W、そのうちダイナミック成分が110W、リーク成分が10W、動作電圧が0.7Vである、最近のテクノロジを用いた64コアのプロセッサを想定する。近年のテクノロジでは、トランジスタサイズが小さくなり、リーク成分がダイナミック成分よりも小さくなってきている。このプロセッサにおいて、全てのコアの演算器が、一斉に停止状態から稼働状態または稼働状態から停止状態に移行すると、157A(110W÷0.7V)もの電流変動が生じる。このように、テクノロジの進歩によるトランジスタサイズの微細化、及びプロセッサ内のコア数の増加に伴って、動作状態の移行時における電流変動量が増大してきている。
電源ノイズを抑制する方法として、回路の省電力化を実現するためにクロック信号の制御を行うクロックゲーティング技術によるクロック信号の無効化を解除し、一定量の回路電流を増加させる方法が考えられる。しかしながら、クロック信号の無効化を解除したことによる電流増加量だけでは十分な電流量を獲得することが困難な場合があり、電源ノイズを許容範囲にまで抑えることができない場合がある。
また、電源ノイズを抑制する他の方法として、演算回路をプリアクセス命令やアクセスエンド命令を用いて制御する方法も考えられる。プリアクセス命令とは、回路資源の一部をダミーで動作させることにより、その回路資源に対する省電力制御を段階的に無効化する命令である。アクセスエンド命令とは、回路資源に対する省電力制御を段階的に有効化する命令である。演算器をプリアクセス命令やアクセスエンド命令を用いて制御する方法によれば、回路電流の大きさは、そのときに演算器に入力されるデータに依存することとなり、電源ノイズを許容範囲にまで抑えることができない場合がある。例えば、演算器が0+0=0を繰り返し演算しても回路電流は殆ど増加しない。
開示の技術は、一つの側面として、回路電流の変動に伴って発生する電源ノイズを効果的に抑制することを目的とする。
開示の技術に係る半導体装置は、入力されたデータについて演算を行う演算部と、制御部とを含む。前記制御部は、供給される命令列に演算命令が含まれている場合、当該演算命令の演算対象である第1のデータについて前記演算部に演算を行わせる。前記制御部は、前記命令列に演算命令が含まれておらず、前記命令列が特定の状態にある場合、前記第1のデータとは異なる第2のデータについて前記演算部に演算を行わせる。
開示の技術は、一つの側面として、回路電流の変動に伴って発生する電源ノイズを効果的に抑制する、という効果を奏する。
回路電流の変動に伴って発生する電源ノイズを示す図である。 開示の技術の実施形態に係るプロセッサの構成を示す図である。 開示の技術の実施形態に係るコアの構成を示す図である。 開示の技術の実施形態に係る演算回路20の詳細な構成を示すブロック図である。 開示の技術の実施形態に係る電流底上げ動作の効果の一例を示す図である。 開示の技術の実施形態に係る演算回路の制御態様の一例を示すフローチャートである。 開示の技術の実施形態に係る演算回路の制御態様の一例を示すタイムチャートである。 比較例に係る演算回路の構成を示す回路ブロック図である。 比較例に係る演算回路の制御態様の一例を示すフローチャートである。 比較例に係る演算回路の制御態様の他の例を示すフローチャートである。 比較例に係る演算回路の制御態様の他の例を示すフローチャートである。 開示の技術の第2の実施形態に係る演算回路の制御態様の一例を示すタイムチャートである。
以下、開示の技術の実施形態の一例について図面を参照しつつ説明する。なお、各図面において同一または等価な構成要素および部分には同一の参照符号を付与している。
[第1の実施形態]
図2は、開示の技術の実施形態に係る半導体装置の一例であるプロセッサ1の構成を示す図である。プロセッサ1は、マトリックス状に配置された複数(例えば64個)のコア100を含んで構成されている。
図3は、コア100の構成の一例を示す図である。コア100の各々は、複数(例えば8個)の演算回路20と、主制御回路10とを含んで構成されている。演算回路20の各々は、演算器22を備えている。主制御回路10は、各種制御信号([PW_DATA[7:0]]、[RS]、[PR_ENB]、[B2_VALID]、[X_VALID]、[LX_VALID])及びクロックイネーブル信号([B2_CLK_ENB]、[X_CLK_ENB_1]、[LX_CLK_ENB_1]、[RR_CLK_ENB])を用いて、演算回路20の各々を制御する。
図4は、演算回路20の詳細な構成を示すブロック図である。演算回路20は、演算器22、保持回路23A、23B、23C、23D、セレクタ24A、24B、ORゲート25A、25B及び副制御回路21を含んで構成されている。
保持回路23Aの各々は、主制御回路10から供給されるクロックイネーブル信号[B2_CLK_ENB]に応じて有効化されたクロック信号CLKに同期して入力されたデータを取り込んで保持する。保持回路23Aは、保持しているデータを出力する。保持回路23Aの各々から出力されるデータD1は、セレクタ24Aの各々の一方の入力端子に入力される。保持回路23Aの各々は、例えばフリップフロップであってもよい。
セレクタ24Aの各々は、保持回路23Aから供給されるデータD1、及び副制御回路21から供給されるダミーデータ[B2_DATA]のいずれか一方を、副制御回路21から供給される選択信号[B2_SEL]に基づいて選択し、選択したデータを出力する。セレクタ24Aの各々から出力されたデータは、保持回路23Bの各々に入力される。
保持回路23Bの各々は、クロックイネーブル信号[X_CLK_ENB_1]または[X_CLK_ENB_2]に応じて有効化されたクロック信号CLKに同期して、入力されたデータを取り込んで保持する。保持回路23Bは、保持しているデータを出力する。保持回路23Bの各々から出力されるデータD2は、セレクタ24Bの各々の一方の入力端子に入力される。保持回路23Bの各々は、例えばフリップフロップであってもよい。
セレクタ24Bの各々は、保持回路23Bから供給されるデータD2、及び副制御回路21から供給されるダミーデータ[X_DATA]のいずれか一方を、副制御回路21から供給される選択信号[X_SEL]に基づいて選択し、選択したデータを出力する。セレクタ24Bの各々から出力されたデータは、演算器22の各々に入力される。
演算器22は、セレクタ24Bから供給されるデータについて演算を行って、演算結果をデータD3として出力する。演算器22から出力されるデータD3は、保持回路23Cに入力される。
保持回路23Cは、クロックイネーブル信号[LX_CLK_ENB_1]または[LX_CLK_ENB_2]に応じて有効化されたクロック信号CLKに同期して、入力されたデータを取り込んで保持する。保持回路23Cは、保持しているデータを出力する。保持回路23Cから出力されるデータD3は、保持回路23Dに入力される。保持回路23Cは、例えばフリップフロップであってもよい。
保持回路23Dは、主制御回路10から供給されるクロックイネーブル信号[RR_CLK_ENB]に応じて有効化されたクロック信号CLKに同期して入力されたデータを取り込んで保持する。保持回路23Dは保持しているデータを出力する。保持回路23Dは、例えばフリップフロップであってもよい。
副制御回路21は、主制御回路10から供給される、各種制御信号([PW_DATA[7:0]]、[RS]、[PR_ENB]、[B2_VALID]、[X_VALID]、[LX_VALID])に応じて、ダミーデータ[B2_DATA]、[X_DATA]、選択信号[B2_SEL]、[X_SEL]、クロックイネーブル信号[X_CLK_ENB_2]、[LX_CLK_ENB_2]を出力する。
制御信号[PW_DATA[7:0]]は、電流底上げ動作を、各演算回路20に行わせる場合に“1”とされ、電流底上げ動作の実行を禁止する場合に“0”とされる。電流底上げ動作とは、演算命令に基づく本来の演算を行わない演算器22が、ダミーデータ[B2_DATA]、[X_DATA]を用いて演算を行う動作である。演算命令とは、当該命令の実行に演算器22を使用する命令である。
演算回路20において、電流底上げ動作が実行されることで、演算回路20の基底状態における回路電流が底上げされる。これにより、演算回路20において、回路電流が最も大きくなるピーク状態における回路電流の大きさと、基底状態における回路電流の大きさとの差が小さくなり、電源ノイズが抑制される。
制御信号[PW_DATA[7:0]]は、例えば、演算回路20が停止状態から稼働状態に移行するタイミングに応じて“0”から“1”に遷移し、演算回路20が稼働状態から停止状態に移行するタイミングに応じて“1”から“0”に遷移する。制御信号[PW_DATA[7:0]]は、コア100を構成する8つの演算回路20の各々に対応する8ビットの信号であり、各ビット値が対応する演算回路20に供給される。
制御信号[RS]は、演算回路20を停止状態(リテンションステート)にする場合“1”とされ、演算回路20を稼働状態にする場合に“0”とされる。
制御信号[PR_ENB]は、上位システムから主制御回路10に供給される命令列が、電源ノイズを発生し得る特定の状態であると主制御回路10が判定した場合に“1”とされる。主制御回路10は、例えば、複数の演算回路20が一斉に停止状態から稼働状態または稼働状態から停止状態に移行にすることが命令列によって示されている場合、当該命令列が電源ノイズを発生し得る特定の状態であると判定する。すなわち、主制御回路10は、回路電流の変動幅が所定値よりも大きくなるおそれがあることを命令列から検出した場合に、制御信号[PR_ENB]を“1”とする。
制御信号[B2_VALID]は、演算命令に基づいて演算回路20において行われるパイプライン処理のB2サイクルに演算器22を起動する場合に“1”とされる。制御信号[X_VALID]は、演算命令に基づいて演算回路20において行われるパイプライン処理のXサイクルに演算器22を起動する場合に“1”とされる。制御信号[LX_VALID]は、演算命令に基づいて演算回路20において行われるパイプライン処理のLXサイクルに演算器22を起動する場合に“1”とされる。
主制御回路10は、上記の各種制御信号([PW_DATA[7:0]]、[RS]、[PR_ENB]、[B2_VALID]、[X_VALID]、[LX_VALID])を副制御回路21に供給することで、電流底上げ動作の実行/非実行を制御する。下記の表1は、各種制御信号と電流底上げ動作の実行/非実行との関係を示す表である。表1において、丸印は電流底上げ動作の実行を示し、バツ印は電流底上げ動作の非実行を示す。
Figure 0007200507000001
制御信号[PW_DATA[7:0]]が“0”のとき、その他の制御信号([RS]、[PR_ENB]、[B2_VALID]、[X_VALID]、[LX_VALID])にかかわらず、演算回路20において電流底上げ動作は実行されない。すなわち、制御信号[PW_DATA[7:0]]が“0”のとき電流底上げ動作が禁止される。制御信号[PW_DATA[7:0]]が“1”のとき、その他の制御信号([RS]、[PR_ENB]、[B2_VALID]、[X_VALID]、[LX_VALID])の状態に応じて、電流底上げ動作の実行/非実行が定められる。
クロックイネーブル信号[B2_CLK_ENB]は、パイプライン処理のB2サイクルにおいて、保持回路23Aのクロック信号CLKの有効化/無効化を制御するための信号である。クロックイネーブル信号[B2_CLK_ENB]が“1”となることで、クロック信号CLKが有効化され、クロックイネーブル信号[B2_CLK_ENB]が“0”となることで、クロック信号CLKが無効化される。
クロックイネーブル信号[X_CLK_ENB_1]は、パイプライン処理のXサイクルにおいて、保持回路23Bのクロック信号CLKの有効化/無効化を制御するための信号である。クロックイネーブル信号[X_CLK_ENB_1]が“1”となることで、クロック信号CLKが有効化され、クロックイネーブル信号[X_CLK_ENB_1]が“0”となることで、クロック信号CLKが無効化される。
クロックイネーブル信号[LX_CLK_ENB_1]は、パイプライン処理のLXサイクルにおいて、保持回路23Cのクロック信号CLKの有効化/無効化を制御するための信号である。クロックイネーブル信号[LX_CLK_ENB_1]が“1”となることで、クロック信号CLKが有効化され、クロックイネーブル信号[LX_CLK_ENB_1]が“0”となることで、クロック信号CLKが無有効化される。
クロックイネーブル信号[RR_CLK_ENB]は、パイプライン処理のRRサイクルにおいて、保持回路23Dのクロック信号CLKの有効化/無効化を制御するための信号である。クロックイネーブル信号[RR_CLK_ENB_1]が“1”となることで、クロック信号CLKが有効化され、クロックイネーブル信号[RR_CLK_ENB_1]が“0”となることで、クロック信号CLKが無有効化される。
副制御回路21は、主制御回路10から供給される各種制御信号([PW_DATA[7:0]]、[RS]、[PR_ENB]、[B2_VALID]、[X_VALID]、[LX_VALID])に基づいて、電流底上げ動作を実行する場合、以下の処理を行う。
電流底上げ動作を実行する副制御回路21は、ダミーデータ[B2_DATA]をセレクタ24Aに供給する。また、電流底上げ動作を実行する副制御回路21は、データD1及びダミーデータ[B2_DATA]のうち、ダミーデータ[B2_DATA]を選択すべきことを示す選択信号[B2_SEL]をセレクタ24Aに供給する。また、電流底上げ動作を実行する副制御回路21は、保持回路23Bのクロック信号CLKを有効化させるクロックイネーブル信号[X_CLK_ENB_2]を保持回路23Bに供給する。また、電流底上げ動作を実行する副制御回路21は、ダミーデータ[X_DATA]をセレクタ24Bに供給する。また、電流底上げ動作を実行する副制御回路21は、データD2及びダミーデータ[X_DATA]のうち、ダミーデータ[X_DATA]を選択すべきことを示す選択信号[X_SEL]をセレクタ24Bに供給する。また、電流底上げ動作を実行する副制御回路21は、保持回路23Cのクロック信号CLKを有効化させるクロックイネーブル信号[LX_CLK_ENB_2]を保持回路23Cに供給する。
電流底上げ動作を実行する副制御回路21が上記の処理を行うことで、ダミーデータ[B2_DATA]がセレクタ24Aから出力され、保持回路23Bにおいてダミーデータ[B2_DATA]が保持される。また、ダミーデータ[B2_DATA]または[X_DATA]がセレクタ24Bから出力され、演算器22に供給される。
演算回路20において電流底上げ動作が実行されることで、演算器22は、ダミーデータ[B2_DATA]または[X_DATA]について演算を行い、演算結果をデータD3として出力する。保持回路23Cは、クロックイネーブル信号[LX_CLK_ENB_2]に基づいてクロック信号CLKが有効化されることで、データD3を保持する。演算器22がダミーデータ[B2_DATA]または[X_DATA]ついて演算することによって得られたデータD3は、保持回路23Dに取り込まれることなく破棄される。
図5は、電流底上げ動作の効果の一例を示す図である。図5の上段は、回路電流の時間推移を示すグラフであり、実線が電流底上げ動作を実行した場合に対応し、点線が電流底上げ動作を実行しない場合に対応する。図5の下段は、電源電圧の時間推移を示すグラフであり、実線が電流底上げ動作を実行した場合に対応し、点線が電流底上げ動作を実行しない場合に対応する。電流底上げ動作が実行されると、演算命令に基づく本来の演算を行わない演算器22が、ダミーデータ[B2_DATA]または[X_DATA]について演算を行う。これにより、図5の上段に示すように、演算回路20の基底状態における回路電流が底上げされ、ピーク状態における回路電流の大きさと、基底状態における回路電流の大きさとの差が小さくなる。その結果、電源ノイズが抑制される。
ここで、例えば、演算器22に「0+0=0」の演算を繰り返し実行させたとしても、回路電流の底上げ効果は期待できない。一方、演算器22の演算結果であるデータD3の各ビットの値が“0”から“1”または“1”から“0”に反転するような演算を演算器22に行わせることで回路電流を効果的に底上げすることが可能である。副制御回路21は、ダミーデータ[B2_DATA]、[X_DATA]として、演算器22の入力ビットの各々に対応したビット列を含む、互いに異なる複数のデータパターンを保持している。副制御回路21は、ダミーデータを構成する複数のデータパターンを順次演算器22に入力する。これにより、演算器22の演算結果であるデータD3の少なくとも1つのビットの値が“0”から“1”または“1”から“0”に反転するような演算を演算器22に行わせる。すなわち、ダミーデータ[B2_DATA]、[X_DATA]をそれぞれ構成する複数のデータパターンは、これらが演算器22に順次供給されることにより、演算器22の出力ビットの少なくとも1ビットの値が反転するように構成されている。これにより、回路電流を効果的に底上げすることが可能となる。
また、演算器22の演算結果であるデータD3の各ビットのうち、“0”から“1”または“1”から“0”に反転するビットの数(以下、反転ビット数という)制御することで、回路電流の底上げ量を調整することも可能である。例えば、64ビットの演算器22から出力されるデータD3の64個の全てのビットの値が反転する場合の回路電流の底上げ量を100とした場合、データD3の32個のビットの値が反転する場合の回路電流の底上げ量は約50である。プロセッサ1において、ダミーデータ[B2_DATA]、[X_DATA]として演算器22に順次入力するデータパターンの組み合わせを適宜選択することで、演算器22の出力における反転ビット数を制御して回路電流の底上げ量を調整してもよい。
図6は、開示の技術の実施形態に係る演算回路20の制御態様の一例を示すフローチャートである。この例では、演算回路20が稼働状態(制御信号[PW_DATA[7:0]]が“1”且つ制御信号[RS]が“0”)にある場合を想定している。
ステップS1において、主制御回路10は、上位システムから供給される命令列に実行すべき命令が存在するか否かを判定する。主制御回路10は、命令列に実行すべき命令が含まれていると判定した場合、処理をステップS2に移行し、命令列に実行すべき命令が含まれていないと判定した場合、処理をステップS13に移行する。
ステップS2において、主制御回路10は、命令列に含まれる命令を解釈する。ステップS3において、主制御回路10は、実行すべき命令が演算命令であるか否かを判定する。主制御回路10は、実行すべき命令が演算命令であると判定した場合、処理をステップS4に移行し、実行すべき命令が演算命令ではないと判定した場合、処理をステップS6に移行する。
ステップS4において、主制御回路10は、クロックイネーブル信号[B2_CLK_ENB]、[X_CLK_ENB_1]、[LX_CLK_ENB_1]、[RR_CLK_ENB]を順次“1”とすることで、保持回路23A、23B、23C、23Dのクロック信号CLKを順次有効化させる。
ステップS5において、演算器22は、演算命令に基づく演算を実行する。すなわち、演算器22は、演算命令に係るデータ(保持回路23Bから供給されるデータD2)について演算を行う。その後、処理は、ステップS1に戻される。
ステップS6において、主制御回路10は、命令列が、電源ノイズを発生し得る特定の状態であるか否かを判定する。主制御回路10は、例えば、複数の演算回路20が一斉に停止状態から稼働状態または稼働状態から停止状態に移行にすることを命令列が示している場合、当該命令列が電源ノイズを発生し得る特定の状態であると判定する。主制御回路10は、命令列が、電源ノイズを発生し得る特定の状態ではないと判定した場合、処理をステップS7に移行し、命令列が、電源ノイズを発生し得る特定の状態であると判定した場合、処理をステップS9に移行する。
ステップS7において、主制御回路10は、クロックイネーブル信号[B2_CLK_ENB]、[X_CLK_ENB_1]、[LX_CLK_ENB_1]、[RR_CLK_ENB]を“0”とすることで、保持回路23A、23B、23C、23Dのクロック信号CLKを無効化させる。
ステップS8において、主制御回路10は、演算命令ではない命令(例えばロード命令等)を実行する。その後、処理はステップS1に戻される。
ステップS9において、主制御回路10は、制御信号[PR_ENB]を“1”とすることで、演算回路20に電流底上げ動作を実行させる。これに応じて、副制御回路21は、クロックイネーブル信号[X_CLK_ENB_2]、[LX_CLK_ENB_2]を“1”とすることで、保持回路23B、23Cのクロック信号CLKを有効化させる。
ステップS10において、副制御回路21は、ダミーデータ[B2_DATA]をセレクタ24Aに供給するとともにダミーデータ[B2_DATA]を選択すべきことを示す選択信号[B2_SEL]をセレクタ24Aに供給する。また、副制御回路21は、ダミーデータ[X_DATA]をセレクタ24Bに供給するとともにダミーデータ[X_DATA]を選択すべきことを示す選択信号[X_SEL]をセレクタ24Bに供給する。
ステップS11において、演算器22は、ダミーデータ[B2_DATA]、[X_DATA]について演算を実行する。このように演算命令に基づく演算を実行しない演算器22に、ダミーデータ[B2_DATA]、[X_DATA]について演算を実行させることで、電流底上げ動作が実現される。その後、処理は、ステップS1に戻される。
ステップS12において、主制御回路10は、演算器22によるダミーデータ[B2_DATA]、[X_DATA]についての演算と並行して、演算命令ではない命令を実行する。その後、処理はステップS1に戻される。
命令列に実行すべき命令が含まれていない場合、ステップS13において、主制御回路10は、命令列が、電源ノイズを発生し得る特定の状態であるか否かを判定する。主制御回路10は、例えば、複数の演算回路20が一斉に停止状態から稼働状態または稼働状態から停止状態に移行にすることを命令列が示している場合、当該命令列が電源ノイズを発生し得る特定の状態であると判定する。主制御回路10は、命令列が、電源ノイズを発生し得る特定の状態であると判定した場合、処理をステップS14に移行し、命令列が、電源ノイズを発生し得る特定の状態ではないと判定した場合、処理を終了させる。
ステップS14において、主制御回路10は、制御信号[PR_ENB]を“1”とすることで、演算回路20に電流底上げ動作を実行させる。これに応じて、副制御回路21は、クロックイネーブル信号[X_CLK_ENB_2]、[LX_CLK_ENB_2]を“1”とすることで、保持回路23B、23Cのクロック信号CLKを有効化させる。
ステップS15において、副制御回路21は、ダミーデータ[B2_DATA]をセレクタ24Aに供給するとともにダミーデータ[B2_DATA]を選択すべきことを示す選択信号[B2_SEL]をセレクタ24Aに供給する。また、副制御回路21は、ダミーデータ[X_DATA]をセレクタ24Bに供給するとともにダミーデータ[X_DATA]を選択すべきことを示す選択信号[X_SEL]をセレクタ24Bに供給する。
ステップS16において、演算器22は、ダミーデータ[B2_DATA]、[X_DATA]について演算を実行する。このように、演算命令に基づく演算を実行しない演算器22に、ダミーデータ[B2_DATA]、[X_DATA]について演算を実行させることで、電流底上げ動作が実現される。
以上のように、開示の技術の実施形態に係るプロセッサ1によれば、供給される命令列に演算命令が含まれている場合、演算器22は、当該演算命令に係るデータ(保持回路23Bから供給されるデータD2)について演算を行う。一方、命令列に実行すべき命令が含まれていないか、命令列に演算命令が含まれていない場合には、命令列が、電源ノイズを発生し得る特定の状態である場合に、演算器22は、ダミーデータ[B2_DATA]、[X_DATA]について演算を実行する。演算器22が、ダミーデータ[B2_DATA]、[X_DATA]について演算を実行することで、演算回路20の基底状態における回路電流が底上げされる。これにより、ピーク状態における回路電流の大きさと、基底状態における回路電流の大きさとの差が小さくなり、電源ノイズが抑制される。
図7は、開示の技術の実施形態に係る演算回路20の制御態様の一例を示すタイムチャートである。演算回路20が停止状態(リテンションステート)にある場合、制御信号[RS]が“1”とされる。この状態において、命令列が電源ノイズを発生し得る特定の状態にあることを主制御回路10が検出すると、主制御回路10は、制御信号[PR_ENB]を“1”に遷移させる(時刻t1)。これに応じて副制御回路21は、クロックイネーブル信号[X_CLK_ENB_2]、[LX_CLK_ENB_2]及び選択信号[B2_SEL]、[X_SEL]を“1”に遷移させる。これにより、演算回路20において電流底上げ動作が開始される。電流底上げ動作時において、演算器22は、ダミーデータ[B2_DATA]、[X_DATA]について演算を行う。
時刻t2において、主制御回路10が制御信号[RS]を“0”に遷移させると、演算回路20が稼働状態に移行する。演算回路20が稼働状態にある間、[B2_VALID]、[X_VALID]、[LX_VALID]が“1”となると、クロックイネーブル信号[X_CLK_ENB_2]、[LX_CLK_ENB_2]及び選択信号[B2_SEL]、[X_SEL]は“0”となる。すなわち、演算回路20が演算命令を実行する場合、電流底上げ動作が停止され、演算器22は、演算命令に基づく演算を行う。一方、演算回路20が演算命令を実行せず且つ制御信号[PR_ENB]が“1”とされている場合、演算回路20において電流底上げ動作が実行される。電流底上げ動作時において、演算器22は、ダミーデータ[B2_DATA]、[X_DATA]について演算を行う。
時刻t3において、主制御回路10が制御信号[RS]を“1”に遷移させると、演算回路20が停止状態(リテンションステート)に移行する。その後、命令列が電源ノイズを発生し得る特定の状態ではない状態となると、主制御回路10は、制御信号[PR_ENB]を“0”に遷移させる(時刻t4)。これにより、クロックイネーブル信号[X_CLK_ENB_2]、[LX_CLK_ENB_2]及び選択信号[B2_SEL]、[X_SEL]は“0”となり、演算回路20において、電流底上げ動作が停止する。
図8は、比較例に係る演算回路20Xの構成を示す回路ブロック図である。比較例に係る演算回路20Xは、開示の技術の実施形態に係る演算回路20(図4参照)が有する、副制御回路21、セレクタ24A、24B、ORゲート25A、25Bを備えていない。
図9は、比較例に係る演算回路20Xの制御態様の一例を示すフローチャートである。この例では、開示の技術の実施形態に係るフローチャート(図6)におけるステップS6、S9~S16において実施される各処理が省略されている。すなわち、この比較例に係る制御態様によれば、演算命令が存在する場合には、保持回路23A~23Dの各クロック信号CLKが有効化され、演算命令が存在しない場合には、保持回路23A~23Dのクロック信号CLKが無効化される。この態様によれば、演算回路20Xの基底状態における回路電流の大きさと、ピーク状態における回路電流の大きさとの差が大きくなり、電源ノイズが大きくなる。
図10は、比較例に係る演算回路20Xの制御態様の他の例を示すフローチャートである。この例では、図9に示すフローチャートに対して、ステップS21~S23が追加されている。すなわち、この比較例に係る制御態様によれば、実行すべき命令が存在しない場合、ステップS21において、命令列が、電源ノイズを発生し得る特定の状態であるか否が判定される。命令列が、電源ノイズを発生し得る特定の状態ではないと判定された場合、ステップS22において、保持回路23A~23Dの各クロック信号CLKが無効化される。一方、命令列が、電源ノイズを発生し得る特定の状態であると判定された場合、ステップS23において、保持回路23A~23Dの各クロック信号CLKが有効化される。この比較例に係る制御態様によれば、実行すべき命令が存在せず、電源ノイズが発生し得る場合に、省電力制御を実現するためのクロックゲーティング技術によるクロック信号の無効化が解除され、これによって回路電流が増加する。しかしながら、クロック信号の無効化を解除したことによる電流増加量だけでは十分な電流量を獲得することは困難な場合があり、電源ノイズを許容範囲にまで抑えることができない場合がある。
図11は、比較例に係る演算回路20Xの制御態様の他の例を示すフローチャートである。この例では、図9に示すフローチャートに対して、ステップS31、S32が追加されている。すなわち、この比較例に係る制御態様によれば、演算命令が存在する場合に、ステップS31において、命令列が、電源ノイズを発生し得る特定の状態であるか否が判定される。命令列が、電源ノイズを発生し得る特定の状態であると判定された場合、ステップS32において、プリアクセス命令及びアクセスエンド命令が実行される。プリアクセス命令とは、回路資源の一部をダミーで動作させることにより、その回路資源に対する省電力制御を段階的に無効化する命令である。アクセスエンド命令とは、回路資源に対する省電力制御を段階的に有効化する命令である。この比較例に係る制御態様によれば、プリアクセス命令によって回路電流が増加する。しかしながら、回路電流の大きさは、そのときに演算器22に入力されるデータに依存することとなり、電源ノイズを許容範囲にまで抑えることが困難な場合がある。
一方、開示の技術の実施形態に係る演算回路20の制御態様によれば、電源ノイズが発生し得る場合に、演算命令に基づく本来の演算を行わない演算器22が、ダミーデータ[B2_DATA]、[X_DATA]を用いて演算を行う。回路電流の底上げにダミーデータ[B2_DATA]、[X_DATA]を用いることで、演算器22の演算結果であるデータD3の各ビットの値が例えば、“0”から“1”または“1”から“0”に反転するような演算を演算器22に繰り返し行わせることが可能となる。これにより、回路電流の底上げを効果的に行うことが可能である。また、ダミーデータ[B2_DATA]、[X_DATA]を構成するデータパターンを適宜選択することで、回路電流の底上げ量を調整することも可能である。従って、開示の技術の実施形態に係るプロセッサ1によれば、回路電流の変動に伴う電源ノイズを効果的に抑制することが可能となる。
[第2の実施形態]
図12は、開示の技術の第2の実施形態に係る演算回路20の制御態様の一例を示すタイムチャートである。本実施形態において、主制御回路10は、コア100が備える8つの演算回路20の各々に対応する8つの制御信号[PW_DATA[0]]~[PW_DATA[7]]を、対応する演算回路20に個別に供給する。
主制御回路10は、制御信号[RS]が“1”から“0”に遷移するタイミング(すなわち、演算回路20が停止状態(リテンションステート)から稼働状態に移行するタイミング)に合わせて、制御信号[PW_DATA[0]]~[PW_DATA[7]]を段階的に“0”から“1”に遷移させる。これにより、各演算回路20が停止状態(リテンションステート)から稼働状態に移行する際に、各演算回路20において、電流底上げ動作が段階的に実行される。
また、主制御回路10は、制御信号[RS]が“0”から“1”に遷移するタイミング(すなわち、演算回路20が稼働状態から停止状態(リテンションステート)に移行するタイミング)に合わせて、制御信号[PW_DATA[0]]~[PW_DATA[7]]を段階的に“1”から“0”に遷移させる。これにより、各演算回路20が稼働状態から停止状態(リテンションステート)に移行する際に、各演算回路20において、電流底上げ動作が段階的に解除される。
例えば、SIMD(Single Instruction Multiple Data)動作の切り替え時のように、稼働/停止がコア単位で生じる場合、電流底上げ動作の実行及び解除を、コア100を構成する複数の演算回路20に対して一括して行うと、電源ノイズが発生するおそれがある。開示の技術の第2の実施形態に係る演算回路20の制御態様によれば、制御信号[PW_DATA[0]]~[PW_DATA[7]]が段階的に遷移するので、電流底上げ動作の実行及び解除を、コア100を構成する複数の演算回路20に対して段階的に行うことが可能となる。従って、SIMD動作の切り替え時のように、稼働/停止がコア単位で生じる場合でも電源ノイズの発生を抑制することが可能となる。
なお、コア100は、開示の技術における半導体装置の一例である。演算器22は、開示の技術における演算部の一例である。主制御回路10及び副制御回路21は、開示の技術における制御部の一例である。データD1、D2は、開示の技術における第1のデータの一例である。ダミーデータ[B2_DATA]、[X_DATA]は、開示の技術における第2のデータの一例である。セレクタ24A、24Bは、開示の技術における選択部の一例である。
以上の実施形態に関し、更に以下の付記を開示する。
(付記1)
入力されたデータについて演算を行う演算部と、
供給される命令列に演算命令が含まれている場合、当該演算命令の演算対象である第1のデータについて前記演算部に演算を行わせ、前記命令列に演算命令が含まれておらず、前記命令列が特定の状態にある場合、前記第1のデータとは異なる第2のデータについて前記演算部に演算を行わせる制御部と、
を含む半導体装置。
(付記2)
前記第1のデータ及び前記第2のデータのうちのいずれか一方を選択して、前記演算部に供給する選択部を更に含む
付記1に記載の半導体装置。
(付記3)
前記第2のデータは、互いに異なる複数のデータパターンを含み、
前記制御部は、前記演算部に前記複数のデータパターンを順次供給する
付記1または付記2に記載の半導体装置。
(付記4)
前記複数のデータパターンは、前記演算部の出力ビットの少なくとも1つの値が反転している
付記3に記載の半導体装置。
(付記5)
複数の演算部を含み、
前記制御部は、前記第2のデータについて演算を行わせる制御を、前記複数の演算部に対して段階的に行う
付記1から付記4のいずれか1つに記載の半導体装置。
(付記6)
前記制御部は、
前記命令列が前記特定の状態にあることを示す制御信号を出力する主制御回路と、
前記制御信号に基づいて、前記第1のデータ及び前記第2のデータのうち前記第2のデータを選択すべき選択信号を前記選択部に供給する副制御回路と、を含む
付記2に記載の半導体装置。
(付記7)
半導体装置の制御方法において、
前記半導体装置が有する演算部が、入力されたデータについて演算を行い、
供給される命令列に演算命令が含まれている場合、前記半導体装置が有する制御部が、当該演算命令の演算対象である第1のデータについて前記演算部に演算を行わせ、前記命令列に演算命令が含まれておらず、前記命令列が特定の状態にある場合、前記制御部が、前記第1のデータとは異なる第2のデータについて前記演算部に演算を行わせる、
半導体装置の制御方法。
(付記8)
前記半導体装置が有する選択部が、前記第1のデータ及び前記第2のデータのうちのいずれか一方を選択して、前記演算部に供給する
付記7に記載の制御方法。
(付記9)
前記第2のデータは、互いに異なる複数のデータパターンを含み、
前記制御部が、前記演算部に前記複数のデータパターンを順次供給する
付記7または付記8に記載の制御方法。
(付記10)
前記複数のデータパターンは、前記演算部の出力ビットの少なくとも1ビットの値が反転している
付記9に記載の制御方法。
(付記11)
前記制御部が、前記第2のデータについて演算を行わせる制御を、複数の演算部に対して段階的に行う
付記7から付記10のいずれか1つに記載の制御方法。
1 プロセッサ
10 主制御回路
20 演算回路
21 副制御回路
22 演算器
23A、23B、23C、23D 保持回路
24A、24B セレクタ
100 コア

Claims (6)

  1. 入力されたデータについて演算を行う演算部と、
    供給される命令列に演算命令が含まれている場合、当該演算命令の演算対象である第1のデータについて前記演算部に演算を行わせ、前記命令列に演算命令が含まれておらず、前記命令列が特定の状態にある場合、前記第1のデータとは異なる第2のデータについて前記演算部に演算を行わせる制御部と、
    を含む半導体装置。
  2. 前記第1のデータ及び前記第2のデータのうちのいずれか一方を選択して、前記演算部に供給する選択部を更に含む
    請求項1に記載の半導体装置。
  3. 前記第2のデータは、複数のデータパターンを含み、
    前記制御部は、前記演算部に前記複数のデータパターンを順次供給する
    請求項1または請求項2に記載の半導体装置。
  4. 前記複数のデータパターンは、前記演算部の出力ビットの少なくとも1ビットの値が反転している
    請求項3に記載の半導体装置。
  5. 複数の演算部を含み、
    前記制御部は、前記第2のデータについて演算を行わせる制御を、前記複数の演算部に対して段階的に行う
    請求項1から請求項4のいずれか1項に記載の半導体装置。
  6. 半導体装置の制御方法において、
    前記半導体装置が有する演算部が、入力されたデータについて演算を行い、
    供給される命令列に演算命令が含まれている場合、前記半導体装置が有する制御部が、当該演算命令の演算対象である第1のデータについて前記演算部に演算を行わせ、前記命令列に演算命令が含まれておらず、前記命令列が特定の状態にある場合、前記制御部が、前記第1のデータとは異なる第2のデータについて前記演算部に演算を行わせる、
    半導体装置の制御方法。
JP2018108572A 2018-06-06 2018-06-06 半導体装置及び演算器の制御方法 Active JP7200507B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2018108572A JP7200507B2 (ja) 2018-06-06 2018-06-06 半導体装置及び演算器の制御方法
US16/413,641 US11294629B2 (en) 2018-06-06 2019-05-16 Semiconductor device and control method of semiconductor device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2018108572A JP7200507B2 (ja) 2018-06-06 2018-06-06 半導体装置及び演算器の制御方法

Publications (2)

Publication Number Publication Date
JP2019212101A JP2019212101A (ja) 2019-12-12
JP7200507B2 true JP7200507B2 (ja) 2023-01-10

Family

ID=68764990

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018108572A Active JP7200507B2 (ja) 2018-06-06 2018-06-06 半導体装置及び演算器の制御方法

Country Status (2)

Country Link
US (1) US11294629B2 (ja)
JP (1) JP7200507B2 (ja)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007189391A (ja) 2006-01-12 2007-07-26 Matsushita Electric Ind Co Ltd 映像信号処理回路
WO2011074059A1 (ja) 2009-12-14 2011-06-23 富士通株式会社 演算処理装置、情報処理装置及びその制御方法
JP2014059761A (ja) 2012-09-18 2014-04-03 Fujitsu Ltd 半導体集積回路及びコンパイラ

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04143819A (ja) * 1989-12-15 1992-05-18 Hitachi Ltd 消費電力制御方法、半導体集積回路装置およびマイクロプロセツサ
CN101681250A (zh) * 2006-12-21 2010-03-24 Vns业务有限责任公司 计算机中的交替指令和/或数据位的反转
JP2013205905A (ja) 2012-03-27 2013-10-07 Fujitsu Ltd 演算処理装置及び演算処理装置の制御方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007189391A (ja) 2006-01-12 2007-07-26 Matsushita Electric Ind Co Ltd 映像信号処理回路
WO2011074059A1 (ja) 2009-12-14 2011-06-23 富士通株式会社 演算処理装置、情報処理装置及びその制御方法
JP2014059761A (ja) 2012-09-18 2014-04-03 Fujitsu Ltd 半導体集積回路及びコンパイラ

Also Published As

Publication number Publication date
JP2019212101A (ja) 2019-12-12
US11294629B2 (en) 2022-04-05
US20190377551A1 (en) 2019-12-12

Similar Documents

Publication Publication Date Title
US10620686B2 (en) Semiconductor integrated circuit
US8239700B2 (en) Systems and methods for power dissipation control in a semiconductor device
US8063509B2 (en) Power supply voltage adjusting apparatus, recording medium, and power supply voltage adjusting method
US20100268917A1 (en) Systems and Methods for Ramped Power State Control in a Semiconductor Device
JP2013205905A (ja) 演算処理装置及び演算処理装置の制御方法
US20100269074A1 (en) Predictive Power Management Semiconductor Design Tool and Methods for Using Such
US8291364B2 (en) Automated digital circuit design tool that reduces or eliminates adverse timing constraints do to an inherent clock signal skew, and applications thereof
US11842199B2 (en) Controlling the operating speed of stages of an asynchronous pipeline
US8806181B1 (en) Dynamic pipeline reconfiguration including changing a number of stages
CN110413414B (zh) 用于平衡负载的方法、装置、设备和计算机可读存储介质
US7725843B2 (en) Behavioral synthesis apparatus, behavioral synthesis method, method for manufacturing digital circuit, behavioral synthesis control program and computer-readable recording medium
JP7200507B2 (ja) 半導体装置及び演算器の制御方法
US8127161B2 (en) Data processing apparatus
US20210234543A1 (en) Information processing apparatus, control method thereof, and non-transitory computer-readable storage medium
JP2007065756A (ja) クロック制御回路、クロック制御方法、半導体集積回路装置、及び電子機器
JP2018528548A (ja) 露出キャッシュ停止時における効果的なクロックスケーリングのための方法および装置
JP5206240B2 (ja) 情報処理装置および情報処理方法
JP5486368B2 (ja) マイクロコンピュータ及びマイクロコンピュータの制御方法
US20170083336A1 (en) Processor equipped with hybrid core architecture, and associated method
US20100229144A1 (en) System and method for behavioral synthesis
JP2004334641A (ja) 情報処理装置および記録媒体、並びにプロセッサ
JP2005084712A (ja) キャッシュシステム
JP2006072864A (ja) 演算装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20210310

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20220128

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20220201

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20220802

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20221122

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20221205

R150 Certificate of patent or registration of utility model

Ref document number: 7200507

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150