AMD と Intel が互いに競争できるようになるために、Zen アーキテクチャにはどのような進歩がありましたか?

AMD と Intel が互いに競争できるようになるために、Zen アーキテクチャにはどのような進歩がありましたか?
AMD が最後に Intel と直接対決したのは何年も前のことだ。 A ファンは皆、EV6 バスによって開拓された K7 時代と、AMD64 が Microsoft の新システムに支持され、Intel が IA64 の推進を断念して A からライセンスを取得して x86-64 に切り替えざるを得なくなった栄光の時代を懐かしく思っています。しかし、良い時は決して長くは続かない。 Intel が NetBurst の影を取り除き、Core 時代を築いたため、A は I に対して優位に立つことができなくなりました。その後、ARM 陣営に加わっても、Intel には何の利益ももたらしませんでした。同時に、GPU 部門も衰退が顕著になり、NVIDIA によって長い間抑圧されるようになりました。そのため、過去数年間は「スライド」工場というあだ名が付けられました。AMD は「PPT で国を救う」という方針に頼って A ファンの心を宙に浮かせてきましたが、A のアップグレードに直面するたびに、彼らのサポートコメントはほとんど自虐的なものになっています。しかし今回、AMD は人々に本当に好転の希望を与えたようだ。今週開催されたHot Chips 2016チップ技術フォーラムで、AMDは新しいマイクロプロセッサアーキテクチャZenに関する多くの詳細を公開しました。これはヒーローの復活の兆しのようです。では、AMD が再び Intel と同じ土俵に立つことができるよう、Zen はどのような進歩を遂げたのでしょうか?活力を与えるもの:マイクロ命令キャッシュ次世代マイクロプロセッサ アーキテクチャの設計では、AMD は既存のアーキテクチャを完全に放棄し、最初から「高性能 x86 プロセッサ」という目標を設定し、Zen のコアを再設計することを選択しました。前世代のアーキテクチャ、つまりブルドーザー/掘削機は、実際のテストで多くの欠陥が明らかになりました。 AMD のコア設計エンジニアは、漏れをチェックして補うのではなく、最初に分解してから構築することを選択する独自の考慮事項を持っている必要があります。新しいコア アーキテクチャには注目すべき変更点が 1 つあります。AMD が Zen にマイクロ命令キャッシュを追加したのです。コンピューティング モジュールにおけるマイクロ命令キャッシュの役割は、マイクロ命令をマイクロ命令キューに近づけ、コアが下位レベルの命令キャッシュから命令をフェッチするのに余分な時間を費やすことを回避することです。これは、コア全体の実行効率を向上させるのに非常に効果的です。 Intel は、CPU コア設計にマイクロ命令キャッシュを非常に早い段階で追加し始め、その結果が非常に良好であったため、数世代にわたってそれを続けました (Intel と AMD の差を広げた Conroe がこれによって直接恩恵を受けた可能性があることを考慮すると、AMD の模倣がより大きなプラス効果をもたらすと信じない理由はありません。 AMD Zen のマイクロ命令キャッシュに関する現在の疑問は、そのサイズだけです。推測するに、一般的なマイクロオペレーション キャッシュは比較的小さく、Intel のマイクロオペレーション キャッシュは 8 ウェイ 1536 uOps をサポートしているため、選択肢があまりないため、AMD のバッファー パラメーターは Intel と同等になるはずです。これにより、Zen では前世代のコアと比較してクロックサイクルあたりの命令数 (IPC) が少なくとも 40% 増加しているという AMD の主張は、はるかに信頼性が高まります。もちろん、数値的な改善なしにマイクロ命令キャッシュだけを追加した場合、40% という数字はやや見劣りすると思われるため、AMD は Zen のさまざまな指標も拡大しました。単一のマイクロ命令ディスパッチの数は 4 から 6 に増加しました (4 つの整数マイクロ命令と 6 つの浮動小数点マイクロ命令を同時にディスパッチできます)。整数/浮動小数点命令スケジューラが 48/60 から 84/96 に増加しました。 L/S キューとコールバック キューの長さは両方とも約 50% 増加しました。理想的には、これらの数値の改善とより正確な分岐予測を組み合わせることで、コアは最速の順序でより高いスループットを達成し、この高い効率をより長い期間維持できるようになります。 AMD Zen は、マイクロ命令キャッシュによって、コアの欠点を補ったと言えます。このステップがなければ、Intel に挑戦することは不可能でしょう。信頼を再び再構築: キャッシュ階層の再構築Zen のキャッシュ階層構造は、ブルドーザーに例えると完全に変化しました。 AMD はキャッシュのレイテンシや帯域幅などのデータについて議論することを避けていますが、現時点ではプラスの効果をもたらす可能性のある変更は存在すると考えられています。まず、 Zen では、各コアの 32KB の第 1 レベル データ キャッシュをブルドーザーのような貫通型からライトバック型に変更し、コア キャッシュのデータ更新を CPU とメモリのバス サイクルに結び付けなくなりました。これにより、低速メモリが同じバス サイクル内でキャッシュされたデータを同期するのを待たずに、第 1 レベル キャッシュのバースト書き込みのパフォーマンスを維持できます。また、ロード操作はストア操作よりも頻繁に行われるという統計によると、Zen の第 1 レベル キャッシュは L/S ユニットを非対称にし、より多くのロード チャネルを提供します。全体像に戻ると、AMD はオリジナルの Bulldozer アーキテクチャを完全に解体し、新しい CCX を構築しました。これは、4 つの CPU コアとそれらの第 1 レベルおよび第 2 レベルのキャッシュを第 3 レベルのキャッシュに掛ける構造です。この 8MB L3 キャッシュは、CPU コアに必要なプリフェッチ/要求命令に基づいてデータを収集する一般的な CPU 下位レベル キャッシュとは異なります。その役割は、時間内に実行されなかったか、ライトバック コマンドによって無効とマークされたために第 1 レベルおよび第 2 レベルのキャッシュから削除された命令を一時的に保存することです。難民キャンプのようなもので、第 1 レベルおよび第 2 レベルのキャッシュほど効率的ではありません。ただし、Zen コアの 8 ウェイ L2 キャッシュは 512KB と大きいため、この非効率性はある程度補うことができます。同時に、難民キャッシュは二次キャッシュにデータを保存する必要がないため、キャッシュ内のデータの冗長性が低減され、間接的にキャッシュの利用効率、つまりキャッシュ容量が向上します。 AMD が Zen で採用しているモジュラー設計により、新しい CPU の製品ラインのスケーラビリティも向上し、最もエネルギー効率の高いモバイル チップから最もパフォーマンスの高いチップまですべてを 1 つのアーキテクチャでカバーできるようになり、前世代のようなギャップを回避できます。たとえば、CCX は、Intel のモバイル i3/i5 と競合するラップトップ用の低電力クアッドコア CPU にすることができます。デスクトップでは、2 つの CCX を組み合わせて 8 コアの Zen を作成し、i7 に正面から挑戦することができます。しかし、AMDはCCX間の相互接続構造がどのようなものなのかを具体的には明かさず、HyperTransportバスの改良による推測を否定したものの具体的な回答は示さず、考えさせる疑問を残した。つまり、 AMD の主張どおりにキャッシュ効率が達成できるかどうかは別として、第 1 レベルおよび第 2 レベルのキャッシュ スループットが 2 倍になり、第 3 レベルのキャッシュ速度が 5 倍になると、少なくともサイズの点では、Intel の現在の Skylake を上回ることは問題ないでしょう。三元法: 真の SMT Intel の同時マルチスレッド (SMT) の適用は 2008 年にまで遡ります。コアを 2 つのスレッドに分割するのは難しい作業です。これら 2 つのスレッドに、互いにうまく連携し、キャッシュとリソースを合理的に使用し、独占しないように指示するだけで、エンジニアたちは非常に落ち込むでしょう。おそらく、AMD は長年にわたり自社の CPU に SMT 機能を追加していなかったため、この問題が発生したのでしょう。来年には 8 コア / 16 スレッドの AMD CPU が登場するはずです。内部的には、 Zen コア内のスレッド間のスケジューリングは主にタイムシェアリング戦略に従います。スレッドごとに占有特性が異なる可能性があることを考慮すると、これは最善の解決策ではありませんが、AMD は独自のスレッド マーキング/識別方法を使用してこれを強制しています。 Zen では、プロセスの優先度に干渉する状況が通常 3 つあります。 1 つは、CPU が各スレッドのデータ フローを分析して、どのスレッドのアルゴリズムの優先度が高いかを判断することです。分岐予測や整数/浮動小数点の名前変更などのリソースを大量に消費するタスクの場合、スレッドはそれに応じて優先度を調整します。もう 1 つは、スレッドが TLB キャッシュやロード キュー操作などの遅延に敏感な操作 (通常はユーザー フィードバックへのタイムリーな応答として上位層に反映される) を伴う場合、CPU は遅延要件マークに基づいてスレッド処理の優先順位を割り当てるというものです。シーケンスに従うマイクロ命令キューなどの部分については、CPU は静的なタイムシェアリング戦略を使用して、スレッドが交互に処理できるようにします。残りについては、はるかに単純で、より粗雑です。先着順です。対応するコア リソースをさらに必要とするスレッドが、最初にそれらを占有しようとします。これをオペレーティングシステムやアプリケーションソフトウェアのレベルにまで引き上げ、AMD の SMT をその観点から観察すると、Intel のハイパースレッディングに似ています。各スレッドはコアとして扱われ、Bulldozer のようなリソース使用制限はありません。 AMDが今回、インテルのハイパースレッディングからインスピレーションを得て、インテルを凌駕できるかどうかは分かりませんが、前世代のAMD CPUに比べてZenの浮動小数点演算のパフォーマンスが大幅に向上することは間違いありません。プロセス技術: 再び FinFET。皆さんは FinFET という言葉を聞くのに飽き飽きしていると思います。この技術については、携帯電話のプロセッサチップに関するこれまでの議論の中で何度も紹介してきたので、ここでは簡単に説明します。電力消費は、AMD が独自の CPU を設計する際に常に考慮してきた側面です。 100W 未満の TDP を達成するには、ゲート クロックをより積極的に設定するだけでは不十分です。 Zen は、以前 Polaris GPU で実際にテストした Global Foundries の 14nm FinFET プロセスを活用する予定です。さらに、AMD は GPU ソリューションをコピーするつもりはありません。また、密度最適化プロセスも使用したいと考えています。結局のところ、DIE 領域を制御する必要がありますが、これは AMD が今回の Hot Chips で説明しなかったことです。現在の設計により 500 平方ミリメートルの 14nm DIE の使用を余儀なくされると、AMD の通常の価格戦略に反することになり、最終製品は間違いなく非常に高価になるでしょう。しかし、Zenの誕生には常にターゲットの調整が伴ってきたことを考えると、AMDの次世代CPUが今見ているものをどれだけ維持できるかは判断が難しい。書類上は40%、実際は2%?ここまで述べてきましたが、エンドユーザーが PPT に騙されることは実際には非常に困難です。数字や建築がどれだけ誇張されていても、彼らが望むのはたった 2 つのことだけです。まず、適切な価格で購入できること。 2 番目に、実際に使用したときに速いと感じられる必要があります。 AMD は、Hot Chips 2016 の参加者に、3GHz 8 コア Zen と 3GHz 8 コア Broadwell-E の Blender ベンチマークを披露しました。同じマルチスレッド カスタム ロードでは、Zen は Broadwell よりも 2% 高速でした。しかし、AMD は構成の詳細をこれ以上明らかにしませんでした。 「PowerPoint から立ち上がった」という歴史があるため、言葉には慎重でなければなりません。国民の疑念を払拭するのは容易なことではない。 AMD が Zen を 2017 年第 1 四半期に大量出荷できれば (実際、当初は今年 10 月に予定されていたが、現時点ですでに延期されている)、消費者は最初にブランド コンピューターで新しい CPU を見つけることになるかもしれない。おそらく彼らはこの機会を捉えてハイエンド x86 CPU の戦場に復帰し、再び Intel と競争できるだろうが、少なくとも古いライバルと対峙するときに使えるカードを確保し、再びデフォルトしないようにする必要がある。

今日頭条の青雲計画と百家曼の百+計画の受賞者、2019年百度デジタル著者オブザイヤー、百家曼テクノロジー分野最人気著者、2019年捜狗テクノロジー文化著者、2021年百家曼季刊影響力のあるクリエイターとして、2013年捜狐最優秀業界メディア人、2015年中国ニューメディア起業家コンテスト北京3位、2015年光芒体験賞、2015年中国ニューメディア起業家コンテスト決勝3位、2018年百度ダイナミック年間有力セレブなど、多数の賞を受賞しています。

<<:  IMF: アジア太平洋先進国の雇用の半分が人工知能の影響を受ける

>>:  iPhone 7 発売ガイド: 最初に入手

推薦する

ラム酒を飲むことのメリット

適度な飲酒は実は健康に良いですし、ワイン文化は実はとても長い歴史を持っています。ですから中国ではワイ...

頸椎の​​痛みに耐えられませんか?華西の医師が、いつでもできる2つの簡単なコツを教えてくれます

今この時代頸椎症なし一生懸命に努力したと言うのは恥ずかしいです。結局、私は一日中コンピューターで計画...

ブドウの栄養価は何ですか?

ブドウは市場で非常に一般的であるため、ブドウといえば多くの人が食べたことがあると思いますが、ブドウの...

唐辛子を食べると口腔内潰瘍の回復が早まるのでしょうか?口内炎を予防するには、4つの側面から始めることができます

ゴシップ少し前、筆者はネットユーザーによる短い動画のコメント欄に「先生が言っていたのですが、口内炎を...

ダムを建設して友達に「水をあげて」あげましょう!

3月はすべてを復活させる花、草、木、緑を植える国家エネルギーグループ大渡河会社大渡河本流水力発電ダ...

緑豆もやしの作り方は?

もやしは皆さんもよくご存知だと思います。もやしは私たちがよく食べる食べ物の一種です。もやしはビタミン...

ウォードの2018年トップ10エンジンが発表:日本車が大勝、ドイツブランドはリストにない

多くの人の印象では、ドイツの自動車産業は常に世界をリードする立場にあったが、今この状況は静かに変化し...

蓮の実豚バラ肉スープのレシピ

蓮の実と豚の胃袋のスープは、私たちの体に素晴らしい効能がありますが、作り方が分からない人もいます。以...

上汽通用五菱の人事異動:戴衛瑞氏が執行副社長に就任

ゼネラルモーターズは、戴衛瑞氏が顧思沃氏の後任として2017年8月1日付けで上汽通用五菱有限公司の執...

スズキ豆腐スープ

スズキは比較的栄養価の高い魚の一種で、その肉は美味しくてとても甘いです。妊婦が生活に必要な栄養素を補...

チキンパウダーとチキンエッセンスの違い

チキンパウダーやチキンエッセンスは、実は私たちの日常生活でも調理材料として使われています。多くの人が...

上流は在庫補充段階に入り、新エネルギー車産業チェーンは再び高い繁栄レベルに戻る

中国証券報記者の崔暁蘇氏:新エネルギー車市場の急速な成長は、上流と下流の産業チェーンに成長の機会をも...

「スター」は旅の途中でどんな落とし穴に陥る可能性があるのでしょうか?

キャリアロケットは、最短10分、最長9時間の飛行を経て、宇宙船を所定の軌道に正確に送り込みますが、そ...