2011年登場のAMDの8コアCPU「Zambezi」とは

【AMD】2011年登場のAMDの8コアCPU「Zambezi」とは【Bulldozer】


Bulldozer
・32nmプロセスで、8コアを搭載
※Intelも32nmのパフォーマンスCPUは、当面のWestmere(ウエストミア)世代では6コア(Gulftown:ガルフタウン)
CPUコアをマルチスレッド処理に最適化することで、単位面積当たりの“コア数”を増やすことができる。
結果として、CPUの面積当たりのコンピューティング性能を上げることができる。


・クラスタードアーキテクチャ
CPUコアの中を分割して、整数演算部などをスレッド専用のリソースにする一方で、浮動小数点演算部をスレッド共有リソースにした。
「我 々は、Bulldozerモジュールの中に、2つの整数演算ユニットと2つの整数スケジューラを分離して実装した。この2つの整数演算コアは、それぞれが 1スレッドを、完全に独立して並列に走らせることができる。そのため、最高パフォーマンスを達成できる」(Akrout氏)。

AMDの判断は、Hyper-ThreadingのようなSMT技術では、整数演算リソースが充分でないとリソースの競合が発生して性能が抑えられてしまうというも のだった。それより、使用頻度の高い整数演算パイプは、それぞれのスレッド毎に分離したクラスタベースマルチスレッディングの方が、パフォーマンスを上げ られる。その一方で、スレッド間で競合する頻度が低いと予想される浮動小数点演算ユニットは共有とした。「通常は浮動小数点演算ユニットはあまり使われな い。だから共有は完璧に自然なことだ」とMoore氏は説明している。


http://pc.watch.impress.co.jp/img/pcw/docs/331/235/kaigai6.jpg


・ヘテロジニアス
「BulldozerはAPUになる能力を持っている。つまり、ヘテロジニアスコンピューティング機能を統合できる」(Akrout氏)。
おそらく、AMDの戦略は次のようなものだ。今後のワークロードで、増えることが予想される浮動小数点演算のニーズの多くは、CPUに載せるGPUのような データ並列型エンジンで吸収する。その方が効率的だからだ。CPUコア側の浮動小数点演算機能の拡張は、APU化を前提として、やや控え目に抑える。 Bulldozerのもう1つの重要なコンセプトはヘテロジニアス化にあることを考えると、アーキテクチャの選択が納得できる。

詳細は以下にて
http://pc.watch.impress.co.jp/docs/column/kaigai/20091126_331235.html




3 名前: ウィンナー巻き(新潟県) :2009/11/27(金) 00:11:49.44 ID:u2WhbMof
2011年 AMD 新アーキテクチャ
◇Bulldozer (Zambezi 4~8コア)

  • 32nmSOIプロセス High-K/メタルゲート採用
  • 1つのモジュールに2コアを内蔵 コア毎に独立した整数スケジューラとL1キャッシュ
  • 1つのモジュールに共有L2キャッシュ、L3キャッシュ、ノースブリッジ、128-bitのSIMD積和算ユニットを2基搭載
  • 浮動小数点演算ユニットや命令デコーダなどのリソースを2つのコア/スレッドで共有※今後、増えていく浮動小数点演算のニーズをGPUで行うこと(ヘテロジニアス化)を見据えている
  • クラスタードアーキテクチャ(HTよりマルチスレッド性能が高い)
  • AMD独自のXOP、FMA4、CVT16に加え新命令のAVXサポート
  • 2ch DDR3-1866まで対応
  • ソケット AM3(AM3 r2?) (チップセット890FX, 890GX、SB850は使用可能)
http://pc.watch.impress.co.jp/img/pcw/docs/328/392/kaigai6.jpg
http://pc.watch.impress.co.jp/img/pcw/docs/328/384/amd-08.jpg
http://pc.watch.impress.co.jp/img/pcw/docs/328/379/02.jpg
http://pc.watch.impress.co.jp/img/pcw/docs/330/076/kaigai2.jpg


分かりやすい図 ※大雑把に解説
Bulldozerはコア数を増やしやすく、マルチスレッド性能が高くなる
Bulldozerは6コア6スレッド
SandyBridgeは4コア8スレッド(ただし、8スレッドがフルに活用されないことがある)
http://sukima.vip2ch.com/up/sukima023014.jpg



6 名前: 虫ピン(関西地方) :2009/11/27(金) 00:12:52.68 ID:czZuPr2r
ブルドーザーとかめちゃくちゃパワフルそうなCPUだな


10 名前: カッターナイフ(愛知県) :2009/11/27(金) 00:14:56.19 ID:oXlOUUKt
>Bulldozerは6コア6スレッド

ん?Gulftownの6コア12スレッドの半分じゃん


25 名前: ウィンナー巻き(新潟県) :2009/11/27(金) 00:44:28.46 ID:u2WhbMof
>>10
>>3の図はあくまでBulldozerの利点を分かりやすくしただけです。
実際に比較するとなるとZambeziの8コア8スレッドとSandyBridge(Gulftown)の6コア12スレッドになるのでは。

Bulldozerの利点はコア数を増やしやすいと言う点です
図を見てもらえれば分かるように、IntelのHTはスレッドの矢印が重なってます。
HTではスレッド同士が競合して性能がフルに引き出せないというデメリットがあります。
スレッド同士が競合しにくい条件でのみ、HTによるマルチスレッドは性能を発揮出来ます(エンコとか)


同じコア数(2コアの場合)
http://sukima.vip2ch.com/up/sukima023021.jpg

Zambeziの6コア6スレッド SandyBridgeの4コア8スレッドの図
http://sukima.vip2ch.com/up/sukima023014.jpg

Zambeziの8コア8スレッド SandyBridge(Gulftown)の6コア12スレッドの図
http://sukima.vip2ch.com/up/sukima023020.jpg


17 名前: ビュレット(埼玉県) :2009/11/27(金) 00:20:35.62 ID:FchslFVT
2011年かあ
AMD潰れてないと良いな


19 名前: 虫ピン(関西地方) :2009/11/27(金) 00:23:56.82 ID:czZuPr2r
ソケットはAM3r2だっけ?
DDR3のAM3マザーなら動きそうな予感がする名前


21 名前: フードプロセッサー(大阪府) :2009/11/27(金) 00:26:15.62 ID:gcEKkjsN
ASRockのM/B使ってるから安心だ
あそこなら確実に使えるようにしてくれる


27 名前: ペトリ皿(アラバマ州) :2009/11/27(金) 00:51:30.17 ID:ObEMap3z
内部の違いとかどうでもいよな
実際エンコードがドンだけ早くなるんだってことwww 


32 名前: ウィンナー巻き(新潟県) :2009/11/27(金) 01:04:12.98 ID:u2WhbMof
>>27
Gulftownが出るまではどうなるか・・・
HT切ったGulftown(6コア6スレッド)とCore i7(4コア8スレッド)で比較すれば
スレッド数よりコア数が多い方がいいのかどうか分かるかと。


28 名前: ペトリ皿(アラバマ州) :2009/11/27(金) 00:53:56.56 ID:ObEMap3z
アスロン2 X4は安いのにエンコード早めで良かった X264とかに強いし
1万円の8コアとか出せよー


33 名前: ウィンナー巻き(新潟県) :2009/11/27(金) 01:06:28.98 ID:u2WhbMof
参考に他のアーキテクチャ

2011年 Intel 新アーキテクチャ
◇SandyBridge (2~8コア)

  • 32nmプロセス ダイサイズは225平方mm以下
  • 4コア+GPU+ノースブリッジを1ダイに統合。8コアの上位モデル、2コアの下位モデルも予定
  • 統合されるのはGPUコアとPCI-Expressコントローラ、DMIコントローラ。PCI-ExpressコントローラはPCI-Express 2.0対応
  • CPUコアは20平方mm/コア
  • CPUコアクロックは2.8~3.4GHz、TB時で最大3.8GHz
  • L2 256KB*4 / L3 8MB(25サイクル)リングアーキテクチャ採用 8コアの場合はL3 16~24MB
  • HT、AEC、VMXに加え新命令のAVXサポート
  • GPUコアのクロックは1.0~1.4GHzで、L3キャッシュ直結
  • 2ch DDR3-1600コントローラー
  • TDP 85W
  • ソケット LGA 1155?(LGA1156?)
http://pc.watch.impress.co.jp/img/pcw/docs/318/033/kaigai1.jpg

AMD Fusion (Llano)CPU+GPU

  • 32nmSOIプロセス High-K/メタルゲート採用
  • CPUはK10.5 2~4コア
  • L2キャッシュ 2MB?
  • DX11/UVD3対応GPUコア内臓 モバイルHD5600シリーズの省電力版? SP数460
  • DDR3-1600対応
  • PCIe2.0
  • LIano向けチップセット SATA 6Gbps/USB 3.0両対応
  • ソケット FM1?
http://pc.watch.impress.co.jp/img/pcw/docs/328/392/kaigai13.jpg


34 名前: ウィンナー巻き(新潟県) :2009/11/27(金) 01:07:40.93 ID:u2WhbMof
低消費電力CPU

Intel
次世代Atom(45nm Pineview) 09年12月に詳細発表 10年1月に発売

  • Atom N450(1C/2T/1.66GHz/667MHz/L2 512KB) $63
  • Atom D410(1C/2T/1.66GHz/667MHz/L2 512KB) $43
  • Atom D510(2C/4T/1.66GHz/667MHz/L2 512KB*2) $63

次々世代Atom(32nm Cedarview) 2011年発売予定

  • シングルチャンネルDDR3-1066
  • メモリ数 2 DIMM
  • DirectX 10.1のサポート
  • 映像出力 LVDS、eDP、HDMI、DisplayPortに対応 デュアルDisplayPortも対応

AMD
Ontario(40nmプロセス? Bobcatアーキテクチャ) 2011年発売予定

  • 消費電力1W以下をターゲットに開発
  • 最大2命令発行2命令リタイヤ/サイクルのOut-of-order実行コア
  • 現在のメインストリームCPUの50%のダイサイズで90%の性能を引き出す予定
  • SSE1~3と仮想化をサポート

http://pc.watch.impress.co.jp/img/pcw/docs/328/392/kaigai10.jpg


38 名前: モンキーレンチ(宮城県) :2009/11/27(金) 01:22:58.19 ID:pU4EyUkH
パーソナルユースレベルなら、コアが多くなるほど遅くなるぞ。
タスク数に応じてコアを纏めたりバラしたりとか出来ればいいのに。


39 名前: ペンチ(東京都) :2009/11/27(金) 01:26:16.28 ID:peuYjm0U
>>38
TurboBoostってベンチ番長用機能って思われてるけど
そういう用途にはぴったりの機能なのにね


40 名前: ガスレンジ(新潟県) :2009/11/27(金) 01:27:24.41 ID:DUoDNj0B
>>38
Bulldozerの詳細は全部出てないので、それに近い機能が実装されるかもよ?
1モジュール(2コア)を1コアとして使える機能とか。


41 名前: ビュレット(アラバマ州) :2009/11/27(金) 01:43:10.52 ID:xoJPpdvA
TurboBoost的なのはThuanに付くらしいな


42 名前: ルアー(富山県) :2009/11/27(金) 01:50:44.35 ID:vIlXyhdQ
Orochiってどうなったん


43 名前: ガスレンジ(新潟県) :2009/11/27(金) 01:52:37.55 ID:DUoDNj0B
>>42
Orochi→Zambezi 名前が変わった


47 名前: ミリペン(埼玉県) :2009/11/27(金) 02:01:19.07 ID:avH07V0k
TDPが全て
80W越えるCPUは使う気にならない


49 名前: フェルトペン(広島県) :2009/11/27(金) 02:12:58.05 ID:7XrigO44
>>47
窒息ケースでもない限りアイドル時の消費電力のほうが重要だろ


52 名前: まな板(大阪府) :2009/11/27(金) 02:32:35.48 ID:32iLEwPg
http://northwood.blog60.fc2.com/blog-entry-3317.html

ISSCCのカバーにあるドキュメントに「32nmプロセスのコアは3GHz以上で動作し、
消費電力は2.5~25Wとなる」と書かれていると、EETimesでは報じている。


55 名前: プリズム(静岡県) :2009/11/27(金) 02:44:56.67 ID:9rMlcgfb
これはopteronのreplacementなんですか?それとも民生用?


56 名前: 落とし蓋(山形県) :2009/11/27(金) 02:52:03.71 ID:c/7Vlm9T
>>55
もちろん両方
AMDもIntelもPC向けのダイをボトムアップでサーバー、HPC向けに利用する


61 名前: ウィンナー巻き(千葉県) :2009/11/27(金) 03:02:06.46 ID:l1VXXeA8
Bulldozerはあほな設計
マルチコアでの高性能化を求めている人は浮動小数点演算の高速化を求めている
整数演算はもう十分


70 名前: ウィンナー巻き(長屋) :2009/11/27(金) 04:55:41.21 ID:xqeCffSl
>>61
H264エンコは?


71 名前: ビュレット(アラバマ州) :2009/11/27(金) 05:02:19.42 ID:xoJPpdvA
>>61
強化してあるって書いてあるじゃん。
あとGPU統合でさらに強化


65 名前: スケッチブック(三重県) :2009/11/27(金) 03:11:10.68 ID:swfjnX2d
AMDはアーキテクチャのチャレンジよりもプロセス技術に注力した方が堅実だろ、もっとGFに力入れろ


66 名前: 落とし蓋(山形県) :2009/11/27(金) 03:17:46.12 ID:c/7Vlm9T
>>65
体力的な問題で力入れられないからそっちはアラブの金持ちに任せたんだろ


67 名前: すりこぎ(東京都) :2009/11/27(金) 03:27:17.24 ID:82SuTdpW
GFができたおかげでAMDのfabは自社以外の半導体を作って
利益を上げられるようになった

逆に言うと
自社の物しかつくってないのに利益を上げられるintelは異常


69 名前: 落とし蓋(山形県) :2009/11/27(金) 03:40:34.17 ID:c/7Vlm9T
>>67
異常ってか償却が済んだラインでいろいろ作ってるから当たり前
チップセット作ってCPUと抱き合わせて売ったりとかな
チップセットビジネスをかき回す互換チップセットメーカーを毛嫌いしてるのはこれが原因
あとLANなんかもIntelのシェアは馬鹿に出来ないレベルだろうしな


84 名前: フードプロセッサー(関東) :2009/11/27(金) 07:29:13.56 ID:QSriT2nv
AM3マザーなら使えるだろうか
それだけが心配


87 名前: 首輪(アラバマ州) :2009/11/27(金) 07:57:40.93 ID:RmjjzFeR
>>84
アーキテクチャが全然違うから無理じゃね


89 名前: エバポレーター(茨城県) :2009/11/27(金) 08:17:46.76 ID:K5HqzoHZ
>>84
ソケットはAM3r2(リビジョン2)になるって言ってたな
AM2→AM2+の時程度の変更なら一部機能制限有りで使えるかもしれんが
何しろ実物が影も形も無いので全く不明


91 名前: 音叉(関西地方) :2009/11/27(金) 08:25:10.25 ID:mgmyWxue
Hyper Threadingの○スレッドって詐欺だよな。


92 名前: インパクトレンチ(埼玉県) :2009/11/27(金) 08:42:02.68 ID:BjjvcTR9
>>91
Pentium4の○GHzと同じだと思う。


93 名前: エバポレーター(茨城県) :2009/11/27(金) 08:43:22.91 ID:K5HqzoHZ
>>91
詐欺でこれだけ実効性能UPするなら詐欺でも何でもいいから実装して貰いたい。

http://journal.mycom.co.jp/photo/special/2009/lynnfield/images/graph01l.gif
http://journal.mycom.co.jp/photo/special/2009/lynnfield/images/graph02l.gif
http://journal.mycom.co.jp/photo/special/2009/lynnfield/images/graph03l.gif
http://journal.mycom.co.jp/photo/special/2009/lynnfield/images/graph04l.gif
http://journal.mycom.co.jp/photo/special/2009/lynnfield/images/graph05l.gif

Lynnfield徹底攻略!! Core i7-870とCore i5-750を試す
http://journal.mycom.co.jp/special/2009/lynnfield/009.html



94 名前: 分度器(アラバマ州) :2009/11/27(金) 08:46:48.93 ID:tZz3C9Wq
毎日変態はintel提灯じゃん


96 名前: ペトリ皿(アラバマ州) :2009/11/27(金) 08:54:00.95 ID:ObEMap3z
HTは処理によるんだよな 逆に邪魔する場合があるから ふつーにコア搭載されてるほうが良い
売るキャッチコピー的にはHT搭載!! 見たいな感じで売りやすいんだろうけど 切って使ってる人も多いし


101 名前: 虫ピン(catv?) :2009/11/27(金) 11:10:48.89 ID:9NojRNch
GPUコアをCPUに統合する意味がわからん
コスト? システム的に何がメリットなの?


102 名前: グラフ用紙(山口県) :2009/11/27(金) 11:14:24.24 ID:vMPvm9JB
>>101
コスト、GPUのシェア奪える。


103 名前: 虫ピン(catv?) :2009/11/27(金) 11:24:07.19 ID:9NojRNch
>>102
コストって、チップセットグラとセットで考えたら変わらんでしょ
シェアだってCPUとチップセットをセット売りしてりゃ一緒でしょ


104 名前: グラフ用紙(山口県) :2009/11/27(金) 11:32:02.71 ID:vMPvm9JB
>>103
シェアはintelのことね。。AMDの場合CPUのシェア伸びないと意味なかったね。


105 名前: ガスレンジ(新潟県) :2009/11/27(金) 14:14:17.09 ID:DUoDNj0B
>>101
Intelはコストとかシェアじゃね。 AMDはGPGPUの活用

Bulldozerで浮動小数点演算ユニットを共有することになったので、
浮動小数点演算で足りない性能はGPUにやらせようってことらしい。


107 名前: 錐(関西地方) :2009/11/27(金) 14:45:28.84 ID:JY6AgTg4
時期悪




このエントリーをはてなブックマークに追加


0 コメント :

コメントを投稿

【注意】投稿前にコメントの名前欄の確認を!!【注意】
Googleアカウントにログインした状態でコメントする際は、「コメントの記入者」の欄をよく確認してから投稿するようお願いいたします。

自動スパム検出機能により投稿が反映されない場合があります。スパムでないことが確認でき次第公開しますので、しばらくお待ちください。