APU平臺(tái)
PS4的APU在性能上十分的強(qiáng)大,擁有1.84T/s浮點(diǎn)的GPU,以及176GB/s速度的8GB GDDR5共享內(nèi)存,在性能上可以媲美中的電腦獨(dú)顯。[1]
APU將通用運(yùn)算x86架構(gòu)CPU核心和可編程矢量處理引擎相融合,把CPU擅長(zhǎng)的精密標(biāo)量運(yùn)算與傳統(tǒng)上只有GPU才具備的大規(guī)模并行矢量運(yùn)算結(jié)合起來。AMD APU設(shè)計(jì)綜合了CPU和GPU的優(yōu)勢(shì),為軟件帶來的靈活性,能夠任意采用的方式開發(fā)新的應(yīng)用。AMD APU通過一個(gè)高性能總線,在單個(gè)硅片上把一個(gè)可編程x86 CPU和一個(gè)GPU的矢量處理架構(gòu)連為一體,雙方都能直接讀取高速內(nèi)存。AMD APU中還包含其他一些系統(tǒng)成分,比如內(nèi)存控制器、I/O控制器、專用視頻、顯示輸出和總線接口等。AMD APU的魅力在于它們內(nèi)含由標(biāo)量和矢量硬件構(gòu)成的全部處理能力。
PS4 APU 的構(gòu)架圖
所謂APU其實(shí)就是“加速處理器”(Accelerated Processing Unit)的英文縮寫,是AMD推出的整合了x86/x64 CPU處理核心和GPU處理核心的新型“融聚”(Fusion)處理器,因此我們也能在網(wǎng)上找到“融聚加速處理器”的說法。AMD的APU平臺(tái)分兩種,一種是此前已經(jīng)能在市面上買到的E系列入門級(jí)APU,一種是2011年才在歐美市場(chǎng)正式上市的A系列主流級(jí)APU,A系列APU分A4/A6/A8/A10四大系列,就是我們一般講的“Llano APU處理器”(拉諾APU處理器)。
因此,A系列的APU平臺(tái)一般就稱為L(zhǎng)lano APU平臺(tái),當(dāng)然,也有人針對(duì)APU整合的GPU,把Llano APU平臺(tái)叫做“Lynx平臺(tái)”(猞猁平臺(tái))。
AMD認(rèn)為,CPU和GPU的融合將分為四步進(jìn)行:
X1 APU 的構(gòu)架圖
步是物理整合過程(Physical Integration),將CPU和GPU集成在同一塊硅芯片上,并利用高帶寬的內(nèi)部總線通訊,集成高性能的內(nèi)存控制器,借助開放的軟件系統(tǒng)促成異構(gòu)計(jì)算。
第二步稱為平臺(tái)優(yōu)化(Optimized Platforms),CPU和GPU之間互連接口進(jìn)一步增強(qiáng),并且統(tǒng)一進(jìn)行雙向電源管理,GPU也支持高級(jí)編程語言,這部分才是最關(guān)鍵的。
第三步是架構(gòu)整合(Architectural Integration),實(shí)現(xiàn)統(tǒng)一的CPU/GPU尋址空間、GPU使用可分頁系統(tǒng)內(nèi)存、GPU硬件可調(diào)度、CPU/GPU/APU內(nèi)存協(xié)同一致,這已在APU中初步完成。
第四步是架構(gòu)和系統(tǒng)整合(Architectural & OS Integration),主要特點(diǎn)包括GPU計(jì)算環(huán)境切換、GPU圖形優(yōu)先計(jì)算、獨(dú)立顯卡的PCI-E協(xié)同、任務(wù)并行運(yùn)行實(shí)時(shí)整合等等,這些需要和微軟、ADOBE等行業(yè)軟件不停的溝通交流。
APU正是AMD公司對(duì)融合技術(shù)多年研究的成果,傳統(tǒng)計(jì)算中的絕大部分浮點(diǎn)操作都脫離CPU而轉(zhuǎn)入擅長(zhǎng)此道的GPU部分,GPU不再只是游戲工具,混合計(jì)算將大放光芒。在不遠(yuǎn)的未來,CPU和GPU的概念也會(huì)漸漸模糊起來,正如AMD所宣傳的:The Future is Fusion。
APU架構(gòu)
RyzenAPU[2]
Trinity APU已在2012年10月2日正式發(fā)布,距Llano APU發(fā)布一年又三個(gè)月,桌面平臺(tái)代號(hào)為“Virgo”,移動(dòng)平臺(tái)為“Comal”,新一代APU采用GlobalFoundries 32nm SOI HKMG工藝制造
[3] ,擁有2-4個(gè)基于改進(jìn)的推土機(jī)架構(gòu)CPU核心,核心代號(hào)為“Piledriver”,可以說這一部分的改進(jìn)還是比較大的,因?yàn)樯弦淮鶯lano的CPU部分還是采用的較老的K10架構(gòu),融合的GPU部分也進(jìn)行了大刀闊斧的改進(jìn),HD6000核心將被采用VLIW4(Cayman核心的HD6900就是采用的這種架構(gòu))架構(gòu)的新圖形核心取代。直接競(jìng)爭(zhēng)將在四月份推出的Intel Ivy Bridge架構(gòu)處理器。AMD在處理器性能上繼續(xù)落后,同時(shí)在圖形性能上大幅。新一代AMD Ryzen APU
[4-5] 2/12正式上市
[2] 。
APU顯示核心
Piledriver APU
Trinity APU基于增強(qiáng)版的推土機(jī)架構(gòu)“打樁機(jī)”(Piledriver),最多雙模塊四核心,支持第三代動(dòng)態(tài)加速技術(shù)Turbo Core 3.0,同時(shí)整合VLIW4架構(gòu)的Radeon HD 7000系列圖形核心。
APU性能預(yù)測(cè)
HD Graphics 3000
關(guān)于Trinity APU處理器的性能我們可以從AMD展示的移動(dòng)版平臺(tái)來一窺端倪。AMD在搭載了Trinity APU的筆記本上運(yùn)行了DX11新作《殺出重圍3:人類革命》,為了方便了解,AMD還拿Intel的Sandy Bridge平臺(tái)進(jìn)行了對(duì)比(移動(dòng)版Sandy Bridge均是內(nèi)置HD Graphics 3000),在開啟了開啟DX11、形態(tài)抗鋸齒(MLAA)、紋理過濾、屏幕環(huán)境光遮蔽(SSAO)、景深(DOF)、后期處理、曲面細(xì)分等和技術(shù)后,Trinity APU平臺(tái)運(yùn)行更為流暢,而Sandy Bridge平臺(tái)則會(huì)時(shí)不時(shí)出現(xiàn)明顯的卡頓現(xiàn)象。 以PCMark Vantage、3DMark Vantage的成績(jī)進(jìn)行衡量,臺(tái)式機(jī)版本的處理器性能、圖形性能相比Llano APU均可提升最多30%,而筆記本版本則是最多25%、50%。 Trinity APU將針對(duì)Windows 8操作系統(tǒng)進(jìn)行專門優(yōu)化,并引入新的視頻處理能力,尤其是視頻壓縮引擎“VCE”,對(duì)手直指Intel QuickSync轉(zhuǎn)碼引擎。
APU功耗續(xù)航
至于電池續(xù)航能力,AMD內(nèi)部測(cè)試給出的答案是:Windows桌面空閑待機(jī)12小時(shí)28分鐘、播放DVD標(biāo)清電影7小時(shí)15分鐘、播放BD藍(lán)光高清電影4小時(shí)2分鐘、運(yùn)行3DMark06測(cè)試3小時(shí)20分鐘。
APU內(nèi)存控制器
Trinity APU還改進(jìn)了DDR內(nèi)存控制器,可以支持到DDR3-2133內(nèi)存,從Llano APU的測(cè)試來看,內(nèi)存性能的提升直接影響到圖形顯示部分的性能,從DDR3-1333內(nèi)存升級(jí)為DDR3-1866后游戲性能可提升55%。也許是由于修改部分較多,Trinity APU采用了新的FM2封裝接口,和FM1接口互不兼容。
APU未來展望
這一代的Llano APU由于缺貨的原因并未發(fā)揮出它應(yīng)有的能量——Fusion APU于2011年3月1日正式發(fā)布,主流的Llano APU于2011年6月1日正式發(fā)布,而在9月中下,隸屬A系列APU的A8-3850和A6-3650還并未在賣場(chǎng)鋪貨,起碼中關(guān)村賣場(chǎng)還未見到貨。在Sandy Bridge早早完成鋪貨并開始大勢(shì)宣傳的情況下,Llano APU還有多少的表現(xiàn)空間還不得而知,也許APU真正的能量在Trinity APU身上才能爆發(fā)出來。 加強(qiáng)了整數(shù)運(yùn)算性能的全新推土機(jī)架構(gòu)處理核心和更側(cè)重通用計(jì)算的全新VLIW4架構(gòu)圖形核心將使新一代Trinity APU具有更強(qiáng)的力,AMD首先提出的融聚概念的威力也將在那時(shí)候宣泄出來。
APU架構(gòu)解析
APU與融合
不同于推土機(jī),Llano APU并沒有使用全新的內(nèi)核架構(gòu),甚至不像Brazos APU平臺(tái)那樣至少處理器部分是新的“山貓”(Bobcat)架構(gòu),說白了主要就是K10處理器、DX11顯卡(以及北橋芯片)的合體,但顯然也不是1+1=2那么簡(jiǎn)單。
Llano APU面臨的問題不僅僅是要避免1+1<2,還要爭(zhēng)取做到1+1>2。Llano APU的設(shè)計(jì)目標(biāo)主要有這么幾條:
- CPU、GPU性能綜合:同時(shí)提供CPU、GPU性能。
- 獨(dú)立顯卡級(jí)別的GPU體驗(yàn):完整的DX11和功能集;拖拽轉(zhuǎn)碼和Aero效果等Windows 7體驗(yàn)。
- 雙顯卡技術(shù):配合AMD Radeon獨(dú)立顯卡提供額外性能。
- 下一代視頻加速:也就是UVD3引擎,創(chuàng)新的顯示和畫質(zhì)功能,更高帶寬。
- 行業(yè)和開放標(biāo)準(zhǔn)計(jì)算API支持:主要是OpenCL、DirectCompute,同時(shí)數(shù)據(jù)傳輸延遲更低。
- 3D立體:支持HD3D,包括藍(lán)光3D、DisplayPort 1.1(不及獨(dú)立顯卡的DP 1.2)、HDMI 1.4a。
可以看出,六個(gè)目標(biāo)中有五個(gè)半是關(guān)于GPU的,涉及CPU的只有半個(gè),Llano APU的關(guān)注重點(diǎn)也就不言而喻了,也與AMD VISION這樣的平臺(tái)名字相符。
APU架構(gòu)(3張)
Llano APU芯片采用GlobalFoundries 32nm HKMG工藝制造,又分為兩種版本,其一是完整版本,集成14.5億個(gè)晶體管,核心面積228平方毫米,又稱為Big Llano或者Llano 1;其二是精簡(jiǎn)版本,集成7.58億個(gè)晶體管,核心面積暫時(shí)不詳,又稱為Small Llano或者Llano 2。二者都采用了新的micro PGA封裝接口Socket FS1,772針無頂蓋,引腳間距1.2192毫米,芯片尺寸35×35=1225平方毫米。
從各方面看,發(fā)布的Llano APU都是采用了個(gè)完整版本,雙核版本也是由四核屏蔽而來的,因此熱設(shè)計(jì)功耗同樣較高。不知道何時(shí)才能看到原生的雙核版本,但是AMD透露說會(huì)在近期推出不需要風(fēng)扇散熱的低功耗型號(hào),想來就是了。
和之前的Brazos APU類似,Llano APU也在單顆硅片上集成了以下眾多模塊:x86處理器核心、二級(jí)緩存、DDR3內(nèi)存控制器、圖形SIMD陣列(也就是GPU)、顯示控制器、UVD解碼引擎、PCI-E控制器。從下邊這兩張圖上你就可以看出各個(gè)模塊的分布位置和相對(duì)大小。
Llano APU內(nèi)集成了如此眾多的功能模塊,如何確保它們之間的高速互連、以便讓整體隨時(shí)保持在狀態(tài)、避免任何潛在的瓶頸,這無疑是APU設(shè)計(jì)過程中最關(guān)鍵的一點(diǎn),也是獲得1+1>2效果的基本前提。AMD在這方面顯然是下足了功夫,比如特意設(shè)計(jì)了全新的Fusion Compute Link(Fusion計(jì)算連接)來將北橋模塊、GPU、IO輸入輸出串聯(lián)在一起,允許GPU訪問一致性緩存/內(nèi)存,同時(shí)在GPU和北橋之間還搭建了Radeon Memory Bus(Radeon內(nèi)存總線),讓沒有獨(dú)立顯存的GPU通過高速帶寬去訪問系統(tǒng)內(nèi)存。
說到底,APU并不是簡(jiǎn)簡(jiǎn)單單地把CPU、GPU整合到一塊硅片上就完事了,不然也不會(huì)花費(fèi)AMD三年多的時(shí)間,反復(fù)修改設(shè)計(jì)才最終修成正果。
CPU與Turbo Core
Llano APU中的處理器部分來源于Stars架構(gòu),也就是俗稱的K10架構(gòu),與Phenom Ⅱ/Athlon Ⅱ系列同宗同源,在移動(dòng)平臺(tái)上更確切地說相當(dāng)于此前的Phenom Ⅱ 系列,自帶128-bit浮點(diǎn)單元、一級(jí)緩存(每核心64KB+64KB)、二級(jí)緩存(每核心1MB),但沒有三級(jí)緩存。
當(dāng)然一切都不是照搬而來的。除了制造工藝從45nm進(jìn)步到32nm,從而更有效地控制晶體管集成度、核心面積、頻率和功耗,支持C6電源狀態(tài),還在細(xì)節(jié)上進(jìn)行了大量?jī)?yōu)化,包括更大容量的二級(jí)緩存、改進(jìn)的硬件預(yù)取、更大的窗口尺寸、硬件分割器、支持第二代Turbo Core智能超頻技術(shù)等等,最終將IPC(每時(shí)鐘周期指令數(shù))提升了6%以上。
Turbo Core 2.0 介紹(8張)
這里特別需要著重介紹的就是Turbo Core,中文名:“
智能超頻”。該技術(shù)出現(xiàn)于六核心的Phenom Ⅱ X6系列上,如今已經(jīng)進(jìn)化到第二代,支持從推土機(jī)到APU的全系列產(chǎn)品,不過截至2011年基本還沒有軟件工具能夠?qū)崟r(shí)監(jiān)測(cè)Turbo Core的動(dòng)態(tài)頻率,只有AIDA64附帶的CPUID還湊合。
我們知道,處理器在不同負(fù)載下的實(shí)際功耗差別很大,而且都距離熱設(shè)計(jì)功耗還有一定的空間,另一方面多核心處理器在不同應(yīng)用環(huán)境中活躍的核心數(shù)量也有所不同,這都造成了處理器資源無法得到充分利用,形成了浪費(fèi)。
解決方案就是由功耗監(jiān)視器實(shí)時(shí)測(cè)量每個(gè)處理器核心的功耗,由北橋匯總,然后統(tǒng)一報(bào)告給P-State電源狀態(tài)管理器,再由其根據(jù)需要讓處理器的各個(gè)核心運(yùn)行在適當(dāng)?shù)碾娫礌顟B(tài)下,或者降速或者提速,特別是提速的時(shí)候能短時(shí)間超過原始頻率,并且保證始終不超過整體熱設(shè)計(jì)功耗。
AMD Turbo Core的創(chuàng)新之處在于使用了數(shù)字式高級(jí)電源管理(APM)模塊,相比于類似技術(shù)中的模擬溫度和電流監(jiān)測(cè)方法,能夠提供高靈敏度的電源管理,精確度更高,具備可重復(fù)性。
更關(guān)鍵的是,Turbo Core會(huì)自動(dòng)協(xié)調(diào)CPU、GPU,讓需要更多資源的能夠獲得更高速度。在GPU閑置的時(shí)候,它就會(huì)大幅降低其頻率,去盡可能高地提升CPU頻率。
如果碰到了較為繁重的圖形或者視頻任務(wù),GPU就會(huì)獲得更高優(yōu)先級(jí),CPU退而求其次。
如果GPU執(zhí)行的是DVD視頻播放等輕負(fù)載任務(wù),那么留給CPU的加速空間就要在整體熱設(shè)計(jì)功耗中排除掉GPU的那一部分。
情況下,如果CPU、GPU都面臨繁忙的任務(wù),或者需要攜手進(jìn)行OpenCL APP加速計(jì)算,此時(shí)CPU、GPU就會(huì)同時(shí)得到加速,甚至?xí)诙虝r(shí)間內(nèi)超過熱設(shè)計(jì)功耗限制,然后再根據(jù)情況去降低CPU的頻率和功耗(GPU不變),保證核心溫度不致于過高。這一點(diǎn)倒是和Sandy Bridge上的第二代Turbo Boost有些相似。
內(nèi)存支持上,Llano APU移動(dòng)版支持雙通道DDR3 SO-DIMM,每通道一條內(nèi)存條,也就是總共只能插兩條內(nèi)存,容量32GB。頻率和電壓方面標(biāo)準(zhǔn)版DDR31600MHz,電壓1.5V,低壓版DDR3L1333MHz,電壓1.35V,帶寬25.6GB/s。
Llano APU的桌面版則支持雙通道DDR3 DIMM,每通道兩條內(nèi)存條,總共可以插入四條內(nèi)存,容量64GB,支持1.35V DDR3-1333、1.5V DDR3-1866,帶寬29.8GB/s。
由于CPU、GPU“同處一室”,難免會(huì)爭(zhēng)奪資源(事實(shí)上APU對(duì)內(nèi)存帶寬的依賴性確實(shí)非常強(qiáng)),為此AMD將GPU與內(nèi)存控制器之間的帶寬提高到了上代平臺(tái)的四倍,且高于內(nèi)存控制器與內(nèi)存之間的帶寬。
DX11 GPU
GPU架構(gòu)(3張)
這部分是Llano APU的重點(diǎn)。它的開發(fā)代號(hào)為“Sumo”(相撲),源于代DX11家族中Radeon HD 5600/5500系列的Redwood核心,最多400個(gè)流處理器、20個(gè)紋理單元、2個(gè)渲染后端、8個(gè)ROP單元,顯存位寬128-bit。遺憾的是,獨(dú)立的GDDR5顯存是沒有了,而且也不像880G主板那樣有板載硬顯存,只能去共享系統(tǒng)DDR3內(nèi)存。
除了繼承原有的TeraScale 2統(tǒng)一處理架構(gòu),以及的DX11、OpenGL 4.1、各種抗鋸齒和各向異性過濾(包括形態(tài)抗鋸齒MLAA)、APP并行計(jì)算加速技術(shù)之外,Sumo核心還增加了來自Radeon HD 6000系列家族的UVD3視頻解碼引擎、功率門控(深度電源管理與節(jié)能),重新設(shè)計(jì)了通往北橋的顯存接口,制造工藝也同步采用了的GlobalFoundries 32nm。
Sumo核心自然還是VLIW5 5D式流處理器架構(gòu),單精度浮點(diǎn)計(jì)算性能480GFlops,整數(shù)計(jì)算性能480Gints,都是每秒鐘4800億次。
作為Fusion APU的競(jìng)爭(zhēng)對(duì)手,Intel Sandy Bridge所集成的HD Graphics 3000/2000雖然比前一代也有了巨大的進(jìn)步,但是在圖形技術(shù)、視頻技術(shù)方面依然落后得很多,尤其是OpenCL并行計(jì)算僅有處理器支持,圖形核心并不支持,無法協(xié)同加速。
Llano APU的處理器、圖形核心部分都支持AMD APP加速并行處理技術(shù),尤其是OpenCL標(biāo)準(zhǔn)規(guī)范,為此AMD將不斷更新APP SDK開發(fā)包,提供更好性能和更多功能。按照規(guī)劃,
APP SDK 2.5版將于八月份推出,主要更新有Windows 7/Linux性能優(yōu)化、多GPU支持(Windows 7)、快速傅立葉變換(根基數(shù)5)、UVD3/MPEG2解碼、PowerExpress獨(dú)顯集顯切換支持、GPU調(diào)試器(Windows 7)等等。
值得一提的是,Llano APU正式支持的OpenCL規(guī)范版本已更新至1.2。
芯片組與節(jié)能
隨著芯片集成度的提高,無論桌面還是移動(dòng)平臺(tái)的構(gòu)成都越來越簡(jiǎn)單,傳統(tǒng)的處理器加南北橋雙的三片架構(gòu)已經(jīng)消失,取而代之的是處理器加互連芯片的雙芯片架構(gòu)。原來由北橋負(fù)責(zé)的大部分功能都已經(jīng)轉(zhuǎn)移到處理器內(nèi)部,包括圖形核心,所謂的芯片組也就剩下了一顆充當(dāng)南橋功能的小芯片。
Llano APU處理器搭配的Hudson系列芯片組同樣是單芯片設(shè)計(jì),
在移動(dòng)平臺(tái)上有A70M、A60M兩款型號(hào),代號(hào)分別為Hudson-M3、Hudson-M2,通過UMI總線(PCI-E 1.0 x4+DP)與處理器互連。和之前用于Brazos APU平臺(tái)的Hudson-M1 A50M是同門師兄弟。
A70M/A60M芯片組采用65nm工藝制造,605球腳FC BGA封裝,芯片尺寸23×23=529平方毫米,典型熱設(shè)計(jì)功耗2.7-4.7W。
兩款芯片組均支持六個(gè)SATA 6Gbps存儲(chǔ)接口并支持RAID 0/1陣列方式,可提供四條PCI-E 2.0 x1連接通道,集成時(shí)鐘發(fā)生器、消費(fèi)級(jí)紅外接收器、風(fēng)扇控制、電壓感應(yīng)、DAC(支持VGA)等等,主要區(qū)別則在于USB接口:A70M原生支持四個(gè)USB 3.0、十個(gè)USB 2.0和兩個(gè)內(nèi)部USB 1.1,A60M則沒有USB 3.0,而是改成了十四個(gè)USB 2.0。
這套平臺(tái)上還有個(gè)可選的替補(bǔ)角色,那就是Vancouver Radeon HD 6000M系列獨(dú)立顯卡,通過PCI-E x16通道與處理器相連。它不但能為筆記本帶來獨(dú)顯性能,還支持與Llano APU集成的圖形核心組成雙顯切換、加速系統(tǒng)。
最后再說一下電源管理與節(jié)能技術(shù),這方面同樣很豐富,包括32nm HKMG新工藝、AMD Turbo Core 2.0動(dòng)態(tài)調(diào)速技術(shù)、系統(tǒng)管理模式(SMM)、ACIP兼容、多重性能狀態(tài)(P-states)、多重節(jié)能狀態(tài)(C-states)、S0/S3/S4/S5休眠狀態(tài)、每個(gè)核心功率門控(CC6)、PCI-E核心功率門控、Radeon流處理器核心與UVD3視頻引擎功率門控。
功率門控(3張)
功率門控(Power Gating)尤為值得一提。它是AMD 45nm時(shí)代非常欠缺的技術(shù),如今終于得到了的支持。相比于時(shí)鐘門控(Clock Gating),它不僅可以實(shí)時(shí)調(diào)節(jié)各個(gè)模塊的運(yùn)行頻率、電壓,還能在不需要的時(shí)候關(guān)閉,實(shí)現(xiàn)部分零功耗。換句話說,
Llano APU的每個(gè)處理器核心、每個(gè)PCI-E控制器、流處理器陣列、UVD3引擎都是可以關(guān)閉的,Turbo Core技術(shù)也是因此更上一層樓。
以上種種,都屬于AMD AllDay全天計(jì)算技術(shù)。按照AMD給出的數(shù)據(jù),ⅥSION 2010移動(dòng)平臺(tái)的待機(jī)時(shí)間最長(zhǎng)為6個(gè)半小時(shí),迎來了APU的ⅥSION 2011則可長(zhǎng)達(dá)10個(gè)小時(shí);同時(shí)相比競(jìng)爭(zhēng)對(duì)手,待機(jī)續(xù)航時(shí)間長(zhǎng)一個(gè)半多小時(shí),滿載續(xù)航時(shí)間也要長(zhǎng)一個(gè)小時(shí)。
APU技術(shù)參數(shù)
APU桌面級(jí)
Richland平臺(tái)
Richland APU上的動(dòng)態(tài)調(diào)頻技術(shù)為“Hybrid Boost”,芯片內(nèi)部集成了更多的溫度傳感器,并調(diào)整了Turbo加速的算法使之更加智能化。以前需要加速的時(shí)候往往是CPU和GPU同時(shí)加速,但是這種情況并不多見,現(xiàn)在的算法則能保證那個(gè)部分需要更強(qiáng)性能就加速哪個(gè)。
Virgo平臺(tái)
移動(dòng)平臺(tái)為“Comal”,新一代APU采用GlobalFoundries 32nm SOI HKMG工藝制造,擁有2-4個(gè)基于改進(jìn)的推土機(jī)架構(gòu)CPU核心,核心代號(hào)為“Piledriver”,可以說這一部分的改進(jìn)還是比較大的,因?yàn)樯弦淮鶯lano的CPU部分還是采用的較老的K10架構(gòu),融合的GPU部分也進(jìn)行了大刀闊斧的改進(jìn),HD6000核心將被采用VLIW4(Cayman核心的HD6900就是采用的這種架構(gòu))架構(gòu)的新圖形核心取代。
Trinity APU于2012年5月15日正式發(fā)布,它的主要任務(wù)是接替Llano成為新一代面向主流和高性能移動(dòng)領(lǐng)域的融合處理器。它和Llano APU一樣最多擁有四個(gè)物理核心,不過核心架構(gòu)從K10升級(jí)至Piledriver(打樁機(jī),也就是第二代推土機(jī)),融合單顯部分則最多擁有384個(gè)DX 11 Radeon流處理器(升級(jí)至HD 6900系列的VLIW 4架構(gòu)),所搭配的單芯片依然支持SATA 6Gbps、USB 3.0、PCI-E 2.0等規(guī)范,至于雙顯混合交火功能也是繼續(xù)支持的。
與上一代AMD APU相比,新一代的打樁機(jī)內(nèi)核Trinity在性能上有著飛躍的提升,他的每一個(gè)運(yùn)算模塊是由兩顆核心組成,每個(gè)模塊搭配2MB的緩存,打樁機(jī)提供了IPC improvement、leakage reduction、CAC reduction和frequency uplift等增強(qiáng)功能,這些有別于Llano的設(shè)計(jì)讓Trinity在性能上的發(fā)揮更為強(qiáng)大,性能提升將會(huì)非常明顯。在以往公布的APU機(jī)構(gòu)途中,內(nèi)存控制器、核心單元吞吐量和信息處理能力一直是重要提升項(xiàng)目,因?yàn)槿诤系脑颍@些單項(xiàng)功能的提升將會(huì)大大提升AMD Trinity的實(shí)際應(yīng)用性能。[6]
Lynx平臺(tái)
"Llano" (32 nm)
CPU支持:MMX,SSE,SSE2,SSE3,SSE4a,Enhanced 3DNow!,NX bit,AMD64,Cool'n'Quiet,AMD-V,Turbo Core
CPU部分代號(hào)Husky,基于改進(jìn)版K10.5架構(gòu)
GPU部分基于Redwood核心
帶K字的型號(hào)開放倍頻
全型號(hào)通用參數(shù):
晶體管數(shù)量:14.5億
核心面積:228平方毫米
步進(jìn):B0
接口:Socket FM1
UMI總線:5GT/s
注:GPU核心配置格式為:流處理器數(shù)量,紋理單元數(shù)量,光柵單元數(shù)量
型號(hào) | 核心線程 | 主頻 | 加速頻率 | 二級(jí)緩存 | GPU型號(hào) | GPU配置 | GPU頻率 | TDP | 內(nèi)存支持 |
---|
E2-3200 | 雙核心雙線程 | 2.4GHz | 無 | 2×512 KB | HD 6370D | 160:8:4 | 443MHz | 65W | DDR3-1600雙通道 |
A4-3300 | 雙核心雙線程 | 2.5GHz | 無 | 2×512 KB | HD 6410D | 160:8:4 | 443MHz | 65W | DDR3-1600雙通道 |
A4-3400 | 雙核心雙線程 | 2.7GHz | 無 | 2×512 KB | HD 6410D | 160:8:4 | 600MHz | 65W | DDR3-1600雙通道 |
A4-3420 | 雙核心雙線程 | 2.8GHz | 無 | 2×512 KB | HD 6410D | 160:8:4 | 600MHz | 65W | DDR3-1600雙通道 |
A6-3500 | 三核心三線程 | 2.1GHz | 2.4GHz | 3×1MB | HD 6530D | 320:16:8 | 443MHz | 65W | DDR3-1866雙通道 |
A6-3600 | 四核心四線程 | 2.1GHz | 2.4GHz | 4×1MB | HD 6530D | 320:16:8 | 443MHz | 65W | DDR3-1866雙通道 |
A6-3620 | 四核心四線程 | 2.2GHz | 2.5GHz | 4×1MB | HD 6530D | 320:16:8 | 443MHz | 65W | DDR3-1866雙通道 |
A6-3650 | 四核心四線程 | 2.6GHz | 無 | 4×1MB | HD 6530D | 320:16:8 | 443MHz | 100W | DDR3-1866雙通道 |
A6-3670K | 四核心四線程 | 2.7GHz | 無 | 4×1MB | HD 6530D | 320:16:8 | 443MHz | 100W | DDR3-1866雙通道 |
A8-3800 | 四核心四線程 | 2.4GHz | 2.7GHz | 4×1MB | HD 6550D | 400:20:8 | 600MHz | 65W | DDR3-1866雙通道 |
A8-3820 | 四核心四線程 | 2.5GHz | 2.8GHz | 4×1MB | HD 6550D | 400:20:8 | 600MHz | 65W | DDR3-1866雙通道 |
A8-3850 | 四核心四線程 | 2.9GHz | 無 | 4×1MB | HD 6550D | 400:20:8 | 600MHz | 100W | DDR3-1866雙通道 |
A8-3870K | 四核心四線程 | 3GHz | 無 | 4×1MB | HD 6550D | 400:20:8 | 600MHz | 100W | DDR3-1866雙通道 |
Athlon Ⅱ X4 631 | 四核心四線程 | 2.6GHz | 無 | 4×1MB | 無 | 無 | 無 | 100W | DDR3-1866雙通道 |
Athlon Ⅱ X4 651 | 四核心四線程 | 3GHz | 無 | 4×1MB | 無 | 無 | 無 | 100W | DDR3-1866雙通道 |
APU移動(dòng)版
Comal平臺(tái)
新一代APU采用GlobalFoundries 32nm SOI HKMG工藝制造,擁有2-4個(gè)基于改進(jìn)的推土機(jī)架構(gòu)CPU核心,核心代號(hào)為“Piledriver”,可以說這一部分的改進(jìn)還是比較大的,因?yàn)樯弦淮鶯lano的CPU部分還是采用的較老的K10架構(gòu),融合的GPU部分也進(jìn)行了大刀闊斧的改進(jìn).
Brazos平臺(tái)
基于Bobcat微架構(gòu)
CPU支持:SSE,SSE2,SSE3,SSSE3,SSE4a,NX bit,AMD64,PowerNow!,AMD-V.
所有型號(hào)支持DX11和UVD3.0硬件解碼
Socket FT1接口
步進(jìn):B0,C0
注:GPU核心配置格式為:流處理器數(shù)量,紋理單元數(shù)量,光柵單元數(shù)量
型號(hào) | 核心 | 主頻 | 二級(jí)緩存 | GPU型號(hào) | GPU配置 | GPU頻率 | GPU加速頻率 | TDP | 內(nèi)存支持 |
---|
"Ontario" (40 nm) |
C-30 | 單核心 | 1.2GHz | 512KB | HD 6250 | 80:8:4 | 276MHz | 無 | 9W | DDR3-1066單通道 |
C-50 | 雙核心 | 1GHz | 2×512 KB | HD 6250 | 80:8:4 | 276MHz | 無 | 9W | DDR3-1066單通道 |
C-60 | 雙核心 | 1GHz | 2×512 KB | HD 6290 | 80:8:4 | 276MHz | 400MHz | 9W | DDR3-1066單通道 |
"Zacate" (40 nm) |
E-240 | 單核心 | 1.5GHz | 512KB | HD 6310 | 80:8:4 | 500MHz | 無 | 18W | DDR3-1066單通道 |
E-300 | 雙核心 | 1.3GHz | 2×512 KB | HD 6310 | 80:8:4 | 488MHz | 無 | 18W | DDR3-1333單通道 |
E-350 | 雙核心 | 1.6GHz | 2×512 KB | HD 6310 | 80:8:4 | 492MHz | 無 | 18W | DDR3-1066單通道 |
E-450 | 雙核心 | 1.65GHz | 2×512 KB | HD 6320 | 80:8:4 | 508MHz | 600MHz | 18W | DDR3-1333單通道 |
"Desna" (40nm) |
Z-01 | 雙核心 | 1GHz | 2×512 KB | HD 6250 | 80:8:4 | 276MHz | 無 | 5.9W | DDR3-1066單通道 |
Sabine平臺(tái)
"Llano" (32 nm)
CPU支持:MMX,SSE,SSE2,SSE3,SSE4a,Enhanced 3DNow!,NX bit,AMD64,Cool'n'Quiet,AMD-V,Turbo Core
CPU部分代號(hào)Husky,基于改進(jìn)版K10.5架構(gòu)
GPU部分基于Redwood核心
全型號(hào)通用參數(shù):
晶體管數(shù)量:14.5億
核心面積:228平方毫米
步進(jìn):B0
接口:Socket FS1
UMI總線:2.5GT/s
注:GPU核心配置格式為:流處理器數(shù)量,紋理單元數(shù)量,光柵單元數(shù)量
型號(hào) | 核心 | 主頻 | 加速頻率 | 二級(jí)緩存 | GPU型號(hào) | GPU配置 | GPU頻率 | TDP | 內(nèi)存支持 |
---|
E2-3000M | 雙核心 | 1.8GHz | 2.4GHz | 2×512 KB | HD 6380G | 160:8:4 | 400MHz | 35W | DDR3-1333雙通道 |
A4-3300M | 雙核心 | 1.9GHz | 2.5GHz | 2×1MB | HD 6480G | 240:12:4 | 444MHz | 35W | DDR3-1333雙通道 |
A4-3305M | 雙核心 | 1.9GHz | 2.5GHz | 2×512 KB | HD 6480G | 240:12:4 | 593MHz | 35W | DDR3-1333雙通道 |
A4-3310MX | 雙核心 | 2.1GHz | 2.5GHz | 2×1MB | HD 6480G | 240:12:4 | 444MHz | 35W | DDR3-1333雙通道 |
A4-3320M | 雙核心 | 2GHz | 2.6GHz | 2×1MB | HD 6480G | 240:12:4 | 444MHz | 35W | DDR3-1333雙通道 |
A4-3330MX | 雙核心 | 2.2GHz | 2.6GHz | 2×1MB | HD 6480G | 240:12:4 | 444MHz | 45W | DDR3-1600雙通道 |
A6-3400M | 四核心 | 1.4GHz | 2.3GHz | 4×1MB | HD 6520G | 320:16:8 | 400MHz | 35W | DDR3-1333雙通道 |
A6-3410MX | 四核心 | 1.6GHz | 2.3GHz | 4×1MB | HD 6520G | 320:16:8 | 400MHz | 45W | DDR3-1600雙通道 |
A6-3420 | 四核心 | 1.5GHz | 2.4GHz | 4×1MB | HD 6520G | 320:16:8 | 400MHz | 35W | DDR3-1333雙通道 |
A6-3430MX | 四核心 | 1.7GHz | 2.4GHz | 4×1MB | HD 6520G | 320:16:8 | 400MHz | 45W | DDR3-1600雙通道 |
A8-3500M | 四核心 | 1.5GHz | 2.4GHz | 4×1MB | HD 6620G | 400:20:8 | 444MHz | 35W | DDR3-1333雙通道 |
A8-3510MX | 四核心 | 1.8GHz | 2.5GHz | 4×1MB | HD 6620G | 400:20:8 | 444MHz | 45W | DDR3-1600雙通道 |
A8-3520M | 四核心 | 1.6GHz | 2.5GHz | 4×1MB | HD 6620G | 400:20:8 | 444MHz | 35W | DDR3-1333雙通道 |
A8-3530MX | 四核心 | 1.9GHz | 2.6GHz | 4×1MB | HD 6620G | 400:20:8 | 444MHz | 45W | DDR3-1600雙通道 |
A8-3550MX | 四核心 | 2GHz | 2.7GHz | 4×1MB | HD 6620G | 400:20:8 | 444MHz | 45W | DDR3-1600雙通道 |