12月21日消息,設計首AMD近日官方公布了第一份關于Zen6架構設計的全新文檔《AMD Family 1Ah Model 50h-57h處理器性能監控計數器》,通過性能監視接口了,計算披露了Zen6架構設計的內核不少細節。
當然,設計首這次講的全新是EPYC數據中心處理器的Zen6,而不是計算消費級銳龍,但底層邏輯是內核相通的。
在此之前,設計首我們只知道EPYC Zen6是全新首個采用臺積電2nm工藝的高性能處理器,最多256個核心。計算
最新文檔支出,內核Zen6架構并不是設計首Zen4/5的漸進式小幅度升級,而是全新經過了全面翻新,專門為高吞吐量設計的計算更寬架構,擁有8個寬度的指令調度引擎(蘋果9個寬度),當然繼續支持SMT同步多線程。
Zen6重點增強了對矢量(向量)運算、浮點運算執行狀態的監測能力,顯然非常重視密集型數學運算負載。
Zen6核心還配備了特殊的計數器,用于統計閑置調度窗口、后端流水線阻塞、線程選擇損耗等,再次印證Zen6架構上對更寬發射技術與SMT仲裁機制的戰略思路。
Zen6依然支持512位完整寬度的AVX-512指令集,兼容FP64、FP32、FP16、BF16等數據格式,支持FMA(融合乘加)、MAC(乘積累加)運算,以及浮點-整數混合矢量執行,包括VNNI(矢量神經網絡指令集)、AES(高級加密標準)、SHA(安全哈希算法)等。
不僅如此,Zen6 AVX-512的持續吞吐量極高,需要借助合并式性能計數器才能實現精準測量。
這兩年,AVX-512指令集反而已經成為AMD的殺招,Zen6每個時鐘周期能夠完成的矢量運算任務量,更是超出了傳統測量方法的適用范圍,所以才需要新的監視接口。
總體而言,Zen6將是AMD首次從底層開始、專為數據中心和AI應用場景打造的微架構,必將成為一款計算利器。
至于消費級版本將保留哪些特性,實際表現如何,還有待觀察。