谁有黄色在线观看,2018天天拍拍天天爽视频,大鸡巴嗯嗯啊嗯啊嗯啊嗯啊嗯啊日逼视频,日韩va免费线上看

首頁 / 

你敢要它就有!至強6新品治好選擇困難癥

來源:河北網絡廣播電視臺 發(fā)表時間:2025-03-24 16:30
分享到:

2月下旬,英特爾新一代數據中心處理器至強6大家族迎來了第三波的新品發(fā)布,主要包括代號GraniteRapids-SP的至強6700/6500性能核處理器,以及代號GraniteRapids-D的至強6系統(tǒng)級芯片(SoC)。

至強6700/6500系列性能核處理器上市,意味著至強6性能核產品陣容終于“補全”,覆蓋從8至128核,得以更好地銜接第四代/第五代至強可擴展處理器產品線,與去年發(fā)布的至強6700系列能效核處理器形成清晰的分工。

至強6全家福

由于至強6產品家族旗下型號多,且發(fā)布時間跨度較長,定位差異也很大,我們先簡要回顧至強6家族已經上市的產品線。

2024年6月,至強6首次亮相,發(fā)布的是代號為SierraForest-SP的至強6700能效核處理器。該系列的計算單元采用英特爾3制造工藝,提供了144個能效核,主要針對高密度、橫向擴展工作負載,如云原生、CDN、微服務等,在為這類應用帶來性能改善的同時,能效也有更為明顯的提升。至強6700系列能效核處理器最大功耗350瓦,采用SocketE2接口(LGA4710),支持8通道DDR56400MT/s,88個PCIe5.0通道及64個CXL2.0通道。

2024年9月發(fā)布的至強6900系列性能核處理器代號GraniteRapids-AP,定位為旗艦級,適合要求嚴苛的云、科學計算、AI(機頭)等領域,可以在同樣的空間內部署更多的性能核(單插槽可以達到128個性能核)、提供更大的內存帶寬(12通道內存,并支持MRDIMM8800MT/s)、更多的PCIe5.0通道(96個)或CXL2.0通道(64個),以及6個UPI2.0鏈路。相應的,至強6900系列性能核處理器需要使用更大面積的接口SocketBR(LGA7529),最大功耗也增加到500瓦。其新的性能核前端設計有較大改進,在翻倍的內核數量和內存帶寬加持下,性能表現(xiàn)是至強6整個家族中的佼佼者,在很多主流應用負載上的性能表現(xiàn)都能達到上一代產品的2-3倍。

今年2月發(fā)布的至強6700/6500系列性能核處理器代號GraniteRapids-SP,集成了8到86個性能核,平均每核分配的末級緩存多數都在4MB以上,完整支持AMX指令集,DSA、QAT、IAA和DLB等加速器也都開啟。至強6700/6500性能核處理器使用與至強6700能效核處理器相同的接口和功耗上限,PCIe、CXL擴展能力相同,支持8通道DDR56400MT/s,部分型號還提供了MRDIMM8000MT/s的支持能力。該系列的市場定位更偏向主流的數據中心、電信基礎設施,以及企業(yè)級服務器和邊緣場景。

在此,我們先做一個小結:至強6家族規(guī)劃了AP與SP,以及性能核與能效核的微架構,由此交叉構成多個產品大類:AP+性能核對應至強6900性能核產品線(最高128核),負責提供這代產品目前最強性能輸出水平(內核數和內存通道),PCIe和CXL擴展能力也要更強一些,使用面積更大的封裝和插座。至強6900性能核的6個UPI2.0鏈路全部用于雙路互聯(lián),可以充分提升跨處理器的訪問帶寬以盡可能提高性能,但不考慮用于構建多路系統(tǒng)。SP+能效核及性能核,對應的產品線則分別為至強6700能效核(最高144核)與至強6700/6500性能核產品線(最高86核),更多是用于主流服務器機型的升級換代,封裝尺寸與前幾代至強保持一致。

應用新主流:生成式AI、結構化數據

至強6700/6500系列性能核處理器與已經發(fā)布半年多的至強6700系列能效核處理器可以使用相同的服務器平臺,因此在發(fā)布后可以迅速進入市場。由于過去一年AI需求高漲,業(yè)內一直期待性能核與能效核處理器能夠盡快形成清晰明確的分工,以完整覆蓋主流市場各種類型業(yè)務的需求:傳統(tǒng)業(yè)務需要降本增效,新興業(yè)務需要提質增量。

傳統(tǒng)業(yè)務混合AI負載

在大模型蔚為風潮的背景下,至強6性能核擁有更多的內核、較大的內存帶寬,以及AMX這類為AI任務優(yōu)化的加速器,不論是傳統(tǒng)的神經網絡推理,還是Transformer大語言模型推理的性能都相較上一代至強處理器有大幅提升。主流的200億參數以下的中、小規(guī)模的模型在至強6上都可以順暢運行,再得益于至強本身在通用計算領域的競爭力和積累,就使得至強6700性能核非常適合混合部署AI業(yè)務的用戶。譬如在互聯(lián)網行業(yè)中已經驗證成熟的推廣搜(廣告、推薦、搜索),企業(yè)應用中滲透率很高的自然語言處理,正在蓬勃發(fā)展的智能客服、知識助理等大模型私有部署等。這些業(yè)務都可以與傳統(tǒng)業(yè)務部署在同一個節(jié)點、同一個資源池當中。

生成式AI

如果說至強6900性能核是AI訓練的最佳機頭,那么至強6700/6500系列性能核也有望成為AI推理的優(yōu)秀機頭,搭配GPU或其他AI專用加速器運行以生成式AI為代表的,大參數、高并發(fā)的大語言模型推理任務。

上一小節(jié)中提到了至強6性能核自身核心性能、內存帶寬的優(yōu)勢。在至強6700/6500系列性能核上,還比較容易獲得內存容量的優(yōu)勢。基于傳統(tǒng)布局,雙路至強6700/6500系列性能核機型依舊可以輕松提供32條內存插槽,可以較低成本部署2~4TB本地內存,上限可以達到8TB。部分型號還可以享受MRDIMM8000MT/s提供的更高帶寬。除了充裕的內存容量和帶寬,充足的PCIe5.0通道數有利于配置多塊AI加速器和高性能網卡。至強6700/6500系列的雙路節(jié)點可以提供176條PCIe5.0通道,單路節(jié)點可提供136條。這使得在4U機箱內部署8卡不再需要依賴PCIeSwitch板,在液冷的支持下部署更高的密度也依然游刃有余。

隨著以KTransformer為代表的開源大語言模型推理優(yōu)化框架的出現(xiàn),利用MoE架構稀疏性的特點在CPU和GPU上實現(xiàn)異構分層部署推理任務逐漸引起重視。這種異構協(xié)同的方案可以充分利用算力、存儲資源,大幅降低部署門檻,顯著提升推理速度。這種模式也能讓至強6處理器的計算性能、內存優(yōu)勢及AMX加速能力獲得更大的發(fā)揮空間。而且至強6性能核產品線中的DSA、QAT、DLB、IAA等加速器也全都默認開放,讓數據流的預處理、節(jié)點間交互的效率更高。尤其是6700性能核的高性能產品線當中,4種加速器都各提供4個,能助力CPU卸載加密、壓縮、數據傳輸和轉換等任務。這些特性有利于改善節(jié)點內南北向、東西向數據傳輸中的消耗,在構建高并行、多節(jié)點的AI集群時可進一步提升效率。

至強處理器在可信或隱私計算方面較為獨到的技術特性,也在這次至強6700/6500系列性能核發(fā)布時得到了進一步增強。其從第四代至強可擴展處理器開始集成的TDX(TrustDomainExtensions)技術,原本可基于硬件的可信執(zhí)行環(huán)境部署信任域(TD)讓敏感數據和應用程序獲得虛擬機/容器級別的隔離,免受未經授權的訪問。這次也隨新品將機密計算的覆蓋范圍進一步增強,通過新增的TDXConnect,可在CPU和PCIe設備之間實現(xiàn)高性能的加密連接,這可以更好地保護加載于主內存、CPU、加速卡全鏈路中的數據。TDXConnect對于需要租賃彈性算力部署私有AI業(yè)務的用戶而言是一個非常重要的保障,畢竟在算力平權的時代,自有數據和微調的垂直模型才是企業(yè)核心競爭力的有力保障。

向量數據庫

生成式AI帶動了業(yè)內對向量數據庫的關注。由于大語言模型的知識是在訓練和微調時固化的,遇到“超綱”的問題時,模型可能會拒絕回答或胡說八道。通過檢索增強生成(RAG)讓模型可以檢索外部數據獲取更多的信息以補充其知識盲區(qū)。對于私有化部署大語言模型的企業(yè)而言,必須通過微調強化模型在特定領域的專業(yè)度,并建議搭配向量數據庫以實現(xiàn)RAG,可以充分利用私有信息并不斷更新。簡單說,參數規(guī)模決定了大語言模型的智力水平,向量數據庫決定了大語言模型的專業(yè)度、可信度,以及可持續(xù)發(fā)展。

向量數據庫與傳統(tǒng)的以行或列組織信息的數據庫不同,其使用數據的高維度嵌入作為信息單元,并基于嵌入進行相似性檢索。因此在構建向量數據庫時需要通過模型對篩選、收集的文檔進行提取、格式化、切分。結構化數據庫的向量操作非常適合使用至強6性能核進行處理。單路的至強6性能核的典型應用場景是全閃存儲節(jié)點,在此基礎上部署向量數據庫能進一步發(fā)揮處理器的性能特點:適宜的處理能力和豐富的擴展性。

內存數據庫

相較于至強6900性能核處理器和6700能效核處理器,至強6700/6500系列性能核處理器還擁有一個關鍵的特點,它們傳承了英特爾在x86市場的獨門絕技:可以原生擴展至4路和8路,這意味著單臺服務器通過八路配置即可提供688個性能核以及32TB本地DDR5內存,尤其適合用于大型內存數據庫以及科學計算集群的胖節(jié)點等。以SAPHANA為代表的大型內存數據庫為聯(lián)機事物處理(OLTP)等關鍵業(yè)務提供了有力支撐,將盡可能多的數據放置在內存當中有利于提高并發(fā)事務吞吐量、加快決策速度。

另外,根據以往的經驗,頂尖的服務器廠商還會通過節(jié)點控制器進一步拓展處理器數量和內存容量。不過在至強6性能核上還有更簡單的內存擴展方式——CXL2.0內存。至強6性能核獨有的CXL平面內存模式(FlatMemoryMode)可以平滑地擴展內存容量和帶寬,不需要操作系統(tǒng)內核或部署專用的軟件支持。平面內存模式與本地內存的配置比例是1:1,理論上可以將服務器的內存容量翻倍,或者允許使用相對更便宜的基于DDR4的CXL內存。以配置32TB內存為例,如果完全使用本地內存,必須使用單條128GB的DDR5RDIMM,價格比較昂貴;而搭配CXL內存,本地內存就可以使用更為常見64GBDDR5RDIMM,從而有效降低整體成本,總帶寬還有所提升。

產品陣容進一步解析

至強6700/6500性能核處理器規(guī)劃了非常綿密和多樣的產品線,內核數量從8核至86核,UPI數量和啟用的加速器數量也有所差別。為了構成如此多樣的規(guī)格,英特爾設計了三種類型的封裝形態(tài):XCC、HCC、LCC。

■XCC:擁有兩個計算單元(ComputeTile)和兩個IO單元(IOTile),分別由Intel3和Intel7工藝制造。XCC所使用計算單元與組成至強6900性能核的UCC相同,都是單芯片44個內核、4通道內存控制器,區(qū)別是UCC使用了3個計算單元。XCC的兩個計算單元提供最多86個內核。

■HCC:一個計算單元和兩個IO單元。HCC的計算單元提供最多48個核心,以及8通道內存控制器。HCC沒有考慮對MRDIMM的支持。

■LCC:一個16核心的計算單元和兩個IO單元,不支持MRDIMM。使用LCC的處理器UPI鏈接數只有3,這可能與其計算單元和IO單元之間的EMIB連接較少有關。

從產品定位角度看,至強6700/6500性能核處理器可以進一步細分為高性能、主流、多路、單路等產品線。

高性能產品線

高性能產品線提供了最多86核的型號(6787P),多數型號的加速器全部打開。至強6的每個IO單元提供2個加速器模塊,每個模塊有DSA、QAT、DLB、IAA各1。兩個IO單元就是4種加速器各4個。基于LCC的6517P和6507P提供的加速器是各兩個。

高性能產品線涵蓋了XCC、HCC、LCC三種封裝,因此內核數量、內存支持、功耗的差異也很大。其中,以第三位數字為界,674xP以上的4款均是XCC,內核數量最多86,LCC末級緩存最多336MB,均支持MRDIMM8000MT/s。這里有一個特例是6730P,它也基于XCC,提供了288MB末級緩存,但不支持MRDIMM。

其中,6745P以32核享受了多達336MB的末級緩存,平均每核緩存超過10MB!它的頻率也較高,基礎頻率超過3GHz,全核睿頻可以達到4.1GHz,單核4.3GHz。這種核少、高頻、大緩存的SKU更適合追求低內存延遲、高處理壓力的任務,譬如大數據分析、科學計算等。而核數更多的型號則更適合高并行性的任務。

6527P、6736P、6737P這幾個SKU使用的HCC封裝,提供16到36核的配置。HCC理論上最多48核,提供192MB末級緩存。6737P只使用了其中的32核,但享用了全部末級緩存,因此其定位略高于核數略多的6736P(36核)。

6507和6517P使用LCC封裝,核數少,基礎頻率高,可以達到3.2GHz以上,睿頻可以達到4.3GHz,而功耗不到200瓦。LCC給每個性能核準備了4.5~6MB的末級緩存,要多于其他系列的原生設計。高頻率、大緩存有都利于在核數相對較少的情況下提升性能。

主流產品線

主流產品線的核數跨度在12個到64個之間,顯然也使用了三種版本的內核封裝。其中兩款67x0P使用XCC,卻沒有開放MRDIMM的支持。不過好在二者的末級緩存都較大,平均每核心的緩存容量達到至少5MB。相比高性能產品線,主流產品線的加速器只開放了一半,分別只有2個,每CPU的TDX數量也減半了。

這一組產品的型號非常直觀,第三位數字可以與實際內核數掛鉤。譬如6760P的第三位是6,核數是64;6520P的2對應24核。唯一的特例是6505P,它不是8核而是12核。

多路產品線

多路產品線是為4路、8路服務器準備的,售價較高,均被列入67xxP序列。該產品線的型號也比較容易理解,第三位數字大致對應了核數多寡;第四位數字是8或4,清晰體現(xiàn)了其原生的UPI直連多路支持能力。譬如6724P和6714P基于LCC,每個插槽有3個UPI鏈接,正好可以分別直連其他3個插座以構成全連接的4路系統(tǒng),或通過節(jié)點控制器實現(xiàn)8路。其余尾數為8的處理器都有4個UPI,可以構成典型的8路系統(tǒng)。

這些面向多路的產品都不支持MRDIMM,即使是其中兩款基于XCC也是如此。其實對于多路系統(tǒng)而言,相鄰任意兩個處理器之間頂多只有一條UPI鏈接,跨插座的內存訪問帶寬遠低于雙路產品線——作為對比,雙路旗艦6900性能核系列會使用全部6個UPI互聯(lián)。因此,多路系統(tǒng)全局訪問內存的瓶頸在于UPI的帶寬,很難發(fā)揮MRDIMM的帶寬優(yōu)勢,暫時也就沒有啟用的必要。長遠看,由于MRDIMM有單條內存容量翻倍的潛力,未來的多路系統(tǒng)還是會擇機引入MDRIMM的。

多路產品線中超過16核的SKU都開放了全部的加速器。6748P是已公開的至強6產品線中,唯一使用了“滿血”HCC的SKU,提供48核和192MB末級緩存。

8核的6714P和16核的6724P基于LCC打造,它倆的核數較少,但設定了比高性能產品線的6507P和6517P更高的功耗和頻率。實際上,6714P和6724P是整個至強6家族當中頻率最高的SKU,基礎頻率甚至達到了4GHz,不論是之前提到的高性能產品線還是后面要提到的單路產品線都沒有達到這個水平。高頻也是它們雖然基于LCC,但依舊可以冠以67xxP之名的原因之一。這樣的規(guī)格雖不適合高并發(fā)的處理,但優(yōu)勢在于響應速度更快,在配合某些根據內核數收取授權費的軟件使用時也可以適當降低成本。

單路產品線

至強6700和6500性能核的單路產品線所有產品名稱的第四位數字均為1,第三位數字與核數的對應關系也最為“整齊”,核數均為8的整倍數,沒有特例。單路處理器不需要使用UPI互聯(lián),因此IO單元中原本可用作UPIx24的幾個UIO可被用作x16的PCIe或CXL通道。最終它們的PCIe通道數比雙路“同胞”們多了48個,達到136個。

(圖注:性能核處理器的IO單元功能模塊)

單路至強6性能核處理器的加速器數量大多為3組,介于性能(4組)和主流(2組)產品線之間。80和64核的單路處理器支持MRDIMM8000MT/s,但同樣使用XCC的48核6741P卻不支持MRDIMM。

由于當前處理器的內核數量已經足夠的多,專門規(guī)劃單路至強可以控制成本,或用于提升機箱內擴展設備的部署密度。以全閃存儲節(jié)點為例,如果2U前窗提供24個U.2NVMe盤位,不依賴PCIeSwitch或擴展卡的話,需要96個NVMe通道。單路至強6性能核滿足NVMeSSD后,還有40個PCIe5.0通道,可分配給兩塊100/200GIB網卡服務存儲集群,還有1塊OCP網卡做管理。對于并行度較高的業(yè)務,譬如云、輕量級推理、視頻轉碼等,如果在原本雙路機箱內部署兩個單路節(jié)點,在內核數相同的前提下,可以掛載更多的PCIe設備用于推理、轉碼、存儲等。

至強6系統(tǒng)級芯片、至強6300

在至強6700/6500性能核發(fā)布同期,英特爾也正式推出了至強6系統(tǒng)級芯片與至強6300,在這里我們對二者也順便做一些簡要介紹。

至強6系統(tǒng)級芯片的計算單元與XCC、HCC、LCC是通用的,但搭配了一個重新設計的IO單元。這個IO單元取消了UIO,減少了IO模塊,僅支持較少、較低規(guī)格的PCIe和CXL,主要面積用于提供2×100Gbps以太網、媒體加速器、vRAN加速器等。這也從另一個角度體現(xiàn)了至強6產品家族將計算單元和IO單元解耦的意義。通過調整IO單元的規(guī)格,配置不同的擴展能力、多樣化的加速器,可以更好地適配更豐富的細分場景。c

至強6系統(tǒng)級芯片將通用計算、AI推理、媒體編碼、以太網等功能整合在單一封裝內,主要部署于邊緣側,如網絡安全加速器、媒體服務器、5G虛擬基站等。目前已經公開規(guī)格的至強6系統(tǒng)級芯片最多42核(6726P-B),使用BGA4368封裝,TDP最高235瓦,支持4通道DDR56400MT/S。英特爾也透露了72核的存在,后續(xù)還會陸續(xù)發(fā)布。

至強6300系列定位于入門級服務器,采用的內核是RaptorLake,提供8個核心,支持雙通道DDR54800MT/sECCUDIMM。RaptorLake就是13代酷睿處理器中的性能核,只是用在至強產品線當中時沒有再用酷睿那種性能核與能效核并存,或者是大小核的設計,而是使用全性能核的設計。它還提供ECC內存支持,并搭配C260系列PCH。同樣的內核、同樣的LGA1700插座,其實英特爾在2024年第四季度推出過至強E-2400系列。至強6300系列的出現(xiàn)看起來像是有意將至強E-2400統(tǒng)一到至強6品牌之下。

至強6全家福成形:高低搭配,平滑過渡

至強6700/6500性能核的發(fā)布,進一步完善了至強6家族產品線。整個面向主流和中高端市場的產品線覆蓋了8核到144核,提供了領先的內核數量、獨一份的內存帶寬、具有前瞻性的加速器。對于正在進入換代周期的第二、第三代至強可擴展處理器的機型用戶而言,至強6可以很好地承接業(yè)務遷移、升級的需求。對于保持傳統(tǒng)業(yè)務的用戶,至強6能效核可以平滑遷移并提供數倍的部署密度以及更好的能效,以改善運營成本。對于希望與時俱進,跟上AI浪潮的用戶,至強6性能核不僅僅是提供更大更多的內核,其實還提供了更適應AI需求的加速器,以實現(xiàn)1+1>2的效果。

至強6為旗艦與主流產品提供了不同的封裝規(guī)模。后者的封裝尺寸與第三代至強可擴展處理器以來的幾代產品保持相同,TDP的增長也比較謹慎。這意味著對于多數用戶而言,這數年來積累的系統(tǒng)布局、運維習慣可以基本保持不變。

狂飆的內核與穩(wěn)定的外形,這并非反差,而是技術前瞻性和對市場持久承諾的結合。


編輯:龔忻

分享到:
評論一下
評論 0人參與,0條評論
快來搶個沙發(fā)吧~
最熱評論
最新評論
已有0人參與,點擊查看更多精彩評論

請輸入驗證碼

熱門文章