昨天英偉達GTC 2021大會正式召開,英偉達正式釋出入門級AI推理、邊緣計算加速卡NVIDIA A2,基於Ampere架構。
它採用了RTX 3050系列同款8nm GA107小核心,只開啟一半1280個流處理器,核心基礎頻率1440MHz、加速頻率1770MHz,單精度浮點效能4.5TFlops。
A2採用了128bit位寬的16GB GDDR6視訊記憶體,頻率12.5Gbps,頻寬200GB/秒。這款加速卡的功耗很低,TDP只有40W-60W。
效能方面,相比Turing架構入門級產品T4效能提升20-30%,功耗降低10%。英偉達暫未公佈NVIDIA A2的公開定價,客戶可以透過英偉達的常規OEM合作伙伴進行購買。
此外英偉達還發布了專為高效能計算而生的新一代Quantum-2網路平臺,核心是7nm工藝的Quantum-2交換晶片,7nm工藝,570億電晶體,可以支撐64路400Gbps網路,網速高達50.2Tbit/s,也就是5000萬兆以上。
Quantum-2網路平臺由Quantum-2交換機、ConnectX-7 NIC及BlueField-3 DPU,以及NVIDIA的軟體組成,其中的核心則是Quantum-2交換機晶片。
根據NVIDIA的說法,Quantum-2交換機晶片採用7nm工藝,整合的晶片超過570億,比NVIDIA的GA100 GPU核心還要多,後者不過540億電晶體。
效能方面,Quantum-2支援64個400Gbps埠或者128個200Gbps埠,雙向吞吐量高達50.2Tbit/s,還有多機交換可提供2048個400Gbps或者4096個200Gbps埠,效能比上代Quantum-1提升5倍多。
除此之外英偉達還在大會上推出全新Jetson AGX Orin機器人計算機,官方稱其為全球最小、功能最強大、能效最高的 AI 超級計算機,用於機器人、自主機器、醫療器械和其他形式的邊緣嵌入式計算。
英偉達表示,Jetson AGX Orin建立在Ampere架構之上,處理能力提升了6倍並保持了與前代機型Jetson AGX Xavier相同的外形尺寸和引腳相容性。它每秒可進行200萬億次運算(TOPS),可與內建GPU的伺服器相媲美,但尺寸卻只有人的手掌那麼大。全新Jetson計算機可以加速整個NVIDIA AI軟體棧,使開發者能夠部署最大、最複雜的模型以解決自然語言理解、3D感知、多感測器融合等領域的邊緣AI和機器人技術挑戰。
Jetson AGX Orin採用Ampere架構GPU和Arm Cortex-A78AE CPU以及新一代深度學習和視覺加速器,配備高速介面、更快的儲存頻寬,支援多模態感測器,可為多個並行AI應用流水線輸送資料。
Jetson AGX Orin模組和開發者工具包將於2022年第一季度上市。