家用固態硬碟的測試內容相對簡單,就是看看順序讀寫,4K隨機讀寫效能。有些朋友比較關注SLC快取外寫入速度,並對掉速現象深以為恨。實際上,固態硬碟真正發揮實力的場景是在伺服器中,也就是要用到企業級固態硬碟。
這次PCEVA評測室將測試新一代PCIe 4.0介面企業級SSD。在消費級產品已經能夠跑滿PCIe 4.0頻寬的情況下,一起來看看企業級產品能夠帶來哪些改變。
本次測試的三款3.84TB容量企業級SSD:DapuStor R5101、英特爾D7-P5510、三星PM9A3,均具備1DWPD寫入耐久度指標,屬於讀取密集型產品。
這裡首先介紹下SSD的一些分類方式。通常大家將SSD分成企業級(伺服器用)和消費級(家用)。而一些SSD製造商可能會進一步細分企業級產品:企業(Enterprise)SSD和資料中心(Data Center)SSD,差異主要是在效能層面。消費級固態硬碟通常也可稱為客戶級(Client SSD)。這次我們測試的DapuStor R5101和英特爾D7-P5510屬於企業級SSD,三星PM9A3屬於資料中心級SSD。另外還有一張1TB容量的消費級SSD作為參考。
產品介紹:
Intel D7-P5510
大家對英特爾的企業級SSD應該都耳熟能詳,它們在二手市場也很受歡迎。這次測試的P5510屬於D7系列,在英特爾企業級SSD產品線中是僅次於使用傲騰的頂級產品。D7-P5510 3.84TB的順序讀取頻寬6500MB/s,順序寫入頻寬3400MB/s,4K隨機讀寫700K/170K IOPS。
英特爾D7-P5510只用到了兩顆螺絲固定,每個晶片上方都設定了導熱墊。斷電保護儲能電容耐壓35V,容量1000uF。
英特爾EAX 33339主控缺少具體資料,有可能是12通道設計。英特爾D7-P5510 3.84TB混合使用了29F01T2ALCQKI和29F04T2ANCQKI兩種不同編號的16顆NAND快閃記憶體顆粒。
英特爾144層堆疊3D快閃記憶體依然是獨樹一幟的Floating Gate浮柵結構,分為TLC和QLC兩種,D7-P5510上使用的是企業級eTLC型別。
Samsung PM9A3
三星企業級SSD擁有很高的市佔率。這次測試的PM9A3提供U.2、M.2 22110和E1.S三種規格。U.2介面3.84TB型號的順序讀取頻寬6800MB/s,順序寫入頻寬4000MB/s,4K隨機讀寫1000/180K IOPS。
三星PM9A3厚度只有7mm,內部設計比較緊湊:
背面只給電源管理晶片設定了導熱貼,看來三星對快閃記憶體發熱控制很有信心。四顆用於斷電保護的儲能電容來自韓國三和。
正面的主控、DRAM快取、四顆NAND快閃記憶體以及電源管理晶片背面都設定了導熱貼。
ELPIS主控是不是很熟悉?沒錯,三星的消費級旗艦980PRO使用的就是同款主控。該主控為8通道設計,使用三星自家8nm工藝製造。在PM9A3當中,同ELPIS主控搭配的是三星128層V-NAND V6,自然也是eTLC型別。
DapuStor R5101
作為近年崛起的國內頭部企業級儲存廠商代表,大普微(DapuStor)具備從晶片設計到產品交付量產全棧能力,產品涵蓋使用eTLC快閃記憶體的企業級固態硬碟和使用XL-Flash的SCM儲存級記憶體。
這次測試的DapuStor R5101是大普微嶸神5系列成員,主打低延遲、高可靠及易擴充套件。3.84TB型號的順序讀取頻寬7400MB/s,順序寫入頻寬5700MB/s,4K隨機讀寫1750K/240K IOPS。
擰下正面的4顆內六角螺絲即可開啟DapuStor R5101,PCB透過另外4顆螺絲固定一側外殼上。8顆NAND快閃記憶體顆粒、5顆DRAM快取顆粒,透過導熱膏向外殼傳遞散熱。
如果是更大的7.68TB容量型號,主控這一面也將會有快閃記憶體和DRAM快取:
DPU616主控是大普微自主研發的16通道智慧SoC,使用12nm FinFET工藝製造,支援4K LDPC糾錯。LDPC碼長從2K增加到4K可帶來更強的糾錯能力。主控還在IO路徑上進行了多項最佳化,從而在混合讀寫下提供更優的延遲和QoS表現。
用於斷電保護的尼吉康儲能電容:
編號為TH58LKT2Y45BA8H的鎧俠企業級eTLC快閃記憶體,屬於112層堆疊BiCS5,並且是4 Plane高效能型別,寫入速度接近普通2 Plane版本的兩倍。DRAM快取來自南亞,DDR4型別,8Gb容量,耐溫0到95度。
紙面分析看企業級強在哪
平時大家接觸到的家用SSD在標稱讀寫效能的時候都有一個Up to xxxx MB/s,也就是至高多少兆每秒,這個峰值速度需要藉助SLC快取的幫助才能在理想狀態下實現。家用環境預設使用負載是比較低的,所以不會標出SLC快取用完後的效能。
在下面的規格表中可以看到,企業級固態硬碟的效能指標跟消費級旗艦相比並沒有更大的優勢,三星PM9A3的指標相比使用同款主控的消費級旗艦980PRO還略低一些,這是因為企業級SSD並不追求極限爆發性能,而是需要充分考慮重負載條件下能夠持續輸出的效能,並且竭盡所能在各種條件下都提供一致的效能表現。
得益於大普微DPU600系列主控的強悍實力,DapuStor R5101的效能指標明顯更強一些,其1750K IOPS的4K隨機讀取效能已經遠遠超越現有消費級SSD。
此外,企業級SSD相比消費級SSD還具備很多優勢。比如更高的耐久度:
更強的效能:
更強的保護:
企業級固態硬碟使用冗餘資料恢復技術來處理快閃記憶體中多個die失效的故障,並且不影響資料完整和業務執行,UBER不可修復的錯誤位元率通常會比消費級SSD低一到兩個數量級。
企業級固態硬碟還可提供全路徑端到端資料保護,在資料從主機端透過 PCIe 鏈路傳輸到SSD主控,主控將資料傳輸到快閃記憶體介面,再透過快閃記憶體介面將資料寫入快閃記憶體顆粒中,再返回給主機端的整個傳輸路徑中,每一段傳輸路徑都有糾錯/檢錯演算法保證資料被正確傳輸,降低靜默錯誤風險。
以上介紹完產品還有基本的紙面,下面進行實測來體驗企業級真正的實力
測試平臺:
CPU:AMD Ryzen 7 5800X @ 4.6GHz
主機板:AMD X570
記憶體:16GB DDR4-3200
SSD:STEC s620 200GB(系統盤)
DapuStor R5101 3.84TB(FW:FF002100)
Intel D7-P5510 3.84TB(FW:JCV10200)
Samsung PM9A3 3.84TB(FW:GDA5402Q)
某消費級PCIE4.0旗艦(對照盤)
OS:Windows Server 2019/Ubuntu 21.10
本次測試依然是在PC測試平臺上進行,透過同樣的指令碼測試,讓三款企業級固態與一款消費級旗艦進行對比,已經能體現出來明顯優勢。除了用於對照的消費級SSD直接安裝在CPU直連的M.2插槽之外,三款企業級SSD在測試時均透過U.2轉接卡連線到CPU直連的主機板PCIE插槽。
CrystalDiskInfo資訊識別:三款企業級SSD均使用PCIe 4.0 x4介面,DapuStor R5101和三星PM9A3支援NVMe 1.4協議,英特爾D7-P5510則沿用NVMe 1.3。
在測試英特爾D7-P5510的時候發生了一個小插曲,這塊測試樣品預設使用了512B+8B的扇區格式,Windows Server 2019無法正確識別,而在Linux下則能夠正常工作。我們在Linux下透過nvme-cli將其高階格式化為標準的512B扇區,成功解決了這個問題。
效能測試1:讀寫效能測試
在我們熟悉的Windows作業系統中,CrystalDiskMark是非常好用的SSD頻寬和IOPS測試工具。只需簡單調整就可以評估SSD能否達到其標稱效能。
不過這一次CrystalDiskMark失靈了,Windows系統似乎在1000K IOPS左右存在一個瓶頸,無法測出DapuStor R5101應有的1750K隨機讀取IOPS。即便請出IOMeter也僅僅是能跑出7500MB/s順序讀取,4K隨機讀取IOPS依然無法體現出來。
而在Linux系統下,DapuStor R5101透過fio可以輕鬆跑出1800K IOPS。除了平均延遲之外,fio還提供詳細的99百分位延遲資訊。雖然很多Linux下的測試工具沒有漂亮的圖形介面,但效能與功能都比Windows下的同類軟體更強,後續的測試也將以Linux系統為主。
效能測試2:ezFIO指令碼測試
ezFIO是經NVM Express推薦的企業級SSD綜合測試,它是一個可重複進行的穩定態效能測試指令碼。在測試開始前有兩次全盤容量寫入的預處理階段,幫助模擬企業級SSD的長期效能。ezFIO同時支援Windows和Linux平臺,測試完成後可自動生成測試報告。以下成績在是Linux系統下搭配fio 3.27測得。
ezFIO的長期效能穩定性檢驗透過穩定態隨機混合讀寫進行,根據平均IOPS和標準差計算得出變異係數,變異係數越低說明SSD在長期高負荷使用後的效能越穩定,越不容易產生程式需要等待IO的情況(卡頓)。
DapuStor R5101 3.84TB的穩定態混合隨機讀寫20分鐘平均IOPS為460071,變異係數1.42%。
英特爾D7-P5510 3.84TB的穩定態混合隨機讀寫20分鐘平均IOPS為313174,變異係數1.60%。
三星PM9A3 3.84TB的穩定態混合隨機讀寫20分鐘平均IOPS為356543,變異係數為0.70%。
作為參照的消費級1TB SSD,穩定態混合隨機讀寫20分鐘平均IOPS為43181,變異係數為21.34%。從平均IOPS來看,消費級PCIe 4.0 SSD能達到企業級的十分之一左右,但高負載下糟糕的效能穩定性使得10塊消費級SSD加起來也不能充當一塊企業級SSD來使用。
三款企業級SSD的穩定性表現都非常不錯,其中三星PM9A3的穩定性最佳(變異係數0.70%),DapuStor R5101的綜合性能表現更好。
接下來的穩定態4K隨機讀寫測試,又到了企業級和消費級的岔路口。消費級SSD的隨機讀寫IOPS都建立在SLC快取基礎上,而企業級SSD則會按照穩定態標註,一個是最佳狀態,一個是最惡劣條件。
測試的結果也比較符合我們的預期:DapuStor R5101 3.84TB穩定態4K隨機讀寫符合1750K/240K IOPS標稱值、英特爾D7-P5510 3.84TB穩定態4K隨機讀寫符合700K/170K IOPS標稱值、三星PM9A3 3.84TB穩定態4K隨機讀寫符合1000K/180K IOPS標稱值。對照用的消費級旗艦固態穩定態4K隨機讀寫777K/14K IOPS,讀取尚能達標,寫入則比理想狀態下定義的標稱值低了將近40倍。
下面是穩定態4K混合讀寫測試,其中讀取佔比70%,寫入佔比30%。為什麼要測試混合讀寫?讀取和寫入同時進行的難度遠比純讀取或純寫入高,但恰恰是這種難度更高的情況更貼近實際使用。金庸小說射鵰英雄傳裡練成左右互搏術的僅有3人,SSD要在混合讀寫一項上取得好成績更是考驗廠商的技術實力。
消費級SSD在自身能力上同企業級SSD有著巨大差距,能順利跑完測試就算成功了。DapuStor R5101則延續它在純讀取和純寫入時的領先優勢,以459K IOPS的成績奪魁,領先第二名的三星PM9A3大約28%。
ezFIO指令碼還提供了4K混合隨機讀寫的99百分位延遲資料,有助於全面評估SSD在複雜高壓條件下的效能一致性表現。圖中將讀取(左)和寫入(右)延遲分開統計,橫軸是延遲,越低越好,不同QD下成績越接近越好。
DapuStor R5101 3.84TB:
英特爾D7-P5510 3.84TB:
三星PM9A3 3.84TB:
整體來看三塊企業級SSD各有千秋,DapuStor和三星的寫入延遲較低,但英特爾的可預期延遲範圍更集中一些。
效能測試3:SNIA SSS PTS-E 2.0
SSS PTS的全稱為Solid State Storage Performance Test Specification,即固態儲存效能測試規範,它由SNIA儲存網路行業協會制定,當前最新版本是2.0,包括針對企業級SSD的PTS-E規範以及針對消費級SSD的PTS-C規範。
PTS測試在裝置而非檔案系統級別進行,通俗的說就是SSD在沒有分割槽的狀態下進行。PTS測試的是SS(Steady State穩定態)效能,而非FOB(Fresh-Out-of-the-Box開箱狀態即出廠態)表現。
為了使SSD達到穩定態,PTS測試需要先執行預處理,也就是我們常說的“填盤”:用隨機資料寫入全盤2倍容量。而後執行一系列隨機寫入,穩定態的判定方式為:檢查測試視窗中的4K隨機寫入、64K R65:W35混合隨機寫入和1024K隨機讀取三項成績,允許波動範圍+-10%,確認SSD已經進入穩定態後才會繼續後續測試。
接下來是對SSS PTS測試報告內容的解讀。SSD PTS測試報告會展示測試平臺的軟硬體配置情況(包括主機板、CPU、記憶體以及作業系統、測試軟體版本等)、受測SSD的資訊(包括製造商、型號、序列號、韌體版本、容量、擦除方式、寫入快取開關等)、測試設定(包括資料模型、測試範圍、預處理方式等等)。下圖是DapuStor R5101 3.84TB的SSS PTS測試資訊:
SSS PTS測試的內容包括512位元組、4K、8K、16K、32K、64K、128K和1MB塊大小,在0/100、5/95、35/65、50/50、65/35、95/5和100/0混合讀寫比例下的穩定態IOPS,並以資料表格、2D和3D圖示三種形式進行展現。首先是DapuStor R5101 3.84TB的成績:
然後是英特爾D7-P5510 3.84TB的成績:
最後是三星PM9A3 3.84TB的成績:
作為參照物的消費級PCIe 4.0 SSD,我們為它降低難度,選擇適合它的PTS-C測試標準,測試範圍從100%降低到75%,寫入快取從禁用改為啟用:
即便是降低了考試的難度,這款產品依舊壓力很大,畢竟現在消費級SSD突出的都是爆發力,針對家用系統盤環境極最佳化的SLC快取演算法,不一定適合穩定態。
為了方便對比,我們直接把PTS成績中的資料表格拼到同一張圖中:
DapuStor R5101的穩定態效能全面超越了其他對手。三星和英特爾之間的戰況膠著,在512位元組和4K塊大小上三星有比較明顯的優勢,而在64K以上則是英特爾佔優。消費級參照型號繼續打醬油,就無需過多評論了。
效能測試4:PCMark 10盤一致性測試
PCMark 10盤效能一致性測試是Windows系統下的長期高負載測試。測試開始前有兩次全盤填充過程、結束後有一次全盤填充過程,此外,每個效能降級階段將隨機寫入1分鐘或50GB,以先到者為準,這就使得高效能的企業級SSD有機會更快地完成整個測試。
最終DapuStor R5101以3小時37分5秒率先到達終點,三星PM9A3和英特爾D7-P5510的用時分別為4小時50分36秒和4小時55分5秒。作為參照的消費級SSD則耗時11小時41分36秒。各盤成績對比如下:
一張盤跑上好幾個小時,消耗數十TB的寫入壽命,如果就只看這麼一個總分成績就太不划算了。下面我們匯出詳細測試資料進行分析。PCMark 10盤效能一致性測試在大量隨機寫入過程中摻雜了若干儲存效能測試專案,其中包括代表大檔案同盤內複製(混合讀寫)的cp2:4個ISO映象檔案,共計20GB。DapuStor R5101最快,三星PM9A3次之,英特爾D7-P5510第三。作為參照的消費級SSD一旦進入到效能降級階段就開始打醬油了。
代表零碎小檔案同盤內複製的cps2:339個JPEG圖片檔案,共計2.37GB。英特爾D7-P5510在這個測試中強勢翻身奪得第一,DapuStor R5101和三星PM9A3分居第二和第三。作為參照的消費級PCIe 4.0 SSD除了開始階段的亮點(SLC快取爆發力強)之外,就沒有了太多表現的機會。
代表設計應用的Photshop重負載測試psh:DapuStor R5101表現得遊刃有餘,英特爾D7-P5510排名第二,三星PM9A3屈居第三,但效能一致性表現的還可以。
下表為穩定態階段Photoshop重負載專案的第99百分位延遲資料。
效能測試5:VDBench測試
VDBench是甲骨文推出的儲存效能評估工具,能夠支援去重和壓縮等特性,我們參考PURESTORAGE的資料製作了模擬甲骨文資料庫、VDI、VCI三種企業級應用負載的測試指令碼,並將IOPS和延遲的關係製表。圖中橫軸為IOPS為IOPS(越高越好),縱軸為對應的延遲(越低越好)。iorate的原理是VDBench先以無限制的方式測一次IOPS,而後以其作為100%基準,按照curve引數中給出百分比的IOPS為目標測定延遲。
在VDBench甲骨文資料庫工作負載中,DapuStor R5101 3.84TB以192477 IOPS和663us的成績排名第一。三星PM9A3 3.84TB以116021 IOPS和1102us延遲的成績位列次席。
VDI虛擬化桌面模擬測試,排名順序不變:DapuStor R5101 3.84TB以195731 IOPS和646us的成績勇奪頭名,其後分別是三星PM9A3、英特爾D7-P5510。
VSI虛擬化儲存模擬測試,消費級SSD直接將雙手舉過了頭頂,這畢竟不是它該來的賽場。DapuStor R5101 3.84TB則以141327 IOPS和897us的成績遙遙領先於其他競爭對手。
VDBench的iorate曲線功能可以方便得顯示出各SSD在逐步達到其極限之前的延遲增長情況。三個測試專案的成績排名順序一致:DapuStor R5101、三星PM9A3、英特爾D7-P5510。
總結:
這是近幾年來PCEVA首次正式評測企業級SSD,雖然測試沒有在真正的伺服器平臺上進行,但我們盡最大努力讓每個讀者能夠由淺入深地瞭解一些企業級SSD同消費級SSD差異、企業級SSD的測試方法和原理。
本次測試的三款企業級SSD來自三星、英特爾和大普微。從全球市場來看,三星和英特爾的企業級SSD的出貨量分別位居第一和第二位。DapuStor R5101則是當前最具實力的國產企業級SSD之一,它使用的DPU616主控在去年榮獲2021中國芯“芯火”新銳產品獎,於穩定態混合隨機讀寫效能上有著極為出色的表現。
效能上,同樣是PCIe 4.0介面,消費級SSD追求各項“全能”,同時滿足辦公、遊戲、設計需求,但是隻適合處理讀取為主的中輕度任務。企業級SSD在外觀和效能指標上都顯得樸實無華,但所標稱的效能卻是實打實的不含水分,他們的重負載使用效能是消費級SSD無法企及的。
安全性上,企業級SSD不僅具備比消費級SSD更低的UBER(不可修復的錯誤位元率),還提供快閃記憶體die級別的內部冗餘資料安全保護,自身故障率更低。此外,企業級SSD能夠提供“可預期的效能”,這一點對於給SSD組建RAID陣列非常重要。消費級SSD由於SLC快取釋放等因素的影響,強行組建RAID陣列不僅效能差而且容易導致陣列崩潰。而企業級SSD則可以透過RAID陣列進一步增強原本就更高的資料安全性。
用過企業級SSD之後,小編才感受到了SSD的真正實力:它提供了酣暢淋漓的舒適感、無後顧之憂的信任感和安全感。經常感嘆SSD一年不如一年的朋友或許可以開拓一下新視角。