解讀固態硬碟的“4K效能”

在談到固態硬碟效能的時候,大家都會想到非常重要的“4K效能”,即4K隨機讀寫IOPS。作為系統盤使用時,固態硬碟執行的讀寫操作中,4K隨機讀寫佔據了相當大的份額。

解讀固態硬碟的“4K效能”

“4K效能”受哪些因素影響呢?快閃記憶體沒有機械活動部件,隨機讀寫的效能比機械硬碟高出許多,但依然會受一些因素的制約,譬如快閃記憶體讀寫延遲、LUT(Look up table)效率。快閃記憶體的讀寫延遲基本是固定的,而LUT效率就成了影響固態硬碟“4K效能”的主要因素。

解讀固態硬碟的“4K效能”

LUT填補了快閃記憶體與針對傳統機械硬碟設計的檔案系統之間鴻溝,解決快閃記憶體不能覆蓋寫入、擦寫次數存在限制等問題。LUT可以被當成是一張邏輯地址(檔案系統)與物理地址(快閃記憶體單元)之間對應關係的查詢表。

解讀固態硬碟的“4K效能”

根據LUT表的儲存位置,固態硬碟可以分為有外接快取和無外接快取(DRAM-less)兩種型別,後者因為省去了固態硬碟當中的DRAM晶片,在價效比上擁有更好的表現。但省去DRAM快取理論上會對“4K效能”產生一些不利影響。下圖是東芝TR200固態硬碟,採用當前主流的DRAM-less無外接快取方案。

解讀固態硬碟的“4K效能”

DRAM-less方案也有LUT表,儲存在主控內整合的高速、小容量SRAM快取當中。兩種方案的工作模式類似於字典中拼音和部首兩種檢字法。

拼音檢字表:有DRAM快取,大腦中對字的讀音已經瞭解,可以快速查到這個字的釋義所在頁碼。

解讀固態硬碟的“4K效能”

部首檢字表:無DRAM快取,需要先找到部首,然後根據比劃數量最終找到頁碼,等於查了兩次表,完整的Look up table需從NAND快閃記憶體上讀出。

解讀固態硬碟的“4K效能”

當然事無絕對,東芝TR200主控內建了高達32MB容量的高速SRAM快取,按照1MB:1GB的標準LUT容量,能夠覆蓋32GB容量的快閃記憶體空間,相當於常用資料無需二次查表,LUT效率提升的結果就是“4K效能”的大幅改善。由於SRAM比外接DRAM快取速度更快,東芝TR200的4K單執行緒讀取速度達到了52MB/s以上。

解讀固態硬碟的“4K效能”

PCMark 7和PCMark 8儲存測試成績也表明TR200具備不俗的效能,說明只要主控硬體和韌體設計得當,無外接快取(DRAM-less)並不會給固態硬碟實用效能造成影響。

解讀固態硬碟的“4K效能”

解讀固態硬碟的“4K效能”

在RC100和BG3/4固態硬碟中,東芝還充分利用了NVMe協議中的Host Memory Buffer主機記憶體緩衝特性,透過借用主機記憶體中的一小段專用空間儲存LUT表,實現了更高性價比的設計目標。

解讀固態硬碟的“4K效能”