不論是什麼原因而購買了 NAS 這項產品,大部分的使用者都很難逃過「該選哪種 RAID 模式」這一關。心懷「聽說選 RAID 0 比較快可是很危險?」、「為什麼 RAID 1 會讓可用空間減半?」、「相傳 RAID 5 在重建時很容易崩解?」等困惑嗎?讓我們來一解你心中對 RAID 疑惑。……
RAID 為 Redundant Array of Independent Disks(獨立硬碟冗餘陣列、容錯式磁碟陣列)的縮寫,主要就是藉由 1 群實體硬碟的不同組合方式,達到更高的效能或是資料安全性。RAID 在電腦上已經行之有年,翻翻主機板的使用說明書,不難找到晶片組支援 RAID 的資訊,只不過一般使用者很少啟用這項功能,消費性機殼產品設計也不容易讓使用者替換掉損壞的硬碟。
直到近幾年 NAS 這項產品的需求大開,存取效能也逐漸拉到 50~60MB/s 以上,加上傳統機械硬碟逐漸受到 SSD 的夾擊,硬碟廠商需要另外開拓市場,於是乎和 NAS 幾乎形影不離的 RAID,才又得到大家關愛的眼神。
因為 NAS 的主要工作就是儲存資料,而 NAS 中常見的資料儲存媒體即為硬碟,硬碟儲存空間該如何分配又會產生不同的效能和安全性,因此當使用者新建立 1 台 NAS 系統時,一定會遇到設定精靈詢問想用何種 RAID 方式。當然現在廠商設計都很不錯,能夠根據使用者放入的硬碟數量自動選擇 RAID 模式,不過除了下一步、下一步的無腦點選外,身為人還是要有點自我意識,了解何種 RAID 模式才是最適合自己的使用情境。
RAID 0:
- 優點:使用 n 顆硬碟,即可擁有將近 n 倍的讀寫效能。
- 缺點:資料安全性較低,同組陣列中任一硬碟發生問題就會造成資料遺失。
- 硬碟數量:最少 2 個。
RAID 0 講求效能的極大化,使用者設定數顆實體硬碟在磁碟陣列中,欲寫入、讀取此硬碟陣列的資料,就會分成數份同時寫入、讀取。理論上來說,RAID 0 磁碟陣列中有幾顆實體硬碟,讀取、寫入效能就呈現倍數成長。若是磁碟陣列中的硬碟存取效能不一,則以最低效能硬碟的存取能力作為基準估算。
因為將資料拆分寫入硬碟的策略,使得 RAID 0 能夠使用到所有硬碟加總起來的容量。如果是在各個實體硬碟容量不同的情況,則能夠依照最小容量的那顆硬碟為標準建立 RAID 0,其它較大容量硬碟的多餘空間,則依磁碟陣列控制器的不同,而有不同的結果;較低階的控制器可能無法使用這部分的空間,高階的控制器則可做另外的規劃,例如做為單一的儲存空間使用或是組合成其它的 RAID 組態。
此外最近採用 PCIe 為連接介面的消費型 SSD,也經常使用 RAID 0 作為內部儲存空間的組合方式,因為 SSD 內部的快閃記憶體控制器原本就擁有較多層、較複雜的糾錯演算法,加上快閃記憶體和傳統硬碟的每儲存單位售價還是存在著一定距離,採用其它 RAID 模式會讓售價提升不少,以至於產生這樣的結果。
▲RAID 0。
RAID 1:
- 優點:安全性依照陣列裡的實體硬碟數量倍數成長。
- 缺點:空間利用率是所有 RAID 中最沒有效率的。
- 硬碟數量:最少 2 個。
在 RAID 0 追求效能極端的彼岸,存在著強調資料安全性的 RAID 1,RAID 1 的資料儲存方式恰好與 RAID 0 相反,欲寫入硬碟的資料被複製成與硬碟相同數量的份數,分別寫入陣列中的各顆硬碟。如此一來每個硬碟內都擁有著同份資料的不同拷貝,只要陣列中的其中 1 顆硬碟還可使用,資料就不會遺失,可忍受 n-1 顆硬碟同時損毀(n 為陣列中實體硬碟的個數)。
效能部分則分為寫入和讀取 2 種不同狀況,寫入時因為須將資料複製多份寫入各顆硬碟,寫入效能與單顆硬碟差不多;讀取時則能夠同時從各顆硬碟同時讀取資料的不同部分,所以能夠和 RAID 0 相提並論,約是單顆硬碟讀取效能乘上陣列中的硬碟個數,不過也有以單顆硬碟讀取的設計。
陣列可使用容量是 RAID 1 最大的缺點,由於各實體硬碟中的資料幾乎是以鏡像的方式儲存,因此無論陣列中放入了多少顆硬碟,可用容量都是以最小的那顆硬碟為主;同 RAID 0,如果陣列中有著硬碟容量不一的情形,大硬碟的剩餘容量能否可利用端看控制器的設計,之後的 RAID 模式也是如此,將不再贅述。
▲RAID 1。
RAID 5:
- 優點:兼顧空間利用率與安全性。
- 缺點:需要額外的運算資源,僅能忍受 1 個硬碟損毀。
- 硬碟數量:至少 3 個。
RAID 5 使用了和 RAID 0、RAID 1 較為不同的策略,相較 RAID 0 將資料拆分以及 RAID 1 的資料複製,RAID 5 則是將資料運算過後的糾錯檢查碼儲存起來,使用奇偶校驗碼、也就是 XOR 運算。詳細實作方式為,將資料分成 n-1 份(n 為磁碟陣列中的實體硬碟個數),分開寫入至各顆硬碟中。剩餘的那個空間,就會將分成 n-1 份的資料進行 XOR 運算後寫入;需注意的是資料與校驗碼是以交錯的方式放在各顆硬碟上,而不是有顆硬碟專門儲存校驗碼。
由於 RAID 5 多了 XOR 運算,所以效能的評估比較複雜,如果運算效能相當充足,存取效能可以接近於採用 n-1 顆硬碟的 RAID 0;如果 XOR 運算效能不足,則存取效能將會無限下探。加強效能的方式,以軟體∕韌體、驅動程式方式搭建的磁碟陣列來說,就是加強處理器的運算效能,如果是硬體獨立運算方式的 RAID 擴充卡∕擴充晶片,就是依照晶片上的 XOR 運算引擎為主。
此外還可開啟「寫入快取」的功能,先將資料寫入快取記憶體(電腦的系統記憶體、陣列卡上的 DRAM 模組等)中,之後再慢慢運算寫入硬碟中,在作業系統端來看就是已經寫入硬碟了。但是資料先行寫入斷電後就會消失的 DRAM,所以開啟寫入快取有著一層風險,萬一資料尚未完整寫入硬碟時斷電,則資料就會損毀。因此在部分硬體式的 RAID 擴充卡,還會有額外的電池模組可安裝,就是為了在意外斷電的情況下還能盡量保留 DRAM 內的資料,或者是直接寫入 RAID 卡上的非揮發性快閃記憶體之中。
還有個原因能夠影響 RAID 5 的存取效能,就是磁碟陣列中的實體硬碟數量,因為硬碟數量越多,每組奇偶校驗碼所對應的資料量就越多,運算過程就更為複雜。
安全性部分則是能夠容許任何 1 顆實體硬碟損毀,無論磁碟陣列中有著多少顆硬碟都是如此。因此 RAID 5 磁碟陣列中要放入多少顆實體硬碟,可以依照偏向安全性、效能、空間利用率來抉擇。假設各顆硬碟故障率都相同,越多顆硬碟,安全性越低(陣列中硬碟出錯機率升高)、效能越低(需要運算量增大)、空間利用率越高(奇偶校驗碼所需容量提攤至更多硬碟上);越少顆硬碟,安全性越高、效能越高、空間利用率越低。
▲RAID 5,注意校驗資訊是以交錯的方式分散在不同實體硬碟中。
(下一頁還有:RAID 6 與骨灰 RAID 模式介紹)
留言列表