องค์ประกอบของระบบย่อยดิสก์ของเซิร์ฟเวอร์

ระบบย่อยของดิสก์และไฟล์ของคอมพิวเตอร์มักไม่ได้รับความสนใจเป็นพิเศษจากผู้ใช้ Winchester เป็นสิ่งที่ค่อนข้างน่าเชื่อถือและทำงานราวกับว่ามันทำงานด้วยตัวเองโดยไม่ดึงดูดความสนใจของผู้ใช้ทั่วไปเลย

เมื่อใช้เทคนิคพื้นฐานในการทำงานกับไฟล์และโฟลเดอร์อย่างเชี่ยวชาญ ผู้ใช้ดังกล่าวจะทำให้ระบบทำงานอัตโนมัติเต็มรูปแบบ โดยไม่ต้องนึกถึงเครื่องมือเพิ่มเติมสำหรับการบำรุงรักษาฮาร์ดดิสก์ การจัดการดิสก์เปลี่ยนไปใช้ระบบปฏิบัติการอย่างสมบูรณ์

ความยากเริ่มต้นขึ้นเมื่อระบบไฟล์แสดงประสิทธิภาพการทำงานที่ลดลงอย่างชัดเจน หรือเมื่อระบบไฟล์เริ่มล้มเหลว อีกเหตุผลหนึ่งสำหรับการศึกษาหัวข้อนี้อย่างใกล้ชิด: ติดตั้ง "สกรู" หลายตัวบนพีซีพร้อมกัน

เช่นเดียวกับอุปกรณ์ที่ซับซ้อน ฮาร์ดไดรฟ์ต้องการการบำรุงรักษาเป็นประจำ Windows 7 แม้ว่าจะดูแลข้อกังวลเหล่านี้บางส่วน แต่ก็ไม่สามารถแก้ปัญหาทั้งหมดให้คุณได้ด้วยตัวเอง มิฉะนั้นจะรับประกัน "เบรก" เมื่อเวลาผ่านไปอย่างน้อย คุณต้องสามารถทำสิ่งต่อไปนี้:

ทำความสะอาดระบบไฟล์จากขยะ แนวคิดของขยะรวมถึงไฟล์ชั่วคราว คุกกี้ของเบราว์เซอร์ที่มีการแพร่กระจาย ข้อมูลที่ซ้ำซ้อน ฯลฯ
จัดเรียงข้อมูลฮาร์ดไดรฟ์ของคุณ ระบบไฟล์ Windows สร้างขึ้นในลักษณะที่สิ่งที่ผู้ใช้เห็นโดยรวมเป็นชิ้นส่วนแยกของไฟล์ที่กระจัดกระจายอยู่บนพื้นผิวแม่เหล็กของฮาร์ดไดรฟ์ รวมกันเป็นลูกโซ่: ส่วนย่อยก่อนหน้าแต่ละส่วนจะรู้จักแต่ละส่วนถัดไป หากต้องการอ่านไฟล์โดยรวม คุณต้องรวบรวมส่วนต่างๆ เหล่านี้เข้าด้วยกัน ซึ่งคุณต้องทำรอบการอ่านจำนวนมากจากตำแหน่งต่างๆ บนพื้นผิว สิ่งเดียวกันนี้เกิดขึ้นเมื่อบันทึก การจัดเรียงข้อมูลช่วยให้คุณสามารถรวบรวมชิ้นส่วนเหล่านี้ได้ในที่เดียว
ดูและแก้ไขข้อมูลส่วน
สามารถเปิดการเข้าถึงไฟล์และโฟลเดอร์ที่ซ่อนอยู่และระบบ
หากจำเป็น สามารถใช้ "สกรู" หลายตัวพร้อมกันได้

และดำเนินการอื่นๆ ที่เป็นประโยชน์ด้วย ในบันทึกของเรา เราจะไม่พูดถึงประเด็นปัญหาเหล่านี้ทั้งหมด แต่จะพูดถึงบางประเด็นเท่านั้น

จะอ่านข้อมูลพาร์ติชั่นได้อย่างไร?

สำหรับผู้ที่ไม่รู้จัก เรามาอธิบายกันดีกว่า: ใน Windows มีสิ่งที่เรียกว่า "สแนป"

เป็นไฟล์ปฏิบัติการ .msc ที่ทำงานเหมือน exe ปกติ สแน็ปอินทั้งหมดมีส่วนต่อประสานที่เหมือนกันและสร้างขึ้นบนเทคโนโลยี COM ซึ่งเป็นพื้นฐานของโครงสร้างภายในของระบบปฏิบัติการนี้

หน้าต่างการจัดการดิสก์ก็ทำได้ง่ายเช่นกัน คุณสามารถเรียกใช้ได้โดยพิมพ์ชื่อในหน้าต่าง "Run" diskmgmt.msc ดังแสดงในรูปต่อไปนี้:

เป็นผลให้เราจะมีหน้าต่างของสแน็ปอินที่มีหัวข้อ "การจัดการดิสก์" นี่คือลักษณะของแอปนี้:

อินเทอร์เฟซนี้ใช้งานง่ายและเรียบง่าย ในแผงด้านบนของหน้าต่าง เราจะเห็นรายการไดรฟ์ข้อมูล (หรือพาร์ติชัน) ทั้งหมดบน "สกรู" พร้อมข้อมูลที่เกี่ยวข้อง เช่น:

ชื่อส่วน
ประเภทส่วน
เต็มความจุของมัน
สถานะของมัน (ส่วนต่าง ๆ อาจมีสถานะแตกต่างกัน)
พื้นที่ว่างที่เหลืออยู่แสดงเป็นกิกะไบต์และเปอร์เซ็นต์ของทั้งหมด

และข้อมูลอื่นๆ แผงด้านล่างประกอบด้วยรายการไดรฟ์และพาร์ติชัน จากที่นี่คุณสามารถดำเนินการกับโวลุ่มและไดรฟ์ได้ ในการดำเนินการนี้ ให้คลิกขวาที่ชื่อโวลุ่มและเลือกการดำเนินการเฉพาะจากเมนูย่อย "การดำเนินการ"

ข้อได้เปรียบหลักของอินเทอร์เฟซคือทุกอย่างถูกรวบรวมไว้ที่นี่ - ไม่จำเป็นต้องเดินผ่านเมนูและหน้าต่างต่าง ๆ เพื่อดำเนินการตามแผนของเรา

ปริมาณการดำเนินงาน

มาวิเคราะห์การดำเนินการที่ไม่ชัดเจนกับพาร์ติชั่นกัน อันดับแรก เรามาพูดถึงการเปลี่ยนจากรูปแบบ MBR เป็นรูปแบบ GPT ทั้งสองรูปแบบนี้สอดคล้องกับประเภท bootloader ที่แตกต่างกัน MBR เป็นรูปแบบ bootloader แบบคลาสสิก แต่ตอนนี้ล้าสมัยแล้ว

มีข้อจำกัดที่ชัดเจนทั้งในปริมาณวอลุ่ม (ไม่เกิน 2 TB) และในจำนวนวอลุ่ม - รองรับไม่เกินสี่รายการ อย่าสับสนปริมาณและส่วน - นี่เป็นแนวคิดที่ค่อนข้างแตกต่างกัน อ่านความแตกต่างบนอินเทอร์เน็ต รูปแบบ GPT ใช้เทคโนโลยี GUID และไม่มีข้อจำกัดเหล่านี้

ดังนั้น หากคุณมีดิสก์ขนาดใหญ่ อย่าลังเลที่จะแปลง MBR เป็น GPT จริงอยู่ ในกรณีนี้ ข้อมูลทั้งหมดในดิสก์จะถูกทำลาย - จะต้องคัดลอกไปยังตำแหน่งอื่น

เทคโนโลยีการจำลองเสมือนได้แทรกซึมอยู่ทุกหนทุกแห่ง มันไม่ได้ข้ามระบบไฟล์อย่างใดอย่างหนึ่ง หากต้องการ คุณสามารถสร้างและติดตั้งสิ่งที่เรียกว่า "ดิสก์เสมือน" ได้

"อุปกรณ์" ดังกล่าวเป็นไฟล์ .vhd ปกติและสามารถใช้เป็นอุปกรณ์จริงทั่วไปได้ - ทั้งสำหรับการอ่านและการเขียน

นี่เป็นการเปิดโอกาสเพิ่มเติมสำหรับการทำรายการข้อมูล นี้สรุปเรื่องราวของเรา การจัดการดิสก์ใน Windows 7 เป็นหัวข้อที่ค่อนข้างกว้าง และคุณสามารถค้นพบสิ่งใหม่ๆ มากมายได้โดยการดำดิ่งลงไปในนั้น

16.01.1997 แพทริก คอร์ริแกน, มิกกี้ แอปเปิลบาม

ตัวเลือกการกำหนดค่าสำหรับระบบย่อยของดิสก์เซิร์ฟเวอร์มีความหลากหลาย และด้วยเหตุนี้ ความสับสนจึงหลีกเลี่ยงไม่ได้ เพื่อช่วยให้คุณเข้าใจปัญหาที่ยากลำบากนี้ เราจึงตัดสินใจพิจารณาเทคโนโลยีหลักและความเป็นไปได้ทางเศรษฐกิจในการใช้งาน ดิสก์

ตัวเลือกการกำหนดค่าสำหรับระบบย่อยของดิสก์เซิร์ฟเวอร์มีความหลากหลาย และด้วยเหตุนี้ ความสับสนจึงหลีกเลี่ยงไม่ได้ เพื่อช่วยให้คุณเข้าใจปัญหาที่ยากลำบากนี้ เราจึงตัดสินใจพิจารณาเทคโนโลยีหลักและความเป็นไปได้ทางเศรษฐกิจในการใช้งาน

ในกรณีของระบบย่อยของดิสก์เซิร์ฟเวอร์ คุณมีตัวเลือกมากมายให้เลือก แต่มีมากมายเหลือเฟือทำให้ยากต่อการค้นหาระบบที่เหมาะกับคุณที่สุด สถานการณ์มีความซับซ้อนโดยข้อเท็จจริงที่ว่าในกระบวนการคัดเลือก คุณจะต้องจัดการกับข้อมูลเท็จและโฆษณาทางการตลาดจำนวนมาก

การทบทวนเทคโนโลยีหลักของระบบย่อยดิสก์ของเซิร์ฟเวอร์และการอภิปรายถึงความเหมาะสมในการใช้งานในแง่ของต้นทุน ประสิทธิภาพ ความน่าเชื่อถือ และความทนทานต่อข้อผิดพลาดควรช่วยให้เข้าใจสาระสำคัญของปัญหานี้

ดิสก์อินเทอร์เฟซ

ไม่ว่าคุณจะระบุเซิร์ฟเวอร์ใหม่หรืออัพเกรดเซิร์ฟเวอร์ที่มีอยู่ อินเทอร์เฟซดิสก์เป็นปัญหาสำคัญ ไดรฟ์ส่วนใหญ่ในปัจจุบันใช้อินเทอร์เฟซ SCSI หรือ IDE เราจะพิจารณาทั้งสองเทคโนโลยี อธิบายการใช้งาน และหารือเกี่ยวกับวิธีการทำงานของเทคโนโลยีทั้งสอง

SCSI เป็นอินเทอร์เฟซ ANSI ที่ได้มาตรฐานซึ่งมีหลายรูปแบบ ข้อกำหนด SCSI ดั้งเดิม ซึ่งปัจจุบันเรียกว่า SCSI-I ใช้ช่องสัญญาณข้อมูล 8 บิตที่อัตราข้อมูลสูงสุด 5 Mbps SCSI-2 อนุญาตให้มีหลายรูปแบบ รวมถึง Fast SCSI พร้อมช่องสัญญาณข้อมูล 8 บิตและอัตราการถ่ายโอนสูงสุด 10 Mbps; Wide SCSI พร้อมช่องข้อมูล 16 บิตและอัตราการถ่ายโอนสูงถึง 10 Mbps; และ Fast/Wide SCSI พร้อม data link 16 บิต และอัตราการถ่ายโอนสูงสุด 10 Mbps (ดูตารางที่ 1)

ตารางที่ 1 - ตัวเลือก SCSI

SCSI-1	ประสิทธิภาพสูงสุด	ความกว้างของช่อง	ความถี่	จำนวนเครื่อง*
SCSI-1	5 Mbps	8 หลัก	5 MHz	8
SCSI-2
SCSI เร็ว	10 Mbps	8 หลัก	10 MHz	8
SCSI เร็ว/กว้าง	20 Mbps	16 หลัก	10 MHz	8; 16**

* อุปกรณ์ที่รองรับ ได้แก่ HBA ** ด้วยสัญญาณเอาท์พุตไม่สมดุล ดิฟเฟอเรนเชียล

ด้วยการถือกำเนิดของ "ไวด์" 16 บิต Fast/Wide SCSI บางครั้งเวอร์ชัน 8 บิตจึงถูกเรียกว่า "แคบ" - Narrow SCSI มีการนำ SCSI ไปใช้เพิ่มเติมอีกหลายอย่างเมื่อเร็ว ๆ นี้: Ultra SCSI, Wide Ultra SCSI และ SCSI-3 เมื่อเทียบกับตัวเลือกทั่วไป อินเทอร์เฟซเหล่านี้มีข้อได้เปรียบด้านประสิทธิภาพบางอย่าง แต่เนื่องจากยังไม่แพร่หลายมากนัก (จำนวนอุปกรณ์ที่ใช้อินเทอร์เฟซเหล่านี้มีจำกัด) เราจะไม่พูดถึงพวกเขาในบทความนี้

ระบบเคเบิล SCSI-I เป็นไลน์บัสที่สามารถเชื่อมต่ออุปกรณ์ได้มากถึงแปดเครื่อง รวมถึงโฮสต์บัสอะแด็ปเตอร์ (HBA) การออกแบบรถบัสนี้เรียกว่า SCSI SCSI แบบปลายเดียว และความยาวของสายเคเบิลอาจสูงถึงเก้าเมตร SCSI-2 (เกือบจะแทนที่ SCSI-I) รองรับทั้ง SCSI แบบปลายเดียวและ SCSI ที่แตกต่างกัน Differential SCSI ใช้วิธีส่งสัญญาณที่แตกต่างจาก SCSI แบบปลายเดียวและรองรับอุปกรณ์ได้มากถึง 16 เครื่องบนลูปที่มีความยาวสูงสุด 25 เมตร ช่วยลดเสียงรบกวนได้ดีขึ้น ซึ่งหมายถึงประสิทธิภาพที่ดีขึ้นในหลายกรณี

ปัญหาหนึ่งของ SCSI ที่แตกต่างกันคือความเข้ากันได้ของอุปกรณ์ ตัวอย่างเช่น เทปไดร์ฟและซีดีรอมที่เข้ากันได้กับดิฟเฟอเรนเชียล SCSI มีจำกัดในปัจจุบัน อุปกรณ์ดิฟเฟอเรนเชียลและ HBA มักจะมีราคาแพงกว่าอุปกรณ์ปลายเดียวเล็กน้อย แต่มีข้อได้เปรียบในการสนับสนุนอุปกรณ์ต่อแชนเนลมากกว่า ลูปที่ยาวกว่า และประสิทธิภาพที่ดีขึ้นในบางกรณี

เมื่อเลือกอุปกรณ์ SCSI คุณควรทราบถึงปัญหาความเข้ากันได้ SCSI ปลายเดียวและ SCSI เฟืองท้ายสามารถใช้การเดินสายเดียวกันได้ แต่อุปกรณ์ปลายเดียวและส่วนต่างไม่สามารถรวมกันได้ Wide SCSI ใช้ระบบสายเคเบิลที่แตกต่างจาก Narrow SCSI ดังนั้นจึงไม่สามารถใช้อุปกรณ์ Wide SCSI และ Narrow SCSI ในช่องเดียวกันได้

SCSI ทำงานอย่างไร

ใน SCSI ตัวควบคุมอุปกรณ์ (เช่น ตัวควบคุมดิสก์) และอินเทอร์เฟซกับคอมพิวเตอร์เป็นอุปกรณ์ที่แตกต่างกัน ส่วนต่อประสานคอมพิวเตอร์ HBA เพิ่มบัสอินเทอร์เฟซเพิ่มเติมให้กับคอมพิวเตอร์สำหรับเชื่อมต่อตัวควบคุมอุปกรณ์หลายตัว: ตัวควบคุมอุปกรณ์สูงสุดเจ็ดตัวบนลิงก์ SCSI แบบปลายเดียวและสูงสุด 15 ตัวบนลิงก์ส่วนต่าง ในทางเทคนิค คอนโทรลเลอร์แต่ละตัวสามารถรองรับอุปกรณ์ได้สูงสุดสี่เครื่อง อย่างไรก็ตาม ด้วยอัตราการถ่ายโอนที่สูงของไดรฟ์ที่มีความจุสูงในปัจจุบัน ตัวควบคุมอุปกรณ์มักจะติดตั้งอยู่ในไดรฟ์เพื่อลดเสียงรบกวนและสัญญาณรบกวนทางไฟฟ้า ซึ่งหมายความว่าคุณสามารถมีไดรฟ์ได้ถึงเจ็ดไดรฟ์บนลิงก์ SCSI แบบปลายเดียว และสูงสุด 15 ไดรฟ์บนลิงก์ SCSI ที่ต่างกัน

ข้อดีอย่างหนึ่งของ SCSI คือการประมวลผลคำสั่งหลายคำสั่งที่ทับซ้อนกัน การสนับสนุน I/O ที่คาบเกี่ยวกันนี้ทำให้ไดรฟ์ SCSI สามารถผสมผสานการอ่านและเขียนกับไดรฟ์อื่นในระบบได้อย่างเต็มที่ เพื่อให้ไดรฟ์ต่างๆ สามารถประมวลผลคำสั่งแบบขนานแทนที่จะทำทีละรายการ

เนื่องจากหน่วยสืบราชการลับทั้งหมดของอินเทอร์เฟซดิสก์ SCSI อยู่ใน HBA HBA จึงควบคุมการเข้าถึงระบบปฏิบัติการของดิสก์ ด้วยเหตุนี้ HBA ไม่ใช่คอมพิวเตอร์จึงสามารถแก้ไขข้อขัดแย้งในการแปลและการเข้าถึงอุปกรณ์ได้ โดยทั่วไป หมายความว่า หากใช้ไดรเวอร์ที่เขียนและติดตั้งอย่างถูกต้อง คอมพิวเตอร์และระบบปฏิบัติการจะไม่เห็นความแตกต่างระหว่างอุปกรณ์

นอกจากนี้ เนื่องจาก HBA ควบคุมการเข้าถึงระหว่างเอ็กซ์แพนชันบัสภายในของคอมพิวเตอร์และบัส SCSI จึงสามารถแก้ไขข้อขัดแย้งในการเข้าถึงของทั้งคู่ได้ด้วยการมอบคุณลักษณะขั้นสูง เช่น บริการตัวแบ่ง/กู้คืนลิงก์ การแบ่ง/การกู้คืนช่วยให้ระบบปฏิบัติการส่งคำสั่งค้นหา อ่าน หรือเขียนไปยังอุปกรณ์เฉพาะ หลังจากนั้นไดรฟ์จะปล่อยให้ตัวเองดำเนินการคำสั่ง เพื่อให้ไดรฟ์อื่นในช่องเดียวกันสามารถรับคำสั่งได้ในระหว่างนี้ กระบวนการนี้ช่วยปรับปรุงทรูพุตของช่องสัญญาณดิสก์ที่มีดิสก์มากกว่าสองดิสก์อย่างมาก โดยเฉพาะอย่างยิ่งเมื่อข้อมูลถูกสไทรพ์หรือกระจัดกระจายไปทั่วดิสก์ คุณลักษณะที่ได้รับการปรับปรุงอีกประการหนึ่งคือการแลกเปลี่ยนข้อมูลแบบซิงโครนัส โดยที่ปริมาณงานโดยรวมของช่องสัญญาณดิสก์และความสมบูรณ์ของข้อมูลจะเพิ่มขึ้น

IDE

IDE เป็นมาตรฐานโดยพฤตินัยที่ใช้กันอย่างแพร่หลายในพีซีที่ใช้ x86 นี่เป็นเพียงคำแนะนำทั่วไปสำหรับผู้ผลิต ดังนั้นทุกคนจึงมีอิสระในการพัฒนา IDE เฉพาะสำหรับอุปกรณ์และอะแดปเตอร์ของตน เป็นผลให้ผลิตภัณฑ์จากผู้ผลิตที่แตกต่างกันและแม้แต่รุ่นที่แตกต่างกันของผู้ผลิตรายเดียวกันกลับกลายเป็นว่าไม่เข้ากัน เมื่อข้อมูลจำเพาะได้รับการแก้ไข ปัญหานี้เกือบจะหายไปแล้ว แต่ยังคงมีความเข้ากันไม่ได้

ไม่เหมือนกับ SCSI ตรงที่ IDE วางหน่วยสืบราชการลับไว้บนดิสก์มากกว่า HBA HBA สำหรับ IDE มีความฉลาดเพียงเล็กน้อยหรือไม่มีเลย และเพียงแค่ส่งออกบัสของคอมพิวเตอร์ไปยังดิสก์โดยตรง หากไม่มีอินเทอร์เฟซระดับกลาง จำนวนอุปกรณ์ในช่อง IDE หนึ่งช่องจะจำกัดไว้ที่ 2 ช่อง และความยาวของสายเคเบิลจำกัดอยู่ที่ 3 เมตร

เนื่องจากความฉลาดของอุปกรณ์ IDE ทั้งหมดนั้นอยู่บนตัวอุปกรณ์เอง ดังนั้นหนึ่งในอุปกรณ์บนช่องสัญญาณจึงถูกกำหนดให้เป็นแชนเนลมาสเตอร์ และคอนโทรลเลอร์ในตัวในอันที่สองถูกปิดใช้งาน และกลายเป็นทาส (แชแนลสเลฟ) อุปกรณ์หลักจะควบคุมการเข้าถึงผ่านช่อง IDE ไปยังอุปกรณ์ทั้งสองและดำเนินการ I/O ทั้งหมดสำหรับอุปกรณ์ดังกล่าว นี่เป็นหนึ่งในความเป็นไปได้ที่จะมีความขัดแย้งระหว่างอุปกรณ์อันเนื่องมาจากการใช้งานอินเทอร์เฟซ IDE ของผู้จำหน่ายที่แตกต่างกัน ตัวอย่างเช่น ไดรฟ์หนึ่งตัวอาจได้รับการออกแบบให้ทำงานกับโครงร่างคอนโทรลเลอร์เฉพาะ แต่โฮสต์ที่เชื่อมต่ออยู่อาจใช้คอนโทรลเลอร์ประเภทอื่น นอกจากนี้ ไดรฟ์ Enhanced IDE (EIDE) ที่ใหม่กว่ายังใช้ชุดคำสั่งและตารางการแปลเพิ่มเติมเพื่อรองรับความจุที่มากขึ้นและไดรฟ์ประสิทธิภาพสูงขึ้น หากเชื่อมต่อกับมาตรฐานเก่า ไดรฟ์หลัก IDE ไม่เพียงแต่จะสูญเสียคุณสมบัติขั้นสูงเท่านั้น แต่อาจไม่ได้ให้ความจุที่พร้อมใช้งานทั้งหมดแก่คุณ ที่แย่กว่านั้น พวกเขาสามารถรายงานความจุเต็มที่ไปยัง OS โดยที่ไม่สามารถใช้งานได้ ซึ่งอาจทำให้ข้อมูลบนดิสก์เสียหายได้

ความเป็นไปได้ที่ข้อมูลจะเสียหายนั้นเกิดจากการที่ระบบปฏิบัติการแต่ละระบบรับรู้ข้อมูลการกำหนดค่าดิสก์ในแบบของตัวเอง ตัวอย่างเช่น DOS และ BIOS ของระบบอนุญาตให้มีความจุดิสก์สูงสุดเพียง 528 MB NetWare และระบบ 32 บิตอื่นๆ ไม่มีข้อจำกัดเหล่านี้ และสามารถอ่านไดรฟ์ IDE ทั้งหมดได้โดยตรงผ่านอุปกรณ์อิเล็กทรอนิกส์ เมื่อคุณสร้างพาร์ติชั่นหลายพาร์ติชั่นของระบบปฏิบัติการที่แตกต่างกันบนดิสก์เดียวกัน แต่ละพาร์ติชั่นจะมองเห็นความจุและการกำหนดค่าต่างกัน และอาจนำไปสู่ตารางพาร์ติชั่นที่ทับซ้อนกัน ซึ่งจะทำให้ข้อมูลบนดิสก์สูญหายได้อย่างมีนัยสำคัญ

สถาปัตยกรรม IDE ดั้งเดิมไม่รู้จักไดรฟ์ที่มีขนาดใหญ่กว่า 528MB และสามารถรองรับได้เพียงสองอุปกรณ์ต่อช่องสัญญาณที่อัตราการถ่ายโอนสูงสุด 3Mbps เพื่อเอาชนะข้อจำกัดบางประการของ IDE สถาปัตยกรรม EIDE จึงถูกนำมาใช้ในปี 1994 EIDE รองรับความจุและประสิทธิภาพที่สูงขึ้น แต่อัตราการถ่ายโอน 9 ถึง 16 Mbps ยังคงช้ากว่า SCSI ไม่เหมือนอุปกรณ์ 15 เครื่องต่อช่องสัญญาณสำหรับ SCSI ซึ่งสามารถรองรับได้สูงสุดสี่เครื่องต่อช่องสัญญาณ โปรดทราบว่าทั้ง IDE และ EIDE ไม่มีคุณสมบัติการทำงานหลายอย่างพร้อมกัน ดังนั้นจึงไม่สามารถให้ประสิทธิภาพในระดับเดียวกับอินเทอร์เฟซ SCSI ในสภาพแวดล้อมเซิร์ฟเวอร์ทั่วไป

แม้ว่าเดิมออกแบบมาสำหรับดิสก์ แต่ตอนนี้มาตรฐาน IDE รองรับเทปไดรฟ์และซีดีรอม อย่างไรก็ตาม การแบ่งช่องสัญญาณด้วยซีดีรอมหรือเทปไดรฟ์อาจส่งผลเสียต่อประสิทธิภาพของดิสก์ โดยรวมแล้วข้อดีด้านประสิทธิภาพและความสามารถในการปรับขนาดของ SCSI ทำให้เป็นทางเลือกที่ดีกว่า IDE หรือ EIDE สำหรับแอปพลิเคชันเซิร์ฟเวอร์ระดับไฮเอนด์ส่วนใหญ่ที่ต้องการประสิทธิภาพสูง อย่างไรก็ตาม สำหรับแอปพลิเคชันระดับเริ่มต้นที่ประสิทธิภาพหรือความสามารถในการขยายไม่ได้เป็นเรื่องใหญ่ IDE หรือ EIDE ก็เพียงพอแล้ว ในเวลาเดียวกัน หากคุณต้องการดิสก์สำรอง IDE ไม่ใช่ตัวเลือกที่ดีที่สุดเนื่องจากปัญหาที่อาจเกิดขึ้นซึ่งเกี่ยวข้องกับแนวทางมาสเตอร์-สเลฟ นอกจากนี้ คุณควรระวังตารางพาร์ทิชันที่ทับซ้อนกันและปัญหาความไม่ลงรอยกันของอุปกรณ์มาสเตอร์-ทาส

อย่างไรก็ตาม มีบางกรณีที่สามารถใช้อินเทอร์เฟซ IDE และ EIDE ในเซิร์ฟเวอร์ระดับไฮเอนด์ได้ เป็นเรื่องปกติ เช่น การใช้ไดรฟ์ IDE ขนาดเล็กสำหรับพาร์ติชัน DOS บนเซิร์ฟเวอร์ NetWare นอกจากนี้ยังได้รับการฝึกฝนอย่างกว้างขวางในการใช้ไดรฟ์ซีดีรอมที่มีอินเทอร์เฟซ IDE สำหรับการดาวน์โหลดซอฟต์แวร์

ระบบดิสก์สำรอง

ประเด็นสำคัญอีกประการหนึ่งที่ต้องพูดถึงเมื่อกำหนดคุณสมบัติของเซิร์ฟเวอร์คือความซ้ำซ้อน มีหลายวิธีในการปรับปรุงความน่าเชื่อถือของระบบดิสก์หลายดิสก์ รูปแบบความซ้ำซ้อนส่วนใหญ่เป็นแบบต่างๆ ของ RAID (ย่อมาจาก "Redundant Array of Inexpensive or Independent Disks") ข้อมูลจำเพาะ RAID ดั้งเดิมได้รับการออกแบบมาเพื่อแทนที่ดิสก์เมนเฟรมและมินิคอมพิวเตอร์ขนาดใหญ่ที่มีราคาแพงด้วยอาร์เรย์ของดิสก์ขนาดเล็กราคาถูกที่ออกแบบมาสำหรับมินิคอมพิวเตอร์ ดังนั้นคำว่า "ราคาไม่แพง" น่าเสียดายที่คุณไม่ค่อยเห็นอะไรราคาถูกในระบบ RAID

RAID คือชุดการใช้งานอาร์เรย์ดิสก์สำรองเพื่อให้ระดับการป้องกันและอัตราการถ่ายโอนข้อมูลแตกต่างกัน เนื่องจาก RAID เกี่ยวข้องกับการใช้ดิสก์อาร์เรย์ SCSI จึงเป็นอินเทอร์เฟซที่ดีที่สุด เนื่องจากสามารถรองรับอุปกรณ์ได้สูงสุด 15 เครื่อง RAID มี 6 ระดับ: จากศูนย์ถึงระดับห้า แม้ว่าผู้ผลิตบางรายจะโฆษณาแผนสำรองของตนเองซึ่งเรียกว่า RAID-6, RAID-7 หรือสูงกว่า (RAID-2 และ RAID-4 ไม่ได้อยู่บนเซิร์ฟเวอร์เครือข่าย เราจะไม่พูดถึงมัน)

จากระดับ RAID ทั้งหมด 0 มีประสิทธิภาพสูงสุดและมีความปลอดภัยน้อยที่สุด โดยจะถือว่าอุปกรณ์อย่างน้อยสองเครื่องและซิงโครไนซ์การเขียนข้อมูลไปยังดิสก์ทั้งสอง ในขณะที่ดิสก์มีลักษณะเหมือนอุปกรณ์จริงเพียงเครื่องเดียว กระบวนการเขียนข้อมูลไปยังดิสก์หลายแผ่นเรียกว่าการขยายไดรฟ์ และวิธีการเขียนข้อมูลนี้จริงเรียกว่าการแบ่งแถบข้อมูล ด้วยการสตริป ข้อมูลจะถูกเขียนไปยังดิสก์ทั้งหมดที่ถูกบล็อกทีละบล็อก กระบวนการนี้เรียกว่าบล็อกอินเตอร์ลีฟ ขนาดบล็อกถูกกำหนดโดยระบบปฏิบัติการ แต่โดยทั่วไปจะอยู่ในช่วงตั้งแต่ 2 KB ถึง 64 KB ขึ้นอยู่กับการออกแบบของดิสก์คอนโทรลเลอร์และ HBA การเขียนตามลำดับเหล่านี้อาจทับซ้อนกัน ส่งผลให้ประสิทธิภาพเพิ่มขึ้น ตัวอย่างเช่น RAID-0 เพียงอย่างเดียวสามารถปรับปรุงประสิทธิภาพได้ แต่ไม่มีการป้องกันข้อผิดพลาด หากไดรฟ์ล้มเหลว ระบบย่อยทั้งหมดจะล้มเหลว ซึ่งมักจะส่งผลให้ข้อมูลสูญหายทั้งหมด

ตัวแปรของการแทรกสอดข้อมูลคือการกระจัดกระจายข้อมูล เช่นเดียวกับการสตริป ข้อมูลจะถูกเขียนตามลำดับไปยังดิสก์หลายแผ่นที่เต็ม อย่างไรก็ตาม ไม่จำเป็นต้องเขียนลงดิสก์ทั้งหมดต่างจากสตริป หากดิสก์ไม่ว่างหรือเต็ม ข้อมูลสามารถเขียนไปยังดิสก์ถัดไปที่มีอยู่ได้ ซึ่งจะช่วยให้คุณเพิ่มดิสก์ลงในโวลุ่มที่มีอยู่ได้ เช่นเดียวกับมาตรฐาน RAID-0 การรวมกลุ่มของจำนวนดิสก์ที่มีการสตริปข้อมูลช่วยเพิ่มประสิทธิภาพและเพิ่มขนาดโวลุ่ม แต่ไม่มีการป้องกันความล้มเหลว

RAID-1 หรือที่เรียกว่าการมิเรอร์ดิสก์ เกี่ยวข้องกับการติดตั้งคู่ของดิสก์ที่เหมือนกัน โดยแต่ละดิสก์ในคู่จะเป็นอิมเมจมิเรอร์ของอีกดิสก์หนึ่ง ใน RAID-1 ข้อมูลจะถูกเขียนลงในดิสก์สองคู่ที่เหมือนกันหรือเกือบเหมือนกัน: ตัวอย่างเช่น เมื่อดิสก์หนึ่งล้มเหลว ระบบจะยังคงทำงานกับดิสก์ที่ทำมิเรอร์ต่อไป หากดิสก์ที่ทำมิเรอร์ใช้ HBA ร่วมกัน ประสิทธิภาพของการกำหนดค่านี้ เมื่อเทียบกับดิสก์เดียว จะลดลง เนื่องจากข้อมูลจะต้องเขียนตามลำดับไปยังแต่ละดิสก์

โนเวลล์จำกัดคำจำกัดความของการมิเรอร์และเพิ่มแนวคิดของการพิมพ์สองด้าน ตามคำศัพท์ของ Novell การมิเรอร์หมายถึงคู่ดิสก์เมื่อเชื่อมต่อกับเซิร์ฟเวอร์หรือคอมพิวเตอร์ผ่าน HBA เดียว ในขณะที่การทำซ้ำหมายถึงดิสก์คู่ที่ทำมิเรอร์ซึ่งเชื่อมต่อผ่าน HBA แยกกัน ความซ้ำซ้อนให้ความซ้ำซ้อนสำหรับช่องสัญญาณดิสก์ทั้งหมด รวมถึง HBA สายเคเบิล และดิสก์ และเพิ่มประสิทธิภาพการทำงานบางอย่าง

RAID-3 ต้องการไดรฟ์ที่เหมือนกันอย่างน้อยสามตัว นี้มักจะเรียกว่าเทคโนโลยี "n ลบ 1" (n-1) เนื่องจากความจุของระบบสูงสุดถูกกำหนดโดยจำนวนไดรฟ์ทั้งหมดในอาร์เรย์ (n) ลบหนึ่งไดรฟ์สำหรับความเท่าเทียมกัน RAID-3 ใช้วิธีการเขียนที่เรียกว่า bit interleaving โดยที่ข้อมูลจะถูกเขียนลงดิสก์ทั้งหมดทีละบิต สำหรับแต่ละไบต์ที่เขียนบน n-disk parity bit จะถูกเขียนไปยัง "parity disk" นี่เป็นกระบวนการที่ช้ามาก เนื่องจากก่อนที่จะสร้างและเขียนข้อมูลพาริตีลงใน "ดิสก์พาริตี้" ข้อมูลจะต้องเขียนลงดิสก์ n แต่ละรายการของอาร์เรย์ คุณสามารถเพิ่มประสิทธิภาพของ RAID-3 ได้โดยการซิงโครไนซ์กลไกการหมุนดิสก์เพื่อให้ทำงานเป็นขั้นตอนอย่างเคร่งครัด อย่างไรก็ตาม เนื่องจากข้อจำกัดด้านประสิทธิภาพ การใช้ RAID-3 จึงลดลงอย่างมาก และมีผลิตภัณฑ์เซิร์ฟเวอร์ที่ใช้ RAID-3 น้อยมากที่จำหน่ายในปัจจุบัน

RAID-5 คือการใช้งาน RAID ที่ได้รับความนิยมมากที่สุดในตลาดเซิร์ฟเวอร์เครือข่าย เช่นเดียวกับ RAID-3 จะต้องมีดิสก์ที่เหมือนกันอย่างน้อยสามแผ่น อย่างไรก็ตาม ไม่เหมือนกับ RAID-3 ตรงที่ RAID-5 แยกแถบข้อมูลโดยไม่ต้องใช้ดิสก์เฉพาะสำหรับพาริตี ทั้งข้อมูลและผลรวมตรวจสอบจะถูกเขียนทับทั้งอาร์เรย์ วิธีนี้ช่วยให้สามารถอ่านและเขียนดิสก์ได้อย่างอิสระ และยังช่วยให้ระบบปฏิบัติการหรือตัวควบคุม RAID ดำเนินการ I/O หลายรายการพร้อมกันได้

ในการกำหนดค่า RAID-5 ดิสก์จะเข้าถึงได้ก็ต่อเมื่อข้อมูลพาริตีหรือข้อมูลถูกอ่าน/เขียนจากดิสก์เท่านั้น เป็นผลให้ RAID-5 มีประสิทธิภาพที่ดีกว่า RAID-3 ในทางปฏิบัติ ประสิทธิภาพของ RAID-5 ในบางครั้งอาจเทียบเท่าหรือเกินกว่าประสิทธิภาพของระบบดิสก์เดี่ยว แน่นอนว่าการปรับปรุงประสิทธิภาพนี้ขึ้นอยู่กับหลายปัจจัย รวมถึงวิธีการใช้อาร์เรย์ RAID และความสามารถดั้งเดิมของระบบปฏิบัติการเซิร์ฟเวอร์ RAID-5 ยังให้ความสมบูรณ์ของข้อมูลในระดับสูงสุดของการนำ RAID มาตรฐานไปใช้ เนื่องจากทั้งข้อมูลและความเท่าเทียมกันถูกเขียนในรูปแบบสไทรพ์ เนื่องจาก RAID-5 ใช้การบล็อกสตริปมากกว่าการสตริปบิต จึงไม่มีประโยชน์ด้านประสิทธิภาพในการซิงโครไนซ์สปิน

ผู้ผลิตบางรายได้เพิ่มส่วนขยายให้กับระบบ RAID-5 ของตน หนึ่งในส่วนขยายเหล่านี้คือการมีดิสก์ "hot-spare" อยู่ในอาร์เรย์ หากไดรฟ์ล้มเหลว hot spare จะแทนที่ไดรฟ์ที่เสียหายทันที และคัดลอกข้อมูลกลับไปยังตัวเองด้วยการกู้คืน parity ในเบื้องหลัง อย่างไรก็ตาม โปรดทราบว่าการสร้างดิสก์ RAID-5 ใหม่ส่งผลให้ประสิทธิภาพของเซิร์ฟเวอร์ลดลงอย่างมาก (สำหรับข้อมูลเพิ่มเติมเกี่ยวกับไดรฟ์แบบ Hot-swap และ Hot-spare โปรดดูที่คุณสมบัติไดรฟ์ "Hot" ของแถบด้านข้าง)

ระบบ RAID สามารถจัดระเบียบได้ทั้งโดยใช้ซอฟต์แวร์ที่โหลดบนเซิร์ฟเวอร์และการใช้โปรเซสเซอร์เพื่อการทำงาน และด้วยความช่วยเหลือของตัวควบคุม RAID แบบพิเศษ

ระบบ RAID ที่ใช้ซอฟต์แวร์ใช้ทรัพยากรโปรเซสเซอร์ระบบจำนวนมาก เช่นเดียวกับหน่วยความจำระบบ ซึ่งลดประสิทธิภาพของเซิร์ฟเวอร์อย่างมาก บางครั้งระบบ RAID ของซอฟต์แวร์จะถูกรวมเป็นคุณสมบัติของระบบปฏิบัติการ (เช่นเดียวกับที่ทำกับ Microsoft Windows NT Server) หรือเป็นส่วนเสริมของบริษัทอื่น (เช่นเดียวกับที่ทำกับ NetWare และระบบปฏิบัติการ Macintosh)

ระบบ RAID แบบใช้ฮาร์ดแวร์ใช้ตัวควบคุมอาร์เรย์ RAID เฉพาะ มักจะมีตัวประมวลผล แคช และซอฟต์แวร์ ROM สำหรับดิสก์ I/O และความเท่าเทียมกัน การมีคอนโทรลเลอร์เฉพาะเพื่อดำเนินการเหล่านี้ทำให้โปรเซสเซอร์เซิร์ฟเวอร์มีเนื้อที่ว่างเพื่อทำหน้าที่อื่นๆ นอกจากนี้ เนื่องจากซอฟต์แวร์โปรเซสเซอร์และอแดปเตอร์ได้รับการปรับแต่งสำหรับฟังก์ชัน RAID โดยเฉพาะ จึงให้ประสิทธิภาพดิสก์ I/O และความสมบูรณ์ของข้อมูลได้ดีกว่าระบบ RAID ที่ใช้ซอฟต์แวร์ น่าเสียดายที่ตัวควบคุม RAID ที่ใช้ฮาร์ดแวร์มักจะมีราคาแพงกว่าคู่แข่งที่ใช้ซอฟต์แวร์

การทำมิเรอร์ การทำซ้ำ และการเติม

ระบบปฏิบัติการบางระบบ รวมถึง NetWare และ Windows NT Server อนุญาตให้ทำการมิเรอร์ดิสก์ผ่านช่องสัญญาณดิสก์หลายช่อง ซึ่งจะทำให้มีความซ้ำซ้อนเพิ่มเติมอีกชั้นหนึ่ง ดังที่ได้กล่าวไว้ก่อนหน้านี้ Novell เรียกการทำสำเนาดิสก์วิธีหลัง เมื่อรวมกับการเติมดิสก์ การทำซ้ำสามารถให้ประสิทธิภาพที่ดีกว่าระบบดิสก์เดียว และโดยทั่วไปสามารถทำงานได้ดีกว่าการใช้งานฮาร์ดแวร์ RAID-5 เนื่องจากแต่ละครึ่งหนึ่งของดิสก์คู่ที่ทำมิรเรอร์ใช้ดิสก์แชนเนลแยกกัน การเขียนลงดิสก์ ต่างจากกรณีที่ดิสก์อยู่บน HBA เดียวกัน จึงสามารถเขียนพร้อมกันได้ การทำสำเนายังอนุญาตให้แยกการค้นหา - กระบวนการแบ่งคำขออ่านระหว่างแชนเนลดิสก์เพื่อการดำเนินการที่รวดเร็วยิ่งขึ้น คุณลักษณะนี้เพิ่มประสิทธิภาพการอ่านดิสก์เป็นสองเท่า เนื่องจากทั้งสองแชนเนลค้นหาบล็อกต่างๆ พร้อมกันจากชุดข้อมูลเดียวกัน นอกจากนี้ยังลดผลกระทบด้านประสิทธิภาพเมื่อเขียนลงดิสก์ เนื่องจากช่องสัญญาณหนึ่งสามารถอ่านข้อมูลได้ในขณะที่อีกช่องหนึ่งเขียนได้

NetWare รองรับดิสก์แชนเนลสูงสุดแปดแชนเนล (อะแด็ปเตอร์ SCSI บางตัวมีแชนเนลหลายแชนเนล) ซึ่งหมายความว่าคุณสามารถมีหลายแชนเนลสำหรับคู่ที่ซ้ำกันแต่ละคู่ คุณสามารถเลือกจัดระเบียบช่องมิเรอร์แยกกันได้ถึงแปดช่อง Windows NT Server ยังจัดเตรียมการมิเรอร์และการทำสำเนาโดยใช้ซอฟต์แวร์ แต่ยังไม่สนับสนุนการเขียนแบบขนานและการค้นหาแบบแยกจากกัน

มีปัจจัยหลักสี่ประการที่ควรพิจารณาเมื่อเลือกระบบดิสก์สำรอง: ประสิทธิภาพ ต้นทุน ความน่าเชื่อถือ และการป้องกันความล้มเหลว

ในแง่ของประสิทธิภาพ ความสามารถในตัวของระบบปฏิบัติการเซิร์ฟเวอร์เป็นปัจจัยสำคัญ โดยเฉพาะอย่างยิ่งเมื่อมีการใช้งานดิสก์ซ้ำซ้อน ตามที่ระบุไว้ก่อนหน้านี้ การทำสำเนาดิสก์ NetWare ร่วมกับการเติมดิสก์ให้ประสิทธิภาพที่ดีกว่าฮาร์ดแวร์หรือซอฟต์แวร์ RAID อย่างไรก็ตาม ประสิทธิภาพของฮาร์ดแวร์ RAID โดยทั่วไปนั้นดีกว่าบริการดิสก์ในตัวของ Windows NT Server โดยทั่วไป ในช่วงหลายปีที่ผ่านมา เทคโนโลยีและประสิทธิภาพของระบบ RAID ได้รับการปรับปรุงอย่างต่อเนื่อง

ปัญหาด้านประสิทธิภาพอีกประการหนึ่งที่อาจเกิดขึ้นกับระบบ RAID คือการกู้คืนข้อมูลในกรณีที่เกิดภัยพิบัติ ก่อนหน้านี้ หากไดรฟ์ล้มเหลว คุณต้องปิดอาร์เรย์RAID เพื่อกู้คืน นอกจากนี้ หากคุณต้องการเปลี่ยนขนาดของอาร์เรย์ (เพิ่มหรือลดความจุของอาร์เรย์) คุณต้องสำรองข้อมูลระบบทั้งหมด จากนั้นกำหนดค่าใหม่และกำหนดค่าเริ่มต้นอาร์เรย์ใหม่ โดยจะลบข้อมูลทั้งหมดในระหว่างกระบวนการนี้ ในทั้งสองกรณี ระบบไม่สามารถใช้งานได้ในระยะเวลาหนึ่ง

เพื่อแก้ปัญหานี้ Compaq ได้พัฒนาตัวควบคุม Smart Array-II ซึ่งช่วยให้คุณขยายความจุของอาร์เรย์โดยไม่ต้องเริ่มต้นการกำหนดค่าอาร์เรย์ที่มีอยู่ใหม่ ผู้ผลิตรายอื่นๆ รวมถึง Distributed Processing Technology (DPT) ได้ประกาศว่าคอนโทรลเลอร์ของพวกเขาจะทำหน้าที่คล้ายคลึงกันในอนาคตอันใกล้นี้ อาร์เรย์ใหม่จำนวนมากมียูทิลิตีสำหรับระบบปฏิบัติการต่างๆ ที่สามารถใช้เพื่อกู้คืนอาร์เรย์หลังจากเปลี่ยนอุปกรณ์ที่เสียหายโดยไม่ต้องปิดเซิร์ฟเวอร์ อย่างไรก็ตาม โปรดทราบว่ายูทิลิตี้เหล่านี้กินทรัพยากรเซิร์ฟเวอร์จำนวนมาก และส่งผลเสียต่อประสิทธิภาพของระบบ เพื่อหลีกเลี่ยงปัญหาประเภทนี้ ควรทำการกู้คืนระบบในช่วงเวลาที่ไม่ได้ทำงาน

มีการถกเถียงกันมากมายในอุตสาหกรรมและสิ่งพิมพ์ของผู้จำหน่าย RAID เกี่ยวกับความแตกต่างในต้นทุนระหว่างการมิเรอร์ การทำสำเนา และการใช้งาน RAID การมิเรอร์และการทำสำเนาทำให้ดิสก์เพิ่มขึ้นสองเท่า 100% และ (หากซ้ำกัน) HBA ในขณะที่การใช้งาน RAID มีตัวควบคุม HBA และ/หรือ RAID หนึ่งตัว บวกกับดิสก์หนึ่งตัวที่มากกว่าความจุที่คุณต้องการ ตามอาร์กิวเมนต์เหล่านี้ RAID มีราคาถูกกว่าเนื่องจากจำนวนดิสก์ที่ต้องการน้อยกว่า นี่อาจเป็นจริงหากข้อจำกัดด้านประสิทธิภาพของการใช้งานซอฟต์แวร์ RAID ที่รวมอยู่ในระบบปฏิบัติการ เช่นที่พบใน Windows NT นั้นสามารถทนต่อคุณได้ อย่างไรก็ตาม ในกรณีส่วนใหญ่ จำเป็นต้องมีคอนโทรลเลอร์ RAID เฉพาะเพื่อให้ได้รับประสิทธิภาพที่เพียงพอ

ไดรฟ์และอะแดปเตอร์ SCSI มาตรฐานมีราคาไม่แพงนัก ในขณะที่คอนโทรลเลอร์ RAID คุณภาพสูงอาจมีราคาสูงถึง $4,500 ในการพิจารณาต้นทุนของระบบ คุณต้องพิจารณาการกำหนดค่าที่เหมาะสมที่สุดสำหรับส่วนประกอบทั้งหมด ตัวอย่างเช่น หากคุณต้องการพื้นที่ดิสก์ที่กำหนดแอดเดรสได้ประมาณ 16 GB คุณสามารถใช้การกำหนดค่ามิเรอร์กับดิสก์ 9 GB สองดิสก์ต่อแชนเนลและรับความจุส่วนเกินได้ ในกรณีของ RAID-5 ด้วยเหตุผลด้านประสิทธิภาพและความน่าเชื่อถือ ควรใช้ไดรฟ์ขนาด 4 GB ห้าตัวเพื่อเพิ่มจำนวนแกนหมุนข้อมูลและด้วยเหตุนี้ประสิทธิภาพโดยรวมของอาร์เรย์

ด้วยระบบย่อยของดิสก์ภายนอก การกำหนดค่ามิเรอร์จะมีราคาประมาณ 10,500 ดอลลาร์ต่อพื้นที่ว่าง 18 GB ตัวเลขนี้อิงจากราคาขายปลีกจริง: 2,000 ดอลลาร์สำหรับหนึ่งไดรฟ์ 250 ดอลลาร์สำหรับ HBA หนึ่งรายการ และ 300 ดอลลาร์สำหรับระบบย่อยดิสก์ภายนอกแต่ละระบบรวมถึงสายเคเบิล ระบบ RAID-5 ที่กำหนดค่าด้วยพื้นที่ที่สามารถระบุตำแหน่งได้ 16 GB โดยใช้ดิสก์ 4 GB ห้าแผ่นจะมีราคาประมาณ 12,800 เหรียญสหรัฐ ตัวเลขนี้อิงตามราคาขายปลีกจริงสำหรับอาร์เรย์ DPT RAID-5

ระบบ RAID จำนวนมากรวมถึงส่วนประกอบ "ที่เป็นกรรมสิทธิ์" ซึ่งออกแบบโดยผู้ผลิต อย่างน้อยที่สุด "แบรนด์" คือเคสและแผงด้านหลัง ตัวควบคุม HBA และ RAID มักเป็นกรรมสิทธิ์เช่นกัน ผู้ผลิตบางรายยังใช้ตัวยึดและยางที่ไม่ได้มาตรฐานสำหรับแผ่นดิสก์ มีคนจัดหาแยกต่างหากในราคาที่เหมาะสมบางคน - ร่วมกับดิสก์และตามกฎแล้วในราคาที่สูง วิธีหลังอาจมีค่าใช้จ่ายสูงเมื่อคุณต้องการแก้ไขหรือขยายระบบของคุณ อีกวิธีหนึ่งที่ผู้ขายผลักดันคุณเข้าสู่มุมหนึ่งคือการจัดหาซอฟต์แวร์การดูแลระบบและการตรวจสอบดิสก์ที่ใช้งานได้กับส่วนประกอบเฉพาะเท่านั้น โดยการหลีกเลี่ยงส่วนประกอบที่ไม่ได้มาตรฐานเมื่อทำได้ มักจะสามารถลดต้นทุนได้

เมื่อเปรียบเทียบความน่าเชื่อถือของระบบดิสก์สำรอง มีสองปัจจัยที่ต้องพิจารณา: ความเป็นไปได้ของความล้มเหลวของระบบหรือความล้มเหลวของส่วนประกอบใดๆ และความเป็นไปได้ของการสูญเสียข้อมูลเนื่องจากความล้มเหลวของส่วนประกอบ (น่าเสียดายที่ RAID หรือการมิเรอร์ไม่สามารถช่วยคุณจากสาเหตุหลักของการสูญหายของข้อมูล - ข้อผิดพลาดของผู้ใช้!)

P = เสื้อ / Tc,

โดยที่ t คือเวลาทำงาน และ Tc คือเวลารวมระหว่างความล้มเหลวของส่วนประกอบ

เมื่อทำงานโดยไม่มีความล้มเหลวเป็นเวลาหนึ่งปี (8760 ชั่วโมง) และ Tc ของดิสก์สมมุติ 300,000 ชั่วโมง ความน่าจะเป็นของความล้มเหลวจะกลายเป็น 3% หรือน้อยกว่าหนึ่งใน 34 กรณีเล็กน้อย เมื่อจำนวนส่วนประกอบเพิ่มขึ้น ความน่าจะเป็นของ ความล้มเหลวของส่วนประกอบใด ๆ เพิ่มขึ้น ทั้ง RAID และการมิเรอร์จะเพิ่มโอกาสของความล้มเหลว แต่ลดโอกาสที่ข้อมูลจะสูญหาย

ตารางที่ 2 ที่นำมาจากกระดานข่าวขนาดพื้นที่เก็บข้อมูลชื่อ "ระบบจัดเก็บข้อมูลที่ทนต่อความผิดพลาดสำหรับเครือข่ายต่อเนื่อง" แสดงความน่าจะเป็นของความล้มเหลวที่คำนวณโดยใช้สูตรข้างต้น เทียบกับความน่าจะเป็นของการสูญเสียข้อมูลสำหรับดิสก์เบาะสี่แผ่น อาร์เรย์ RAID ห้าดิสก์ และ ดิสก์มิเรอร์แปดแผ่น (สมมติว่าไดรฟ์ทั้งหมดมีขนาดเท่ากัน และทั้งสามระบบมีความจุที่ใช้งานได้เท่ากัน สำหรับกระดานข่าวสาร ให้ไปที่หน้าขนาดพื้นที่เก็บข้อมูล: http://www.storagedimensions.com/raidwin/wp-ovrvw.html.)

ตารางที่ 2 - ค่าประมาณความน่าจะเป็นที่ล้มเหลว

แม้ว่าการทำมิเรอร์ร่วมกับการเติมไดรฟ์จะมีความเป็นไปได้ทางสถิติที่สูงกว่าที่จะเกิดความล้มเหลวของดิสก์ แต่ก็มีความเป็นไปได้ที่ข้อมูลจะสูญหายน้อยกว่ามากหากดิสก์ล้มเหลว นอกจากนี้ ด้วยระบบสำรองที่ออกแบบมาอย่างเหมาะสม เวลาการกู้คืนอาจสั้นลงอย่างเห็นได้ชัด

ตัวอย่างนี้ไม่ได้คำนึงถึงปัจจัยหลายอย่าง เพื่อให้ได้ตัวเลขที่ถูกต้องทางสถิติ ต้องคำนวณเวลาเฉลี่ยระหว่างความล้มเหลวของส่วนประกอบระบบดิสก์ทั้งหมด รวมถึง HBA, สายแพ, สายไฟ, พัดลม และอุปกรณ์จ่ายไฟ แน่นอน การคำนวณเหล่านี้บอกได้เพียงสิ่งที่สามารถเกิดขึ้นได้เมื่อพิจารณาถึงความน่าเชื่อถือของส่วนประกอบที่เสนอ แต่ไม่จำเป็นเลยที่สิ่งนี้จะเกิดขึ้น

เมื่อเลือกระบบดิสก์ คุณต้องทราบอย่างชัดเจนว่าส่วนประกอบใดไม่ซ้ำกัน ในระบบ RAID ซึ่งอาจรวมถึง HBA, ตัวควบคุม RAID, อุปกรณ์จ่ายไฟ, สายไฟ และสายแพ ข้อดีประการหนึ่งของการทำสำเนาด้วยระบบย่อยของดิสก์ที่แยกจากกันในแต่ละแชนเนลคือการกำจัดจุดเดียวส่วนใหญ่ที่อาจเกิดความล้มเหลวได้

บทสรุป

โดยทั่วไป อุปกรณ์ SCSI เป็นตัวเลือกที่ดีกว่าสำหรับระบบย่อยของดิสก์เซิร์ฟเวอร์มากกว่าไดรฟ์ IDE หรือ EIDE ง่ายต่อการรับไดรฟ์ SCSI สูงสุด 9 GB ต่อไดรฟ์ ในขณะที่ไดรฟ์ EIDE ในปัจจุบันมีความจุสูงสุดประมาณ 2.5 GB ด้วย HBA แบบดูอัลลิงค์หลายตัว ความจุ SCSI ทั้งหมดสามารถเกิน 100 GB ได้อย่างง่ายดาย ในขณะที่ขีดจำกัด EIDE คือ 10 GB SCSI ยังมีประสิทธิภาพที่ดีขึ้น ยิ่งไปกว่านั้น SCSI ไม่ประสบปัญหาที่แนวทางหลัก-ทาสใน IDE/EIDE ก่อขึ้น

หากคุณต้องการดิสก์สำรอง มีหลายตัวเลือก ความซ้ำซ้อนของ Novell NetWare รวมกับการเติมดิสก์ให้ทั้งประสิทธิภาพที่ยอดเยี่ยมและการป้องกันความล้มเหลว RAID ที่ใช้ฮาร์ดแวร์ก็เป็นทางเลือกที่ดีเช่นกัน แต่โดยทั่วไปแล้วจะมีประสิทธิภาพที่ต่ำกว่าและมีราคาสูงกว่า หากคุณกำลังใช้ Windows NT และประสิทธิภาพเป็นสิ่งสำคัญสำหรับคุณ ฮาร์ดแวร์ RAID อาจเป็นทางออกที่ดีที่สุดของคุณ

Patrick Corrigan เป็นประธานและที่ปรึกษาอาวุโส/นักวิเคราะห์ที่ The Corrigan Group ซึ่งเป็นบริษัทที่ปรึกษาและฝึกอบรม สามารถติดต่อได้ที่ [ป้องกันอีเมล]หรือทาง Compuserve: 75170.146 Mickey Applebaum เป็นที่ปรึกษาเครือข่ายอาวุโสของ GSE Erudite Software สามารถติดต่อได้ที่ [ป้องกันอีเมล]

แนะนำฟังก์ชั่นระบบย่อยของดิสก์

ฟังก์ชั่น "Hot" ของระบบย่อยดิสก์

คำว่า hot-swap, hot spare และ hot-rebuild ใช้กันอย่างแพร่หลายเพื่ออธิบายฟังก์ชันเฉพาะของระบบย่อยของดิสก์ มักเข้าใจผิด

"Hot Swap" เป็นคุณลักษณะที่ช่วยให้คุณสามารถลบดิสก์ที่ล้มเหลวออกจากระบบย่อยของดิสก์โดยไม่ต้องปิดระบบ การสนับสนุน Hot swap เป็นคุณสมบัติฮาร์ดแวร์ของระบบย่อยดิสก์ของคุณ ไม่ใช่ RAID

ในระบบแบบ Hot-swappable โดยทั่วไปแล้ว ฮาร์ดไดรฟ์จะติดตั้งอยู่บนแคร่เลื่อนที่ช่วยให้หมุดกราวด์ระหว่างไดรฟ์และแชสซีสามารถเชื่อมต่อได้นานกว่าสายไฟและสายควบคุม สิ่งนี้จะช่วยปกป้องไดรฟ์จากความเสียหายจากไฟฟ้าสถิตย์หรือการเกิดประกายไฟระหว่างหน้าสัมผัส ดิสก์แบบ Hot-swappable สามารถใช้ได้ทั้งในอาร์เรย์ RAID และระบบดิสก์ที่ทำมิเรอร์

"การคืนค่าแบบด่วน" หมายถึงความสามารถของระบบในการกู้คืนการกำหนดค่าดิสก์ดั้งเดิมโดยอัตโนมัติหลังจากเปลี่ยนดิสก์ที่ล้มเหลว

Hot spare ถูกสร้างขึ้นในอาร์เรย์ RAID และโดยทั่วไปจะไม่ได้ใช้งานจนกว่าจะมีความจำเป็น ในบางจุดหลังจากที่ hot spare แทนที่ไดรฟ์ที่ล้มเหลว คุณต้องเปลี่ยนไดรฟ์ที่ล้มเหลวและกำหนดค่าอาร์เรย์ใหม่

ระบบดิสก์แบบ Hot-swap ที่มีดิสก์สำรองไม่จำเป็นต้องมีความสามารถในการกู้คืนโดยด่วน "Hot Swap" ช่วยให้คุณถอด/ติดตั้งไดรฟ์ได้อย่างรวดเร็ว ปลอดภัย และง่ายดาย ดูเหมือนว่า "hot spare" จะให้ "hot rebuild" เนื่องจากอนุญาตให้เปลี่ยนไดรฟ์ที่ล้มเหลวในอาร์เรย์ RAID ได้ทันที แต่ไดรฟ์ที่ล้มเหลวยังคงต้องถูกแทนที่ก่อนที่จะได้รับคำสั่งสร้างใหม่ ในปัจจุบัน ระบบ RAID ทั้งหมดที่มีอยู่บนแพลตฟอร์มพีซีจำเป็นต้องมีการแทรกแซงของผู้ใช้ในระดับหนึ่งเพื่อเริ่มการกู้คืนข้อมูล อย่างน้อยที่สุดก็ในระดับของการโหลดโมดูล NLM บนเซิร์ฟเวอร์ NetWare หรือกดปุ่มเริ่มต้นในเมนูแอปพลิเคชัน NT Server

เป้าหมายของสถาปัตยกรรมที่ทนทานต่อข้อผิดพลาดคือการจัดเตรียมระบบข้อมูลที่มีค่าใช้จ่ายในการบำรุงรักษาต่ำและไม่มีการหยุดทำงานเป็นศูนย์ ความพร้อมใช้งานของระบบไม่เพียงพออาจส่งผลให้เกิดการสูญเสียทางการเงินอย่างมากสำหรับบริษัท จำนวนนี้ประกอบด้วยต้นทุนในการผลิตที่ลดลงของพนักงานเนื่องจากความล้มเหลวของระบบ ต้นทุนของงานที่ไม่สามารถทำได้จนกว่าระบบจะกู้คืน ค่าใช้จ่ายในการซ่อมแซมองค์ประกอบที่ล้มเหลวของระบบ ดังนั้น เมื่อนำแอปพลิเคชันที่มีความสำคัญต่อธุรกิจไปใช้ ควรพิจารณาว่าต้นทุนของการหยุดทำงานเนื่องจากความล้มเหลวของระบบเป็นตัวกำหนดการลงทุนจำนวนมากในการติดตั้งสถาปัตยกรรมที่ทนทานต่อข้อผิดพลาด

ในการสร้างระบบที่ทนต่อข้อผิดพลาด จำเป็นต้องใส่ใจกับส่วนประกอบหลักหลายประการ ความน่าเชื่อถือของระบบย่อยของดิสก์เป็นสิ่งสำคัญ มาดูคุณสมบัติหลักของระบบย่อยของดิสก์ที่ทนทานต่อข้อผิดพลาดและพิจารณาการใช้งานโดยใช้เทคโนโลยี RAID

สิ่งที่อยู่เบื้องหลังความทนทานต่อความผิดพลาดของระบบย่อยของดิสก์

ระบบทนต่อข้อผิดพลาดจะตรวจจับส่วนประกอบที่ล้มเหลวโดยอัตโนมัติ จากนั้นจึงระบุสาเหตุของความล้มเหลวอย่างรวดเร็วและกำหนดค่าส่วนประกอบเหล่านี้ใหม่

จุดสำคัญในการสร้างระบบที่ทนต่อข้อผิดพลาดคือการจัดเตรียมระบบป้องกันซ้ำซ้อนตามฮาร์ดแวร์และซอฟต์แวร์ ความซ้ำซ้อนนี้ใช้อัลกอริธึมการตรวจจับข้อผิดพลาดที่ใช้ร่วมกับอัลกอริธึมการวินิจฉัยเพื่อระบุสาเหตุของข้อผิดพลาด

มีวิธีการตรวจจับข้อผิดพลาดหลักสามวิธี อย่างแรกคือการทดสอบเบื้องต้น (Initial Testing) ซึ่งดำเนินการโดยผู้ผลิตก่อนการรวมระบบขั้นสุดท้าย ในขั้นตอนนี้ จะระบุข้อบกพร่องของฮาร์ดแวร์ที่อาจเกิดขึ้นระหว่างการผลิตและการประกอบส่วนประกอบระบบ

วิธีที่สอง การทดสอบออนไลน์พร้อมกัน หมายถึงเวลาของการทำงานของระบบปกติ วิธีนี้จะมองหาข้อผิดพลาดที่อาจเกิดขึ้นหลังจากการติดตั้งระบบเป็นหลัก วิธีการทดสอบออนไลน์ที่เป็นที่รู้จักมากที่สุดวิธีหนึ่งคือการตรวจสอบความเท่าเทียมกัน ช่วยให้มั่นใจได้ว่าข้อมูลทุก ๆ ไบต์ที่ส่งผ่านระบบคอมพิวเตอร์จะไปถึงองค์ประกอบถัดไปที่ครบถ้วน วิธีพาริตีตรวจพบเฉพาะข้อผิดพลาดและไม่สามารถระบุได้ว่าบิตใดขาดหายไป ดังนั้นจึงใช้ร่วมกับ Error Correction Code ซึ่งกำหนดว่าข้อมูลใดสูญหาย ทำให้ระบบสามารถกู้คืนได้อย่างรวดเร็ว

สุดท้าย วิธีการตรวจจับข้อผิดพลาดที่สามคือการทดสอบความซ้ำซ้อน เป็นการตรวจสอบว่าคุณลักษณะการป้องกันความผิดพลาดของระบบทำงานอย่างถูกต้อง

ระบบที่ทนต่อข้อผิดพลาดจะต้องจัดเตรียมการเฟลโอเวอร์ให้กับอุปกรณ์สำรองในกรณีที่เกิดความล้มเหลว รวมทั้งแจ้งให้ผู้ดูแลระบบทราบถึงการเปลี่ยนแปลงการกำหนดค่าใดๆ เพื่อให้สามารถกู้คืนส่วนประกอบที่ล้มเหลวได้ก่อนที่รายการที่ซ้ำกันจะหยุดทำงาน ในการดำเนินการนี้ ระบบจะต้องส่งข้อความไปยังคอนโซลของผู้ดูแลระบบ บันทึกข้อผิดพลาดทั้งหมดลงในดิสก์เพื่อตรวจสอบเป็นระยะ และยังสามารถส่งข้อความภายนอกได้หากเกิดข้อผิดพลาดขึ้นโดยที่ไม่มีผู้ดูแลระบบในที่ทำงาน

เมื่อเลือกระบบที่ทนต่อข้อผิดพลาด เราต้องพิจารณาถึงความสามารถในการปรับให้เข้ากับเทคโนโลยีใหม่ เนื่องจากคอมพิวเตอร์และอุปกรณ์ดิสก์ที่มีประสิทธิภาพสูงจะมีอัตราที่ยอดเยี่ยม

สุดท้ายนี้ ผู้ใช้ไม่ควรลืมว่าในการใช้งานความทนทานต่อข้อผิดพลาดที่ดีที่สุด พวกเขาต้องสำรองข้อมูลบนเทปแม่เหล็กหรือดิสก์ออปติคัลเป็นระยะ เพื่อความปลอดภัยของพวกเขาในกรณีที่เกิดภัยพิบัติทั่วโลกมากกว่าความล้มเหลวของส่วนประกอบใดๆ ของระบบ ความทนทานต่อความผิดพลาดไม่น่าจะช่วยในกรณีที่เกิดไฟไหม้ แผ่นดินไหว หรือระเบิดของผู้ก่อการร้าย

ระบบย่อยของดิสก์ RAID

แม้ว่าปัจจัยหลายประการจะส่งผลต่อประสิทธิภาพของระบบ เช่น ไฟดับหรือความร้อนสูงเกินไป ไม่มีอะไรสำคัญไปกว่าการปกป้องข้อมูลบนไดรฟ์ของคุณ ความล้มเหลวของดิสก์ทำให้เกิดการหยุดทำงานของระบบเป็นเวลานาน เนื่องจากต้องสร้างข้อมูลใหม่ก่อนที่จะสามารถดำเนินโปรแกรมต่อได้

ในปี พ.ศ. 2530 นักวิจัยสามคนจากมหาวิทยาลัยเบิร์กลีย์ได้ตีพิมพ์บทความที่อธิบายถึงวิธีการจัดเตรียมความทนทานต่อข้อผิดพลาดโดยใช้อาร์เรย์ของดิสก์ไดรฟ์ขนาดเล็ก (3.5 และ 5.25 นิ้ว) ที่สามารถบรรลุคุณลักษณะด้านประสิทธิภาพของดิสก์ขนาดใหญ่ราคาแพงเพียงแผ่นเดียว (Single Large Expensive Disk) - SLED) ในเมนเฟรม เทคโนโลยีนี้เรียกว่า RAID - Redundant Array of Inexpensive Disks (Redundant Array of Inexpensive Disks) ด้านล่างนี้ เราจะดูคุณสมบัติหลักของระดับ RAID ทั้งหกระดับ

ระดับ RAID มีลักษณะการทำงานที่แตกต่างกันและต้นทุนที่แตกต่างกัน RAID 0 (วิธีดูเพล็กซ์) จะเร็วที่สุด รองลงมาคือ RAID 3 หรือ RAID 5 (ขึ้นอยู่กับขนาดบันทึก) ค่าใช้จ่ายของแต่ละวิธีขึ้นอยู่กับจำนวนพื้นที่ดิสก์ทั้งหมดที่ต้องการ ตัวอย่างเช่น สำหรับไฟล์ขนาดเล็กถึงขนาดกลาง การมิเรอร์อาจมีราคาถูกกว่า RAID 3 หรือ 5

เมื่อเลือกระบบย่อยของดิสก์ที่ทนทานต่อข้อผิดพลาด คุณต้องคำนึงถึงซอฟต์แวร์สำหรับการกู้คืนข้อมูลโดยอัตโนมัติในกรณีที่เกิดความล้มเหลว เมื่อพูดถึงไฟล์เซิร์ฟเวอร์ LAN สิ่งสำคัญคือสามารถกู้คืนข้อมูลได้โดยใช้ความพยายามเพียงเล็กน้อยในส่วนของผู้ดูแลระบบ LAN และทำให้ผู้ใช้เซิร์ฟเวอร์สูญเสียน้อยที่สุด ตัวอย่างเช่น สำหรับ RAID 0 การสร้างใหม่เป็นเพียงการคัดลอกข้อมูลจากไดรฟ์รองไปยังไดรฟ์ที่สร้างใหม่หรือถูกแทนที่ สำหรับระบบ RAID 3, 4 และ 5 ผู้ผลิตจัดหาซอฟต์แวร์ที่กู้คืนข้อมูลตามเซ็กเมนต์ XOR โปรแกรมเหล่านี้ทำงานในเบื้องหลัง ทำให้ผู้ใช้สามารถทำงานต่อไปได้ในขณะที่กำลังกู้คืน ระบบ RAID ที่มีโปรเซสเซอร์อัจฉริยะในตัวสามารถสร้างใหม่ได้เร็วกว่าระบบคู่ขนานที่ใช้ซอฟต์แวร์ที่ทำงานบนโปรเซสเซอร์ของระบบหลัก

ระบบ RAID แบบดั้งเดิมมีข้อดีที่ปฏิเสธไม่ได้ แต่ก็สร้างปัญหามากมายเช่นกัน RAID ระดับต่างๆ ให้ประสิทธิภาพและต้นทุนที่แตกต่างกัน และผู้ดูแลระบบต้องหาตัวเลือกที่ดีที่สุดสำหรับระบบที่กำหนด ระบบย่อยของดิสก์ RAID ในปัจจุบันค่อนข้างซับซ้อนในการจัดการและกำหนดค่า การเพิ่มพื้นที่ดิสก์และการกำหนดค่าระบบย่อยใหม่ยังเป็นกระบวนการที่ใช้เวลานานและลำบาก

เพื่อรับมือกับปัญหาเหล่านี้ เทคโนโลยีดิสก์อาเรย์ใหม่ได้รับการพัฒนาพร้อมความสามารถในการกำหนดค่าโดยอัตโนมัติเป็นระดับต่างๆ ที่ไม่เข้ากับเฟรมเวิร์กดั้งเดิมของระดับ RAID ที่ระบุอีกต่อไป เราจะดูผลิตภัณฑ์ประเภทนี้จาก Hewlett-Packard และ EMC

Hewlett-Packard AutoRAID

หลังจากทำงานหนักมาสี่ปี แผนกการจัดเก็บข้อมูลของ Hewlett-Packard ได้พัฒนาเทคโนโลยีใหม่ที่ใช้ประโยชน์จากความซ้ำซ้อนของ RAID แบบเดิม ในขณะที่ขจัดข้อบกพร่องหลายประการ ระบบย่อยของดิสก์ AutoRAID จะเลือกระดับ RAID ที่ตรงกับความต้องการของผู้ใช้โดยอัตโนมัติ และยังใช้คุณสมบัติที่สำคัญอื่นๆ อีกจำนวนหนึ่ง

แกนหลักของเทคโนโลยีคือชุดของอัลกอริธึมตัวควบคุมระบบย่อยของดิสก์สำหรับจัดการที่อยู่บล็อกข้อมูล ดิสก์อาร์เรย์แบบดั้งเดิม เช่น RAID 4 หรือ 5 ใช้อัลกอริธึมที่กำหนดไว้ล่วงหน้าแบบสแตติกสำหรับการแปลที่อยู่ของบล็อกข้อมูลคอมพิวเตอร์โฮสต์เป็นที่อยู่ดิสก์ นักพัฒนา AutoRAID ละทิ้งแนวทางนี้และต้องการใช้อัลกอริธึมแบบไดนามิกเพื่อแมปที่อยู่บล็อกใดๆ บนโฮสต์กับไดรฟ์ใดๆ ในอาร์เรย์อย่างชาญฉลาด การแสดงผลนี้อาจเปลี่ยนแปลงระหว่างการทำงานของระบบ

อัลกอริธึมแบบไดนามิกช่วยให้ตัวควบคุมสามารถย้ายข้อมูลที่จัดเก็บไว้ในอาร์เรย์ของดิสก์ไปยังตำแหน่งใดก็ได้บนดิสก์ใดๆ โดยไม่กระทบต่อข้อมูลหรือวิธีที่คอมพิวเตอร์โฮสต์จะระบุ เทคโนโลยีนี้ทำให้สามารถแปลงจากระดับ RAID หนึ่งเป็นระดับอื่นได้ ตามสิ่งที่ทราบเกี่ยวกับคุณลักษณะด้านประสิทธิภาพที่แตกต่างกันของระดับ RAID ที่แตกต่างกัน ระบบย่อยของดิสก์จะปรับเปลี่ยนแบบไดนามิกเพื่อตอบสนองความต้องการของคอมพิวเตอร์โฮสต์ได้ดีที่สุด

ความเป็นไปได้ที่สำคัญอีกประการของแนวทางนี้คือการผสมดิสก์ที่มีขนาดและประสิทธิภาพต่างกันอย่างง่ายในระบบย่อยเดียว ดิสก์อาร์เรย์แบบดั้งเดิมบางตัวมีสิ่งอำนวยความสะดวกที่คล้ายกัน แต่ในการกำหนดค่าของระบบย่อยนั้นเป็นกระบวนการที่ซับซ้อนและใช้เวลานาน การกำหนดค่าใน AutoRAID ทำได้ง่ายและรวดเร็ว งานหนึ่งของผู้ดูแลระบบในการกำหนดค่าดิสก์อาร์เรย์คือการสร้างดิสก์เสมือนจากพื้นที่ที่มีอยู่จริง ผู้ใช้ทำงานกับดิสก์เสมือนที่คอนโทรลเลอร์ระบบย่อยแสดงเป็นฟิสิคัล เมื่อกำหนดค่าดิสก์อาเรย์แบบเดิม ผู้ดูแลระบบต้องทราบลักษณะของฟิสิคัลดิสก์แต่ละตัวเพื่อจัดกลุ่มเข้าด้วยกันเพื่อสร้างดิสก์เสมือน AutoRAID ปลดปล่อยผู้ดูแลระบบจากความซับซ้อนเหล่านี้ ตอนนี้ก็เพียงพอแล้วสำหรับเขาที่จะรู้จำนวนหน่วยความจำทั้งหมดในอาร์เรย์ของดิสก์ ผู้ดูแลระบบกำหนดจำนวนหน่วยความจำที่จำเป็นสำหรับดิสก์เสมือนแต่ละรายการ หลังจากนั้นอัลกอริธึมการทำแผนที่จะจัดกลุ่มฟิสิคัลดิสก์โดยอัตโนมัติเพื่อให้แน่ใจว่ามีการใช้พื้นที่ว่างอย่างมีประสิทธิภาพสูงสุดและให้ประสิทธิภาพสูงสุด

การกำหนดค่าระบบย่อยใหม่ก็ทำได้ง่ายเช่นกัน สาเหตุที่พบบ่อยที่สุดประการหนึ่งสำหรับการกำหนดค่าใหม่คือความจำเป็นในการเพิ่มพื้นที่ดิสก์ ระบบย่อย RAID แบบดั้งเดิมแก้ปัญหานี้ได้สองวิธี อย่างแรกคือการเพิ่มดิสก์ให้เพียงพอเพื่อสร้างกลุ่มความซ้ำซ้อนใหม่ วิธีนี้อาจมีราคาแพงมาก ในกรณีที่สอง ผู้ดูแลระบบจะบันทึกข้อมูลทั้งหมดลงในดิสก์สำรอง เพิ่มดิสก์ใหม่ กำหนดค่าระบบย่อยใหม่ทั้งหมด และกู้คืนข้อมูล เห็นได้ชัดว่ากระบวนการนี้จะใช้เวลานาน ในระหว่างที่ระบบไม่ทำงาน

ดูเหมือนง่ายกว่ามากในการกำหนดค่าใหม่เพื่อเพิ่มพื้นที่ดิสก์เพิ่มเติม ผู้ดูแลระบบจะติดตั้งดิสก์ใหม่และสร้างดิสก์เสมือนอื่นก็เพียงพอแล้ว งานนี้ทำแบบโต้ตอบและใช้เวลาไม่กี่วินาที

ความง่ายในการกำหนดค่าระบบใหม่นี้ขึ้นอยู่กับเทคโนโลยีการทำแผนที่แบบไดนามิกที่ใช้ใน AutoRAID แต่ละดิสก์ในอาร์เรย์จะถือว่าเป็นลำดับของบล็อก เมื่อมีการเพิ่มดิสก์ใหม่ บล็อคจะถูกเพิ่มไปยังพูลรวมของหน่วยความจำที่พร้อมใช้งาน อัลกอริธึมการทำแผนที่ช่วยให้คอนโทรลเลอร์ใช้แต่ละบล็อกได้อย่างอิสระ ส่งผลให้ระบบมีประสิทธิภาพ ต้นทุน และความพร้อมใช้งานดีขึ้น

คุณลักษณะเฉพาะของเทคโนโลยี AutoRAID คือการใช้ดิสก์ใหม่โดยอัตโนมัติและโดยตรง เพื่อปรับปรุงประสิทธิภาพของระบบย่อยของดิสก์ เมื่อมีการติดตั้งไดรฟ์ใหม่ ข้อมูลจะถูกแจกจ่ายอย่างเท่าเทียมกันในทุกไดรฟ์ในระบบย่อย กระบวนการนี้เรียกว่าการปรับสมดุลและทำงานในพื้นหลังระหว่างการทำงานของคอมพิวเตอร์โฮสต์ แม้แต่การกระจายข้อมูลในดิสก์ทั้งหมดก็สร้างโอกาสมากขึ้นในการดำเนินการข้อมูลหลายรายการพร้อมกัน สำหรับระบบการประมวลผลธุรกรรม การเพิ่มจำนวนของการดำเนินการแบบคู่ขนานหมายถึงการเพิ่มประสิทธิภาพโดยรวม

นวัตกรรมอื่นของเทคโนโลยีที่อธิบายไว้นั้นขึ้นอยู่กับวิธีการปรับสมดุล - ที่เรียกว่า "อะไหล่ร้อนที่ใช้งานอยู่" (อะไหล่ร้อนที่ใช้งานอยู่) การทำงานของอะไหล่สำรองแบบแอ็คทีฟจะเหมือนกับการทำงานของอะไหล่สำรองแบบปกติ หากไดรฟ์ใดล้มเหลว ตัวควบคุมระบบย่อยจะเริ่มกระบวนการสร้างใหม่ทันที ซึ่งสร้างข้อมูลที่สูญหายขึ้นใหม่บนไดรฟ์สำรองและกู้คืนระบบย่อยที่ซ้ำซ้อน ในอาร์เรย์ทั่วไป ไดรฟ์สำรองจะไม่ถูกใช้จนกว่าจะมีบางอย่างเกิดขึ้นกับระบบ เนื่องจากมีเนื้อที่ว่างสำหรับข้อมูลที่กู้คืน บางครั้งการจัดเก็บข้อมูลชั่วคราวจะถูกสร้างขึ้นบนไดรฟ์แบบ hot-spark แต่ต้องกำจัดทิ้งทันทีที่ไดรฟ์ทำงานล้มเหลว

เทคโนโลยี HP AutoRAID ใช้ hot spare เพื่อปรับปรุงประสิทธิภาพของระบบย่อย กระบวนการปรับสมดุลจะกระจายข้อมูลผู้ใช้ไปยังดิสก์ทั้งหมดในระบบ รวมถึงดิสก์สำรอง (ยิ่งใช้ดิสก์สำหรับข้อมูลมากเท่าใด ประสิทธิภาพก็จะยิ่งดีขึ้นเท่านั้น) ในขณะเดียวกัน ในแต่ละดิสก์ พื้นที่ส่วนหนึ่งจะถูกสงวนไว้สำหรับการกู้คืนข้อมูลในกรณีที่เกิดความล้มเหลว ข้อมูลที่สร้างใหม่ระหว่างกระบวนการสร้างระบบใหม่จะถูกเก็บไว้ในพื้นที่สำรองของแต่ละดิสก์ในอาร์เรย์

EMC RAID-S

EMC ผู้ผลิตระบบจัดเก็บข้อมูล นำเสนอการนำเทคโนโลยี RAID มาใช้ใหม่ RAID-S ซึ่งให้ประสิทธิภาพที่ดีขึ้นและการปกป้องข้อมูล และขจัดข้อบกพร่องหลายประการของระบบ RAID แบบเดิม

ไม่สามารถกำหนด RAID-S ให้กับระดับ RAID ใดระดับหนึ่งได้ ด้วยการใช้ความก้าวหน้าใหม่ๆ ในฮาร์ดแวร์ ซอฟต์แวร์ และจอแสดงผล EMC ได้รวมเอาแง่บวกของ RAID 4, 5 และ RAID 6 เข้ากับเทคโนโลยีใหม่เพื่อสร้างรูปแบบการปกป้องข้อมูลใหม่ ดิสก์อาร์เรย์ RAID-S ได้รับการออกแบบมาเพื่อใช้ในระบบระดับเมนเฟรม

RAID-S จะอนุญาตให้ผู้ใช้สร้างระบบจัดเก็บข้อมูลที่ช่วยสร้างสมดุลที่ดีที่สุดระหว่างประสิทธิภาพ การปกป้องข้อมูล และความพร้อมใช้งานของระบบ RAID-S ให้คุณเลือกระดับ RAID ที่เหมาะสมกับความต้องการขององค์กรของคุณมากที่สุด นอกจากนี้ EMC ยังให้คุณรวมเทคโนโลยี RAID-S, ดิสก์อาเรย์ RAID 1 และระบบจัดเก็บข้อมูลดิสก์ของบริษัทอื่นๆ ในระบบเดียว

ตัวอย่างเช่น ธนาคารขนาดใหญ่อาจใช้ระบบประมวลผลธุรกรรมออนไลน์เพื่อให้บริการลูกค้า เช่นเดียวกับระบบประมวลผลแบบกลุ่มสำหรับงานธุรการ แต่ละแอปพลิเคชันมีข้อกำหนดด้านการจัดเก็บและการเข้าถึงของตัวเอง ระบบดิสก์ EMC จะให้ระดับความพร้อมใช้งานและการปกป้องข้อมูลที่จำเป็นแก่แต่ละระบบ

ขั้นตอนของ RAID Excellence

RAID 0. RAID 0 ไม่ได้ทนทานต่อข้อผิดพลาดโดยเนื้อแท้ แต่สามารถปรับปรุงประสิทธิภาพได้อย่างมาก ในระบบทั่วไป ข้อมูลจะถูกเขียนตามลำดับไปยังดิสก์จนกว่าความจุจะหมด RAID 0 กระจายข้อมูลทั่วดิสก์ในอาร์เรย์ดังนี้ ตัวอย่างเช่น หากใช้ดิสก์สี่แผ่น ข้อมูลจะถูกเขียนไปยังแทร็กแรกของดิสก์แผ่นแรก จากนั้นไปยังแทร็กแรกของดิสก์ที่สอง แทร็กแรกของดิสก์ที่สาม และแทร็กแรกของดิสก์ที่สี่ ข้อมูลจะถูกเขียนไปยังแทร็กที่สองของแผ่นดิสก์แผ่นแรก เป็นต้น การกระจายข้อมูลนี้ทำให้คุณสามารถอ่านและเขียนข้อมูลบนดิสก์สี่ตัวพร้อมกันได้ และด้วยเหตุนี้จึงเพิ่มประสิทธิภาพของระบบ ในทางกลับกัน หากไดรฟ์ตัวใดตัวหนึ่งล้มเหลว คุณจะต้องกู้คืนข้อมูลในไดรฟ์ทั้งสี่ด้วย

RAID 1 RAID 1 ใช้การมิเรอร์ข้อมูล/ดูเพล็กซ์โดยสร้างสำเนาที่สองของข้อมูลบนดิสก์แยกต่างหากสำหรับแต่ละดิสก์ในอาร์เรย์ การดูเพล็กซ์ นอกจากข้อมูลบนดิสก์แล้ว ยังทำซ้ำการ์ดอะแดปเตอร์และสายเคเบิล ทำให้มีความซ้ำซ้อนมากยิ่งขึ้น วิธีการจัดเก็บข้อมูลสองชุดเป็นวิธีที่เชื่อถือได้ในการใช้ระบบย่อยของดิสก์ที่ทนทานต่อข้อผิดพลาด และพบว่ามีการใช้งานอย่างกว้างขวางในสถาปัตยกรรมสมัยใหม่

RAID 2 RAID 2 กระจายข้อมูลบนดิสก์ของอาร์เรย์ทีละบิต: บิตแรกเขียนบนดิสก์แรก บิตที่สองเขียนบนดิสก์ที่สอง และอื่นๆ ความซ้ำซ้อนมีให้โดยดิสก์เพิ่มเติมหลายแผ่นซึ่งมีการเขียนรหัสการแก้ไขข้อผิดพลาด การใช้งานนี้มีราคาแพงกว่าเนื่องจากต้องใช้โอเวอร์เฮดที่ซ้ำซ้อนมากขึ้น: อาร์เรย์ที่มีดิสก์หลัก 16 ถึง 32 ดิสก์ต้องมีดิสก์เพิ่มเติมสามแผ่นเพื่อจัดเก็บรหัสแก้ไข RAID 2 ให้ประสิทธิภาพและความน่าเชื่อถือสูง แต่การใช้งานนั้นจำกัดเฉพาะตลาดคอมพิวเตอร์เพื่อการวิจัยเป็นหลัก เนื่องจากความต้องการพื้นที่ดิสก์ขั้นต่ำที่สูง ไฟล์เซิร์ฟเวอร์เครือข่ายไม่ได้ใช้วิธีนี้ในขณะนี้

RAID 3 RAID 3 กระจายข้อมูลบนดิสก์ของอาร์เรย์ไบต์ทีละไบต์: ไบต์แรกเขียนบนดิสก์แรก ไบต์ที่สองเขียนบนดิสก์ที่สอง และอื่น ๆ ความซ้ำซ้อนจัดเตรียมดิสก์เพิ่มเติมหนึ่งดิสก์ ซึ่งเขียนผลรวมของ data modulo 2 (XOR) สำหรับแต่ละดิสก์หลัก ด้วยวิธีนี้ RAID 3 จะแบ่งเร็กคอร์ดไฟล์ข้อมูล จัดเก็บไว้บนดิสก์หลายตัวพร้อมกัน และให้การอ่านและเขียนที่รวดเร็วมาก ส่วน XOR บนไดรฟ์รองสามารถตรวจพบความล้มเหลวของระบบย่อยของดิสก์ และซอฟต์แวร์พิเศษจะกำหนดว่าไดรฟ์ใดในอาร์เรย์ที่ล้มเหลว การใช้การกระจายข้อมูลแบบไบต์ช่วยให้สามารถอ่านหรือเขียนข้อมูลจากดิสก์หลายแผ่นพร้อมกันสำหรับไฟล์ที่มีบันทึกที่ยาวมากได้ สามารถดำเนินการอ่านหรือเขียนได้ครั้งละหนึ่งรายการเท่านั้น

RAID 4 RAID 4 นั้นคล้ายกับ RAID 3 เว้นแต่ว่าข้อมูลจะถูกสไทรพ์ข้ามดิสก์ในบล็อก ดิสก์เพิ่มเติมหนึ่งแผ่นยังใช้เพื่อจัดเก็บเซ็กเมนต์ XOR การใช้งานนี้มีประโยชน์สำหรับไฟล์ที่มีการเขียนสั้นมากและความถี่ของการอ่านสูงกว่าการเขียน เนื่องจากสามารถอ่านได้หลายครั้งพร้อมกันด้วยขนาดบล็อกที่ถูกต้องบนดิสก์ อย่างไรก็ตาม อนุญาตให้เขียนได้ครั้งละหนึ่งรายการเท่านั้น เนื่องจากการดำเนินการเขียนทั้งหมดใช้ไดรฟ์รองเดียวกันในการคำนวณเช็คซัม

RAID 5 RAID 5 เช่นเดียวกับ RAID 4 ใช้การกระจายข้อมูลแบบบล็อกต่อบล็อก แต่เซ็กเมนต์ XOR ถูกกระจายไปทั่วดิสก์ทั้งหมดในอาร์เรย์ สิ่งนี้ทำให้คุณสามารถดำเนินการเขียนหลายรายการพร้อมกันได้ RAID 5 ยังมีประโยชน์สำหรับไฟล์การเขียนแบบสั้นอีกด้วย

การย้ายถิ่นแบบสด

โดยเฉพาะอย่างยิ่ง กลยุทธ์การย้ายข้อมูลแบบสด ช่วยให้คุณสามารถจัดเก็บข้อมูลที่ใช้งานมากที่สุดใน RAID 1 ซึ่งมีประสิทธิภาพสูงสุด และข้อมูลที่ใช้งานน้อยกว่าใน RAID 5 ที่ถูกกว่า ในระบบส่วนใหญ่ ข้อมูลที่ใช้งานจริงเป็นส่วนเล็ก ๆ ของทั้งหมด ข้อมูลที่เก็บไว้ ดังนั้น ข้อมูลจำนวนมากจะถูกจัดเก็บบน RAID 5 เทคโนโลยีนี้ช่วยให้ผู้ดูแลระบบมีข้อดีสองประการ อย่างแรก มันช่วยปลดปล่อยพวกเขาจากความเจ็บปวดจากการคิดว่าจะเลือกระดับ RAID ใด ประการที่สอง ระบบย่อยของดิสก์จะปรับประสิทธิภาพและต้นทุนของพื้นที่จัดเก็บดิสก์ให้เหมาะสมอย่างต่อเนื่อง เช่นเดียวกับกรณีที่ผู้ดูแลระบบใช้เวลาทำงานทั้งหมดเพื่อปรับแต่งระบบ

คุณสมบัติของการใช้งาน RAID-S:

RAID-S คำนวณรหัสแก้ไขข้อผิดพลาดซ้ำซ้อนที่ระดับไดรเวอร์ดิสก์ ไม่ใช่ที่ระดับคอนโทรลเลอร์ของระบบย่อย ซึ่งจะทำให้คอนโทรลเลอร์หลุดพ้นจากการประมวลผลคำขอ I / O และด้วยเหตุนี้จึงช่วยปรับปรุงประสิทธิภาพของระบบย่อยของดิสก์

ใน RAID-S ข้อมูลจะไม่ถูกแบ่งพาร์ติชั่นระหว่างฟิสิคัลดิสก์เหมือนกับในการใช้งาน RAID แบบดั้งเดิม แต่จะไม่ถูกแตะต้องบนดิสก์ นี้ช่วยให้คุณใช้การตรวจสอบที่มีอยู่และการตั้งค่าระบบย่อย I / O

โดยไม่ต้องอบรมพนักงานเพิ่มเติม

เนื่องจากข้อมูลไม่ได้ถูกแบ่งระหว่างดิสก์ แม้ว่าหลายดิสก์จะล้มเหลวพร้อมกัน ข้อมูลบนโวลุ่มที่เหลือในกลุ่ม RAID-S จะยังสามารถใช้ได้กับแอปพลิเคชันบนเครื่องโฮสต์

RAID-S ใช้เทคโนโลยีขั้นสูงและเตรียมพร้อมสำหรับการรวมเทคโนโลยีในอนาคตอย่างง่ายดาย ปกป้องการลงทุนระยะยาวของผู้ใช้

วัสดุแบ่งออกเป็นสามส่วน: A - ทฤษฎี, B - ปฏิบัติ, C - การสร้างแฟลชไดรฟ์มัลติบูต

ก. ทฤษฎีทั่วไป (นิยม).

1. เตารีด.

อุปกรณ์ทางกายภาพทั้งหมดที่เราใช้ทุกวันเพื่อเก็บข้อมูล (HDD, CD-ROM, แฟลชไดรฟ์ และแม้แต่ฟลอปปี้) เป็นอุปกรณ์ I/O แบบบล็อก พวกเขาสามารถเชื่อมต่อกับคอมพิวเตอร์ผ่านอินเทอร์เฟซต่างๆ: IDE, SATA, eSATA, USB ระบบปฏิบัติการจัดเตรียมวิธีที่โปร่งใสเพียงวิธีเดียวสำหรับผู้ใช้และโปรแกรมเมอร์ซอฟต์แวร์แอปพลิเคชันในการอ่าน/เขียนข้อมูลจาก/ไปยังสื่อเหล่านี้

ไดรเวอร์สื่อสารโดยตรงกับฮาร์ดแวร์ ไดรเวอร์คือโปรแกรมที่โหลดเข้าสู่ระบบปฏิบัติการ เป็นเลเยอร์ระหว่างระบบปฏิบัติการและอุปกรณ์ ซึ่งแสดงถึงระบบปฏิบัติการที่มีอินเทอร์เฟซการเขียนโปรแกรมมาตรฐานสำหรับอุปกรณ์บล็อก I / O

2. ข้อมูลบนฟิสิคัลดิสก์

อุปกรณ์เหล่านี้เรียกว่าอุปกรณ์บล็อกเนื่องจากมีการเขียนและอ่านข้อมูลในบล็อก (ส่วนกลุ่ม) ที่มีขนาดคงที่ ขนาดบล็อกมีหลายขนาด 512 ไบต์ วิธีการบล็อกเป็นสิ่งจำเป็นเพื่อให้แน่ใจว่าระบบย่อยดิสก์มีความเร็วสูง

ดิสก์ได้รับการฟอร์แมต (แบ่งพาร์ติชัน) ที่ระดับต่ำ (ที่โรงงาน) ดิสก์ประกอบด้วยกระบอกสูบ ทรงกระบอกเป็นวงกลมบนจานดิสก์ กระบอกสูบแรกตั้งอยู่ตรงกลางของจานดิสก์ อันสุดท้ายอยู่ที่ขอบด้านนอก แต่ละกระบอกแบ่งออกเป็นภาค เซกเตอร์จัดระเบียบบล็อกบนดิสก์ นอกจากตัวข้อมูลเองแล้ว ข้อมูลยังถูกบันทึกในบล็อกเพื่อควบคุมข้อผิดพลาด ตัวควบคุมภายในฮาร์ดไดรฟ์ทำงานกับข้อมูลนี้และไม่สามารถมองเห็นได้จากภายนอก ไดรเวอร์ส่งคำสั่งไปยังตัวควบคุมดิสก์ที่ระดับ "อ่าน 10 บล็อก 10 กระบอก 20 เซกเตอร์"

ข้อมูลเพย์โหลดทั้งหมดที่เขียนลงสื่อถูกจัดเป็นส่วนๆ ใน Windows แต่ละพาร์ติชันจะแสดงเป็นไดรฟ์แบบลอจิคัล (C, D, E, ...) ในสื่อแบบถอดได้ (แฟลชไดรฟ์, ซีดี, ฟลอปปี) ตามกฎแล้วจะมีการสร้างพาร์ติชั่นเดียวบนฮาร์ดไดรฟ์ภายในในทางตรงกันข้ามมักจะมีหลายพาร์ติชั่น ข้อมูลในพาร์ติชันถูกจัดระเบียบในระบบไฟล์

แต่ละพาร์ติชั่นสามารถกำหนดขนาดบล็อกของตัวเอง - ขนาดคลัสเตอร์ได้อย่างอิสระ ปรับสมดุลความเร็ว/เศรษฐกิจ บล็อกคือหน่วยที่เล็กที่สุดของพื้นที่ดิสก์ที่สามารถระบุแอดเดรสได้ คลัสเตอร์รวมหลายบล็อก - นี่คือหน่วยที่กำหนดแอดเดรสขั้นต่ำในพาร์ติชัน

ดังนั้น ลำดับชั้นเชิงตรรกะต่อไปนี้จึงถูกสร้างขึ้น (จากล่างขึ้นบน): บล็อก เซกเตอร์ กระบอก - คลัสเตอร์ - ส่วน - ไฟล์ ไดเร็กทอรี

ในระบบไฟล์ส่วนใหญ่ ไฟล์สามารถครอบครองคลัสเตอร์ได้ตั้งแต่หนึ่งคลัสเตอร์ขึ้นไป ดังนั้น หากขนาดไฟล์น้อยกว่าขนาดคลัสเตอร์ ไฟล์นั้นจะครอบครองทั้งคลัสเตอร์ ไฟล์ใดๆ บนดิสก์จะได้รับการจัดสรรจำนวนไบต์ที่มีหลายขนาดคลัสเตอร์ ระบบไฟล์บางระบบสามารถแบ่งคลัสเตอร์หนึ่งกลุ่มออกเป็นหลายไฟล์ (การแพ็ก) ได้ แต่นี่เป็นข้อยกเว้น (สำหรับตอนนี้) ดังนั้น ยิ่งขนาดคลัสเตอร์ใหญ่ขึ้นเท่าใด ความเร็วก็จะสูงขึ้นและพื้นที่ว่างมากขึ้นเท่านั้นในคลัสเตอร์ที่บรรจุครึ่งหนึ่ง

3. เลย์เอาต์ฟิสิคัลดิสก์

ขนาดพาร์ติชั่นยังวัดเป็นบล็อค นั่นคือเหตุผลที่เมื่อแบ่งพาร์ติชั่นดิสก์ โปรแกรมจะแก้ไขขนาดที่แสดงเป็นไบต์ได้เล็กน้อย

เนื่องจากดิสก์สามารถมีได้หลายพาร์ติชั่น จึงจำเป็นต้องแสดงไว้ที่ใดที่หนึ่งพร้อมกับขีดจำกัดและคุณสมบัติของแต่ละพาร์ติชั่น สำหรับสิ่งนี้จะใช้ตารางพาร์ติชั่นซึ่งอยู่ที่จุดเริ่มต้นของฟิสิคัลดิสก์ (จุดเริ่มต้นของดิสก์คือบล็อกแรกตามที่อยู่) ในกรณีคลาสสิก มันเป็นส่วนหนึ่งของ MBR (มาสเตอร์บูตเรคคอร์ด) ซึ่งครอบครองบล็อกแรกทั้งหมด ตารางพาร์ติชั่นทั้งหมดถูกจัดสรร 64 ไบต์ แต่ละรายการในตารางประกอบด้วยที่อยู่ของจุดเริ่มต้นและจุดสิ้นสุดของพาร์ติชั่น ประเภทพาร์ติชั่น จำนวนเซกเตอร์ในพาร์ติชั่น และแฟล็ก "ไม่ว่าง" ของพาร์ติชั่น และใช้พื้นที่ 16 ไบต์ ดังนั้น จำนวนพาร์ติชั่นสูงสุดบนดิสก์จึงถูกจำกัดไว้ที่สี่พาร์ติชั่น (16 × 4 = 64)

มันเกิดขึ้นในอดีต แต่เมื่อเวลาผ่านไปเห็นได้ชัดว่า 4 ส่วนนั้นไม่เพียงพอเสมอไป พบวิธีแก้ไขปัญหาแล้ว พาร์ติชันที่ถูกทำเครื่องหมายในส่วนหัวของดิสก์ (ใน MBR) เรียกว่า หลัก (หลัก) พวกเขายังควรจะรวมได้ถึง 4 นอกจากนี้ยังมีการแนะนำแนวคิดของส่วนเพิ่มเติม (ขยาย) พาร์ติชันเสริมประกอบด้วยพาร์ติชันย่อยตั้งแต่หนึ่งพาร์ติชันขึ้นไป และไม่มีระบบไฟล์ ตัวเขาเองเป็นส่วนหลักที่เต็มเปี่ยม

เนื่องจากพาร์ติชั่นย่อยของพาร์ติชั่นเสริมไม่อยู่ในตารางพาร์ติชั่นดิสก์ จึงไม่สามารถทำเครื่องหมายเป็นบู๊ตได้ พาร์ติชั่นที่สามารถบู๊ตได้คือพาร์ติชั่นที่ระบบปฏิบัติการเริ่มบู๊ต มันถูกตั้งค่าสถานะในรายการตารางพาร์ทิชัน ดังนั้นสามารถทำเครื่องหมายได้เพียงหนึ่งใน 4 ส่วนหลักเท่านั้น พาร์ติชันเสริมไม่สามารถบูตได้เนื่องจากไม่มีระบบไฟล์

มาร์กอัปของส่วนที่ขยายได้อธิบายไว้ในตอนเริ่มต้น เมื่อเปรียบเทียบกับ MBR จะมี EBR (Extended boot record) อยู่ในภาคแรก อธิบายเค้าโครงของไดรฟ์แบบลอจิคัลของพาร์ติชันเสริมนี้

ออปติคัลดิสก์และแฟลชไดรฟ์มักจะมีพาร์ติชั่นเพียงพาร์ติชั่นเดียว เนื่องจากการแบ่งพาร์ติชั่นที่เล็กกว่านั้นไม่สมเหตุสมผล โดยปกติเมื่อเบิร์นซีดี ระบบไฟล์ ISO 9660 จะถูกใช้ อิมเมจดิสก์ที่มีระบบไฟล์นี้เรียกว่าอิมเมจ ISO มักใช้แยกจากฟิสิคัลดิสก์เป็นคอนเทนเนอร์สำหรับการถ่ายโอนข้อมูล เนื่องจากอิมเมจใดๆ ก็ตามเป็นสำเนาของสื่อจริงในระดับบิต

4. ระบบไฟล์

พาร์ติชั่นดิสก์แต่ละพาร์ติชั่นสำหรับจัดเก็บข้อมูล (นั่นคือ พาร์ติชั่นทั้งหมดยกเว้นพาร์ติชั่นเสริม) ถูกฟอร์แมตตามระบบไฟล์บางระบบ การจัดรูปแบบเป็นกระบวนการของการสร้างโครงสร้างระบบไฟล์ในพื้นที่บางส่วนบนดิสก์ - พาร์ติชั่น ระบบไฟล์จัดระเบียบข้อมูลผู้ใช้ในรูปแบบของไฟล์ที่อยู่ในลำดับชั้นของไดเร็กทอรี (โฟลเดอร์, ไดเร็กทอรี)

โครงสร้างของไดเร็กทอรีและไฟล์ในพาร์ติชั่นมีการอธิบายแบบคลาสสิกในตารางไฟล์ โดยทั่วไป ตารางจะใช้พื้นที่บางส่วนที่จุดเริ่มต้นของส่วน หลังจากตารางข้อมูลจะถูกเขียนเอง ดังนั้น ระบบจึงถูกสร้างขึ้นโดยอธิบายโครงสร้างแยกจากกัน และข้อมูล (ไฟล์) จะถูกจัดเก็บแยกจากกัน

หากไฟล์ถูกลบออกจากดิสก์ ไฟล์นั้นจะถูกลบออกจากตารางไฟล์ พื้นที่ว่างบนดิสก์ถูกทำเครื่องหมายว่าว่าง แต่ไม่มีการชำระร่างกายของสถานที่นี้ เมื่อเขียนแผ่นดิสก์ ข้อมูลจะถูกเขียนลงในพื้นที่ว่าง ดังนั้น หากคุณสร้างไฟล์ใหม่หลังจากลบไปแล้ว มีความเป็นไปได้ที่ไฟล์นั้นจะถูกเขียนไปยังตำแหน่งของไฟล์ที่ถูกลบ ด้วยการจัดรูปแบบด่วน (ใช้ในกรณีส่วนใหญ่) ของพาร์ติชัน เฉพาะตารางเท่านั้นที่จะถูกเขียนทับด้วย ขั้นตอนในการกู้คืนไฟล์หลังจากลบหรือฟอร์แมตจะขึ้นอยู่กับคุณสมบัติเหล่านี้

ระหว่างการทำงาน ความเสียหายทางกายภาพอาจเกิดขึ้นบนดิสก์ บางบล็อกอาจอ่านไม่ได้ บล็อคเหล่านี้เรียกว่า "bads" (เซกเตอร์เสีย) หากดิสก์เสียขณะอ่านดิสก์ ข้อผิดพลาด I/O จะเกิดขึ้น เนื้อหาบางส่วนในไฟล์หรือบางส่วนของตารางไฟล์อาจสูญหาย ทั้งนี้ขึ้นอยู่กับตำแหน่งที่บล็อกเสียปรากฏขึ้นและจำนวนบล็อกที่ปรากฏ

เมื่อพยายามเขียนไปยังบล็อกที่เสียหาย ตัวควบคุมดิสก์จะต้องระบุปัญหาและจัดสรรตำแหน่งใหม่บนพื้นผิวดิสก์สำหรับบล็อกนี้ และลบที่เก่าออกจากการใช้งาน (ย้ายบล็อกที่เสียหาย) มันทำสิ่งนี้อย่างมองไม่เห็นกับระบบปฏิบัติการและไดรเวอร์ด้วยตัวมันเอง สิ่งนี้จะเกิดขึ้นตราบใดที่มีพื้นที่สำรองสำหรับการโอน

5. ทำงานกับดิสก์

ระบบปฏิบัติการให้ความสามารถในการทำงานกับดิสก์ในระดับไฟล์ พาร์ติชั่น และอุปกรณ์ การใช้งานเฉพาะของการเข้าถึงแต่ละระดับขึ้นอยู่กับระบบปฏิบัติการเฉพาะ แต่ในกรณีใด ๆ สิ่งทั่วไปคือสามารถเข้าถึงฟิสิคัลดิสก์และพาร์ติชั่นใด ๆ ได้ในลักษณะเดียวกับไฟล์ไบนารีปกติ นั่นคือ คุณสามารถเขียนข้อมูลลงไป คุณสามารถอ่านข้อมูลจากมันได้ คุณสมบัติดังกล่าวมีประโยชน์อย่างยิ่งสำหรับการสร้างและกู้คืนภาพดิสก์ การโคลนดิสก์

ในระบบปฏิบัติการ UNIX อุปกรณ์จัดเก็บข้อมูลทั้งหมดจะแสดงเป็นไฟล์ในไดเร็กทอรี /dev:

sda, sdb, sdc, ... - ฟิสิคัลดิสก์ (HDD รวมถึงภายนอก, แฟลชไดรฟ์, ไดรฟ์ IDE);

fd0, fd1 - ล้มเหลว

พาร์ติชั่นในแต่ละดิสก์มีให้เลือกเป็น sda1, sda2, sd3, ...

ดิสก์มีหมายเลขตามลำดับที่ BIOS เห็น การกำหนดหมายเลขพาร์ติชั่น - ตามลำดับที่สร้างพาร์ติชั่นบนดิสก์

ในการสร้างรูปภาพ (รูปภาพเป็นสำเนาข้อมูลทีละบิตที่วางอยู่บนดิสก์หรือพาร์ติชัน) ของดิสก์ทั้งหมด (ตัวอย่างเช่น อันแรกตาม BIOS - sda) คุณต้องลบข้อมูลจาก / dev / sda ไปยังไฟล์อื่น ๆ ที่สร้างขึ้นเป็นพิเศษสำหรับรูปภาพโดยใช้เนื้อหาไฟล์โปรแกรมคัดลอกตามลำดับ ในการเขียนรูปภาพลงในไฟล์ คุณต้องใช้โปรแกรมเดียวกันเพื่อลบข้อมูลออกจากรูปภาพใน /dev/sda โดยการเปรียบเทียบ คุณสามารถสร้าง/กู้คืนอิมเมจของพาร์ติชัน (เช่น อันแรกบนดิสก์แรก - sda1) โดยการเข้าถึง /dev/sda1 แทน /dev/sda

6. การติดตั้ง

ในการ "เปลี่ยน" อุปกรณ์ดิสก์ให้เป็นชุดของไฟล์และไดเร็กทอรีที่สามารถเข้าถึงได้ จะต้องติดตั้งอุปกรณ์นั้น ไม่มีสิ่งที่เรียกว่าเมานต์บน Windows ที่นั่น พาร์ติชันเชื่อมต่อกับไดรฟ์แบบลอจิคัล (C:, D:, E, ...) ข้อมูลเกี่ยวกับตัวอักษรที่จะกำหนดให้กับไดรฟ์ที่จัดเก็บไว้ในระบบปฏิบัติการ

ใน UNIX แนวคิดของการติดตั้งเป็นพื้นฐานในการทำงานกับดิสก์และให้ความยืดหยุ่นมากกว่า Windows การเมานท์เป็นกระบวนการเชื่อมโยงแหล่งที่มาของอิมเมจดิสก์ (ไม่ว่าจะเป็นดิสก์เองหรือไฟล์ที่มีอิมเมจ) กับไดเร็กทอรีบางตัวในระบบไฟล์ UNIX ระบบไฟล์ใน UNIX เริ่มต้นจากจุดหนึ่ง - จากไดเร็กทอรีราก (/) และไม่มีไดรฟ์แบบลอจิคัล C, D, E

เมื่อเริ่มต้นการบู๊ตของระบบปฏิบัติการตระกูล UNIX พาร์ติชั่นดิสก์ที่ทำเครื่องหมายว่าเป็นรูท (รูท) จะถูกเมาต์ในไดเร็กทอรีรูท / ไดเร็กทอรีบริการ OS ที่อยู่ในรูทของระบบไฟล์ควรถูกสร้างขึ้นบนพาร์ติชั่นดิสก์ สามารถติดตั้งพาร์ติชั่นอื่นๆ ได้ หรือไฟล์สามารถเขียนโดยตรงไปยังพาร์ติชั่นหลัก (ต่อเชื่อมกับ /)

จุดสำคัญคือที่มาของดิสก์อิมเมจ (อุปกรณ์บล็อก ไฟล์อิมเมจ หรือไดเร็กทอรีของระบบไฟล์ที่ติดตั้งอยู่แล้ว) สามารถติดตั้งกับไดเร็กทอรีใดก็ได้ที่ระดับการซ้อนของระบบไฟล์ใดๆ ที่ขึ้นต้นด้วย / ดังนั้น โลจิคัลพาร์ติชันที่แตกต่างกันของฟิสิคัลดิสก์จึงถูกแสดงโดยไดเร็กทอรีในระบบไฟล์เดียว ซึ่งต่างจากระบบไฟล์ที่แยกจากกันของโลจิคัลดิสก์ที่แตกต่างกันใน Windows (โดยที่แต่ละดิสก์ถือว่าเป็นระบบไฟล์อิสระที่มีรูทของตัวเอง)

ในการติดตั้ง คุณต้องระบุระบบไฟล์อิมเมจ ตัวเลือกการเมาต์ และไดเร็กทอรีที่จะเชื่อมโยง

ด้วยความยืดหยุ่นนี้ คุณจึงสามารถผูกไดเรกทอรีหนึ่งกับหลายตำแหน่งในระบบไฟล์ สร้างดิสก์อิมเมจและติดตั้งโดยไม่ต้องเขียนลงดิสก์ เปิดอิมเมจ ISO และทั้งหมดนี้ทำได้โดยไม่ต้องใช้ยูทิลิตี้ของบุคคลที่สาม

7. MBR - พื้นที่บูต

ที่จุดเริ่มต้นของฟิสิคัลดิสก์ มักจะมี MBR (มาสเตอร์บูตเรคคอร์ด) นี่คือพื้นที่บูตของดิสก์ เมื่อคอมพิวเตอร์บูทขึ้น ไบออสจะกำหนดว่าดิสก์ใดเป็นดิสก์หลัก (หลัก) และค้นหา MBR บนดิสก์ หากพบว่ามีการโอนการควบคุม ถ้าไม่เช่นนั้น ข้อผิดพลาดจะปรากฏขึ้นโดยระบุว่าไม่พบดิสก์สำหรับบูต

ใน MBR นอกเหนือจากตารางพาร์ติชั่น (ที่อธิบายไว้ข้างต้น) ยังมีรหัสโปรแกรมที่โหลดเข้าสู่หน่วยความจำและดำเนินการ เป็นโปรแกรมนี้ที่ควรกำหนดพาร์ติชันสำหรับเริ่มระบบบนดิสก์และถ่ายโอนการควบคุมไป การถ่ายโอนการควบคุมเกิดขึ้นในลักษณะเดียวกัน: บล็อกแรก (512 ไบต์) ของพาร์ติชันสำหรับเริ่มระบบจะอยู่ใน RAM และดำเนินการ ประกอบด้วยรหัสโปรแกรมที่เริ่มต้นการบูตระบบปฏิบัติการ

เนื่องจากการควบคุมจาก BIOS ถูกถ่ายโอนไปยังโปรแกรมที่บันทึกไว้ในดิสก์เมื่อเปิดเครื่องคอมพิวเตอร์ จึงเป็นไปได้ที่จะทำให้การเลือกพาร์ติชันสำหรับเริ่มระบบมีความยืดหยุ่นมากขึ้น นี่คือสิ่งที่ตัวโหลด GRUB และ LILO ซึ่งใช้กันอย่างแพร่หลายในโลก UNIX ทำ ขณะนี้ไม่มีประเด็นในการใช้ bootloader ล่าสุดในคอมพิวเตอร์สมัยใหม่ ด้วย GRUB คุณสามารถให้ผู้ใช้เลือกได้ว่าต้องการบูตพาร์ติชันใดและอย่างไร

รหัส GRUB ใหญ่เกินไปที่จะใส่ลงใน MBR ดังนั้นจึงถูกติดตั้งบนพาร์ติชั่นแยกต่างหาก (โดยปกติคือพาร์ติชั่นที่ติดตั้งบน /boot) ด้วยระบบไฟล์ FAT, FFS หรือ Ext2 MBR มีรหัสที่โหลดรหัส GRUB จากพาร์ติชั่นเฉพาะและโอนการควบคุมไป

ตัวด้วงเองหรือด้วยความช่วยเหลือของผู้ใช้เป็นตัวกำหนดว่าควรบูตพาร์ติชั่นใด ในกรณีของพาร์ติชั่น Winsows การควบคุมจะถูกโอนไปยังพาร์ติชั่นในลักษณะเดียวกับที่ใช้กับ MBR ปกติ ในกรณีของ Linux โปรแกรมโหลดบูตจะดำเนินการที่ซับซ้อนมากขึ้น มันโหลดเคอร์เนล OS ลงในหน่วยความจำและโอนการควบคุมไป

การสำรองข้อมูลพื้นที่บูตของดิสก์นั้นง่ายพอ ๆ กับการสำรองดิสก์ทั้งหมดหรือพาร์ติชั่นเดียว สิ่งสำคัญที่สุดคือ MBR ใช้พื้นที่ 512 ไบต์แรกของดิสก์ /dev/sda ดังนั้น สำหรับการสำรองข้อมูล MBR คุณต้องลบ 512 ไบต์แรกของ /dev/sda ลงในไฟล์ และในการคืนค่า ตรงกันข้าม คุณต้องลบไฟล์ลงใน /dev/sda

เมื่อเราพูดถึงทรัพยากรระบบย่อยของดิสก์ มีสามทรัพยากร: จำนวนพื้นที่ ความเร็วในการอ่านและเขียนเป็น MB / s และความเร็วในการอ่าน-เขียนในจำนวนการดำเนินการอินพุต / เอาต์พุตต่อวินาที (อินพุต / เอาต์พุตต่อ ประการที่สอง IOPS หรือเพียงแค่ I /O)

มาพูดถึงปริมาณกันก่อน ผมจะให้ข้อพิจารณาที่ควรเป็นแนวทางและตัวอย่างการคำนวณ

ข้อควรพิจารณามีดังนี้

พื้นที่ดิสก์ถูกครอบครองโดยไฟล์ดิสก์ของเครื่องเสมือนเอง ดังนั้นคุณต้องเข้าใจว่าพวกเขาต้องการพื้นที่เท่าใด

หากเราวางแผนที่จะใช้ธินดิสก์สำหรับ VM ทั้งหมดหรือบางส่วน เราควรวางแผนโวลุ่มเริ่มต้นและการเติบโตที่ตามมา (ต่อไปนี้ ดิสก์แบบบางหมายถึงประเภทไฟล์ vmdk ที่สอดคล้องกัน กล่าวคือ ฟังก์ชันการจัดเตรียมแบบบางใน ESX (i ) การใช้งาน) ความจริงก็คือว่าฟังก์ชันการจัดเตรียมแบบบางสามารถนำไปใช้กับระบบจัดเก็บข้อมูลโดยไม่คำนึงถึง ESX(i) และฉันไม่ได้หมายถึงฟังก์ชันการทำงานของระบบจัดเก็บข้อมูล)

ตามค่าเริ่มต้น สำหรับแต่ละ VM ไฮเปอร์ไวเซอร์จะสร้างไฟล์เพจที่มีขนาดเท่ากับ RAM ไฟล์เพจนี้จะอยู่ในโฟลเดอร์ VM (ค่าเริ่มต้น) หรือใน LUN แยกต่างหาก

หากคุณวางแผนที่จะใช้สแน็ปช็อต คุณควรวางแผนสถานที่สำหรับสแน็ปช็อตด้วย ข้อควรพิจารณาต่อไปนี้สามารถใช้เป็นจุดเริ่มต้น:

หากสแน็ปช็อตจะมีอยู่ในช่วงเวลาสั้นๆ หลังจากสร้าง ตัวอย่างเช่น สำหรับเวลาของการสำรองข้อมูลเท่านั้น เราจะสำรองขนาดดิสก์ VM ไว้สิบเปอร์เซ็นต์

หากสแนปชอตจะถูกใช้โดยมีความเข้มเฉลี่ยหรือคาดเดาไม่ได้ ก็ควรวางขนาดดิสก์ VM ประมาณ 30%

หากมีการใช้สแน็ปช็อตสำหรับ VM (ซึ่งเกี่ยวข้องในสถานการณ์ที่ใช้ VM สำหรับการทดสอบและการพัฒนา) ปริมาณที่ใช้งานได้อาจมากกว่าขนาดปกติของดิสก์เสมือนหลายเท่า ในกรณีนี้ เป็นการยากที่จะให้คำแนะนำที่แน่นอน แต่การเพิ่มขนาดของแต่ละ VM เป็นจุดเริ่มต้นได้ (ต่อไปนี้ สแนปชอตหมายถึงฟังก์ชันที่สอดคล้องกันของ ESX(i) ความจริงก็คือว่าสแน็ปช็อตสามารถนำไปใช้กับระบบสตอเรจโดยไม่ขึ้นกับ ESX(i) และฉันไม่ได้หมายถึงการทำงานของระบบสตอเรจ)

ตัวอย่างสูตรมีลักษณะดังนี้:

จำนวนพื้นที่สำหรับกลุ่ม VMs = จำนวน VMs x (ขนาดดิสก์ x T +

ขนาดดิสก์ x S + ขนาดหน่วยความจำ - ขนาดหน่วยความจำ x R)

T - ค่าสัมประสิทธิ์ของดิสก์บาง หากไม่ได้ใช้ดิสก์ดังกล่าว จะเท่ากับ 1 หากใช่ เป็นการยากที่จะให้ค่าประมาณที่เป็นนามธรรม ขึ้นอยู่กับลักษณะของแอปพลิเคชันใน VM โดยพื้นฐานแล้ว ดิสก์แบบบางจะใช้พื้นที่จัดเก็บน้อยกว่าขนาดปกติของดิสก์ ดังนั้น - สัมประสิทธิ์นี้แสดงให้เห็นว่าสัดส่วนของขนาดที่ระบุนั้นถูกครอบครองโดยดิสก์ของเครื่องเสมือน

S คือขนาดของสแนปชอต 10/30/200 เปอร์เซ็นต์ ขึ้นอยู่กับระยะเวลาในการใช้งานต่อเนื่อง

R คือเปอร์เซ็นต์ของหน่วยความจำที่สงวนไว้ หน่วยความจำที่สงวนไว้ไม่พอดีกับไฟล์ swap ไฟล์ swap จะถูกสร้างขึ้นในขนาดที่เล็กกว่า ขนาดเท่ากับ: จำนวนหน่วยความจำ VM ลบด้วยจำนวนหน่วยความจำที่สงวนไว้

ข้อมูลที่ป้อนโดยประมาณ เช่น ดูตาราง 1.3.

ตาราง 1.3. ข้อมูลสำหรับการวางแผนโวลุ่มของระบบย่อยของดิสก์

เราได้รับค่าประมาณของปริมาณที่ต้องการ:

กลุ่มโครงสร้างพื้นฐาน - 15 x (20 + 20 x 10% + 2 - 2 x 0) = 360 GB;

เซิร์ฟเวอร์แอปพลิเคชัน - 20 x (40 + 40 x 10% + 2 - 2 x 0) = 920 GB;

เซิร์ฟเวอร์ที่สำคัญ - 10 x (100 + 100 x 10% + 6 - 6 x 0.5) = 1130 GB;

ทดสอบและชั่วคราว - 20 x (20 x 30% + (20 x 30%) x 200% + 2 - 2 x 0) = = 400 GB

ดังนั้น เราจึงสามารถสร้าง LUN สองตัวได้ครั้งละ 1.4 TB และแจกจ่ายเครื่องเสมือนระหว่างกันโดยประมาณ หรือสร้าง 4-5 LUN อันละ 600800 GB และวางเครื่องของกลุ่มต่างๆ บน LUN ที่ต่างกัน ทั้งสองตัวเลือก (และตัวเลือกที่อยู่ตรงกลาง) เป็นที่ยอมรับได้ การเลือกระหว่างตัวเลือกเหล่านี้ขึ้นอยู่กับการตั้งค่าอื่นๆ (เช่น องค์กร)

ทรัพยากรอื่นของระบบย่อยของดิสก์คือประสิทธิภาพ ในกรณีของเครื่องเสมือน ความเร็ว MB/s ไม่ใช่เกณฑ์ที่เชื่อถือได้ เนื่องจากเมื่อมี VM จำนวนมากเข้าถึงดิสก์เดียวกัน การเข้าถึงจะไม่สอดคล้องกัน สำหรับโครงสร้างพื้นฐานเสมือน คุณลักษณะที่สำคัญกว่าคือจำนวนการดำเนินการอินพุต / เอาต์พุต (IOPS, Input / Output ต่อวินาที) ระบบย่อยดิสก์ของโครงสร้างพื้นฐานของเราต้องอนุญาตการดำเนินการเหล่านี้มากกว่าที่เครื่องเสมือนร้องขอ

เส้นทางของการเข้าถึงระบบปฏิบัติการของแขกสำหรับดิสก์จริงในกรณีทั่วไปคืออะไร:

1. guest OS ส่งคำขอไปยังไดรเวอร์คอนโทรลเลอร์ SAS/SCSI (ซึ่งจำลองไฮเปอร์ไวเซอร์สำหรับมัน)

2. ไดรเวอร์ส่งผ่านไปยังคอนโทรลเลอร์เสมือน SAS/SCSI เอง

3. ไฮเปอร์ไวเซอร์สกัดกั้น รวมกับคำขอจาก VM อื่น และส่งผ่านคิวทั่วไปไปยังไดรเวอร์คอนโทรลเลอร์จริง (HBA ในกรณีของ FC และฮาร์ดแวร์ iSCSI หรือคอนโทรลเลอร์อีเทอร์เน็ตในกรณีของ NFS และซอฟต์แวร์ iSCSI)

4. คนขับส่งคำขอไปยังคอนโทรลเลอร์

5. คอนโทรลเลอร์ถ่ายโอนไปยังระบบจัดเก็บข้อมูลผ่านเครือข่ายข้อมูล

6. ตัวควบคุมการจัดเก็บยอมรับคำขอ คำขอนี้เป็นการดำเนินการอ่านหรือเขียนจากโวลุ่ม LUN หรือ NFS บางตัว

7. LUN คือ "พาร์ติชันเสมือน" บนอาร์เรย์ RAID ที่ประกอบด้วยฟิสิคัลดิสก์ นั่นคือ คำขอจะถูกส่งผ่านโดยคอนโทรลเลอร์การจัดเก็บข้อมูลไปยังไดรฟ์ในอาร์เรย์RAID นั้น

คอขวดของระบบย่อยดิสก์อยู่ที่ไหน:

เป็นไปได้มากที่ระดับของฟิสิคัลดิสก์ จำนวนฟิสิคัลดิสก์ในอาเรย์ RAID มีความสำคัญ ยิ่งมีมากเท่าใด การดำเนินการอ่าน-เขียนก็จะยิ่งดีขึ้นเท่านั้น นอกจากนี้ ยิ่งดิสก์เร็วขึ้น (ในแง่ของ I/O) ก็ยิ่งดี

อาร์เรย์ RAID ระดับต่างๆ มีประสิทธิภาพที่แตกต่างกัน เป็นการยากที่จะให้คำแนะนำที่สมบูรณ์ เพราะนอกจากความเร็วแล้ว ประเภท RAID ยังแตกต่างกันในด้านราคาและความน่าเชื่อถือ อย่างไรก็ตาม ข้อควรพิจารณาพื้นฐานคือ:

RAID-10 นั้นเร็วที่สุด แต่ใช้พื้นที่ดิสก์อย่างมีประสิทธิภาพน้อยที่สุด โดยหัก 50% สำหรับการสนับสนุนความทนทานต่อข้อผิดพลาด

RAID-6 นั้นน่าเชื่อถือที่สุด แต่ประสิทธิภาพการเขียนต่ำ (30-40% ของ RAID-10 ที่การเขียน 100%) แม้ว่าการอ่านจากมันจะเร็วเท่ากับ RAID-10

RAID-5 เป็นการประนีประนอม ประสิทธิภาพการเขียนดีกว่า RAID-6 (แต่แย่กว่า RAID-10) ประสิทธิภาพการจัดเก็บข้อมูลสูงกว่า (ความจุของดิสก์เพียงแผ่นเดียวเท่านั้นที่ใช้สำหรับความทนทานต่อข้อผิดพลาด) แต่ RAID-5 ประสบปัญหาร้ายแรงที่เกี่ยวข้องกับการกู้คืนข้อมูลที่ยาวนานหลังจากเกิดความล้มเหลวของดิสก์ในกรณีของดิสก์ความจุสูงที่ทันสมัยและกลุ่ม RAID ขนาดใหญ่ ในระหว่างนั้นยังคงไม่ได้รับการป้องกันจากความล้มเหลวอื่น (เปลี่ยนเป็น RAID-0) และสูญเสียอย่างมาก ประสิทธิภาพ;

ไม่สามารถใช้ RAID-0 หรือ "RAID ที่มี Zero Fault Tolerance" เพื่อจัดเก็บข้อมูลที่มีความหมายได้

การตั้งค่าระบบจัดเก็บข้อมูล โดยเฉพาะแคชของตัวควบคุมการจัดเก็บข้อมูล การศึกษาเอกสารของระบบจัดเก็บข้อมูลมีความสำคัญต่อการกำหนดค่าและการใช้งานที่เหมาะสม

เครือข่ายข้อมูล โดยเฉพาะถ้าคุณวางแผนที่จะใช้ที่เก็บข้อมูล IP, iSCSI หรือ NFS ฉันไม่ต้องการที่จะบอกว่าไม่จำเป็นต้องใช้มัน - ระบบดังกล่าวถูกเอารัดเอาเปรียบมาเป็นเวลานานและโดยหลาย ๆ คน สิ่งที่ฉันพูดคือคุณควรพยายามตรวจสอบให้แน่ใจว่าโหลดที่ถ่ายโอนไปยังสภาพแวดล้อมเสมือนจะมีแบนด์วิดท์เครือข่ายเพียงพอกับแบนด์วิดท์ที่วางแผนไว้

ความเร็วที่เป็นผลลัพธ์ของระบบย่อยของดิสก์จะตามมาด้วยความเร็วของดิสก์และอัลกอริทึมสำหรับการเข้าถึงดิสก์แบบขนานโดยคอนโทรลเลอร์ (หมายถึงประเภทของ RAID และฟังก์ชันที่คล้ายกัน) อัตราส่วนของจำนวนการดำเนินการอ่านต่อจำนวนการดำเนินการเขียนก็มีความสำคัญเช่นกัน เราใช้อัตราส่วนนี้จากสถิติหรือจากเอกสารประกอบสำหรับแอปพลิเคชันใน VM ของเรา

ลองมาดูตัวอย่างกัน สมมติว่า VM ของเราจะสร้างโหลดได้มากถึง 1,000 IOps โดย 67% จะอ่านและ 33% - กำลังเขียน เราต้องการดิสก์จำนวนเท่าใดและในกรณีของการใช้ RAID-10 และ RAID-5

ในอาเรย์ RAID-10 ดิสก์ทั้งหมดเกี่ยวข้องกับการดำเนินการอ่านพร้อมกัน และมีเพียงครึ่งเดียวเท่านั้นที่เกี่ยวข้องกับการดำเนินการเขียน (เนื่องจากแต่ละบล็อกของข้อมูลถูกเขียนลงดิสก์สองดิสก์พร้อมกัน) ในอาร์เรย์ RAID-5 ดิสก์ทั้งหมดมีส่วนร่วมในการอ่าน แต่แต่ละบล็อกเขียนด้วยโอเวอร์เฮดที่เกี่ยวข้องกับการคำนวณและการเปลี่ยนแปลงเช็คซัม คุณสามารถนึกถึงการเขียนครั้งเดียวไปยังอาร์เรย์ RAID-5 ที่ทำให้เกิดการเขียนสี่รายการไปยังดิสก์โดยตรง

เขียน - 1,000 x 0.33% = 330 x 2 (เนื่องจากมีเพียงครึ่งหนึ่งของดิสก์ที่เกี่ยวข้องกับการเขียน) = 660 IOps

โดยรวมแล้ว เราต้องการ 1330 IOps จากดิสก์ หากเราหาร 1330 ด้วยจำนวน IOps ที่ประกาศในลักษณะประสิทธิภาพของดิสก์หนึ่งตัว เราจะได้รับจำนวนดิสก์ที่ต้องการในอาร์เรย์ RAID-10 สำหรับการโหลดที่ระบุ

การอ่าน - 1,000 x 0.67% = 670 IOps;

เขียน - 1,000 x 0.33% = 330 x 4 = 1320 IOps

โดยรวมแล้ว เราต้องการ 1990 IOps จากดิสก์

ตามเอกสารของผู้ผลิต ฮาร์ดไดรฟ์ SAS 15k หนึ่งตัวรองรับ 150-180 IOps หนึ่งไดรฟ์ SATA 7.2k - 70-100 IOps อย่างไรก็ตาม มีความเห็นว่าควรเน้นตัวเลขที่แตกต่างกันเล็กน้อย: 50-60 สำหรับ SATA และ 100-120 สำหรับ SAS

มาจบตัวอย่างกัน

เมื่อใช้ RAID-10 และ SATA เราจำเป็นต้องมีดิสก์ 22-26

เมื่อใช้ RAID-5 และ SAS เราจำเป็นต้องมีดิสก์ 16-19 ตัว

เห็นได้ชัดว่าการคำนวณที่ฉันให้นั้นค่อนข้างใกล้เคียงกัน ระบบสตอเรจใช้กลไกประเภทต่างๆ ซึ่งส่วนใหญ่เป็นการแคช เพื่อเพิ่มประสิทธิภาพการทำงานของระบบสตอเรจ แต่เพื่อเป็นจุดเริ่มต้นในการทำความเข้าใจกระบวนการกำหนดขนาดระบบย่อยของดิสก์ ข้อมูลนี้จึงมีประโยชน์

เบื้องหลังคือวิธีการรับจำนวน IOPS ที่จำเป็นสำหรับ VM และอัตราส่วนการอ่าน-เขียน สำหรับโครงสร้างพื้นฐานที่มีอยู่ (เมื่อย้ายไปยังเครื่องเสมือน) สามารถรับข้อมูลนี้ได้โดยใช้เครื่องมือรวบรวมข้อมูลพิเศษ เช่น VMware Capacity Planner สำหรับโครงสร้างพื้นฐานที่วางแผนไว้ - จากเอกสารสำหรับแอปพลิเคชันและประสบการณ์ของคุณเอง