โครงการลดความเร็วป้องกัน vms ของคุณจากความผิดพลาดของโฮสต์

สารบัญ:

วีดีโอ: เพลง๠ดนซ์มาใหม่2017เบส๠น่นฟังà 2024

วีดีโอ: เพลง๠ดนซ์มาใหม่2017เบส๠น่นฟังà 2024
Anonim

หลังจากการเปลี่ยนแปลงของ Azure หลายครั้งและการปรับปรุงความปลอดภัยในสองสามเดือนที่ผ่านมา Microsoft ได้แนะนำ Project Tardigrade เป็นความพยายามครั้งล่าสุดในการทำให้ Azure เชื่อถือได้มากขึ้น

Project Tardigrade ป้องกันความล้มเหลวของแพลตฟอร์ม

Project Tardigrade เป็นบริการใหม่ที่มีจุดมุ่งหมายเพื่อปรับปรุงความยืดหยุ่นสีฟ้า มันมีกลยุทธ์บรรเทาผลกระทบที่ปกป้อง Azure VMs จากความล้มเหลวของแพลตฟอร์ม

นี่เป็นวิธีที่ Mark Russinovich ประธานเจ้าหน้าที่ฝ่ายเทคโนโลยีของ Microsoft Azure อธิบายการทำงานของ Azure ในปัจจุบัน:

เป้าหมายของเราคือช่วยให้องค์กรต่างๆสามารถใช้งานปริมาณงานที่เชื่อถือได้บน Azure ด้วยหลักการนี้เป็นแนวทางหลักของเราเราจึงลงทุนอย่างต่อเนื่องในการพัฒนาแพลตฟอร์ม Azure เพื่อให้เกิดความผิดพลาดไม่เพียงเพื่อเพิ่มประสิทธิภาพทางธุรกิจ แต่ยังเพื่อมอบประสบการณ์การใช้งานที่ราบรื่นให้กับลูกค้า

เพื่อป้องกันผลกระทบต่อปริมาณงานของคุณบริการช่วยให้ส่วนประกอบสามารถรักษาตัวเองและกู้คืนอย่างรวดเร็วจากความล้มเหลวที่อาจเกิดขึ้นแม้ในโฮสต์ที่มีข้อบกพร่องร้ายแรง

Project Tardigrade ทำงานอย่างไร

นี่คือตัวอย่างเกี่ยวกับวิธีการทำงานของการกู้คืน Tardigrade:

  • ขั้นตอนที่ 1: ขั้นตอนนี้ไม่มีผลต่อการเรียกใช้ VM ของลูกค้า มันเพียงรีไซเคิลบริการทั้งหมดที่ทำงานบนโฮสต์ ในกรณีที่ไม่ค่อยเกิดขึ้นว่าบริการที่มีข้อบกพร่องไม่สามารถรีสตาร์ทได้สำเร็จเราดำเนินการในขั้นตอนที่ 2
  • ขั้นตอนที่ 2: บริการการวินิจฉัยของเราทำงานบนโฮสต์เพื่อรวบรวมบันทึก / การทิ้งที่เกี่ยวข้องทั้งหมดอย่างเป็นระบบเพื่อให้แน่ใจว่าเราสามารถวิเคราะห์สาเหตุของความล้มเหลวได้อย่างทั่วถึงในระยะที่ 1 การวิเคราะห์ที่ครอบคลุมนี้ช่วยให้เราสามารถ ในอนาคต.
  • ขั้นตอนที่ 3: ในระดับสูงเรารีเซ็ตระบบปฏิบัติการเป็นสถานะปกติโดยมีผลกระทบต่อลูกค้าน้อยที่สุดเพื่อลดปัญหาโฮสต์ ในระหว่างขั้นตอนนี้เรารักษาสถานะของแต่ละ VM เป็น RAM หลังจากนั้นเราเริ่มรีเซ็ตระบบปฏิบัติการเป็นสถานะปกติ ในขณะที่ระบบปฏิบัติการรีเซ็ตอย่างรวดเร็วภายใต้การรันแอปพลิเคชันบน VMs ทั้งหมดที่โฮสต์บนเซิร์ฟเวอร์ 'หยุด' สั้น ๆ เนื่องจาก CPU ถูกระงับชั่วคราว ประสบการณ์นี้คล้ายกับการเชื่อมต่อเครือข่ายที่ขาดหายไปชั่วคราว แต่กลับมาทำงานต่ออย่างรวดเร็วเนื่องจากการลองตรรกะอีกครั้ง หลังจากรีเซ็ตระบบปฏิบัติการได้สำเร็จ VM จะใช้สถานะที่เก็บไว้และกลับสู่กิจกรรมปกติดังนั้นจึงหลีกเลี่ยงการรีบูต VM ที่อาจเกิดขึ้น

เมื่อคำนึงถึงสิ่งนี้ Project Tardigrade จะทำให้แน่ใจได้ว่าความล้มเหลวของส่วนประกอบใด ๆ ในโฮสต์ไม่ส่งผลกระทบต่อทั้งระบบ ดังนั้น VMs ของลูกค้าจะไม่ได้รับผลกระทบจากความผิดพลาดของโฮสต์

Microsoft กำลังทำงานอย่างหนักเพื่อปรับปรุงและขยายสถานการณ์ความล้มเหลวของโฮสต์ที่แตกต่างกันเพื่อให้แน่ใจว่าแพลตฟอร์มการประมวลผลแบบคลาวด์ของพวกเขาเชื่อถือได้มากขึ้นกว่าเดิม

คาดว่าการพัฒนาใหม่และการใช้งานความน่าเชื่อถืออื่น ๆ ในอนาคตอันใกล้

โครงการลดความเร็วป้องกัน vms ของคุณจากความผิดพลาดของโฮสต์