ถอดบทเรียนเหตุการณ์ “CrowdStrike” หายนะหน้าจอฟ้าที่ทำให้ธุรกิจหยุดชะงัก

ตุลาคม 21, 2024

เมื่อวันที่ 19 กรกฎาคม พ.ศ. 2567 ที่ผ่านมา โลกของเราได้ประสบกับเหตุการณ์ครั้งสำคัญที่อาจเรียกได้ว่า เป็นเหตุการณ์ระบบไอทีล่มครั้งใหญ่ที่สุดในประวัติศาสตร์ จากการอัปเดตซอฟต์แวร์ที่ผิดพลาด นำไปสู่การล่มของระบบ Windows ทั่วโลก ส่งผลกระทบต่อบริษัทต่าง ๆ และแทบทุกอุตสาหกรรมในโลก ไม่เว้นแม้แต่การบิน และระบบบริการสุขภาพ เหตุการณ์นี้เกิดขึ้นได้อย่างไร? และเราได้เรียนรู้อะไรจากเหตุการณ์ในครั้งนี้บ้าง? InnoHub มีคำตอบให้ในบทความนี้

เหตุการณ์เริ่มต้นจากที่มีผู้ใช้เครื่องคอมพิวเตอร์ระบบ Windows พบว่า ระบบปฏิบัติการล่มอย่างกะทันหัน หน้าจอขึ้นเป็นสีฟ้า หรือที่เรียกว่า Blue Screen of Death (BSOD) และเกิด Boot Loop หรือการที่อุปกรณ์ Windows รีสตาร์ทโดยไม่มีการเตือนล่วงหน้าในขณะที่กำลังเริ่มต้นระบบ ส่งผลให้อุปกรณ์ค้างอยู่ในการรีบูต (Reboot) และไม่สามารถเปิดเครื่องได้ โดยเหตุการณ์ได้เริ่มต้นขึ้นในประเทศออสเตรเลีย ก่อนที่จะแพร่กระจายไปยังทวีปเอเชีย ยุโรป และอเมริกา อย่างรวดเร็ว

ในตอนแรกผู้คนจำนวนมากคิดว่าเหตุการณ์นี้เป็นผลมาจากความผิดพลาดของ Microsoft ผู้เป็นเจ้าของระบบ Windows แต่หลังจากนั้นเพียงไม่นาน ความจริงก็ได้ปรากฏ หลังจากที่บริษัท CrowdStrike ได้ออกมาเคลื่อนไหว และยอมรับว่าเหตุการณ์ที่ระบบ Windows ล่มครั้งใหญ่นี้เป็นผลมาจากการที่ระบบ Content Validator ที่ CrowdStrike ใช้ตรวจสอบความสมบูรณ์ของการอัปเดตเนื้อหา ไม่สามารถตรวจสอบไฟล์ที่มีข้อผิดพลาดได้ ทำให้ไฟล์นั้นถูกปล่อยไปกับการอัปเดตระบบ Falcon Sensor จนก่อให้เกิดความผิดพลาดทางตรรกะ (Logic Error) ในระบบคอมพิวเตอร์ทั่วโลกนั่นเอง

CrowdStrike เป็นหนึ่งในบริษัทความปลอดภัยทางไซเบอร์ที่ใหญ่ที่สุดในโลก โดยมีความเชี่ยวชาญด้านการป้องกันความปลอดภัยให้กับอุปกรณ์ปลายทาง (Endpoint Security) เช่น การตรวจจับภัยคุกคาม และการหยุดการกระทำทุกอย่างที่ระบบตรวจสอบแล้วว่ามีจุดประสงค์ในการมุ่งร้าย ซึ่ง Falcon Sensor ก็เป็นระบบเฝ้าระวังภัยคุกคามที่อยู่ใน Falcon Platform อันเป็นผลิตภัณฑ์หลักของบริษัท CrowdStrike นั่นเอง ประสิทธิภาพของผลิตภัณฑ์ตัวนี้สามารถการันตีได้จากการที่มีลูกค้าเป็นบริษัทหลายพันแห่งทั่วโลก ซึ่งจำนวนไม่น้อยในนั้นอยู่ในกลุ่มบริษัทสัญชาติอเมริกาที่ใหญ่ที่สุดในโลก 500 แห่ง จากการจัดอันดับของนิตยสาร Fortune

Microsoft คาดการณ์ว่ามีอุปกรณ์ที่ใช้ระบบ Windows กว่า 8.5 ล้านเครื่อง ที่ได้รับผลกระทบจากเหตุการณ์ในครั้งนี้ และแม้ว่าจะนับเป็นเพียงแค่ไม่ถึง 1% ของอุปกรณ์ที่ใช้ระบบ Windows ทั้งหมดในโลก แต่เนื่องจากบริษัทที่ได้รับผลกระทบเป็นบริษัทที่ให้บริการที่สำคัญ ไม่ว่าจะเป็นระบบการบิน บริการสุขภาพ หรือธนาคารและสถาบันการเงินต่าง ๆ ความเสียหายที่เกิดจากเหตุการณ์ครั้งนี้จึงไม่อาจมองข้ามได้ โดยมีเที่ยวบินกว่า 10,000 เที่ยวบินทั่วโลกที่ต้องดีเลย์หรือถูกยกเลิก ในด้านของระบบบริการสุขภาพเองก็ต้องมีการเลื่อนหรือยกเลิกนัดกับคนไข้ เนื่องจากไม่สามารถเข้าถึงระบบข้อมูลดิจิทัลด้านสุขภาพของคนไข้ได้ อีกทั้งยังส่งผลให้ระบบธุรกรรมการเงินออนไลน์ของธนาคารบางแห่งเกิดความขัดข้องอีกด้วย

นอกจากนี้ เหตุการณ์ระบบไอทีล่มในครั้งนี้ยังนำมาซึ่งโอกาสให้กับมิจฉาชีพได้ออกมาใช้ประโยชน์จากสถานการณ์อีกด้วย โดย CrowdStrike ได้รับรายงานว่ามีความพยายามที่จะหลอกลวงผู้บริโภคด้วยหลากหลายวิธี เช่น การโทรศัพท์หา หรือส่งอีเมลเพื่ออาศัยความร้อนรนของผู้บริโภคและแสร้งทำเป็นพนักงานจาก CrowdStrike ที่จะมาให้ความช่วยเหลือโดยมีจุดประสงค์ในการหลอกลวงเพื่อให้ได้มาซึ่งข้อมูลส่วนตัวของผู้บริโภค

อย่างไรก็ตาม CrowdStrike และ Microsoft ก็ไม่ได้นิ่งนอนใจกับเหตุการณ์ที่เกิดขึ้นแต่อย่างใด โดย CrowdStrike พยายามที่จะวิเคราะห์ต้นเหตุของปัญหาอย่างละเอียด เพื่อทำการแก้ไขข้อผิดพลาด และป้องกันปัญหาในอนาคต ในด้านของ Microsoft เองก็มีความพยายามที่จะสื่อสารกับทั้งฝั่ง CrowdStrike และฝั่งผู้บริโภค รวมถึงได้มีการมอบหมายให้วิศวกรกว่าหลายร้อยคน เข้ามาช่วยผู้บริโภคแก้ไขปัญหานี้โดยตรง นอกจากนี้ เมื่อเดือนกันยายนที่ผ่านมา Microsoft ก็ได้ออกมากล่าวถึงแผนการพัฒนาแพลตฟอร์มใหม่สำหรับ CrowdStrike รวมถึงพาร์ตเนอร์ผู้ดูแลด้านความปลอดภัยเจ้าอื่น ๆ โดยอาจเป็นการแยกระบบรักษาความปลอดภัยของบริษัทเหล่านี้ออกจากเคอร์เนล (Kernel) ของ Windows ซึ่งเป็นโปรแกรมพื้นฐานของระบบปฏิบัติการ และการเปลี่ยนแปลงครั้งนี้อาจทำให้ระบบรักษาความปลอดภัยของพาร์ตเนอร์เข้าถึง Windows ได้อย่างจำกัด เพื่อไม่ให้ Windows ได้รับผลกระทบเมื่อเกิดความผิดพลาดลักษณะนี้ขึ้นอีก อย่างไรก็ตามพาร์ตเนอร์บางรายก็มีข้อโต้แย้งว่าการที่ Microsoft จะเป็นผู้ดูแลความปลอดภัยของอุปกรณ์ปลายทางอยู่เพียงผู้เดียวนั้นไม่ได้ช่วยให้ระบบไอทีมีความปลอดภัยมากขึ้นแต่อย่างใด

เหตุการณ์ครั้งนี้ช่วยชี้ให้เราเห็นถึงจุดอ่อนของสังคมในปัจจุบันที่พึ่งพาเทคโนโลยีเป็นอย่างมาก แนวทางป้องกันไม่ให้เกิดเหตุการณ์ซ้ำรอยเช่นนี้อีก คือการที่บริษัทผู้ให้บริการให้ความสำคัญกับการทดสอบเนื้อหาที่จะอัปเดตให้มากยิ่งขึ้นก่อนที่จะปล่อยออกมาให้ผู้บริโภคใช้งานจริง ในด้านบริษัทต่าง ๆ ที่ใช้บริการเองก็ควรวางแผนรับมือกับสถานการณ์วิกฤติเอาไว้ เพื่อให้สามารถกู้คืนระบบได้อย่างรวดเร็วและทันท่วงที นอกจากนี้ บริษัทก็ควรบันทึกข้อมูลเป็นเอกสารเอาไว้ รวมถึงฝึกฝนพนักงานให้สามารถปฏิบัติงานได้ด้วยวิธีการแบบดั้งเดิม นอกเหนือจากระบบไอที เพื่อเป็นแผนสำรองให้ธุรกิจและบริการยังคงดำเนินต่อไปได้ในยามวิกฤติ

Share this article

กดติดตาม InnoHub

เพื่อรับข้อมูลข่าวสารและแรงบันดาลใจด้านนวัตกรรมใหม่ ๆ

เรานำข้อมูลมาใช้เพื่อการส่งมอบคอนเทนต์และบริการอย่างเหมาะสม เราจะปกป้องความเป็นส่วนตัวของคุณ คุณสามารถอ่านข้อมูลเพิ่มเติมได้ที่ Privacy Policy และคลิกสมัครเพื่อดำเนินการต่อ