ใน

Xiaomi EV เปิดตัว Auto World Model โมเดลขับขี่อัจฉริยะยุคใหม่ ผสานภาพ 3 มิติเข้ากับวิดีโอจำลอง

Xiaomi EV ซึ่งเป็นธุรกิจยานยนต์ไฟฟ้าในเครือของ Xiaomi ได้เปิดตัว Xiaomi Auto World Model อย่างเป็นทางการเมื่อวันอังคารที่ผ่านมา ซึ่งเป็นโครงสร้างโมเดลจำลองโลกรูปแบบใหม่สำหรับเทคโนโลยีขับขี่อัตโนมัติ ส่งผลให้ Xiaomi กลายเป็นผู้ผลิตรถยนต์รายล่าสุดต่อจาก Nio Inc ที่นำเทคโนโลยีนี้มาใช้งาน

Xiaomi EV เปิดตัว Auto World Model โมเดลขับขี่อัจฉริยะยุคใหม่ ผสานภาพ 3 มิติเข้ากับวิดีโอจำลอง

ทาง Xiaomi ระบุในแถลงการณ์ว่า ความเคลื่อนไหวในครั้งนี้มีเป้าหมายเพื่อเร่งการเปลี่ยนผ่านของปัญญาประดิษฐ์ หรือ AI จากโลกเสมือนจริงเข้าสู่โลกแห่งความเป็นจริง ซึ่งจะช่วยสร้างแนวทางการพัฒนาใหม่ ๆ ให้กับเทคโนโลยีระบบช่วยขับขี่ขั้นสูงของอุตสาหกรรมยานยนต์

โดยโครงสร้างระบบ Xiaomi Auto World Model นี้ จะหลอมรวมการสร้างภาพ 3 มิติ (3D reconstruction) เข้ากับการสร้างวิดีโอ (video generation) อย่างแนบแน่น ซึ่งถือเป็นการทลายขีดจำกัดและทฤษฎีทางเทคนิคแบบเดิมๆ ของอุตสาหกรรมที่แยกการสร้างภาพและการสร้างวิดีโอออกจากกันมาโดยตลอด

บริษัทเปิดเผยว่า โมเดลนี้ได้สร้างผลทดสอบที่ยอดเยี่ยมในระดับแนวหน้า (SOTA หรือ state-of-the-art) จากการทดสอบเกณฑ์มาตรฐานของอุตสาหกรรม เช่น Waymo และ nuScenes ปัจจุบัน Xiaomi ได้นำเทคโนโลยีใหม่นี้ไปประยุกต์ใช้ใน 3 ส่วนงานหลัก ได้แก่ การสร้างข้อมูลจำลอง (synthetic data generation) การทดสอบระบบจำลองแบบปิด (closed-loop simulation testing) และการใช้งานภายในห้องโดยสารอัจฉริยะ (smart cabin)

ซึ่งบริษัทได้ส่งมอบคลิปข้อมูลจำลองคุณภาพสูงไปแล้วมากกว่า 100,000 คลิป เพื่อนำไปเพิ่มประสิทธิภาพในการฝึกฝนระบบ AI ของโมเดลการรับรู้

โครงสร้างรูปแบบใหม่นี้ประกอบด้วย 2 โมดูลหลักที่ทำงานควบคุมซึ่งกันและกัน ได้แก่ โมดูลการสร้างภาพ (Reconstruction module) ที่เรียกว่า WorldRec และโมดูลการจำลองวิดีโอ (Generation module) ที่เรียกว่า WorldGen โดยระบบ WorldRec จะใช้จุดยึด 3 มิติแบบกระจาย (sparse 3D anchors) แทนที่การใช้พิกเซลแบบหนาแน่นในรูปแบบเดิม ทำให้ใช้เวลาเพียงแค่ประมาณ 10 วินาทีเท่านั้นในการสร้างฉากขึ้นมาใหม่จากวิดีโอที่มีความยาว 10 วินาที ซึ่งช่วยเพิ่มประสิทธิภาพในการประมวลผลได้อย่างมหาศาล

ขณะที่ WorldGen จะทำหน้าที่เป็นเหมือนเครื่องยนต์ที่ช่วยเติมเต็มพื้นที่และเวลาที่มองไม่เห็น โดยใช้ขั้นตอนการลดสัญญาณรบกวน (denoising steps) เพียง 4 ขั้นตอนเพื่อสร้างภาพ 1 เฟรม ด้วยความเร็วเพียง 0.19 วินาที ปัจจุบันระบบนี้รองรับการสร้างวิดีโอต่อเนื่องคุณภาพสูงได้นานสูงสุดถึง 1 นาที

Xiaomi กล่าวว่า การรวมทั้ง 2 โมดูลนี้เข้าด้วยกันอย่างเหนียวแน่น มีวัตถุประสงค์เพื่อลดการสะสมของข้อผิดพลาดและการคลาดเคลื่อนของเนื้อหาในระหว่างการสร้างวิดีโอที่มีความยาว โดยโมดูลการสร้างภาพจะช่วยกำหนดขอบเขตทางเรขาคณิตที่แม่นยำ

ในขณะที่โมดูลการจำลองวิดีโอจะช่วยขยายขอบเขตการคาดเดาของโมเดล ซึ่งสิ่งนี้จะช่วยแก้ปัญหาสำคัญในการรับมือกับสถานการณ์ที่เกิดขึ้นได้ยากบนท้องถนน (long-tail scenarios) เช่น สภาพอากาศที่ย่ำแย่รุนแรง หรือการมีสัตว์วิ่งตัดหน้ารถได้อย่างมีประสิทธิภาพ

การเปิดตัวครั้งนี้ถือเป็นส่วนหนึ่งของการอัปเกรดเทคโนโลยีระบบขับขี่อัจฉริยะที่ดำเนินมาอย่างต่อเนื่องของ Xiaomi โดยเมื่อเดือนมีนาคมปีนี้ (ปี 2026) บริษัทเพิ่งเปิดตัวรถยนต์ซีดานไฟฟ้ารุ่นปรับปรุงใหม่อย่าง SU7 ที่มาพร้อมกับระบบช่วยขับขี่ที่ขับเคลื่อนด้วยโมเดลสมองกลอัจฉริยะ XLA รุ่นใหม่ล่าสุด

อย่างไรก็ตาม ในด้านระบบขับขี่อัจฉริยะนี้ Xiaomi ต้องเผชิญกับการแข่งขันที่รุนแรงจากคู่แข่งในประเทศจีน รวมถึงแรงกดดันที่อาจเกิดขึ้นจากการเตรียมเข้ามาของระบบ FSD (Full Self-Driving) ของ Tesla

นอกจากนี้ แบรนด์คู่แข่งอย่าง Nio (NYSE: NIO) ได้เริ่มส่งมอบโมเดลจำลองโลกเวอร์ชันแรกที่ชื่อว่า Nio World Model ไปยังรถยนต์ของตนตั้งแต่เดือนพฤษภาคมปี 2025 แล้ว และแบรนด์ลูกระดับแมสของ Nio อย่าง Onvo ก็ได้ติดตั้งเทคโนโลยีโมเดลจำลองโลกนี้ในรถยนต์ SUV รุ่น L90 ประจำปี 2026 ที่เพิ่งเปิดตัวไปเมื่อเดือนที่แล้วด้วยเช่นกัน

สำหรับแผนการในอนาคต Xiaomi EV ตั้งเป้าที่จะสำรวจและพัฒนารูปแบบการฝึกฝนระบบ AI ทั้งในขั้นตอน pre-training และขั้นตอน closed-loop training ต่อไป โดยบริษัทคาดหวังว่าโครงสร้างโมเดลจำลองโลกแบบครบวงจรนี้ จะช่วยยกระดับความสามารถในการรับรู้และการตัดสินใจของโมเดลอัจฉริยะแบบ end-to-end ได้อย่างก้าวกระโดด

ที่มา cnevpost

แสดงความคิดเห็น

เขียนโดย Sakura P.