Google DeepMind เปิดตัว Genie 3 โมเดล AI สร้างโลกเสมือนจริงแบบเรียลไทม์

Google DeepMind เปิดตัว Genie 3 โมเดล AI สร้างโลกเสมือนจริงแบบเรียลไทม์

Google DeepMind ได้เปิดตัว Genie 3 ที่พัฒนาต่อยอดจาก Genie 2 ซึ่งเป็นโมเดลปัญญาประดิษฐ์ (AI) ประเภทโมเดลโลก (World Model) รุ่นล่าสุด ที่สามารถสร้างและจำลองสภาพแวดล้อมเสมือนจริงได้อย่างสมจริงและโต้ตอบได้ทันที (Real-time) ถือเป็นก้าวสำคัญในการพัฒนา AI และอาจนำไปสู่ปัญญาประดิษฐ์ทั่วไป (AGI) ในอนาคต

สรุปข่าว

Google DeepMind เปิดตัว Genie 3 โมเดล AI ล้ำยุคที่สามารถสร้างโลกเสมือนจริงให้ผู้ใช้เข้าไปสำรวจและโต้ตอบได้ทันทีแบบเรียลไทม์ เทคโนโลยีนี้เป็นเครื่องมือสำคัญสำหรับใช้ฝึกฝน AI เอเจนต์ให้ทำภารกิจซับซ้อน และเป็นก้าวสำคัญบนเส้นทางสู่การพัฒนาปัญญาประดิษฐ์ทั่วไป (AGI) ในอนาคต

Google DeepMind ได้เปิดตัว Genie 3 ที่พัฒนาต่อยอดจาก Genie 2 ซึ่งเป็นโมเดลปัญญาประดิษฐ์ (AI) ประเภทโมเดลโลก (World Model) รุ่นล่าสุด ที่สามารถสร้างและจำลองสภาพแวดล้อมเสมือนจริงได้อย่างสมจริงและโต้ตอบได้ทันที (Real-time) ถือเป็นก้าวสำคัญในการพัฒนา AI และอาจนำไปสู่ปัญญาประดิษฐ์ทั่วไป (AGI) ในอนาคต

Genie 3 คืออะไร ?

Genie 3 คือ AI ที่สามารถสร้างโลกเสมือนจริงขึ้นมาจากคำสั่งง่าย ๆ และให้ผู้ใช้ หรือ AI อื่น ๆ เรียกว่า "เอเจนต์" เข้าไปโต้ตอบได้แบบเรียลไทม์ Genie 3 ถูกพัฒนาขึ้นมาจาก Genie 2 โดยแตกต่างจากรุ่นก่อน ๆ ตรงที่เน้นการสร้างวิดีโอ Genie 3 มุ่งเน้นไปที่การสร้างประสบการณ์ที่ต่อเนื่องและสมจริง ทำให้เอเจนต์สามารถเรียนรู้และทดลองในสภาพแวดล้อมที่หลากหลายได้อย่างไม่จำกัด

ความสามารถหลักของ Genie 3

  • รองรับการโต้ตอบแบบเรียลไทม์ ผู้ใช้สามารถควบคุมการเคลื่อนไหวและมุมมองในโลกที่สร้างขึ้นได้อย่างอิสระและทันที เหมือนกับการเล่นเกม

  • ความสมจริงและความต่อเนื่อง โดยโลกที่สร้างขึ้นมีความต่อเนื่องทางกายภาพสูง แม้จะผ่านไประยะหนึ่งแล้วกลับมาดูที่เดิม สภาพแวดล้อมยังคงเหมือนเดิม ไม่เกิดความผิดเพี้ยนง่ายๆ

  • สร้างปรากฏการณ์ธรรมชาติและแฟนตาซี เช่น ความสามารถจำลองได้ตั้งแต่ระบบนิเวศที่ซับซ้อน เช่น พฤติกรรมสัตว์ ป่าไม้ ไปจนถึงการสร้างโลกแฟนตาซีและตัวละครแอนิเมชันตามจินตนาการ

  • ควบคุมเหตุการณ์ในโลก (World Events) ผู้ใช้สามารถใช้คำสั่งข้อความเพื่อเปลี่ยนแปลงสิ่งต่าง ๆ ในโลกได้ทันที เช่น การเปลี่ยนสภาพอากาศเป็นฝนตก หรือ "สร้างรถยนต์ขึ้นมา

  • สำรวจสถานที่และประวัติศาสตร์สามารถสร้างสภาพแวดล้อมจากยุคสมัยและสถานที่ต่างๆ ทั่วโลก เพื่อการเรียนรู้และสำรวจ

เป้าหมายและการประยุกต์ใช้

  • สนามฝึกซ้อมสำหรับปัญญาประดิษฐ์ Genie 3 เป็นเครื่องมือสำคัญในการฝึกฝนเอเจนต์ AI เช่น SIMA เอเจนต์อเนกประสงค์ของ Google ให้เรียนรู้การทำภารกิจที่ซับซ้อนในสภาพแวดล้อมที่หลากหลายและคาดเดาไม่ได้

  • เส้นทางสู่ AGI การที่ AI สามารถเข้าใจและจำลองโลกได้ จะเป็นพื้นฐานสำคัญในการพัฒนาปัญญาประดิษฐ์ทั่วไปที่มีความสามารถทัดเทียมมนุษย์

  • โอกาสทางการศึกษาและสื่อสร้างสรรค์ สามารถนำไปใช้สร้างสื่อการเรียนรู้แบบโต้ตอบ หรือเป็นเครื่องมือสำหรับนักสร้างสรรค์ในการสร้างผลงานรูปแบบใหม่ๆ

ข้อจำกัดในปัจจุบันของ Genie 3

  • การสร้างภาพและช่วยเหลือของเอเจนต์ยังมีจำกัด โดยเอเจนต์ยังไม่สามารถโต้ตอบกับวัตถุทุกอย่างในโลกได้อย่างอิสระ

  • การจำลองตำแหน่งจริงยังไม่แม่นยำ เอเจนต์ยังไม่สามารถสร้างสถานที่จริงบนโลกได้อย่างสมบูรณ์แบบ

  • ระยะเวลาโต้ตอบจำกัด ปัจจุบันรองรับการโต้ตอบต่อเนื่องได้เพียงไม่กี่นาที



อย่างไรก็ตาม Google DeepMind ตระหนักถึงความท้าทายด้านความปลอดภัยและความรับผิดชอบ จึงได้เปิดให้กลุ่มนักวิจัยและนักสร้างสรรค์จำนวนจำกัดได้ทดลองใช้ก่อน เพื่อรวบรวมความคิดเห็นและพัฒนาระบบบรรเทาความเสี่ยงต่างๆ ก่อนที่จะเปิดให้ใช้งานในวงกว้างต่อไปในอนาคต

ที่มาข้อมูล : Google DeepMind

ที่มารูปภาพ : Google DeepMind