วันพุธที่ 21 พฤษภาคม พ.ศ. 2568

วิสัยทัศน์ของเราในการสร้างผู้ช่วย AI ที่เป็นสากล

เรากำลังขยายความสามารถของ Gemini ให้กลายเป็นโมเดลสากลที่สามารถวางแผนและจินตนาการถึงประสบการณ์ใหม่ๆ โดยการจำลองแง่มุมต่างๆ ของโลก


ในช่วงทศวรรษที่ผ่านมา เราได้วางรากฐานมากมายสำหรับ AI ที่ทันสมัย ตั้งแต่การบุกเบิกสถาปัตยกรรม Transformer ซึ่งเป็นพื้นฐานของโมเดลภาษาขนาดใหญ่ทั้งหมด ไปจนถึงการพัฒนา Agentic AI ที่สามารถเรียนรู้และวางแผนได้อย่าง AlphaGo และ AlphaZero

เราได้นำเทคนิคเหล่านี้มาประยุกต์ใช้ในการสร้างความก้าวหน้าครั้งสำคัญในการประมวลผลแบบควอนตัม (Quantum Computing) คณิตศาสตร์ ชีววิทยาศาสตร์ และการค้นพบอัลกอริทึม และเรายังคงมุ่งมั่นพัฒนางานวิจัยพื้นฐานให้ครอบคลุมและลึกขึ้นเรื่อยๆ เพื่อคิดค้นนวัตกรรมใหม่ๆ ที่จำเป็นสำหรับการต่อยอดไปสู่ยุคของ AGI (Artificial General Intelligence)

ด้วยเหตุนี้ เราจึงกำลังขยายความสามารถของโมเดลพื้นฐานแบบมัลติโมดัลที่ดีที่สุดของเราอย่าง Gemini 2.5 Pro ให้กลายเป็น “โมเดลสากล” ที่สามารถวางแผนและจินตนาการถึงประสบการณ์ใหม่ๆ โดยทำความเข้าใจและจำลองแง่มุมต่างๆ ของโลก เช่นเดียวกับที่สมองมนุษย์ทำ

เราได้สร้างความก้าวหน้าในด้านนี้มาระยะหนึ่งแล้ว ตั้งแต่การพัฒนา AI Agent ฝึกหัดรุ่นบุกเบิกไปจนถึง AI ที่สามารถเล่นเกมที่มีความซับซ้อนอย่าง Go และ StarCraft ไปจนถึง Genie 2 ซึ่งสามารถสร้างสภาพแวดล้อมจำลองแบบ 3 มิติที่คุณสามารถโต้ตอบได้โดยใช้พรอมต์รูปภาพเพียงรายการเดียว

ในปัจจุบัน เราสามารถเห็นหลักฐานของความสามารถเหล่านี้ได้จากการที่ Gemini ใช้ความรู้ทั่วไปและการให้เหตุผลเพื่อแสดงและจำลองสภาพแวดล้อมตามธรรมชาติ การที่ Veo เข้าใจกลไกฟิสิกส์โดยสัญชาตญาณอย่างลึกซึ้ง และวิธีที่ Gemini Robotics สอนหุ่นยนต์ให้เข้าใจ ปฏิบัติตามคำสั่ง และปรับการทำงานได้ทันที

การทำ Gemini ให้เป็นโมเดลสากลถือเป็นก้าวสำคัญในการพัฒนา AI รูปแบบใหม่ที่ครอบคลุมและมีประโยชน์มากขึ้น ซึ่งก็คือผู้ช่วย AI สากลนั่นเอง นี่เป็น AI อัจฉริยะที่เข้าใจบริบทของคุณในขณะนั้น และสามารถวางแผนและทำสิ่งต่างๆ แทนคุณผ่านอุปกรณ์ใดก็ได้


การนำความสามารถในการประมวลผลแบบเรียลไทม์ของ Project Astra มาไว้ในผลิตภัณฑ์ของเรา


วิสัยทัศน์สูงสุดของเราคือการพลิกโฉมแอป Gemini ให้กลายเป็นผู้ช่วย AI สากลที่จะมาช่วยเราทำสิ่งต่างๆ ในชีวิตประจำวัน ดูแลงานธุรการทั่วๆ ไป และให้คำแนะนำใหม่ๆ ที่น่าสนใจ ทำให้เรามีประสิทธิผลมากขึ้น และทำให้ชีวิตเราดีขึ้น


โดยเริ่มต้นจากความสามารถที่เราได้เริ่มทดลองในโปรเจ็กต์วิจัยต้นแบบอย่าง Project Astra เช่น การเข้าใจวิดีโอ การแชร์หน้าจอ และการจดจำสิ่งต่างๆ


ในช่วงปีที่ผ่านมา เราได้ผสานรวมความสามารถเหล่านี้เข้ากับ Gemini Live เพื่อให้ผู้คนมากขึ้นได้สัมผัสประสบการณ์การใช้งาน เรายังคงพัฒนาและสำรวจนวัตกรรมใหม่ๆ อย่างต่อเนื่อง ตัวอย่างเช่น เราได้อัปเกรดเอาต์พุตเสียงให้เป็นธรรมชาติมากขึ้นด้วยเสียงแบบเนทีฟ พร้อมทั้งเพิ่มประสิทธิภาพหน่วยความจำ และเพิ่มการควบคุมด้วยคอมพิวเตอร์



เราได้เริ่มรวบรวมความคิดเห็นจากผู้ทดสอบที่เชื่อถือได้เกี่ยวกับความสามารถเหล่านี้ และกำลังพัฒนาความสามารถต่างๆ เหล่านี้ให้สามารถใช้งานได้ใน Gemini Live และผลิตภัณฑ์อื่นๆ เช่น Google Search, Live API สำหรับนักพัฒนาซอฟต์แวร์ ตลอดจนรูปแบบอุปกรณ์ใหม่ๆ เช่น แว่นตา

ความปลอดภัยและความรับผิดชอบเป็นหัวใจสำคัญในการดำเนินงานของเราในทุกขั้นตอนของกระบวนการนี้ เมื่อไม่นานนี้ เราได้ดำเนินโครงการวิจัยขนาดใหญ่เพื่อสำรวจประเด็นทางจริยธรรมเกี่ยวกับผู้ช่วย AI ขั้นสูง และงานวิจัยนี้ยังคงเป็นข้อมูลสำคัญในการวิจัย การพัฒนา และการนำระบบไปใช้

การสร้าง AI ที่สามารถทำงานหลายอย่างพร้อมกันแทนคุณ

นอกจากนี้ เรายังศึกษาว่าความสามารถของ Agentic AI จะช่วยผู้คนทํางานหลายอย่างพร้อมกันได้อย่างไรด้วย Project Mariner ซึ่งเป็นต้นแบบการวิจัยที่สำรวจอนาคตของการโต้ตอบระหว่างมนุษย์กับ Agentic AI โดยเริ่มจากเบราว์เซอร์

นับตั้งแต่เปิดตัว Project Mariner เมื่อเดือนธันวาคมที่ผ่านมา เราได้ทำงานร่วมกับกลุ่มผู้ทดสอบที่เชื่อถือได้เพื่อรวบรวมความคิดเห็นและปรับปรุงความสามารถต่างๆ ที่ยังอยู่ในช่วงการทดลอง

ตอนนี้ Project Mariner มีระบบ AI Agent ที่สามารถทำหลายๆ งานพร้อมกันได้สูงสุด 10 งาน AI Agent เหล่านี้สามารถช่วยคุณค้นหาข้อมูล ทำการจอง ซื้อของ ค้นคว้าวิจัย และอื่นๆ ได้ในคราวเดียว


Project Mariner เวอร์ชันอัปเดตพร้อมให้บริการแก่สมาชิก Google AI Ultra ในสหรัฐอเมริกา เรากำลังนำความสามารถในการใช้คอมพิวเตอร์มาไว้ใน Gemini API และเราวางแผนที่จะนำความสามารถอื่นๆ ของ Project Mariner ไปใช้กับผลิตภัณฑ์ต่างๆ ของ Google ตลอดทั้งปีนี้ ดูข้อมูลเพิ่มเติมเกี่ยวกับความสามารถของ Agentic AI ใน Google Search และแอป Gemini


การทำงานที่ล้ำสมัยทั้งหมดนี้ช่วยให้เราสร้าง AI ที่ทรงพลังและตอบโจทย์ความต้องการที่เฉพาะเจาะจงของผู้ใช้แต่ละคนมากขึ้น ซึ่งช่วยยกระดับคุณภาพชีวิต เร่งให้วิทยาศาสตร์ก้าวหน้าเร็วขึ้น และปูทางไปสู่ยุคทองแห่งการค้นพบและการเรียนรู้สิ่งใหม่ๆ


Demis Hassabis

CEO ของ Google DeepMind

ไม่มีความคิดเห็น:

แสดงความคิดเห็น