Official Google Thailand Blog: ขอแนะนำ Gemini โมเดล AI ที่มีขนาดใหญ่ที่สุดและมีความสามารถมากที่สุดของเรา

การทำให้ AI มีประโยชน์มากขึ้นสำหรับทุกคน

ข้อความจากซุนดาร์ พิชัย CEO ของ Alphabet และ Google

การเปลี่ยนแปลงทางเทคโนโลยีในแต่ละครั้งเป็นโอกาสสำหรับความก้าวหน้าในการค้นพบทางวิทยาศาสตร์ เร่งความก้าวหน้าของมนุษย์ และพัฒนาชีวิตของผู้คนให้ดีขึ้น ผมเชื่อว่าการเปลี่ยนแปลงที่เกิดขึ้นจาก AI ที่เราเห็นกันอยู่ในขณะนี้จะเป็นสิ่งที่ยิ่งใหญ่มากที่สุดในช่วงชีวิตของเรา ซึ่งยิ่งใหญ่กว่าการเปลี่ยนแปลงไปสู่ยุคของอุปกรณ์เคลื่อนที่หรือยุคของเว็บไซต์ก่อนหน้านี้มาก AI มีศักยภาพในการสร้างโอกาสมากมายให้กับผู้คนทั่วโลก ไม่ว่าจะเป็นสิ่งต่างๆ ในชีวิตประจำวันไปจนถึงสิ่งที่พิเศษที่ไม่เคยเกิดขึ้นมาก่อน AI จะนำมาซึ่งคลื่นลูกใหม่ของนวัตกรรมและความก้าวหน้าทางเศรษฐกิจ และขับเคลื่อนความรู้ การเรียนรู้ ความคิดสร้างสรรค์ และประสิทธิภาพการทำงานไปในระดับที่เราไม่เคยเห็นมาก่อน

นั่นคือสิ่งที่ทำให้ผมรู้สึกตื่นเต้น นี่คือโอกาสที่จะทำให้ AI มีประโยชน์ต่อผู้คนทั่วโลก

ในช่วงเวลาเกือบ 8 ปีที่ Google ได้เริ่มเส้นทางของการเป็น AI-First Company มีความก้าวหน้าเกิดขึ้นอย่างมาก ปัจจุบันนี้ผู้คนหลายล้านคนกำลังใช้ Generative AI ที่อยู่ในผลิตภัณฑ์ของเราเพื่อทำสิ่งที่พวกเขาไม่สามารถทำได้มาก่อน ตั้งแต่การค้นหาคำตอบสำหรับคำถามที่มีความซับซ้อนมากขึ้น ไปจนถึงการใช้เครื่องมือใหม่ๆ ในการทำงานร่วมกันและสร้างสรรค์สิ่งต่างๆ ในขณะเดียวกัน นักพัฒนาแอปก็ใช้โมเดลและโครงสร้างพื้นฐานของเราเพื่อสร้างแอปพลิเคชัน Generative AI ใหม่ๆ ส่วนสตาร์ทอัพและองค์กรต่างๆ ทั่วโลกก็กำลังเติบโตจากการใช้เครื่องมือ AI ของเรา

นี่เป็นแรงขับเคลื่อนอันยอดเยี่ยม แต่นี่เป็นเพียงจุดเริ่มต้นในการเผยให้เห็นถึงสิ่งที่เป็นไปได้จากพลังของ AI

เรากำลังปลดล็อกศักยภาพของ AI อย่างกล้าหาญและมีความรับผิดชอบ นั่นหมายถึงความทุ่มเทในการวิจัยของเราและการแสวงหาศักยภาพที่จะนำมาซึ่งประโยชน์มหาศาลให้กับผู้คนและสังคม ในขณะเดียวกันก็สร้างมาตรการป้องกันและทำงานร่วมกับรัฐบาลและผู้เชี่ยวชาญเพื่อจัดการกับความเสี่ยงต่างๆ จาก AI ที่มีความสามารถมากขึ้น และเรายังคงเดินหน้าลงทุนในเครื่องมือ โมเดลพื้นฐาน และโครงสร้างพื้นฐานที่ดีที่สุดอย่างต่อเนื่อง และนำสิ่งเหล่านี้มาใช้กับผลิตภัณฑ์ของเราและผลิตภัณฑ์อื่นๆ ตามแนวทางของหลักการเกี่ยวกับ AI ของเรา

ตอนนี้ การพัฒนา AI ของเรากำลังก้าวหน้าขึ้นไปอีกขั้นด้วย Gemini ซึ่งเป็นโมเดลทั่วไปที่มีความสามารถมากที่สุดของเรา ที่มาพร้อมด้วยประสิทธิภาพที่ล้ำสมัยที่ผ่านเกณฑ์มาตรฐานชั้นนำมากมาย Gemini 1.0 ซึ่งเป็นเวอร์ชันแรกของเรามีขนาดต่างๆ ได้แก่ Ultra, Pro และ Nano โดยนี่เป็นโมเดลแรกๆ ของ Gemini และเป็นการบรรลุวิสัยทัศน์ครั้งแรกที่เรามีตั้งแต่การก่อตั้ง Google DeepMind เมื่อต้นปีนี้ โมเดลยุคใหม่นี้แสดงถึงความพยายามด้านวิทยาศาสตร์และวิศวกรรมที่ยิ่งใหญ่ที่สุดครั้งหนึ่งของเรา ผมรู้สึกตื่นเต้นมากกับสิ่งที่รออยู่ข้างหน้า และโอกาสใหม่ๆ ที่ Gemini จะมาช่วยปลดล็อกให้กับผู้คนทั่วโลก

- ซุนดาร์

ขอแนะนำ Gemini

โดย Demis Hassabis, CEO และผู้ร่วมก่อตั้ง Google DeepMind ในนามของทีม Gemini

AI เป็นสิ่งที่ผม รวมถึงเพื่อนร่วมงานวิจัยของผมหลายๆ คน ให้ความสำคัญมาโดยตลอด นับตั้งแต่ที่ผมเริ่มเขียนโปรแกรม AI สำหรับเกมคอมพิวเตอร์ตอนที่ยังเป็นวัยรุ่น และตลอดหลายปีที่ผ่านมาในฐานะนักวิจัยด้านประสาทวิทยาศาสตร์ที่พยายามทำความเข้าใจการทำงานของสมอง ผมเชื่อมาโดยตลอดว่าถ้าเราสามารถสร้างเครื่องมือที่ชาญฉลาดขึ้นมาได้ เราก็สามารถควบคุมเครื่องมือนั้นเพื่อสร้างประโยชน์ให้กับมนุษยชาติในด้านต่างๆ ได้

คำมั่นสัญญาในการขับเคลื่อนโลกด้วย AI อย่างมีความรับผิดชอบยังคงเป็นความมุ่งมั่นในการทำงานของเราที่ Google DeepMind เราต้องการสร้างโมเดล AI รุ่นใหม่มาสักระยะหนึ่งแล้ว โดยได้รับแรงบันดาลใจจากวิธีที่ผู้คนทำความเข้าใจและมีปฏิสัมพันธ์กับสิ่งต่างๆ ที่อยู่รอบตัว AI ที่ให้ความรู้สึกไม่เหมือนชิ้นส่วนอัจฉริยะของซอฟต์แวร์ แต่ดูเหมือนสิ่งที่มีประโยชน์และใช้งานง่ายมากกว่า เช่น ผู้ช่วยที่มีความเชี่ยวชาญ

วันนี้ เราเข้าใกล้วิสัยทัศน์นี้ไปอีกขั้นแล้ว ด้วยการเปิดตัว Gemini ซึ่งเป็นโมเดลทั่วไปที่มีความสามารถมากที่สุดเท่าที่เราเคยสร้างมา

Gemini เป็นผลพวงของความพยายามในการทำงานร่วมกันในวงกว้างของทีมต่างๆ ที่ Google รวมถึงทีมวิจัยของ Google อย่างเราด้วย Gemini ถูกสร้างขึ้นมาใหม่ทั้งหมดเพื่อให้เป็นโมเดลที่ทำงานได้กับข้อมูลหลายประเภท (Multimodal) ซึ่งหมายความว่า Gemini สามารถสรุปและทำความเข้าใจสิ่งต่างๆ ได้อย่างราบรื่น ทำงานได้อย่างต่อเนื่อง และผนวกรวมข้อมูลหลากหลายประเภทเข้าด้วยกัน ทั้งข้อความ โค้ด เสียง รูปภาพ และวิดีโอ

ขอแนะนำ Gemini โมเดล AI ที่มีขนาดใหญ่ที่สุดและมีความสามารถมากที่สุดของเรา

นอกจากนี้ Gemini ยังเป็นโมเดลที่มีความยืดหยุ่นมากที่สุดเท่าที่เราเคยสร้างมา โดยสามารถใช้ได้บนทุกสิ่งอย่างมีประสิทธิภาพ ตั้งแต่ศูนย์ข้อมูลไปจนถึงอุปกรณ์เคลื่อนที่ ความสามารถที่ล้ำสมัยของ Gemini จะช่วยยกระดับวิธีที่นักพัฒนาซอฟต์แวร์และลูกค้าองค์กรขนาดใหญ่สามารถสร้างและขยายบริการด้วย AI ได้อย่างมีประสิทธิภาพ

เราได้เพิ่มประสิทธิภาพของ Gemini 1.0 ซึ่งเป็นเวอร์ชันแรก สำหรับโมเดล 3 ขนาดที่แตกต่างกัน ดังนี้

Gemini Ultra — โมเดลที่มีขนาดใหญ่ที่สุดและมีความสามารถมากที่สุดสำหรับงานที่มีความซับซ้อนสูง
Gemini Pro — โมเดลที่ดีที่สุดของเราสำหรับการปรับขนาดงานที่หลากหลาย
Gemini Nano — โมเดลที่มีประสิทธิภาพสูงสุดสำหรับการทำงานในอุปกรณ์

ประสิทธิภาพที่ล้ำสมัย

เราได้ทดสอบโมเดล Gemini อย่างละเอียดและประเมินประสิทธิภาพในการทำงานที่หลากหลาย ตั้งแต่การทำความเข้าใจภาพ เสียง และวิดีโอที่เป็นธรรมชาติไปจนถึงการให้เหตุผลทางคณิตศาสตร์ โดยพบว่าจากเกณฑ์มาตรฐานทางวิชาการที่ใช้ในการวิจัยและพัฒนาโมเดลภาษาขนาดใหญ่ (Large Language Model หรือ LLM) กันอย่างแพร่หลายจำนวน 32 รายการ Gemini Ultra มีประสิทธิภาพเหนือกว่าโมเดลที่ล้ำสมัยที่สุดอยู่ในขณะนี้มากถึง 30 รายการ

Gemini Ultra เป็นโมเดลแรกที่สามารถเอาชนะผู้เชี่ยวชาญที่เป็นมนุษย์ในด้าน MMLU (Massive Multitask Language Understanding) ด้วยคะแนน 90.0% จากการทดสอบประสิทธิภาพด้านความรู้รอบตัวและความสามารถในการแก้ปัญหา โดยครอบคลุม 57 วิชา เช่น คณิตศาสตร์ ฟิสิกส์ ประวัติศาสตร์ กฎหมาย การแพทย์ และจริยธรรม

แนวทางใหม่ของเราในการเปรียบเทียบประสิทธิภาพของ MMLU ช่วยให้ Gemini สามารถใช้ความสามารถในการให้เหตุผลเพื่อคิดให้รอบคอบมากขึ้นก่อนที่จะตอบคำถามที่ยากๆ ซึ่งนำไปสู่การพัฒนาที่สำคัญๆ นอกเหนือไปจากการใช้แค่เพียงความเข้าใจเบื้องต้น

Gemini มีประสิทธิภาพที่เหนือกว่าโมเดลอื่นๆ จากการเปรียบเทียบในด้านต่างๆ รวมถึงข้อความและการเขียนโค้ด

Gemini Ultra ยังได้รับคะแนนล้ำหน้าที่สุดถึง 59.4% จากเกณฑ์มาตรฐาน MMMU ใหม่ ซึ่งประกอบด้วยงานหลากหลายรูปแบบและครอบคลุมโดเมนต่างๆ ที่ต้องมีการให้เหตุผลอย่างรอบคอบ

จากการทดสอบด้วยเกณฑ์มาตรฐานด้านรูปภาพพบว่า Gemini Ultra มีประสิทธิภาพเหนือกว่าโมเดลรุ่นก่อนๆ โดยไม่ต้องอาศัยระบบการรู้จำอักขระด้วยรูปภาพ (Object Character Recognition หรือ OCR) ที่แยกข้อความจากรูปภาพเพื่อการประมวลผลเพิ่มเติม เกณฑ์มาตรฐานเหล่านี้เน้นย้ำถึงความสามารถในการเข้าใจและทำงานกับข้อมูลหลายประเภทแบบเนทีฟของ Gemini และบ่งบอกถึงสัญญาณเริ่มต้นของความสามารถในการให้เหตุผลที่ซับซ้อนมากขึ้นของ Gemini

ดูรายละเอียดเพิ่มเติมได้จากรายงานด้านเทคนิคเกี่ยวกับ Gemini ของเรา

Gemini มีประสิทธิภาพที่เหนือชั้นจากการทดสอบด้วยเกณฑ์มาตรฐานการทำงานกับข้อมูลหลายประเภท

ความสามารถของโมเดลรุ่นใหม่

จนถึงขณะนี้ แนวทางมาตรฐานในการสร้างโมเดลที่ทำงานได้กับข้อมูลหลายประเภทต้องอาศัยการฝึกคอมโพเนนต์ต่างๆ แยกกันสำหรับรูปแบบที่แตกต่างกัน จากนั้นจึงนำมาผนวกเข้าด้วยกันเพื่อเลียนแบบฟังก์ชันการทำงานนี้บางส่วน บางครั้งโมเดลเหล่านี้ก็สามารถทำงานบางอย่างได้ดี เช่น การอธิบายรูปภาพ แต่ยังต้องปรับปรุงในเรื่องของการให้เหตุผลเชิงมโนทัศน์และเชิงซ้อน

เราออกแบบ Gemini ให้เป็นโมเดลที่ทำงานได้กับข้อมูลหลายประเภทแบบเนทีฟ โดยได้รับการฝึกล่วงหน้าตั้งแต่เริ่มต้นในรูปแบบต่างๆ จากนั้นเราได้ปรับแต่ง Gemini ด้วยข้อมูลเพิ่มเติมหลายประเภทเพื่อพัฒนาประสิทธิภาพให้ดียิ่งขึ้น ซึ่งช่วยให้ Gemini เข้าใจและให้เหตุผลเกี่ยวกับอินพุตทุกประเภทตั้งแต่ต้นได้อย่างราบรื่นกว่าโมเดลประเภทเดียวกันที่มีอยู่ในขณะนี้ และความสามารถของ Gemini ก็ล้ำสมัยในเกือบทุกโดเมน

เรียนรู้เพิ่มเติมเกี่ยวกับความสามารถและการทำงานของ Gemini

การให้เหตุผลที่มีความซับซ้อน

ความสามารถในการให้เหตุผลหลายรูปแบบที่มีความซับซ้อนของ Gemini 1.0 ช่วยให้เข้าใจข้อมูลที่เป็นลายลักษณ์อักษรและภาพที่ซับซ้อนได้ สิ่งนี้ทำให้ Gemini มีทักษะเฉพาะตัวที่ช่วยให้เห็นถึงความรู้ที่ซ่อนอยู่และยากที่จะเข้าใจท่ามกลางข้อมูลจำนวนมหาศาล

ความสามารถที่โดดเด่นของ Gemini ในการดึงข้อมูลเชิงลึกจากเอกสารนับแสนผ่านการอ่าน การกรอง และการทำความเข้าใจข้อมูล จะช่วยทำให้เกิดความก้าวหน้าครั้งใหม่อย่างรวดเร็วในหลายแขนง ตั้งแต่วิทยาศาสตร์ไปจนถึงการเงิน

Gemini ช่วยปลดล็อกข้อมูลเชิงลึกทางวิทยาศาสตร์ใหม่ๆ

ความสามารถในการทำความเข้าใจข้อความ รูปภาพ เสียง และอื่นๆ

Gemini 1.0 ได้รับการฝึกให้จดจำและเข้าใจข้อความ รูปภาพ เสียง และอื่นๆ ในเวลาเดียวกัน ดังนั้นจึงเข้าใจข้อมูลโดยละเอียดได้ดีขึ้น และสามารถตอบคำถามเกี่ยวกับหัวข้อที่ซับซ้อนได้ ซึ่งทำให้ Gemini สามารถให้เหตุผลในวิชาที่มีความซับซ้อนอย่างเช่นคณิตศาสตร์และฟิสิกส์ได้ดีเป็นพิเศษ

Gemini ให้เหตุผลในวิชาคณิตศาสตร์และฟิสิกส์

การเขียนโค้ดขั้นสูง

Gemini เวอร์ชันแรกของเราสามารถเข้าใจ อธิบาย และสร้างโค้ดคุณภาพสูงในภาษาโปรแกรมยอดนิยมของโลก เช่น Python, Java, C++ และ Go ความสามารถในการทำงานข้ามภาษาและการให้เหตุผลเกี่ยวกับข้อมูลที่ซับซ้อนทำให้ Gemini เป็นหนึ่งในโมเดลพื้นฐานชั้นนำสำหรับการเขียนโค้ด

Gemini Ultra มีความเป็นเลิศในเกณฑ์มาตรฐานการเขียนโค้ดหลายรายการ ซึ่งรวมถึง HumanEval ซึ่งเป็นเกณฑ์มาตรฐานอุตสาหกรรมที่สำคัญสำหรับการประเมินประสิทธิภาพของงานเขียนโค้ด และ Natural2Code ซึ่งเป็นชุดข้อมูลสำหรับการวัดประสิทธิภาพภายในของเราที่ใช้แหล่งข้อมูลที่ผู้เขียนสร้างขึ้นแทนข้อมูลบนเว็บ

Gemini ยังสามารถนำไปใช้เป็นกลไกสำหรับระบบการเขียนโค้ดขั้นสูงได้อีกด้วย เมื่อ 2 ปีที่แล้วเราได้นำเสนอ AlphaCode ซึ่งเป็นระบบสร้างโค้ด AI ระบบแรกที่มีความสามารถในระดับที่แข่งขันกับมนุษย์ในการแข่งขันการเขียนโปรแกรม

เราใช้ Gemini เวอร์ชันพิเศษสร้าง AlphaCode 2 ขึ้นมา ซึ่งเป็นระบบการสร้างโค้ดขั้นสูงที่มีความเป็นเลิศในการแก้ปัญหาการเขียนโปรแกรมเชิงแข่งขัน ซึ่งนอกเหนือจากการเขียนโค้ดแล้วยังมีความสามารถในด้านคณิตศาสตร์ที่ซับซ้อนและวิทยาการคอมพิวเตอร์เชิงทฤษฎีอีกด้วย

Gemini มีความเป็นเลิศในการเขียนโค้ดและการเขียนโปรแกรมเชิงแข่งขัน

เมื่อประเมินบนแพลตฟอร์มเดียวกันกับ AlphaCode รุ่นแรก AlphaCode 2 แสดงให้เห็นถึงการพัฒนาศักยภาพครั้งใหญ่ โดยสามารถแก้ปัญหาได้มากกว่าเกือบสองเท่า และเราคาดการณ์ว่า AlphaCode 2 ทำงานได้ดีกว่า 85% ของผู้เข้าร่วมแข่งขันทั้งหมด หรือเพิ่มขึ้นจากเกือบ 50% สำหรับ AlphaCode นอกจากนี้ยังพบว่า เมื่อโปรแกรมเมอร์ทำงานร่วมกับ AlphaCode 2 โดยการกำหนดพร็อพเพอร์ตี้บางอย่างให้ตัวอย่างโค้ดปฏิบัติตาม AlphaCode 2 ก็จะทำงานได้ดียิ่งขึ้นไปอีก

เรารู้สึกตื่นเต้นที่โปรแกรมเมอร์จะใช้โมเดล AI ที่มีความสามารถสูงเป็นเครื่องมือในการทำงานร่วมกันมากขึ้น ซึ่งจะช่วยให้พวกเขาสามารถให้เหตุผลเกี่ยวกับปัญหาต่างๆ เสนอการออกแบบโค้ด และให้ความช่วยเหลือในการนำไปปฏิบัติ เพื่อให้พวกเขาสามารถเผยแพร่แอปและออกแบบบริการที่ดีกว่าเดิมได้เร็วยิ่งขึ้น

ดูรายละเอียดเพิ่มเติมได้จากรายงานด้านเทคนิคเกี่ยวกับ AlphaCode 2 ของเรา

โมเดลที่เชื่อถือได้ ปรับขนาดได้ และมีประสิทธิภาพมากขึ้น

เราได้ทำการฝึก Gemini 1.0 ในวงกว้างบนโครงสร้างพื้นฐานที่ปรับให้เหมาะสมกับ AI ของเราโดยใช้ Tensor Processing Unit (TPU) v4 และ v5e ที่ Google เป็นผู้ออกแบบเอง และเราได้ออกแบบ Gemini 1.0 ให้เป็นโมเดลสำหรับการฝึกที่น่าเชื่อถือและปรับขนาดได้มากที่สุด และเป็นโมเดลมีประสิทธิภาพมากที่สุดในการให้บริการของเรา

เมื่ออยู่บน TPU นั้น Gemini จะทำงานเร็วกว่าโมเดลรุ่นก่อนๆ ที่มีขนาดเล็กกว่าและมีความสามารถน้อยกว่าอย่างมาก โปรแกรม AI Accelerator ที่ออกแบบมาเป็นพิเศษเหล่านี้เป็นหัวใจสำคัญของผลิตภัณฑ์ที่ทำงานด้วยระบบ AI ของ Google ที่ให้บริการแก่ผู้ใช้หลายพันล้านคนทั่วโลก เช่น Google Search, YouTube, Gmail, Google Maps, Google Play และ Android นอกจากนี้ยังช่วยให้บริษัทต่างๆ ทั่วโลกสามารถฝึกโมเดล AI ขนาดใหญ่ได้อย่างคุ้มค่าอีกด้วย

วันนี้ เราขอประกาศเปิดตัวระบบ TPU ที่ทรงพลัง มีประสิทธิภาพ และปรับขนาดได้มากที่สุดเท่าที่มีในปัจจุบัน นั่นคือ Cloud TPU v5p ซึ่งออกแบบมาเพื่อฝึกโมเดล AI ที่ล้ำสมัย TPU รุ่นใหม่นี้จะเร่งการพัฒนาของ Gemini และช่วยให้นักพัฒนาซอฟต์แวร์และลูกค้าองค์กรฝึกโมเดล Generative AI ขนาดใหญ่ได้เร็วขึ้น ซึ่งจะทำให้ผลิตภัณฑ์และความสามารถใหม่ๆ เข้าถึงลูกค้าได้เร็วยิ่งขึ้น

ซูเปอร์คอมพิวเตอร์ที่ใช้ Cloud TPU v5p เป็น AI Accelerator ภายในศูนย์ข้อมูลของ Google

โมเดลที่สร้างขึ้นด้วยความรับผิดชอบและความปลอดภัยเป็นหัวใจหลัก

ที่ Google เรามุ่งมั่นที่จะพัฒนา AI อย่างกล้าหาญและมีความรับผิดชอบในทุกสิ่งที่เราทำ โดยยึดหลักการเกี่ยวกับ AI และนโยบายความปลอดภัยที่แข็งแกร่งในผลิตภัณฑ์ของเรา เรากำลังเพิ่มการป้องกันใหม่ๆ เพื่อรองรับความสามารถที่หลากหลายของ Gemini โดยในแต่ละขั้นตอนของการพัฒนา เราจะพิจารณาความเสี่ยงที่อาจเกิดขึ้น จากนั้นจะดำเนินการทดสอบและลดความเสี่ยงเหล่านั้น

ณ ปัจจุบัน Gemini มีการประเมินด้านความปลอดภัยที่ครอบคลุมมากที่สุดในบรรดาโมเดล AI ของ Google รวมถึงการประเมินอคติและความเป็นพิษ (toxicity) เราได้ดำเนินการวิจัยใหม่ๆ ในด้านความเสี่ยงที่อาจเกิดขึ้น เช่น การกระทำผิดทางไซเบอร์ การโน้มน้าวใจ และความเป็นอิสระในตนเอง และใช้เทคนิคการทดสอบแบบ Adversarial Testing ที่ดีที่สุดของทีมวิจัยของ Google เพื่อช่วยระบุปัญหาด้านความปลอดภัยที่สำคัญล่วงหน้าก่อนที่จะทำให้ Gemini ใช้งานได้

เรากำลังทำงานร่วมกับกลุ่มผู้เชี่ยวชาญภายนอกและพาร์ทเนอร์หลายกลุ่มเพื่อทดสอบความสามารถในการรับมือกับความท้าทายของโมเดลของเราในประเด็นต่างๆ เพื่อระบุจุดบอดในแนวทางการประเมินภายในของเรา

เรากำลังใช้เกณฑ์มาตรฐานต่างๆ เช่น Real Toxicity Prompts ที่ประกอบด้วยพรอมต์จำนวน 100,000 รายการที่มีระดับความเป็นพิษที่ดึงมาจากเว็บที่แตกต่างกัน ซึ่งพัฒนาโดยผู้เชี่ยวชาญที่ Allen Institute of AI เพื่อวินิจฉัยปัญหาความปลอดภัยของเนื้อหาในระหว่างขั้นตอนการฝึกของ Gemini และเพื่อให้แน่ใจว่าผลลัพธ์ที่ได้เป็นไปตามนโยบายของเรา เราจะอัปเดตรายละเอียดเพิ่มเติมเกี่ยวกับการดำเนินงานในส่วนนี้ให้ทราบในเร็วๆ นี้

สำหรับการจำกัดอันตรายที่อาจเกิดขึ้น เราได้สร้างตัวแยกประเภทความปลอดภัยโดยเฉพาะเพื่อระบุ ติดป้ายกำกับ และจัดเรียงเนื้อหาที่เกี่ยวข้องกับความรุนแรงหรือทัศนคติเชิงลบ เมื่อรวมเข้ากับตัวกรองที่ทำงานอย่างละเอียด วิธีการหลายขั้นตอนนี้ได้รับการออกแบบมาเพื่อทำให้ Gemini ปลอดภัยยิ่งขึ้นและใช้งานได้สำหรับทุกคน นอกจากนี้ เรายังจัดการกับความท้าทายสำหรับโมเดลต่างๆ ที่เราทราบกันดีอยู่แล้ว เช่น ข้อเท็จจริง การให้เหตุผล การระบุแหล่งที่มา และการหาพยานหลักฐานสนับสนุน

ความรับผิดชอบและความปลอดภัยจะยังคงเป็นสิ่งที่เราให้ความสำคัญในการพัฒนาและทำให้โมเดลของเราใช้งานได้อยู่เสมอ นี่เป็นความมุ่งมั่นระยะยาวที่จำเป็นต้องร่วมมือกันสร้างขึ้น ดังนั้นเราจึงร่วมมือกับอุตสาหกรรมและระบบนิเวศในวงกว้างขึ้นในการกำหนดแนวทางปฏิบัติแนะนำและกำหนดเกณฑ์มาตรฐานด้านความปลอดภัยผ่านองค์กรต่างๆ เช่น MLCommons, Frontier Model Forum และ AI Safety Fund และ Secure AI Framework (SAIF) ของเราซึ่งได้รับการออกแบบมาเพื่อช่วยลดความเสี่ยงด้านความปลอดภัยเฉพาะของระบบ AI ทั่วทั้งภาครัฐและเอกชน เราจะยังคงร่วมมือกับนักวิจัย ภาครัฐ และกลุ่มประชาสังคมทั่วโลกในการพัฒนา Gemini ต่อไป

การทำให้ Gemini พร้อมใช้งานทั่วโลก

เรากำลังทยอยนำ Gemini 1.0 มาใช้ในผลิตภัณฑ์และแพลตฟอร์มต่างๆ

Gemini Pro ในผลิตภัณฑ์ของ Google

เรากำลังนำ Gemini มาให้ผู้คนหลายพันล้านคนทั่วโลกได้ใช้ ผ่านผลิตภัณฑ์ต่างๆ ของ Google

ตั้งแต่วันนี้เป็นต้นไป Bard จะใช้ Gemini Pro เวอร์ชันที่ได้รับการพัฒนาให้ดีขึ้นเพื่อการให้เหตุผล การวางแผน การทำความเข้าใจขั้นสูง และอื่นๆ อีกมากมาย นี่เป็นการอัปเกรดครั้งใหญ่ที่สุดของ Bard นับตั้งแต่เปิดตัว

โดยในเบื้องต้น Gemini Pro ใน Bard จะพร้อมให้บริการในภาษาอังกฤษในกว่า 170 ประเทศและเขตแดนทั่วโลก และเรามีแผนที่จะขยายให้ครอบคลุมรูปแบบต่างๆ รวมถึงรองรับภาษาและให้บริการในประเทศอื่นๆ เพิ่มเติมในอนาคตอันใกล้นี้

นอกจากนี้เรายังจะเปิดตัว Gemini ใน Pixel โดย Pixel 8 Pro จะเป็นสมาร์ทโฟนเครื่องแรกที่ออกแบบมาเพื่อใช้งาน Gemini Nano ซึ่งขับเคลื่อนฟีเจอร์ใหม่ๆ เช่น ฟีเจอร์ Summarize ในโปรแกรมอัดเสียงและฟีเจอร์ช่วยตอบใน Gboard โดยจะเริ่มจาก WhatsApp ก่อน และจะมีแอปรับส่งข้อความเพิ่มมากขึ้นในปีหน้า

ในอีกไม่กี่เดือนข้างหน้า Gemini จะพร้อมใช้งานในผลิตภัณฑ์และบริการอื่นๆ ของเรา เช่น Google Search, Google Ads, Chrome และ Duet AI

เรากำลังเริ่มทดลองใช้ Gemini ใน Google Search ซึ่งทำให้ Search Generative Experience (SGE) เร็วขึ้นสำหรับผู้ใช้ โดยช่วยลดเวลาในการตอบสนองในภาษาอังกฤษในสหรัฐอเมริกาลงถึง 40% ควบคู่ไปกับการปรับปรุงคุณภาพ

การสร้างแอปด้วย Gemini

ตั้งแต่วันที่ 13 ธันวาคมเป็นต้นไป นักพัฒนาแอปและลูกค้าองค์กรจะสามารถเข้าถึง Gemini Pro ผ่านทาง Gemini API ใน Google AI Studio หรือ Google Cloud Vertex AI

Google AI Studio เป็นเครื่องมือบนเว็บที่ไม่เสียค่าใช้จ่ายสำหรับนักพัฒนา ซึ่งช่วยให้นักพัฒนาแอปและลูกค้าองค์กรสร้างต้นแบบและเปิดใช้แอปได้อย่างรวดเร็วด้วยคีย์ API เมื่อถึงเวลาสำหรับแพลตฟอร์ม AI ที่มีการจัดการเต็มรูปแบบ Vertex AI จะช่วยให้ปรับแต่ง Gemini ด้วยการควบคุมข้อมูลเต็มรูปแบบและรับประโยชน์จากฟีเจอร์เพิ่มเติมของ Google Cloud สำหรับการรักษาความปลอดภัย ความเป็นส่วนตัว การกำกับดูแลข้อมูล และการปฏิบัติตามข้อกำหนดขององค์กร

นอกจากนี้ นักพัฒนาแอป Android ยังสามารถสร้างแอปด้วย Gemini Nano ซึ่งเป็นโมเดลที่มีประสิทธิภาพสูงสุดสำหรับการทำงานในอุปกรณ์ ผ่านทาง AICore ซึ่งเป็นความสามารถระบบใหม่ที่พร้อมใช้งานใน Android 14 โดยเริ่มจากอุปกรณ์ Pixel 8 Pro ลงทะเบียนเพื่อดูตัวอย่าง AICore ก่อนใคร

Gemini Ultra จะเปิดตัวในเร็วๆ นี้

สำหรับ Gemini Ultra ขณะนี้เรากำลังดำเนินการตรวจสอบความน่าเชื่อถือและความปลอดภัยในด้านต่างๆ อยู่ รวมถึงการเข้าร่วมการทดสอบแบบ Adversarial Testing ของบุคคลภายนอกที่เชื่อถือได้ และการปรับปรุงโมเดลเพิ่มเติมโดยใช้การปรับแต่งอย่างละเอียดและการสนับสนุนการเรียนรู้ด้วยความคิดเห็นของมนุษย์ (Reinforcement Learning from Human Feedback หรือ RLHF) ก่อนที่จะเผยแพร่ในวงกว้าง

ส่วนหนึ่งของกระบวนการนี้ เราจะเปิดให้ลูกค้า นักพัฒนาแอป พาร์ทเนอร์ และผู้เชี่ยวชาญด้านความปลอดภัยและความรับผิดชอบบางรายทดลองใช้ Gemini Ultra และให้ข้อเสนอแนะก่อนในเบื้องต้น ก่อนที่จะเปิดให้บริการแก่นักพัฒนาแอปและลูกค้าองค์กรในวงกว้างในต้นปีหน้า

ในต้นปีหน้า เรายังจะเปิดตัว Bard Advanced ซึ่งเป็นประสบการณ์ AI แบบใหม่ที่ล้ำสมัยที่ให้คุณเข้าถึงโมเดลและความสามารถที่ดีที่สุดของเรา โดยจะเริ่มจาก Gemini Ultra ก่อน

ยุคของ Gemini และการขับเคลื่อนนวัตกรรมแห่งอนาคต

นี่เป็นก้าวสำคัญในการพัฒนา AI และเป็นการเริ่มต้นยุคใหม่สำหรับ Google โดยเราจะเดินหน้าสร้างสรรค์นวัตกรรมใหม่ๆ และพัฒนาขีดความสามารถของโมเดลของเราอย่างมีความรับผิดชอบ

จนถึงขณะนี้ เรามีความก้าวหน้าอย่างมากในการพัฒนา Gemini และเรากำลังทำงานอย่างหนักเพื่อขยายขีดความสามารถสำหรับเวอร์ชันใหม่ๆ ในอนาคต รวมถึงความก้าวหน้าในด้านการวางแผนและหน่วยความจำ และการเพิ่มบริบทสำหรับการประมวลผลข้อมูลเพิ่มเติมเพื่อให้การตอบสนองที่ดียิ่งขึ้น

เรารู้สึกตื่นเต้นกับความเป็นไปได้อันน่าทึ่งของโลกที่ขับเคลื่อนอย่างมีความรับผิดชอบด้วย AI ซึ่งเป็นนวัตกรรมแห่งอนาคตที่จะช่วยต่อยอดความคิดสร้างสรรค์ ขยายความรู้ สร้างความก้าวหน้าทางวิทยาศาสตร์ และสร้างการเปลี่ยนแปลงในการใช้ชีวิตประจำวันและการทำงานของผู้คนหลายพันล้านคนทั่วโลก

Official Google Thailand Blog

วันพฤหัสบดีที่ 7 ธันวาคม พ.ศ. 2566

ขอแนะนำ Gemini โมเดล AI ที่มีขนาดใหญ่ที่สุดและมีความสามารถมากที่สุดของเรา

ไม่มีความคิดเห็น:

แสดงความคิดเห็น