วันพุธที่ 21 พฤษภาคม พ.ศ. 2568

กระตุ้นความคิดสร้างสรรค์ของคุณด้วยโมเดลและเครื่องมือ Generative AI ใหม่ๆ สำหรับการสร้างสื่อ

ขอแนะนำ Veo 3, Imagen 4 และเครื่องมือใหม่สำหรับการสร้างภาพยนตร์ที่ชื่อว่า Flow


วันนี้เราขอประกาศเปิดตัวโมเดล Generative AI ใหม่ล่าสุด ซึ่งเป็นก้าวสำคัญของการสร้างสื่อ โมเดลเหล่านี้สร้างภาพ วิดีโอ และเสียงเพลงได้อย่างน่าทึ่ง ซึ่งช่วยให้ศิลปินสามารถทำให้แนวคิดสร้างสรรค์เป็นจริงได้ นอกจากนี้ยังเป็นเครื่องมือที่ยอดเยี่ยมสำหรับทุกคนในการแสดงออกอีกด้วย

Veo 3 และ Imagen 4 ซึ่งเป็นโมเดลการสร้างวิดีโอและรูปภาพใหม่ล่าสุดของเราได้ขยายขอบเขตการสร้างสื่อด้วยความสามารถใหม่ๆ ที่ล้ำสมัย นอกจากนี้ เรายังขยายสิทธิ์เข้าถึง Lyria 2 เพื่อให้นักดนตรีมีเครื่องมือเพิ่มเติมสำหรับแต่งเพลง และขอเชิญชวนผู้ที่ชอบเล่าเรื่องด้วยภาพมาลองใช้ Flow ซึ่งเป็นเครื่องมือสร้างภาพยนตร์ด้วย AI ใหม่ของเรา โดย Flow ใช้โมเดลที่ดีที่สุดของ Google DeepMind ให้คุณสร้างภาพยนตร์ได้อย่างง่ายดายด้วยการควบคุมตัวละคร ฉาก และสไตล์ที่ซับซ้อนยิ่งขึ้น เพื่อให้เรื่องราวของคุณมีชีวิตชีวา

เราได้ร่วมมืออย่างใกล้ชิดกับอุตสาหกรรมครีเอทีฟ ไม่ว่าจะเป็นผู้สร้างภาพยนตร์ นักดนตรี ศิลปิน หรือครีเอเตอร์ YouTube เพื่อช่วยให้สร้างโมเดลและผลิตภัณฑ์เหล่านี้อย่างมีความรับผิดชอบ รวมถึงมอบเครื่องมือใหม่ๆ ให้แก่ครีเอเตอร์เพื่อใช้ประโยชน์จากศักยภาพของ AI ในผลงานศิลปะได้อย่างมีประสิทธิภาพ

สร้างวิดีโอที่มีเสียงด้วย Veo 3

Veo 3 คือโมเดลการสร้างวิดีโอที่ล้ำสมัยใหม่ล่าสุดของเรา ซึ่งไม่เพียงปรับปรุงคุณภาพจาก Veo 2 เท่านั้น แต่ยังสามารถสร้างวิดีโอที่มีเสียงเป็นครั้งแรกได้ด้วย เช่น เสียงรถในฉากถนนในเมือง เสียงนกร้องในสวนสาธารณะ หรือแม้แต่บทสนทนาระหว่างตัวละคร




Veo 3 ทำงานได้อย่างยอดเยี่ยมในทุกด้าน ตั้งแต่การเขียนพรอมต์แบบข้อความและรูปภาพไปจนถึงฟิสิกส์ในชีวิตจริงและการซิงค์ปากที่แม่นยำ โมเดลนี้เข้าใจสิ่งต่างๆ ได้อย่างดีเยี่ยม คุณสามารถเล่าเรื่องราวสั้นๆ ลงในพรอมต์ แล้วโมเดลก็จะสร้างคลิปที่ถ่ายทอดเรื่องราวนั้นออกมาให้ Veo 3 พร้อมให้บริการแก่สมาชิก Google AI Ultra ในสหรัฐอเมริกาแล้ววันนี้ในแอป Gemini และใน Flow นอกจากนี้ยังเปิดให้บริการแก่ผู้ใช้ระดับองค์กรใน Vertex AI ด้วย

Veo 2: ความสามารถใหม่ๆ ที่สร้างขึ้นร่วมกับผู้สร้างภาพยนตร์และเพื่อผู้สร้างภาพยนตร์

ขณะพัฒนา Veo 3 เราก็ได้เพิ่มความสามารถใหม่ๆ ให้กับ Veo 2 โมเดลการสร้างวิดีโอรุ่นยอดนิยมของเราด้วย โดยใช้ข้อมูลที่ได้รับจากการร่วมงานกับครีเอเตอร์และผู้สร้างภาพยนตร์ วันนี้ เราจะเปิดตัวความสามารถใหม่ๆ ของ Veo 2 หลายรายการ ซึ่งรวมถึงรายการต่อไปนี้

  • ความสามารถของวิดีโอที่ทำงานด้วยระบบอ้างอิงสุดล้ำสมัย ช่วยให้คุณสามารถให้ Veo แสดงภาพตัวละคร ฉาก วัตถุ และแม้แต่รูปแบบต่างๆ เพื่อควบคุมการสร้างสรรค์และสร้างความสอดคล้องกันให้ดียิ่งขึ้น
  • การควบคุมกล้องช่วยให้คุณกำหนดการเคลื่อนไหวของกล้องได้อย่างแม่นยำ ไม่ว่าจะเป็นการหมุน การเลื่อน และซูม เพื่อให้ได้ช็อตที่สมบูรณ์แบบ
  • การขยายขอบเขตการแสดงผลช่วยให้คุณขยายเฟรมได้ ซึ่งจะเปลี่ยนวิดีโอจากแนวตั้งให้เป็นแนวนอนและปรับให้พอดีกับหน้าจอทุกขนาดได้ง่ายๆ เพิ่มความสวยงามให้กับฉากได้อย่างชาญฉลาด
  • การเพิ่มและนำวัตถุออกทำให้คุณสามารถเพิ่มหรือลบวัตถุออกจากวิดีโอได้ Veo เข้าใจเรื่องขนาด การโต้ตอบ และแสงเงา และใช้ความเข้าใจนี้เพื่อสร้างฉากที่ดูเป็นธรรมชาติสมจริง
วิดีโอที่ทำงานด้วยระบบอ้างอิงและการควบคุมกล้องพร้อมใช้งานแล้วใน Flow นอกจากนี้เราจะนำความสามารถใหม่ๆ ทั้งหมดนี้เข้าไปไว้ใน Vertex AI API ในอีกไม่กี่สัปดาห์ข้างหน้านี้ และจะขยายบริการไปยังผลิตภัณฑ์อื่นๆ เพิ่มเติมอีกในช่วง 2-3 เดือนข้างหน้า


วิดีโอต้นฉบับ

วิดีโอที่ขยายขอบเขตการแสดงผล

วิดีโอต้นฉบับ

วิดีโอที่นำเอายานอวกาศออก

Flow: เครื่องมือสร้างภาพยนตร์ด้วย AI ที่ออกแบบมาสำหรับ Veo

Flow เป็นเครื่องมือสร้างภาพยนตร์ด้วย AI ที่สร้างขึ้นร่วมกับครีเอทีฟและเพื่อครีเอทีฟ โดยเป็นเครื่องมือที่ให้คุณสร้างคลิปที่มีสไตล์แบบภาพยนตร์ ฉาก และเรื่องราวต่างๆ ได้อย่างราบรื่นด้วยการรวมโมเดลที่ล้ำสมัยที่สุดของ Google DeepMind ไว้ด้วยกัน ได้แก่ Veo, Imagen และ Gemini เพียงใช้ภาษาพูดทั่วไปเพื่ออธิบายช็อตที่คุณต้องการเพื่อให้ Flow จัดการองค์ประกอบต่างๆ ของเรื่องราว ไม่ว่าจะเป็นนักแสดง สถานที่ วัตถุ และสไตล์ ให้ครบจบในที่เดียว และใช้ Flow เพื่อถักทอการเล่าเรื่องให้กลายเป็นฉากที่สวยงาม

Flow พร้อมให้บริการแล้ววันนี้สำหรับผู้สมัครใช้บริการแพ็กเกจ Google AI Pro และ Ultra ในสหรัฐอเมริกา โดยจะมีให้บริการในประเทศอื่นๆ ในเร็วๆ นี้


Imagen 4: คุณภาพที่น่าทึ่งและการออกแบบตัวอักษรที่เหนือชั้น

โมเดล Imagen ล่าสุดของเราผสานความเร็วกับความแม่นยำเข้าด้วยกันเพื่อสร้างรูปภาพอันน่าทึ่ง Imagen 4 มีความคมชัดที่โดดเด่นในรายละเอียดเล็กๆ น้อยๆ เช่น ผ้าที่มีลวดลายซับซ้อน หยดน้ำ และขนสัตว์ ทั้งยังทำได้ดีทั้งสไตล์นามธรรมและสมจริง Imagen 4 สามารถสร้างรูปภาพในอัตราส่วนต่างๆ และความละเอียดสูงสุด 2K ซึ่งเหมาะสำหรับการพิมพ์หรืองานนำเสนอมากยิ่งขึ้น เครื่องมือนี้ยังช่วยเรื่องตัวสะกดและการออกแบบตัวอักษรได้ดีขึ้น ทำให้คุณสามารถสร้างการ์ดอวยพร โปสเตอร์ หรือแม้แต่การ์ตูนได้ง่ายขึ้น



Imagen 4 พร้อมใช้งานแล้ววันนี้ในแอป Gemini, Whisk, Vertex AI รวมถึงใน Google Slides, Vids, Google Docs และผลิตภัณฑ์อื่นๆ ใน Google Workspace

และในเร็วๆ นี้ เราจะเปิดตัว Imagen 4 เวอร์ชันที่ทำงานเร็วกว่า Imagen 3 ถึง 10 เท่า ซึ่งจะช่วยให้คุณสำรวจแนวคิดต่างๆ ได้เร็วขึ้น

Lyria 2: การสร้างสรรค์ทางดนตรีที่ทรงพลังและการสำรวจที่ไม่รู้จบ

ในเดือนเมษายน เราได้ขยายสิทธิ์เข้าถึง Music AI Sandbox ซึ่งขับเคลื่อนโดย Lyria 2 Music AI Sandbox มอบชุดเครื่องมือเวอร์ชันทดลองสำหรับนักดนตรี โปรดิวเซอร์ และนักแต่งเพลง ซึ่งสามารถจุดประกายความเป็นไปได้ใหม่ๆ ในการสร้างสรรค์และช่วยให้ศิลปินสำรวจแนวคิดทางดนตรีที่ไม่เหมือนใคร ความรู้ความชำนาญและความคิดเห็นที่มีค่าจากอุตสาหกรรมดนตรีช่วยให้เรามั่นใจได้ว่าเครื่องมือของเราจะช่วยส่งเสริมครีเอเตอร์ ในขณะเดียวกันก็เปิดโอกาสให้ครีเอทีฟได้ตระหนักถึงความเป็นไปได้ของการนำ AI มาใช้ในงานศิลปะของตน

Lyria 2 มาพร้อมการสร้างสรรค์ทางดนตรีที่ทรงพลังและการสำรวจที่ไม่รู้จบ ซึ่งตอนนี้พร้อมใช้งานสำหรับครีเอเตอร์ผ่าน YouTube Shorts และสำหรับผู้ใช้ระดับองค์กรใน Vertex AI นอกจากนี้เรายังได้สร้าง Lyria RealTime ซึ่งเป็นโมเดลการสร้างเพลงแบบอินเทอร์แอกทีฟที่ขับเคลื่อน MusicFX DJ โดยโมเดลนี้พร้อมใช้งานผ่าน API และใน AI Studio Lyria RealTime ช่วยให้ทุกคนสามารถโต้ตอบ สร้างสรรค์ ควบคุม และแสดงดนตรีที่สร้างสรรค์ด้วย Generative AI ได้แบบเรียลไทม์

การสร้างสรรค์และการร่วมมือกันอย่างมีความรับผิดชอบกับชุมชนครีเอทีฟ

นับตั้งแต่เปิดตัวในปี 2023 SynthID ได้ใส่ลายน้ำในรูปภาพ วิดีโอ ไฟล์เสียง และข้อความกว่า 1 หมื่นล้านรายการ ซึ่งช่วยให้สามารถระบุได้ว่าเนื้อหาดังกล่าวเป็นข้อมูลที่ AI สร้างขึ้น และลดโอกาสในการให้ข้อมูลที่ไม่ถูกต้องและการระบุแหล่งที่มาที่ไม่ถูกต้อง โดยเนื้อหาที่สร้างขึ้นด้วย Veo 3, Imagen 4 และ Lyria 2 จะยังคงมีลายน้ำ SynthID

ในวันนี้ เราจะเปิดตัว SynthID Detector ซึ่งเป็นพอร์ทัลการยืนยันที่จะช่วยให้ผู้คนระบุเนื้อหาที่ AI สร้างขึ้นได้ เมื่ออัปโหลดเนื้อหา SynthID Detector จะระบุว่าไฟล์ทั้งหมดหรือเนื้อหาเพียงบางส่วนมี SynthID อยู่หรือไม่

เรามุ่งมั่นที่จะให้โมเดล Generative AI ทั้งหมดที่มีอยู่ของเราช่วยปลดล็อกความคิดสร้างสรรค์ของมนุษย์และช่วยให้ศิลปินและครีเอเตอร์นำไอเดียของตนมาสร้างสรรค์เป็นชิ้นงานได้อย่างรวดเร็วและง่ายดายกว่าที่เคย

Eli Collins

VP, Google DeepMind

ไม่มีความคิดเห็น:

แสดงความคิดเห็น