สรุปไฮไลต์สำคัญงาน Google I/O 2026 : ยุคแห่ง AI Agent


แชร์

สรุปไฮไลต์สำคัญงาน Google I/O 2026 : ยุคแห่ง AI Agent

https://www.thaipbs.or.th/now/content/3989

สรุปไฮไลต์สำคัญงาน Google I/O 2026 : ยุคแห่ง AI Agent

สรุปไฮไลต์ที่น่าสนใจในงาน Google I/O 2026 เปลี่ยนผ่านทางเทคโนโลยี จากยุค "Prompt-driven AI" AI ที่รอรับคำสั่ง ไปสู่ "Agentic AI" หรือระบบอัตโนมัติที่มีอิสระในการดำเนินงานเพื่อช่วยเหลือมนุษย์มากขึ้น

Google I/O งานประชุมนักพัฒนาประจำปีครั้งใหญ่ที่สุดแห่งปีของ Google ซึ่งจัดขึ้นในวันที่ 19-20 พฤษภาคม ที่ Shoreline Amphitheatre ในเมืองเมาน์เทนวิว รัฐแคลิฟอร์เนีย เพื่อเรียนรู้เกี่ยวกับความก้าวหน้าล่าสุดด้าน AI และการอัปเดตผลิตภัณฑ์ต่าง ๆ ทั่วทั้งบริษัท ตั้งแต่ Gemini ไปจนถึง Android และอื่น ๆ

ปีนี้ Google ประกาศเดินหน้าลุยพัฒนาด้านปัญญาประดิษฐ์ AI อย่างเต็มสูบ ภายใต้แนวคิดการเปลี่ยนผ่านเข้าสู่ "ยุคแห่ง Agentic" (Agentic Era) หรือยุคที่ AI สามารถคิดและทำงานต่าง ๆ แทนได้อย่างเป็นอิสระ วันนี้ Thai PBS Sci & Tech สรุปไฮไลต์ที่น่าสนใจมาฝากกัน

Google AI Showcase ภาพจาก AP Photo/Jeff Chiu

1. เปิดตัวโมเดลใหม่ Gemini 3.5 และ Gemini 3.5 Flash

Google ประกาศเปิดตัวโมเดลปัญญาประดิษฐ์เจเนอเรชันใหม่ในตระกูล Gemini 3.5 โดยเริ่มให้บริการโมเดล Gemini 3.5 Flash ตั้งแต่วันนี้เป็นต้นไป ซึ่งจะกลายเป็นโมเดลเริ่มต้น ในแอปฯ​ Gemini และฟีเชอร์ AI Mode บน Google Search ซึ่งมีจุดเด่นด้านความเร็ว การเขียนโค้ดที่มีประสิทธิภาพสูงขึ้น และประหยัดโทเคน ส่วนโมเดลระดับท็อปอย่าง Gemini 3.5 Pro จะเปิดตัวตามมาในเดือนหน้า

Gemini 3.5

2. Gemini Spark ผู้ช่วยส่วนตัว AI ที่ทำงานตลอด 24 ชั่วโมง

อีกหนึ่งในสิ่งแปลกใหม่และทะเยอทะยานที่สุดในงาน Google I/O นั่นก็คือการเปิดตัว "Gemini Spark" ซึ่งเป็น AI Agent บนคลาวด์ที่ทำงานอยู่เบื้องหลังอย่างต่อเนื่องตลอด 24 ชั่วโมง สามารถจัดการภารกิจที่ซับซ้อนแทนมนุษย์ได้ เช่น การเขียนอีเมล, จัดการสัญญากับหน่วยงาน, จัดตารางงานเลี้ยง, วางแผนการเรียน หรือแม้แต่ตรวจสอบค่าธรรมเนียมต่าง ๆ โดยจะเชื่อมต่อกับบริการของ Google และเครื่องมือจากภายนอก (Third-party) กว่า 30 รายการผ่านโปรโตคอล MCP เช่น Adobe, Dropbox และ Uber

Gemini Spark

3. Gemini Omni สร้างสรรค์ได้จากทุก Input

Google เปิดตัว Gemini Omni โมเดลประเภท Multimodal World Model ซึ่ง เดมิส ฮัสซาบิส ซีอีโอของ Google DeepMind ระบุว่า เป็นก้าวสำคัญที่จะนำไปสู่ระบบปัญญาประดิษฐ์ทั่วไป (Artificial General Intelligence - AGI) โมเดลนี้ถูกออกแบบมาให้ผู้ใช้จะ input อะไรเข้าไปก็ได้ และสั่งให้สร้างอะไรออกมาก็ได้ โดยไม่จำเป็นต้องผ่านขั้นตอนแปลงเป็นข้อความก่อน

สำหรับในงานนี้ เน้นโชว์ศักยภาพด้านการสร้างและตัดต่อวิดีโอเป็นหลัก เช่น การเปลี่ยนพื้นหลัง การเปลี่ยนมุม และการปรับรายละเอียดเฉพาะในคลิป นอกจากนี้ยังมีฟีเชอร์ Avatar สำหรับสร้างภาพเหมือนดิจิทัล แม้ว่า Google จะกล่าวว่ายังอยู่ในระหว่างการทดสอบก่อนที่จะเปิดตัวในวงกว้าง ขณะที่วิดีโอทั้งหมดที่สร้างโดย Omni จะฝังลายน้ำ SynthID ของ Google เพื่อระบุว่าเป็นวิดีโอที่สร้างโดย AI

สำหรับโมเดลแรกในตระกูลอย่าง Gemini Omni Flash ซึ่งเปิดให้ใช้งานแล้ววันนี้สำหรับผู้สมัครใช้งาน AI Plus, Pro และ Ultra แบบชำระเงินในแอปฯ Gemini และ Google Flow และเปิดให้ใช้งานฟรีบน YouTube Shorts และ YouTube Create ในช่วงปลายสัปดาห์นี้

Gemini Omni

4. แว่นตาอัจฉริยะ “Audio Glasses”

Google ร่วมมือกับ Samsung และ Qualcomm เปิดตัวแว่นตาอัจฉริยะกลุ่มแรกในแพลตฟอร์ม Android XR โดยถูกเรียกว่า "Audio Glasses" มีกำหนดวางจำหน่ายในช่วงปลายปีนี้ ตัวแว่นเน้นการออกแบบให้ดูมีสไตล์และสวมใส่ได้จริงในชีวิตประจำวัน ผ่านการร่วมมือกับแบรนด์แว่นตาชื่อดังอย่าง Warby Parker และ Gentle Monster เพื่อไม่ให้ดูเหมือนแว่นตาติดกล้องจนเกินไป แว่นนี้รองรับการทำงานร่วมกับทั้งโทรศัพท์ Android และ iPhone และสามารถใช้ AI ในการวิเคราะห์สิ่งที่เราเห็นเพื่อสั่งกาแฟ หรือเปิดเพลงต้อนรับได้

แว่นตาอัจฉริยะ Audio Glasses

5. ปรับโฉมดีไซน์ Gemini ใหม่ในชื่อ “Neural Expressive”

แอปพลิเคชัน Gemini กำลังจะได้รับการปรับเปลี่ยนภาษาการออกแบบใหม่ทั้งหมด ภายใต้ชื่อ Neural Expressive ที่จะมาพร้อมแอนิเมชันที่ลื่นไหล สีสันที่สดใส การจัดวางตัวอักษรแบบใหม่ รวมถึงระบบตอบสนองด้วยการสั่น เมื่อผู้ใช้สัมผัสปุ่มต่าง ๆ บนหน้าจอ

6. ยกระดับ Google Search ด้วย AI Mode และกล่องค้นหาอัจฉริยะ

ระบบค้นหา Google Search จะถูกปรับโฉมใหม่โดยใช้โมเดล Gemini 3.5 Flash เป็นขุมพลังใน AI Mode นอกจากนี้ Google ยังออกแบบกล่องค้นหาใหม่ครั้งแรกในรอบกว่า 25 ปี โดยจะขยายขนาดกว้างขึ้นโดยอัตโนมัติเมื่อผู้ใช้พิมพ์ข้อความยาว ๆ เพื่อรองรับพฤติกรรมการค้นหาในปัจจุบันที่เป็นลักษณะการสนทนาและมีความยาวมากขึ้น และให้แนบรูปภาพ วิดีโอ ไฟล์ และแม้แต่แท็บ Chrome ไปพร้อมกับการค้นหาได้ พร้อมระบบแนะนำคำค้นหาที่ช่วยคาดเดาความตั้งใจของผู้ใช้ล่วงหน้า โดย Google ตั้งใจจะให้ผู้ใช้หยุดค้นหาด้วย Google แต่เริ่มพูดคุยกับ Google แทน

Ark Google

7. Ask YouTube และ Google Flow

• Ask YouTube ฟีเชอร์ที่จะช่วยค้นหาและระบุช่วงเวลาที่เจาะจงของวิดีโอที่สามารถตอบคำถามที่คุณอยากรู้ได้ทันที โดยไม่ต้องนั่งดูวิดีโอจนจบ
• Google Flow และ Flow Music เครื่องมือสร้างสรรค์วิดีโอและเพลงด้วย AI ได้รับการอัปเดตโมเดลเป็น Gemini Omni Flash ทำให้นักสร้างสรรค์สามารถเปลี่ยนฉาก เพิ่มเอฟเฟกต์ ตัวละคร หรือเสียงพากย์ได้ง่ายขึ้น และตอนนี้เปิดตัวในรูปแบบแอปพลิเคชันบนมือถือแล้ว (Flow บน Android และ Flow Music บน iOS)

Ask YouTube

8. Universal Cart ผู้ช่วยชอปปิงส่วนตัว

Google เปิดตัวระบบ Universal Cart ตะกร้าสินค้าอัจฉริยะ ที่ขับเคลื่อนด้วย AI Agent เพื่อช่วยให้การชอปปิงออนไลน์สนุกและเป็นระบบมากขึ้น โดย AI สามารถช่วยเลือกซื้อสินค้า เพิ่มสินค้าลงในตะกร้าได้ในขณะที่คุณกำลังค้นหาข้อมูล แชตกับ Gemini ดู YouTube หรือแม้กระทั่งอ่านอีเมลใน Gmail พร้อมทั้งยังช่วยเปรียบเทียบราคา และรวมตระกร้าสินค้าจากร้านค้าต่าง ๆ มาไว้ในที่เดียว

ทันทีที่คเพิ่มสินค้าลงในตะกร้า ระบบจะเริ่มทำงานเบื้องหลังโดยอัตโนมัติ ค้นหาโปรโมชันและราคาลดพิเศษ ให้ข้อมูลเชิงลึกเกี่ยวกับประวัติราคา และแจ้งเตือนเมื่อสินค้ากลับมาวางจำหน่ายอีกครั้ง 

Universal Cart จะเริ่มใช้งานใน Google Search และแอปฯ Gemini ในสหรัฐอเมริกาช่วงปลายปี โดยจะตามมาด้วย YouTube และ Gmail ในภายหลัง

Universal Cart

9. Google Docs Live เปลี่ยนเสียงบ่นให้กลายเป็นบทความ

ฟีเชอร์ใหม่บน Google Docs ที่ช่วยให้ผู้ใช้งานสามารถพูดไอเดียหรือสิ่งที่คิดในหัวออกมา จากนั้นระบบ AI จะนำคำพูดเหล่านั้นมาประมวลผลและเรียบเรียงใหม่ให้กลายเป็นบทความหรือเอกสารที่สละสลวยและเข้าใจง่ายในทันที

Docs Live

10. ขยายระบบ C2PA และ SynthID

เครื่องมือสร้างลายน้ำดิจิทัลด้วย AI ของ Google อย่าง SynthID กำลังถูกนำไปใช้โดย OpenAI, Kakao และ ElevenLabs โครงการของ Google นี้กำลังกลายเป็นมาตรฐานอุตสาหกรรมในการต่อสู้กับเนื้อหาที่สร้างโดย AI และยังเป็นช่วงเวลาที่หาได้ยากของการร่วมมือข้ามบริษัทในแวดวง AI อีกด้วย

และการรับรองเนื้อหาตามมาตรฐาน C2PA ไปยังฟีเชอร์ Search และเบราว์เซอร์ Chrome เพื่อให้ผู้ใช้ตรวจสอบได้ง่ายขึ้นว่ารูปภาพหรือสื่อใดถูกสร้างขึ้นด้วย AI นอกจากนี้บน YouTube ยังมีการขยายระบบตรวจสอบการนำใบหน้าของผู้สร้างสรรค์ (Creators) ไปดัดแปลงด้วย AI สำหรับผู้ใช้ที่อายุ 18 ปีขึ้นไปทุกคน

SynthID

นี่เป็นเพียงแค่ส่วนหนึ่งเท่านั้น Google ยังมีการพัฒนานวัตกรรมอื่น ๆ ที่น่าสนใจ และฟีเชอร์ใหม่อีกมากมาย เพื่อให้นับต่อจากนี้ไป AI ที่ทุกคนใช้จะไม่ใช่แค่เครื่องมือรอรับคำสั่งจากผู้ใช้ แต่จะกลายเป็นผู้ช่วยอิสระที่คิดและทำงานแทนมนุษย์ได้ 24 ชั่วโมง

ที่มา : Google Blog

อัปเดตข้อมูลแวดวงวิทยาศาสตร์ เทคโนโลยี รู้ทันโลกไอที และโซเชียลฯ ในรูปแบบ Audio จาก AI เสียงผู้ประกาศของไทยพีบีเอส ได้ที่ Thai PBS

“รอบรู้ ดูกระแส ก้าวทันโลก” ไปกับ Thai PBS Sci & Tech

แท็กที่เกี่ยวข้อง

Thai PBS Sci & Tech Thai PBS Sci And Tech AIGoogleGemini
Thai PBS Sci & Tech

ผู้เขียน: Thai PBS Sci & Tech

🌎 "รอบรู้ ดูกระแส ก้าวทันโลก" ไปกับ Thai PBS Sci & Tech • วิทยาศาสตร์ • เทคโนโลยี นวัตกรรม • ดาราศาสตร์ • Media Literacy • Cyber Security • Tips & Tricks • Trends

บทความ NOW แนะนำ