ค้นหา
ทีวีออนไลน์
เว็บไซต์ในเครือ
เว็บไซต์บริการ

บอกลาหุ่นหน้าตาย! หุ่นยนต์ AI ฝึก "พูดหน้ากระจก" เรียนรู้การขยับปาก ลิปซิงค์ได้หลายภาษา


วิทยาศาสตร์ & เทคโนโลยี

ขนิษฐา จันทร์ทร

แชร์

บอกลาหุ่นหน้าตาย! หุ่นยนต์ AI ฝึก "พูดหน้ากระจก" เรียนรู้การขยับปาก ลิปซิงค์ได้หลายภาษา

https://www.thaipbs.or.th/now/content/3577

บอกลาหุ่นหน้าตาย! หุ่นยนต์ AI ฝึก "พูดหน้ากระจก" เรียนรู้การขยับปาก ลิปซิงค์ได้หลายภาษา

นักวิจัยพัฒนาเทคนิคใหม่ให้หุ่นยนต์ AI เรียนรู้การลิปซิงค์ด้วยตัวเองจากการสังเกตและเลียนแบบมนุษย์ ลดภาพจำหุ่นหน้าตาย และเปิดทางสู่การสื่อสารที่เป็นธรรมชาติมากขึ้น

ทีมนักวิจัยสหรัฐฯ พลิกโฉมวงการหุ่นยนต์ด้วยการพัฒนาระบบ AI ที่สามารถเรียนรู้การ "ลิปซิงค์" หรือขยับริมฝีปากตามเสียงพูดได้อย่างสมจริง โดยใช้เทคนิคการสังเกตและเลียนแบบพฤติกรรมมนุษย์ ซึ่งจะช่วยให้การสื่อสารระหว่างมนุษย์และเครื่องจักรมีความเป็นธรรมชาติและสามารถเชื่อมโยงทางอารมณ์ได้ดียิ่งขึ้น

พลิกแนวคิดการสอนหุ่นยนต์ให้พูดเหมือนมนุษย์

งานวิจัยของนักวิทยาศาสตร์และวิศวกรจาก มหาวิทยาลัยโคลัมเบีย (Columbia University) ประเทศสหรัฐอเมริกา ได้รับการตีพิมพ์ในวารสาร Science Robotics โดยทีมวิจัยภายใต้การนำของ ศาสตราจารย์ ฮอด ลิปสัน (Hod Lipson) ได้นำเสนอหุ่นยนต์ฮิวแมนนอยด์ที่ไม่ได้ถูกโปรแกรมคำสั่งแบบตายตัว แต่ใช้ระบบปัญญาประดิษฐ์เพื่อเรียนรู้การแสดงออกทางสีหน้าผ่านการสังเกต ซึ่งช่วยแก้ปัญหาอาการแข็งทื่อของหุ่นยนต์ที่มักทำให้มนุษย์รู้สึกไม่สบายใจเมื่อเผชิญหน้า หรือที่เรียกว่าสภาวะ "หุบเขาแห่งความแปลกประหลาด" (Uncanny Valley)

พูดหน้ากระจก ฝึกควบคุมมอเตอร์ใบหน้า 26 จุด

ความลับของความสมจริงนี้อยู่ที่การติดตั้งมอเตอร์ขนาดเล็ก 26 ตัว ไว้ใต้ผิวหนังซิลิโคน ซึ่งเปรียบเสมือนกล้ามเนื้อใบหน้า ในช่วงแรก หุ่นยนต์จะถูกวางไว้หน้ากระจกเพื่อฝึกฝนเทคโนโลยี "การจำลองโมเดลด้วยตัวเอง" (Self-modeling) โดยการขยับใบหน้าแบบสุ่มนับพันครั้งเพื่อให้ AI เรียนรู้ว่าการเคลื่อนไหวมอเตอร์แต่ละตัวส่งผลต่อรูปร่างริมฝีปากอย่างไร

กระบวนการนี้เรียกว่าโมเดลภาษาจากภาพสู่การกระทำ (Vision-to-Action Language Model หรือ VLA) ซึ่งเป็นการปูพื้นฐานให้หุ่นยนต์เข้าใจร่างกายก่อนจะเริ่มสื่อสาร

เรียนรู้การลิปซิงค์จากวิดีโอออนไลน์

หลังจากเข้าใจกลไกใบหน้าแล้ว หุ่นยนต์จะเข้าสู่ขั้นตอนการเรียนรู้จากการสังเกต (Observational Learning) โดยระบบ AI จะศึกษาภาพใบหน้าของมนุษย์ขณะพูดและร้องเพลงจากวิดีโอนับพันชั่วโมงบนแพลตฟอร์มออนไลน์ เพื่อจดจำว่าเสียงแต่ละพยางค์สัมพันธ์กับการขยับปากอย่างไร

เทคนิคนี้ช่วยให้หุ่นยนต์สามารถเปลี่ยนสัญญาณเสียงเป็นคำสั่งควบคุมมอเตอร์ได้ทันที ทำให้สามารถลิปซิงค์ได้หลายภาษาทั่วโลก รวมถึงสามารถร้องเพลงที่มีท่วงทำนองซับซ้อนได้อย่างลื่นไหลโดยไม่ต้องพึ่งพาการเขียนโค้ดล่วงหน้า

สร้างความเชื่อมโยงทางอารมณ์

ทีมวิจัยระบุว่าใบหน้าคือจุดเชื่อมต่อการสื่อสารที่สำคัญที่สุด โดยมนุษย์จะจดจ้องที่ริมฝีปากเกือบครึ่งหนึ่งของเวลาสนทนา การที่หุ่นยนต์สามารถขยับปากได้อย่างถูกต้องจะช่วยเพิ่มความน่าเชื่อถือและความอบอุ่นในการสื่อสาร ซึ่งจะมีประโยชน์อย่างมหาศาลเมื่อนำไปใช้ในงานด้านการศึกษา การแพทย์ และการดูแลผู้สูงอายุ

นอกจากนี้ เมื่อนำเทคโนโลยีลิปซิงค์ไปผสานกับระบบ AI สนทนาขั้นสูง จะยิ่งช่วยให้การสื่อสารมีมิติทางอารมณ์ที่ลึกซึ้งขึ้น เปลี่ยนเครื่องจักรให้กลายเป็นคู่สนทนาที่มนุษย์ไว้วางใจได้มากขึ้น เพราะมีการเคลื่อนไหวที่สมจริง

ความท้าทายในการออกเสียงที่ต้องห่อปาก

แม้จะมีความก้าวหน้าอย่างมาก แต่ปัจจุบันหุ่นยนต์ยังประสบปัญหาในการออกเสียงพยัญชนะบางตัวที่ต้องใช้การห่อปากหรือระเบิดลมแรง ๆ เช่น เสียง "B" หรือ "W" ซึ่งทีมงานจะพัฒนาการฝึกฝนให้แม่นยำยิ่งขึ้นต่อไป นอกจากนี้ยังต้องคำนึงถึงประเด็นด้านจริยธรรม เนื่องจากความสมจริงที่เพิ่มขึ้นอาจถูกนำไปใช้ในการเลียนแบบมนุษย์ในทางที่ผิด ทีมวิจัยจึงเน้นย้ำถึงความรอบคอบในการพัฒนาเทคโนโลยีนี้ เพื่อให้เกิดประโยชน์สูงสุดในฐานะผู้ช่วยที่มีประสิทธิภาพและปลอดภัยต่อสังคม

การเปลี่ยนผ่านจากหุ่นยนต์ที่ทำงานตามกฎเกณฑ์ ไปสู่หุ่นยนต์ที่เรียนรู้การมีปฏิสัมพันธ์ด้วยตนเอง ด้วยความสามารถในการลิปซิงค์และแสดงออกทางสีหน้าได้อย่างเป็นธรรมชาตินับเป็นจุดเริ่มต้นของการสร้างหุ่นยนต์ฮิวแมนนอยด์ที่จะเข้ามามีบทบาทในชีวิตประจำวันของเรามากขึ้น ไม่ใช่ในฐานะเพียงเครื่องมือ แต่ในฐานะคู่สนทนาที่สามารถสื่อสารได้อย่างเข้าใจและเข้าถึงอารมณ์ความรู้สึกของมนุษย์ได้อย่างแท้จริงในอนาคตอันใกล้

เรียบเรียงโดย ขนิษฐา จันทร์ทร

ที่มาข้อมูล: columbia, newatlas, techxplore, interestingengineering
ที่มาภาพ: columbia 

อัปเดตข้อมูลแวดวงวิทยาศาสตร์ เทคโนโลยี รู้ทันโลกไอที และโซเชียลฯ ในรูปแบบ Audio จาก AI เสียงผู้ประกาศของไทยพีบีเอส ได้ที่ Thai PBS

“รอบรู้ ดูกระแส ก้าวทันโลก” ไปกับ Thai PBS Sci & Tech

แท็กที่เกี่ยวข้อง

Thai PBS Sci And Tech Thai PBS Sci & Tech TechnologyAIหุ่นยนต์
ขนิษฐา จันทร์ทร

ผู้เขียน: ขนิษฐา จันทร์ทร

นักเขียนอิสระ สนใจเทคโนโลยี เชื่อว่าคอนเทนต์และ Storytelling ที่ดี สามารถเชื่อมโยงผู้คนกับข้อมูลได้

บทความ NOW แนะนำ