รู้ไหม? ไฟล์ PDF ที่ดูธรรมดา กำลังกลายเป็นปัญหาสำหรับปัญญาประดิษฐ์ (AI) แทบทุกครั้ง เนื่องจากโครงสร้างของ PDF (Portable Document Format) ของ Adobe เพราะแม้จะอ่านเอกสารได้เหมือนกันทุกดีไวซ์ แต่ความเป๊ะของเลย์เอาต์ทำให้โมเดลภาษาขนาดใหญ่ (Large Language Model : LLM) งงงวย-สับสน จน AI เกิดอาการหลอน
อธิบายเหตุผลที่ Large Language Model งง+หลอน ก็คือ AI จะเก็บข้อมูลเป็นพิกัดกราฟิก อ่านบรรทัดจากซ้ายไปขวาอย่างเคร่งครัด อาจสะดุดกับเอกสารทางวิทยาศาสตร์ที่มีหลายคอลัมน์ อ่านข้ามฝั่ง แล้วเอาสรุปมารวมกับเนื้อหา ลามไปสู่ปัญหาที่เรียกว่า “AI หลอน” (AI Hallucinations) สร้างแบบจำลอง สร้างบทสรุปที่ไม่ถูกต้อง ไปจนถึงสร้างรายละเอียดขึ้นมาเอง
ด้วยเหตุนี้ทำให้ Adobe Acrobat AI Assistant และ Google Gemini มีความพยายามใส่เครื่องมือ เพื่อช่วยให้ปัญญาประดิษฐ์ (AI) สามารถเข้าใจโครงสร้าง PDF ได้แม่นยำมากยิ่งขึ้น

นอกจากนี้ ยังมีประเด็นสำคัญเกี่ยวกับความปลอดภัยของไฟล์ PDF โดยบริษัทรักษาความปลอดภัยทางไซเบอร์ Check Point รายงานว่า การโจมตีผ่านอีเมลประมาณหนึ่งในห้าครั้งใช้ไฟล์ PDF ที่ติดมัลแวร์ เนื่องจากถูกใช้ประโยชน์จากความสามารถของรูปแบบไฟล์ในการฝังสคริปต์และลิงก์
ผู้ประกอบการบางรายมองว่า อุปสรรคของ AI เป็นโอกาสในการสร้างโครงสร้างพื้นฐานของเอกสารดิจิทัลขึ้นใหม่ เช่น Factify สตาร์ตอัปสัญชาติอิสราเอลที่นำโดย Matan Gavish กำลังพัฒนาฟอร์แมตที่ออกแบบมาตั้งแต่เริ่มต้น เพื่อให้สามารถทำงานร่วมกับโมเดลภาษาขนาดใหญ่ได้อย่างราบรื่น เนื่องจากมองว่าไฟล์ PDF ไม่เหมาะกับยุคของการทำงานอัตโนมัติด้วย AI
Matan Gavish กล่าวว่า Factify กำลังสร้างระบบใหม่ รูปแบบใหม่ เลเยอร์ข้อมูล และแอปพลิเคชันส่วนติดต่อผู้ใช้ เพื่อสร้างเอกสารอัจฉริยะที่เชื่อมต่อกันและรองรับการเปลี่ยนแปลงได้ จำเป็นต้องสร้างหลายสิ่งหลายอย่างขึ้นมาใหม่ทั้งหมด
อัปเดตข้อมูลแวดวงวิทยาศาสตร์ เทคโนโลยี รู้ทันโลกไอที และโซเชียลฯ ในรูปแบบ Audio จาก AI เสียงผู้ประกาศของไทยพีบีเอส ได้ที่ Thai PBS
ที่มาข้อมูล : techspot
“รอบรู้ ดูกระแส ก้าวทันโลก” ไปกับ Thai PBS Sci & Tech









