Google เปิดตัว MedGemma AI Opensource ด้านการแพทย์

เมื่อเร็ว ๆ นี้ Google ได้เปิดตัว MedGemma ปัญญาประดิษฐ์วิเคราะห์ข้อมูลด้านการแพทย์ ทำความเข้าใจภาพถ่ายทางการแพทย์ ช่วยเหลือด้านการวินิจฉัยโรค และเข้าใจข้อมูลเวชระเบียนคนไข้ได้

เริ่มจากก่อนหน้านี้ Google เคยเปิดตัว MedGemma 4B Multimodal กับ MedGemma 27B Text ไปก่อนหน้า ในครั้งนี้ได้เปิดตัว MedGemma 27B Multimodal และ MedSigLIP ซึ่งเครื่องมือทั้งหมดในกลุ่มของ MedGemma เป็น Open Source หรือก็คือซอฟต์แวร์ที่สามารถนำโมเดลไปใช้งานบนเครื่องได้โดยเสรี

แผนผังของโมเดล MedGemma ทั้งตัว MedGemma และ MedSigLIP ที่เพิ่งเปิดตัวมาใหม่ ภาพจาก Google

สำหรับ MedGemma โมเดลที่เน้นการวิเคราะห์ข้อความถูกออกแบบมาให้ทำงานจัดการเอกสารทางการแพทย์อย่างเวชระเบียน ส่วนโมเดลที่วิเคราะห์ข้อมูลได้หลายรูปแบบ หรือ Multimodal เป็นโมเดลที่ออกแบบมาเพื่อการวิเคราะห์ภาพถ่ายทางการแพทย์ร่วมด้วยกับข้อความจากเวชระเบียน ทั้งภาพถ่ายบาดแผล ผิวหนัง ภาพเอกซเรย์ หรือภาพถ่ายจากกล้องจุลทรรศน์ ส่วนโมเดล MedSigLIP เป็นโมเดลเข้ารหัส (Encoder) หาความเชื่อมโยงเพื่อจัดหมวดหมู่ว่าเป็นข้อมูลจากภาพเอกซเรย์ ภาพถ่ายผิวหนัง ภาพถ่ายดวงตา หรือแม้แต่ภาพถ่ายจากกล้องจุลทรรศน์

ภาพตัวอย่างการใช้งาน MedGemma Multimodal ที่สามารถทำความเข้าใจภาพถ่ายทางการแพทย์ได้ไม่ว่าจะเป็นภาพบาดแผลทางผิวหนัง ภาพเอกซเรย์ หรือภาพถ่ายจากกล้องจุลทรรศน์ ภาพจาก Google

ขณะนี้ทางฝั่งของกลุ่ม MedGemma มีโมเดล AI ที่ปล่อยออกมาทั้งหมด 4 ตัวด้วยกันคือ MedGemma 4B Multimodal, MedGemma 27B Text, MedGemma 27B Multimodal และ MedSigLIP โมเดลทุกตัวมีขนาดเล็ก สามารถทำงานบนการ์ดจอทั่วไปได้เลย ซึ่งทาง Google ได้ปล่อยโมเดลเหล่านี้ออกมาเป็น Open Source ให้ผู้ใช้ทุกคนสามารถดาวน์โหลดและนำไปดัดแปลงใช้งานได้โดยไม่เสียค่าใช้จ่าย และที่สำคัญโมเดลที่ให้มานี้เป็นโมเดลสำเร็จรูป ไม่ใช่การเรียกใช้โมเดลผ่าน API ซึ่งปกติจะมีการเปลี่ยนแปลงการตั้งค่าภายในโมเดลได้ตลอดเวลา แสดงว่าหากผู้ใช้ดาวน์โหลดและใช้งานไปแล้วจะไม่มีการเปลี่ยนแปลงใด ๆ ดังนั้นหากมีการตั้งค่าการใช้งานโมเดลนี้เป็นการเฉพาะแล้วจะสามารถใช้โมเดลนี้ไปได้ตลอดอย่างไม่ต้องกังวล

ภาพแผนภูมิเปรียบเทียบประสิทธิภาพของโมเดลทางการแพทย์ต่อทรัพยากรที่ใช้ ซึ่ง MedGemma เป็นโมเดลที่ได้คะแนนใกล้เคียงกับ DeepSeek R1 แต่ใช้ทรัพยากรในการดำเนินงานน้อยกว่ามาก ภาพจาก Google

Google กล่าวเพิ่มเติมอีกว่าโมเดล MedGemma 27B Multimodal มีประสิทธิภาพจากการทดสอบด้านการแพทย์ MedQA สามารถทำได้ดีเทียบเท่ากับ DeepSeek R1 โดยมีต้นทุนในการทำงานที่ต่ำกว่า 10 เท่า

นอกจากนี้โมเดลนี้ยังมีส่วนที่เป็น Pre-trained Model หรือโมเดลที่สามารถนำข้อมูลมาฝึกฝนเพื่อให้ทำงานได้อย่างเหมาะสมกับงานเฉพาะทาง โดยทาง Google ได้ออกมาย้ำว่าก่อนจะนำโมเดลเหล่านี้ไปใช้งานควรที่จะให้ผู้เชี่ยวชาญด้านปัญญาประดิษฐ์และผู้เชี่ยวชาญทางการแพทย์ตรวจสอบก่อนทุกครั้ง

ขณะนี้โมเดลของ MedGemma 27B Multimodal มีให้ทดลองใช้บนแพลตฟอร์ม Huggingface ซึ่งสามารถส่งภาพให้ MedGemma สอบถามอาการเพื่อวินิจฉัยโรคได้อีกด้วย

เรียบเรียงโดย จิรสิน อัศวกุล

อัปเดตข้อมูลแวดวงวิทยาศาสตร์ เทคโนโลยี รู้ทันโลกไอที และโซเชียลฯ ในรูปแบบ Audio จาก AI เสียงผู้ประกาศของไทยพีบีเอส ได้ที่ Thai PBS

ที่มาข้อมูล : Google

“รอบรู้ ดูกระแส ก้าวทันโลก” ไปกับ Thai PBS Sci & Tech