www.siamphone.com
AI (AI) | วันที่ : 1 พฤษภาคม 2568
จากข่าวการประกาศของ Google ที่เพิ่มความสามารถให้แชทบอท Gemini สามารถแก้ไขรูปภาพได้ตามคำสั่งข้อความ (prompt) ล่าสุดมีรายละเอียดเพิ่มเติมจากรายงานข่าวต่างๆ ซึ่งเผยให้เห็นถึงขีดความสามารถที่น่าสนใจยิ่งขึ้นของฟีเจอร์นี้
ความสามารถใหม่ในการแก้ไขรูปภาพนี้ ขับเคลื่อนโดยโมเดล AI ที่ชื่อว่า Gemini 2.0 Flash ซึ่งเป็นโมเดลที่ได้รับการออกแบบมาเพื่อการประมวลผลที่รวดเร็วและมีประสิทธิภาพ ผู้ใช้งานสามารถแก้ไขรูปภาพได้ทั้งรูปภาพที่สร้างขึ้นโดย AI ภายใน Gemini เอง และรูปภาพที่อัปโหลดเข้ามาจากอุปกรณ์ของผู้ใช้งาน
รายงานข่าวระบุว่า Gemini สามารถทำความเข้าใจคำสั่งแก้ไขรูปภาพด้วย ภาษามนุษย์ทั่วไป (natural language) และรองรับการแก้ไขแบบ สนทนาโต้ตอบ (conversational editing) ทำให้สามารถปรับเปลี่ยนและแก้ไขรูปภาพได้อย่างละเอียดและเป็นธรรมชาติในรูปแบบ ทีละขั้นตอน (multi-step editing) โดยระบบจะยังคงจดจำบริบทของการแก้ไขที่ทำไปก่อนหน้านี้ได้
ตัวอย่างความสามารถในการแก้ไขรูปภาพที่ Gemini ทำได้ตามคำสั่ง ได้แก่
ฟีเจอร์แก้ไขรูปภาพนี้เริ่มทยอยเปิดให้ผู้ใช้งาน Gemini ตั้งแต่ช่วงปลายเดือนเมษายน 2025 ที่ผ่านมา โดยสามารถใช้งานได้ทั้งใน แอปพลิเคชัน Gemini และบนเว็บไซต์ gemini.google.com Google ระบุว่าความสามารถนี้จะทยอยเปิดให้ผู้ใช้งานในกว่า 45 ภาษา และครอบคลุมในหลายประเทศทั่วโลกภายในไม่กี่สัปดาห์ข้างหน้า
สำหรับความปลอดภัยและความโปร่งใส Google ยืนยันว่ารูปภาพทั้งหมดที่ถูกสร้างขึ้นหรือแก้ไขโดยใช้ฟีเจอร์นี้ จะถูก ฝังลายน้ำดิจิทัล SynthID ซึ่งเป็นลายน้ำที่มองไม่เห็นด้วยตาเปล่า ตามมาตรฐานสำหรับรูปภาพที่สร้างโดย AI นอกจากนี้ Google ยังอยู่ในขั้นตอนการ ทดลองเพิ่มลายน้ำที่มองเห็นได้ บนรูปภาพที่สร้างโดย Gemini เพื่อเพิ่มความชัดเจนและป้องกันการนำไปใช้ในทางที่ผิด
ความสามารถนี้ต่อยอดมาจากการทดสอบที่เคยมีในแพลตฟอร์ม AI Studio (ปัจจุบันคือ Google AI Studio) สำหรับนักพัฒนา ซึ่งเปิดโอกาสให้นักพัฒนาได้ทดลองใช้งานฟีเจอร์สร้างและแก้ไขภาพโดยใช้โมเดล Gemini 2.0 Flash Experimental และ Imagen 3
การเพิ่มฟีเจอร์แก้ไขรูปภาพนี้เข้ามาใน Gemini นับเป็นการยกระดับความสามารถของแชทบอทให้เป็นผู้ช่วยแบบ Multimodal ที่สามารถทำงานร่วมกับรูปภาพได้อย่างมีประสิทธิภาพ ทำให้การสร้างสรรค์และปรับแต่งเนื้อหาด้วย AI เป็นเรื่องที่ง่ายและเข้าถึงได้มากยิ่งขึ้นสำหรับผู้ใช้งานทั่วไป โดยไม่จำเป็นต้องมีความเชี่ยวชาญในการใช้ซอฟต์แวร์แก้ไขรูปภาพที่ซับซ้อน
แหล่งที่มา blog.google
วันที่ : 1 พฤษภาคม 2568
รีวิว ProArt PX13 โน้ตบุ๊กจอพับ 360 องศา เครื่องเล็กแต่เวิร์กโฟลว์ระดับโปร ครบทุกโหมดสำหรับครีเอเตอร์10 ชั่วโมงที่แล้ว
รีวิว REDMI Pad 2 Pro 5G ราชาความคุ้มค่าตัวใหม่! จอ 12.1 นิ้ว Dolby Vision คมชัด 2.5K ในดีไซน์ที่ดูแพงเกินราคา17 ชั่วโมงที่แล้ว
Soundcore Work เครื่องอัดเสียงจิ๋วเท่าเหรียญ หนักแค่ 10 กรัม พร้อมฟีเจอร์ถอดเสียงแม่นยำ 97%8 ก.พ. 69 07:00
Viaim RecDot หูฟัง AI อัจฉริยะ พลัง GPT-4o และ GPT-5 ที่มาปลดล็อกการบันทึกเสียงยุคใหม่7 ก.พ. 69 15:00
HONOR X5c Plus อึด คุ้มทุกฟีเจอร์ ใช้งานได้ครอบคลุม เพียง 2,xxx7 ก.พ. 69 10:32
Plaud NotePin S เข็มกลัด AI อัดเสียงรุ่นใหม่ เพิ่มปุ่มกดจริง สวมใส่ได้ 4 แบบ พร้อมแอปฯ เดสก์ท็อปท...
YouTube เตรียมเปิดให้ครีเอเตอร์สร้าง Shorts ด้วย AI จำลองภาพลักษณ์ของตัวเอง
Spotify ดัน AI สร้างเพลย์ลิสต์อัตโนมัติ เพิ่มประสบการณ์ฟังเพลงแบบเฉพาะบุคคล
อดีตทีมงาน Google เปิดตัว Sparkli แอปฯ การเรียนรู้เด็กด้วย AI แบบอินเทอร์แอคทีฟ
ดีลประวัติศาสตร์! Apple ผนึก Google เตรียมยกเครื่อง Siri ด้วยสมองกล Gemini คาดเปิดตัวกุมภาพันธ์นี้
ยืนยันแล้ว! vivo X300e และ X Fold6 โผล่ฐานข้อมูล GSMA เตรียมลุยตลาดจอพับและพรีเมียมปี 2026
หลุดข้อมูล Samsung Galaxy S26 Series เผยสีใหม่ครบเซต พร้อมบอกลาความจุ 128GB อย่างเป็นทางการ
LAVA Blaze Duo 3 สมาร์ตโฟนจอ 2 ด้าน จอเสริมด้านหลัง AMOLED กว้าง 1.6 นิ้ว
Nothing Phone (4a) Series จ่อเปิดตัว 5 มี.ค. นี้! ชูวิวัฒนาการใหม่ แบตฯ 5,080mAh + UFS 3.1