เช็กความล้ำ ChatGPT-4o สร้างสรรค์ภาพได้มากกว่าแค่คำว่า “สวย”
------------------------------------------
ภาพยุคนี้ต้องมีดีทั้ง “สวยและมีประโยชน์”
------------------------------------------
นับตั้งแต่ยุคของภาพวาดที่เกิดยุคแรก ๆ ที่ถูกสร้างอยู่ ในถ้ำ พัฒนามาจนกลายเป็นภาพอินโฟกราฟฟิกในยุคปัจจุบันที่เราเห็นกันทั่วไป เห็นได้ว่ามนุษย์เราใช้ “ภาพ” ในการสื่อสาร โน้มน้าวใจ และสามารถใช้มาช่วยในการวิเคราะห์ข้อมูลได้อีกด้วย
จะเห็นได้ว่าเมื่อการสร้างสรรค์ภาพที่เสริมด้วยสัญลักษณ์ต่าง ๆ ที่ใช้สื่อสารแทนภาษาได้ เราจะได้เห็นทั้งภาพที่ดีไซน์ออกมาสวยงาม พร้อมทั้งสามารถสื่อสารให้ทุกคนมองและเข้าใจความหมายออกมาตรงกันได้อย่างน่าทึ่ง!
.
ถามว่าโมเดล GPT-4o สามารถสร้างสรรค์ภาพออกมาตอบโจทย์ได้มากแค่ไหน??
ช่วยให้สามารถแสดงข้อความอย่างแม่นยำ
มีการปฏิบัติตามคำแนะนำได้อย่างแม่นยำ
การใช้ประโยชน์จากหลักฐานความรู้ และบริบทการสนทนาที่เคยมีอยู่ในโมเดล 4o
สามารถใช้ภาพ Reference จากที่เราอัพโหลดมาเป็น inspiration ในการสร้างสรรค์ภาพออกมาให้ใกล้เคียงความต้องการได้มากที่สุด
จากทั้ง 4 ความสามารถในการตอบโจทย์การสร้างสรรค์ภาพของโมเดล GPT-4o นับเป็นจุดที่สามารถเข้ามาเปลี่ยนให้ภาพในจินตนาการของเรา กลายมาเป็นภาพที่มองเห็นได้จริงอย่างง่ายดาย! เป็นอีกหนึ่งการพัฒนากระบวนการสร้างสรรค์ภาพให้กลายมาเป็นเครื่องมือที่ใช้งานได้ตอบโจทย์ แม่นยำ และทรงพลังมากกว่าเดิม!
จุดนี้นับว่า ChatGPT-4o ถูกเพิ่มความสามารถจากการฝึกอบรมโมเดล ให้สามารถทำงานออกมาได้ตอบโจทย์การสร้างสรรค์ภาพ ที่สอดคล้องกับความต้องการ และสร้างสรรค์ออกมาได้ในหลากหลายบริบทอีกด้วย
------------------------------------------
สรุป 6 การอัปเดตโมเดล GPT-4o ที่มาเพื่อตอบโจทย์การ Generate รูปภาพได้หลากหลายและเนียนกว่าเดิม
------------------------------------------
1. การอัปเดตความสามารถด้านการสร้างรูปภาพให้เก่งขึ้นไปอีกขั้น
โดยโมเดล GPT-4o ได้รับการฝึกจากข้อมูลที่รวมทั้งข้อความและภาพ มีการปรับแต่งหลังการฝึกโมเดลให้มีความสามารถด้านการสร้างรูปภาพที่ดีขึ้น ทำให้ GPT-4o สามารถสร้างรูปภาพที่ดูมีความสมเหตุสมผล และสอดคล้องกับบริบทได้อย่างตอบโจทย์
2. อัปเดตความสามารถในการเรนเดอร์ข้อความในภาพให้เนียนขึ้น
โดยโมเดล GPT-4o สามารถนำข้อความลงมาใส่ในภาพได้อย่างแม่นยำ ช่วยเสริมการสื่อสารด้วยภาพและข้อความที่ช่วยให้สามารถสื่อความหมายได้ดีมากขึ้น
3. อัปเดตความสามารถในการสร้างภาพได้หลายรอบ หรือพัฒนาจากภาพเดิมได้ (Multi-Turn Generation)
โดยการอัปเดตครั้งนี้ ทำมาเพื่อให้ ChatGPT สามารถรองรับการแก้ไข และพัฒนาภาพที่ generate ออกมาได้อย่างต่อเนื่องผ่านการสนทนา พร้อมทั้งยังสามารถรักษาความสอดคล้องของภาพตลอดกระบวนการแก้ไขได้อีกด้วย
4. อัปเดตโมเดลใหม่ให้สามารถทำตามคำสั่งที่ซับซ้อนได้
ซึ่งการสร้างสรรค์ภาพบน ChatGPT-4o สามารถรองรับภาพที่มีวัตถุ 10-20 ชิ้นในภาพเดียว และยังสามารถจัดการวัตถุและคุณสมบัติต่าง ๆ ได้ดีขึ้นอีกด้วย
5. อัปเดตโมเดลให้สามารถเรียนรู้จากภาพที่อัปโหลดได้
โดยเป็นโมเดลที่อัปเดต เพื่อให้สามารถวิเคราะห์ และนำรายละเอียดจากภาพที่ผู้ใช้ส่งเข้ามาในแชท ไปใช้ในการสร้างภาพใหม่เพื่อให้ตอบโจทย์ตามคำสั่งได้อย่างแม่นยำมากยิ่งขึ้น
6. อัปเดตการสร้างสรรค์รูปภาพให้มีความสมจริงและมีหลากหลายสไตล์
เป็นการที่ตัวโมเดลถูกฝึกฝนจากภาพที่มีหลากหลายสไตล์ ทำให้สามารถสร้างสรรค์ภาพได้ทั้งแบบสมจริงและแบบศิลป์ นอกจากนี้ยังสามารถเปลี่ยนหรือดัดแปลงภาพให้เข้ากับรูปแบบที่ต้องการได้ เป็นการเชื่อมโยงข้อมูลจากข้อความและภาพเข้าด้วยกัน ช่วยให้การสร้างสรรค์ภาพมีความสมจริงและฉลาดมากยิ่งขึ้น
------------------------------------------
นอกจากความสามารถสุดล้ำทั้ง 6 ข้อที่อัปเดตมานี้ ยังมีการตั้งมาตรการความปลอดภัย เพื่อป้องกันข้อผิดพลาดที่เกิดจาก AI และผู้ใช้งาน โดยมีการติดแท็ก C2PA metadata เพื่อระบุว่าเป็นภาพที่สร้างจาก AI, ป้องกันการสร้างภาพที่เป็นอันตราย เช่น deepfake หรือเนื้อหาที่ไม่เหมาะสม, ควบคุมการสร้างภาพที่เกี่ยวข้องกับบุคคลจริงอย่างเข้มงวด, และใช้ AI ที่สามารถให้เหตุผล (reasoning LLM) ในการตรวจสอบและกรองภาพที่สร้างขึ้น
.
ในส่วนของ ChatGPT-4o ที่ใช้ในการ Generate รูปภาพนี้ เปิดให้เข้าถึงได้ตั้งแต่กลุ่มผู้ใช้ฟรี ไปจนถึงผู้ใช้ระดับ Plus, Pro, และ Team พร้อมทั้งกำลังจะเปิดให้ใช้กับ Enterprise, Edu และ API และมีการตั้งเป้าจะผสานรวมเข้ากับ Sora และ DALL·E GPT เพื่อเพิ่มความสามารถให้ไปสุดกว่าเดิม!
#ChatGPT #GPT4o #AI #ArtificialIntelligence #สร้างภาพด้วยAI #BBO #thebigblueocean #digitaltransformation #transformationbuddy
ที่มา: www.openai.com