DALL-E และ GPT Vision: สร้างและวิเคราะห์รูปภาพด้วย AI — LearnFlat

DALL-E และ GPT Vision: สร้างและวิเคราะห์รูปภาพด้วย AI

เรียนรู้พื้นฐานของ DALL-E และ GPT Vision เพื่อสร้างรูปภาพที่กำหนดเองและพัฒนาแอปพลิเคชันที่สามารถมองเห็น วิเคราะห์ และอธิบายเนื้อหาภาพได้ด้วยโปรแกรม

4.6 (18) ⏱ 1 ชม. 40 นาที 📚 9 บทเรียน 🎧 เวอร์ชันเสียง

เกี่ยวกับคอร์สนี้

Visual AI กำลังเปลี่ยนแปลงวิธีการสร้างและทำความเข้าใจเนื้อหาดิจิทัล ไม่ว่าคุณต้องการสร้างกราฟิกที่กำหนดเองจากข้อความ หรือพัฒนาแอปพลิเคชันที่สามารถ "มองเห็น" และตีความโลกทางกายภาพได้ โมเดล AI แบบหลายรูปแบบ (multimodal AI) ที่ทันสมัยทำให้ความสามารถเหล่านี้เข้าถึงได้สำหรับทุกคน หลักสูตรที่เน้นข้อความนี้จะแนะนำคุณผ่านแนวคิดพื้นฐานของ DALL-E และ GPT Vision คุณจะได้เปลี่ยนจากการเขียนข้อความแจ้ง (prompt) แบบพื้นฐานไปสู่การสร้างภาพที่ซับซ้อนด้วยโปรแกรม และดึงข้อมูลที่มีโครงสร้างจากอินพุตภาพโดยใช้ API สิ่งที่คุณจะได้เรียนรู้: - ทำความเข้าใจหลักการพื้นฐานของการสร้างภาพจากข้อความ (text-to-image generation) และคอมพิวเตอร์วิทัศน์ (computer vision) - สร้างข้อความแจ้ง (prompts) ที่แม่นยำเพื่อสร้าง แก้ไข และทดสอบความหลากหลายของรูปภาพคุณภาพสูงโดยใช้ DALL-E - วิเคราะห์เนื้อหาภาพด้วย GPT Vision เพื่อทำการตรวจจับวัตถุ (object detection) การสร้างคำบรรยายภาพ (image captioning) และการตอบคำถาม (question-answering) - ผสานรวมความสามารถของ Visual AI เข้ากับแอปพลิเคชันซอฟต์แวร์โดยใช้เวิร์กโฟลว์ API - ใช้เทคนิคการทำ Prompt Engineering ที่ทันสมัยซึ่งปรับให้เหมาะสมสำหรับโมเดลแบบหลายรูปแบบ (multimodal models) - จัดการค่าใช้จ่าย API และประสิทธิภาพโดยการกำหนดค่าโหมดรายละเอียดความละเอียดของภาพ คุณจะเริ่มต้นด้วยการสำรวจแนวคิดพื้นฐานของศิลปะเชิงสร้างสรรค์ (generative art) และสถาปัตยกรรมโมเดลภาพ (visual model architecture) ก่อนที่จะเข้าสู่การออกแบบข้อความแจ้ง (text prompt design) ที่ใช้งานได้จริง จากนั้น คุณจะได้อ่านเวิร์กโฟลว์การรวม API ทีละขั้นตอน เรียนรู้วิธีส่งรูปภาพไปยังโมเดลภาษา (language models) และแยกวิเคราะห์การวิเคราะห์ข้อความของโมเดล หลักสูตรนี้ออกแบบมาสำหรับผู้เริ่มต้น นักพัฒนา และครีเอเตอร์ที่ต้องการสำรวจเทคโนโลยีภาพที่ขับเคลื่อนด้วย AI โดยไม่จำเป็นต้องมีพื้นฐานด้านการเรียนรู้ของเครื่อง (machine learning) ไม่จำเป็นต้องมีประสบการณ์การเขียนโปรแกรมมาก่อน แม้ว่าความอยากรู้อยากเห็นทางเทคนิคพื้นฐานจะเป็นประโยชน์ก็ตาม ก้าวเข้าสู่โลกของ AI แบบหลายรูปแบบ (multimodal AI) และเริ่มสร้างแอปพลิเคชันที่สามารถสร้างและเข้าใจสื่อภาพได้

สิ่งที่คุณจะได้รับ

  • 📜 ใบประกาศนียบัตร
    เพิ่มในโปรไฟล์ LinkedIn ของคุณ
  • 💬 ติวเตอร์ AI ส่วนตัว
    ติดขัดในบทเรียน? ถามติวเตอร์ในตัวของคุณได้ทุกอย่าง ทุกเวลา
  • 🎧 รวมเวอร์ชันเสียง
    เรียนได้ทุกที่ ไม่ต้องดูจอ
  • ♾️ เข้าถึงตลอดชีพ
    กลับมาเรียนได้ตลอด ไม่มีหมดอายุ
  • 📱 โทรศัพท์หรือคอมพิวเตอร์
    ใช้งานได้ทุกที่ ทุกอุปกรณ์
  • 💸 คืนเงิน 14 วัน
    ไม่ต้องอธิบาย
  • กระชับและตรงประเด็น
    1 ชม. 40 นาที เนื้อหาเชิงปฏิบัติ

รีวิว

ยังไม่มีรีวิว — เป็นคนแรกที่แชร์ประสบการณ์

เขียนรีวิว

หลังจากส่ง เราจะขอให้คุณเข้าสู่ระบบ — ฉบับร่างของคุณถูกบันทึก

ผู้เรียนคนอื่นเรียน

คำถามที่พบบ่อย

ฉันต้องใช้อะไรในการเรียนคอร์สนี้? +

แค่โทรศัพท์หรือคอมพิวเตอร์ที่มีอินเทอร์เน็ต ไม่ต้องติดตั้งหรือใช้อุปกรณ์พิเศษ

ฉันชำระเงินอย่างไร? +

ผ่านบัตรด้วย Stripe เราไม่เก็บข้อมูลบัตร — Stripe จัดการอย่างปลอดภัย

ฉันขอคืนเงินได้ไหม? +

ใช่ — คืนเงินเต็มจำนวนใน 14 วัน ไม่ต้องอธิบาย

ฉันมีสิทธิ์เข้าถึงนานเท่าไร? +

ตลอดไป เมื่อซื้อแล้วคอร์สเป็นของคุณ กลับมาเรียนได้ตลอด

ฉันจะได้ใบประกาศนียบัตรไหม? +

ได้ เมื่อเรียนจบจะได้รับใบประกาศนียบัตรที่เพิ่มในโปรไฟล์ LinkedIn ได้

ออกแบบสำหรับผู้เรียนใน
เทคโนโลยี ดีไซน์ การเงิน การตลาด สาธารณสุข การศึกษา ธุรกิจการบริการ อุตสาหกรรม