Building Multimodal LLM Agents for Multi-Object Image Generation
Learn how to design agentic workflows using planning, progressive execution, and feedback loops to generate complex, multi-object images with diffusion models.
เกี่ยวกับคอร์สนี้
Standard text-to-image models often struggle to accurately place and render multiple distinct objects in a single scene. By combining the reasoning power of Large Language Models with diffusion models, you can build smart agentic systems that plan, execute, and refine complex image generation tasks. In this course, you will transition from a beginner to understanding how multimodal LLM agents orchestrate multi-object image generation. You will learn how to break down user prompts, generate precise spatial layouts, and implement iterative feedback loops to correct errors. What you'll learn: 1. Understand the foundational principles of multimodal LLMs and text-to-image diffusion models. 2. Design agentic planning systems that decompose complex multi-object prompts into structured layouts. 3. Apply progressive execution techniques to generate images step-by-step. 4. Implement automated feedback loops to evaluate and refine generated images. 5. Utilize structured JSON outputs and tool-calling patterns to coordinate agent-to-model communication. 6. Explore modern orchestration workflows for building reliable AI agent architectures. The course starts with essential terminology and foundational concepts before guiding you through the architecture of agentic planners, layout generators, and feedback loops. You will study practical code walk-throughs and conceptual design patterns to build your own image-generation coordinator. This course is designed for software developers, AI enthusiasts, and tech professionals who are new to agentic workflows. No advanced background in machine learning is required, though basic familiarity with Python is helpful. Start learning today to build intelligent agents that bridge the gap between language and vision.
สิ่งที่คุณจะได้รับ
-
📜
ใบประกาศนียบัตร
เพิ่มในโปรไฟล์ LinkedIn ของคุณ -
💬
ติวเตอร์ AI ส่วนตัว
ติดขัดในบทเรียน? ถามติวเตอร์ในตัวของคุณได้ทุกอย่าง ทุกเวลา -
♾️
เข้าถึงตลอดชีพ
กลับมาเรียนได้ตลอด ไม่มีหมดอายุ -
📱
โทรศัพท์หรือคอมพิวเตอร์
ใช้งานได้ทุกที่ ทุกอุปกรณ์ -
💸
คืนเงิน 14 วัน
ไม่ต้องอธิบาย -
⚡
กระชับและตรงประเด็น
51 นาที เนื้อหาเชิงปฏิบัติ
รีวิว
ยังไม่มีรีวิว — เป็นคนแรกที่แชร์ประสบการณ์
ผู้เรียนคนอื่นเรียน
🎓 มีใบรับรอง
เครื่องมือ AI เชิงปฏิบัติสำหรับนักการศึกษา
ใบรับรอง
ลงมือทำ
$24.99
→
⚡ เหมาะสำหรับผู้เริ่มต้น
🎓 มีใบรับรอง
พื้นฐาน Generative AI: แนวคิดหลักและการสร้าง Prompt
ใบรับรอง
ลงมือทำ
$24.99
→
💼 พร้อมสำหรับงาน
🎓 มีใบรับรอง
การรัน AI บนเครื่อง: คู่มือ LM Studio และ Ollama
ใบรับรอง
ลงมือทำ
$24.99
→
🎓 มีใบรับรอง
สร้างโปรแกรมที่ใช้พลังงานจากปัญญาประดิษฐ์ด้วย OpenAI API
ใบรับรอง
ลงมือทำ
$24.99
→
คำถามที่พบบ่อย
ฉันต้องใช้อะไรในการเรียนคอร์สนี้? +
แค่โทรศัพท์หรือคอมพิวเตอร์ที่มีอินเทอร์เน็ต ไม่ต้องติดตั้งหรือใช้อุปกรณ์พิเศษ
ฉันชำระเงินอย่างไร? +
ผ่านบัตรด้วย Stripe เราไม่เก็บข้อมูลบัตร — Stripe จัดการอย่างปลอดภัย
ฉันขอคืนเงินได้ไหม? +
ใช่ — คืนเงินเต็มจำนวนใน 14 วัน ไม่ต้องอธิบาย
ฉันมีสิทธิ์เข้าถึงนานเท่าไร? +
ตลอดไป เมื่อซื้อแล้วคอร์สเป็นของคุณ กลับมาเรียนได้ตลอด
ฉันจะได้ใบประกาศนียบัตรไหม? +
ได้ เมื่อเรียนจบจะได้รับใบประกาศนียบัตรที่เพิ่มในโปรไฟล์ LinkedIn ได้
ออกแบบสำหรับผู้เรียนใน
เทคโนโลยี
ดีไซน์
การเงิน
การตลาด
สาธารณสุข
การศึกษา
ธุรกิจการบริการ
อุตสาหกรรม
×2
เติมครั้งเดียว จ่ายครึ่งเดียว
เพิ่ม $100 → รับ 200 เครดิต แต่ละคลาสราคา $12.50 แทน $24.99 เครดิตไม่มีวันหมดอายุ
$100
200 เครดิต
$12.50 / คลาส
คุ้มที่สุด
$250
550 เครดิต
$11.36 / คลาส
$500
1200 เครดิต
$10.42 / คลาส
ไม่มีการสมัครสมาชิก เครดิตใช้ได้กับทุกคลาสและไม่หมดอายุ