Building Multimodal LLM Agents for Multi-Object Image Generation
Learn how to design agentic workflows using planning, progressive execution, and feedback loops to generate complex, multi-object images with diffusion models.
حول هذه الدورة
Standard text-to-image models often struggle to accurately place and render multiple distinct objects in a single scene. By combining the reasoning power of Large Language Models with diffusion models, you can build smart agentic systems that plan, execute, and refine complex image generation tasks. In this course, you will transition from a beginner to understanding how multimodal LLM agents orchestrate multi-object image generation. You will learn how to break down user prompts, generate precise spatial layouts, and implement iterative feedback loops to correct errors. What you'll learn: 1. Understand the foundational principles of multimodal LLMs and text-to-image diffusion models. 2. Design agentic planning systems that decompose complex multi-object prompts into structured layouts. 3. Apply progressive execution techniques to generate images step-by-step. 4. Implement automated feedback loops to evaluate and refine generated images. 5. Utilize structured JSON outputs and tool-calling patterns to coordinate agent-to-model communication. 6. Explore modern orchestration workflows for building reliable AI agent architectures. The course starts with essential terminology and foundational concepts before guiding you through the architecture of agentic planners, layout generators, and feedback loops. You will study practical code walk-throughs and conceptual design patterns to build your own image-generation coordinator. This course is designed for software developers, AI enthusiasts, and tech professionals who are new to agentic workflows. No advanced background in machine learning is required, though basic familiarity with Python is helpful. Start learning today to build intelligent agents that bridge the gap between language and vision.
ما الذي ستحصل عليه
-
📜
شهادة إتمام
أضفها إلى ملفك على LinkedIn -
💬
مدرّس AI شخصي
عالق في درس؟ اسأل مدرّسك المدمج أي شيء، في أي وقت. -
♾️
وصول مدى الحياة
عُد متى شئت، بلا انتهاء -
📱
الهاتف أو الكمبيوتر
يعمل في أي مكان وعلى أي جهاز -
💸
استرداد خلال 14 يومًا
دون أسئلة -
⚡
قصير ومركَّز
51 دقيقة من المحتوى التطبيقي
المراجعات
لا توجد مراجعات بعد — كن أول من يشارك تجربته.
المتعلمون أخذوا أيضًا
🔥 مطلوب
🎓 بشهادة
الذكاء الاصطناعي المولد لتطوير تطبيقات الهواتف المحمولة
شهادة
تطبيق عملي
E£1,200.00
→
🎓 بشهادة
أدوات عملية للذكاء الاصطناعي للمعلمين
شهادة
تطبيق عملي
E£1,200.00
→
⚡ الأفضل للبداية
🎓 بشهادة
أساسيات الذكاء الاصطناعي المولد: المفاهيم الأساسية والاستدعاء
شهادة
تطبيق عملي
E£1,200.00
→
🎓 بشهادة
تطوير تطبيقات مختارة لبرنامج الماجستير في القانون مع RAG ووكلاء
شهادة
تطبيق عملي
E£1,200.00
→
الأسئلة الشائعة
ما الذي أحتاجه لأخذ هذه الدورة؟ +
يكفي هاتف أو كمبيوتر متصل بالإنترنت. بدون تثبيتات أو أجهزة خاصة.
كيف يمكنني الدفع؟ +
بالبطاقة عبر Stripe. لا نخزن بيانات البطاقة — يتولى Stripe ذلك بأمان.
هل يمكنني استرداد المال؟ +
نعم — استرداد كامل خلال 14 يومًا، دون أسئلة.
إلى متى يستمر وصولي؟ +
إلى الأبد. بمجرد الشراء، الدورة لك تعود إليها متى شئت.
هل سأحصل على شهادة؟ +
نعم. عند الإتمام ستحصل على شهادة يمكنك إضافتها إلى ملفك في LinkedIn.
مصمَّم للعاملين في
التقنية
التصميم
المالية
التسويق
الرعاية الصحية
التعليم
الضيافة
التصنيع
×2
اشحن مرة واحدة وادفع النصف
أضف E£5,000 → احصل على 200 أرصدة. كل فئة تكلف E£625.00 بدلاً من E£1,200.00. الأرصدة لا تنتهي أبداً.
E£5,000
200 رصيد
E£625.00 / درس
أفضل قيمة
E£13,000
550 رصيد
E£590.91 / درس
E£25,000
1200 رصيد
E£520.83 / درس
بدون اشتراك. الرصيد يصلح لأي درس ولا ينتهي.