LLM Post-Training: Fine-Tuning and Reinforcement Learning Basics
Master the essentials of LLM post-training to align, specialize, and improve model safety using supervised fine-tuning and reinforcement learning techniques.
حول هذه الدورة
Pre-trained large language models are powerful, but adapting them to specific tasks and aligning them with human preferences requires post-training. Understanding how to guide these models is essential for building safe, reliable, and specialized AI applications. In this text-based course, you will learn the fundamental concepts and practical workflows behind LLM post-training, moving from raw models to helpful, aligned AI assistants.
What you'll learn:
- Understand the key differences between pre-training, supervised fine-tuning (SFT), and reinforcement learning.
- Apply parameter-efficient fine-tuning (PEFT) methods like LoRA to adapt models with minimal computational resources.
- Explore Reinforcement Learning from Human Feedback (RLHF) and modern alignment alternatives like Direct Preference Optimization (DPO).
- Evaluate model behavior and safety to ensure outputs are helpful, honest, and harmless.
- Analyze code snippets and written walkthroughs to prepare datasets for custom fine-tuning tasks.
The course begins with foundational definitions of post-training paradigms before guiding you through data preparation, fine-tuning configurations, and alignment strategies. You will progress from theoretical concepts to reading and analyzing real-world implementation code.
This course is designed for software developers, data enthusiasts, and AI beginners who want to understand how LLMs are customized. No prior experience with advanced machine learning is required, though basic Python familiarity is helpful.
Start reading today to unlock the power of custom model alignment and post-training.
ما الذي ستحصل عليه
-
📜
شهادة إتمام
أضفها إلى ملفك على LinkedIn -
💬
مدرّس AI شخصي
عالق في درس؟ اسأل مدرّسك المدمج أي شيء، في أي وقت. -
♾️
وصول مدى الحياة
عُد متى شئت، بلا انتهاء -
📱
الهاتف أو الكمبيوتر
يعمل في أي مكان وعلى أي جهاز -
💸
استرداد خلال 14 يومًا
دون أسئلة -
⚡
قصير ومركَّز
1 ساعة 20 دقيقة من المحتوى التطبيقي
المراجعات
لا توجد مراجعات بعد — كن أول من يشارك تجربته.
المتعلمون أخذوا أيضًا
⚡ الأفضل للبداية
التعلم العميق في بايثون: مقدمة حديثة
شهادة
تطبيق عملي
DH 250.00
→
🌟 اختيار الطلاب
التعلم العميق: الأسس والتنفيذ العملي
شهادة
تطبيق عملي
DH 250.00
→
⚡ الأفضل للبداية
التعلم المعزز: من التعلم العالي الجودة إلى التدرجات العميقة في السياسات
شهادة
تطبيق عملي
DH 250.00
→
🔥 مطلوب
متاهة بايثون: البحث عن المسار مع الأعداء والمكافآت
شهادة
تطبيق عملي
DH 250.00
→
الأسئلة الشائعة
ما الذي أحتاجه لأخذ هذه الدورة؟ +
يكفي هاتف أو كمبيوتر متصل بالإنترنت. بدون تثبيتات أو أجهزة خاصة.
كيف يمكنني الدفع؟ +
بالبطاقة عبر Stripe. لا نخزن بيانات البطاقة — يتولى Stripe ذلك بأمان.
هل يمكنني استرداد المال؟ +
نعم — استرداد كامل خلال 14 يومًا، دون أسئلة.
إلى متى يستمر وصولي؟ +
إلى الأبد. بمجرد الشراء، الدورة لك تعود إليها متى شئت.
هل سأحصل على شهادة؟ +
نعم. عند الإتمام ستحصل على شهادة يمكنك إضافتها إلى ملفك في LinkedIn.
مصمَّم للعاملين في
التقنية
التصميم
المالية
التسويق
الرعاية الصحية
التعليم
الضيافة
التصنيع
×2
اشحن مرة واحدة وادفع النصف
أضف DH 900 → احصل على 200 أرصدة. كل فئة تكلف DH 112.50 بدلاً من DH 250.00. الأرصدة لا تنتهي أبداً.
DH 900
200 رصيد
DH 112.50 / درس
أفضل قيمة
DH 2,300
550 رصيد
DH 104.55 / درس
DH 4,500
1200 رصيد
DH 93.75 / درس
بدون اشتراك. الرصيد يصلح لأي درس ولا ينتهي.