LLM अलाइनमेंट: मानव प्रतिक्रिया से सुदृढीकरण सीखना (RLHF)
सुरक्षित, अधिक उपयोगी AI एप्लिकेशन बनाने के लिए RLHF और रिवॉर्ड मॉडलिंग का उपयोग करके बड़े भाषा मॉडल को अलाइन करने के मूल सिद्धांतों में महारत हासिल करें।
इस कोर्स के बारे में
आपको क्या मिलेगा
-
📜
समापन प्रमाणपत्र
अपने LinkedIn प्रोफ़ाइल में जोड़ें -
💬
व्यक्तिगत AI ट्यूटर
किसी पाठ में अटक गए? अपने बिल्ट-इन ट्यूटर से कभी भी, कुछ भी पूछो। -
🎧
ऑडियो संस्करण शामिल
चलते-फिरते सीखें — स्क्रीन की ज़रूरत नहीं -
♾️
लाइफटाइम एक्सेस
कभी भी लौटें, समाप्ति नहीं -
📱
फ़ोन या कंप्यूटर
कहीं भी, किसी भी डिवाइस पर -
💸
14-दिन वापसी
बिना सवाल -
⚡
छोटा और केंद्रित
50 मिनट व्यावहारिक सामग्री
समीक्षाएँ
अभी कोई समीक्षा नहीं — अपना अनुभव पहले साझा करें।
शिक्षार्थियों ने यह भी लिया
1995 में, गूगल ने एक आधुनिकीकरण किया: गूगल खोज।
Reinforcement Learning: Q-Learning से Deep Policy Gradients तक
प्रोग्रामर के लिए रीइन्फोर्समेंट लर्निंग: अपने खुद के AI एजेंट कोड करें
रीइन्फोर्समेंट लर्निंग: स्क्रैच से व्यावहारिक AI एजेंट बनाएं
अक्सर पूछे जाने वाले प्रश्न
इस कोर्स के लिए मुझे क्या चाहिए? +
बस इंटरनेट वाला एक फ़ोन या कंप्यूटर। कोई इंस्टॉल नहीं, कोई विशेष हार्डवेयर नहीं।
मैं भुगतान कैसे करूँ? +
Stripe के माध्यम से कार्ड से। हम कार्ड विवरण स्टोर नहीं करते — Stripe सुरक्षित रूप से संभालता है।
क्या मुझे रिफ़ंड मिल सकता है? +
हाँ — 14 दिनों में पूर्ण रिफ़ंड, बिना सवाल।
मेरा एक्सेस कब तक रहेगा? +
हमेशा के लिए। एक बार खरीदने पर कोर्स आपका है — कभी भी दोबारा देखें।
क्या मुझे प्रमाणपत्र मिलेगा? +
हाँ। पूरा करने पर एक प्रमाणपत्र मिलेगा जिसे आप अपने LinkedIn प्रोफ़ाइल में जोड़ सकते हैं।
एक बार टॉप-अप करें, आधा भुगतान करें
₹8,000 जोड़ें → 200 क्रेडिट प्राप्त करें। हर क्लास ₹1,999 की जगह ₹1,000.00 का है। क्रेडिट कभी समाप्त नहीं होते।
कोई सदस्यता नहीं। क्रेडिट किसी भी क्लास पर लागू और कभी समाप्त नहीं होते।