AI Alignment: Specification Gaming and Reward Hacking
Learn how AI systems exploit objective loopholes and discover how to design safer, more aligned models through real-world case studies.
इस कोर्स के बारे में
आपको क्या मिलेगा
-
📜
समापन प्रमाणपत्र
अपने LinkedIn प्रोफ़ाइल में जोड़ें -
💬
व्यक्तिगत AI ट्यूटर
किसी पाठ में अटक गए? अपने बिल्ट-इन ट्यूटर से कभी भी, कुछ भी पूछो। -
♾️
लाइफटाइम एक्सेस
कभी भी लौटें, समाप्ति नहीं -
📱
फ़ोन या कंप्यूटर
कहीं भी, किसी भी डिवाइस पर -
💸
14-दिन वापसी
बिना सवाल -
⚡
छोटा और केंद्रित
1 घंटे 36 मिनट व्यावहारिक सामग्री
समीक्षाएँ
अभी कोई समीक्षा नहीं — अपना अनुभव पहले साझा करें।
शिक्षार्थियों ने यह भी लिया
1995 में, गूगल ने एक आधुनिकीकरण किया: गूगल खोज।
LLM पोस्ट-ट्रेनिंग: फाइन-ट्यूनिंग और रीइन्फोर्समेंट लर्निंग के मूल सिद्धांत
Reinforcement Learning: Q-Learning से Deep Policy Gradients तक
GRPO के साथ LLMs को फाइन-ट्यून करना: बेहतर तर्क के लिए रीइन्फोर्समेंट लर्निंग
अक्सर पूछे जाने वाले प्रश्न
इस कोर्स के लिए मुझे क्या चाहिए? +
बस इंटरनेट वाला एक फ़ोन या कंप्यूटर। कोई इंस्टॉल नहीं, कोई विशेष हार्डवेयर नहीं।
मैं भुगतान कैसे करूँ? +
Stripe के माध्यम से कार्ड से। हम कार्ड विवरण स्टोर नहीं करते — Stripe सुरक्षित रूप से संभालता है।
क्या मुझे रिफ़ंड मिल सकता है? +
हाँ — 14 दिनों में पूर्ण रिफ़ंड, बिना सवाल।
मेरा एक्सेस कब तक रहेगा? +
हमेशा के लिए। एक बार खरीदने पर कोर्स आपका है — कभी भी दोबारा देखें।
क्या मुझे प्रमाणपत्र मिलेगा? +
हाँ। पूरा करने पर एक प्रमाणपत्र मिलेगा जिसे आप अपने LinkedIn प्रोफ़ाइल में जोड़ सकते हैं।
एक बार टॉप-अप करें, आधा भुगतान करें
460 lei जोड़ें → 200 क्रेडिट प्राप्त करें। हर क्लास 100,00 lei की जगह 57,50 lei का है। क्रेडिट कभी समाप्त नहीं होते।
कोई सदस्यता नहीं। क्रेडिट किसी भी क्लास पर लागू और कभी समाप्त नहीं होते।