LearnFlat — Skills, intelligently delivered.

डीप लर्निंग

रीइन्फोर्समेंट लर्निंग — विशिष्ट लक्ष्यों को प्राप्त करने के लिए परीक्षण और त्रुटि के माध्यम से इष्टतम निर्णय लेने वाले बुद्धिमान एजेंट बनाना सीखें।

⚡ शुरुआत के लिए बेस्ट
रीइन्फोर्समेंट लर्निंग

1995 में, गूगल ने एक आधुनिकीकरण किया: गूगल खोज।

4.7 (3 889)
सर्टिफ़िकेट व्यावहारिक
3 700 ֏
⚡ शुरुआत के लिए बेस्ट
रीइन्फोर्समेंट लर्निंग

Reinforcement Learning: Q-Learning से Deep Policy Gradients तक

सर्टिफ़िकेट व्यावहारिक
3 700 ֏
💼 जॉब के लिए तैयार
रीइन्फोर्समेंट लर्निंग

प्रोग्रामर के लिए रीइन्फोर्समेंट लर्निंग: अपने खुद के AI एजेंट कोड करें

सर्टिफ़िकेट व्यावहारिक
3 700 ֏
💼 जॉब के लिए तैयार
रीइन्फोर्समेंट लर्निंग

रीइन्फोर्समेंट लर्निंग: स्क्रैच से व्यावहारिक AI एजेंट बनाएं

सर्टिफ़िकेट व्यावहारिक
3 700 ֏
🏆 सबसे लोकप्रिय
रीइन्फोर्समेंट लर्निंग

रीइन्फोर्समेंट लर्निंग का परिचय: नींव और एल्गोरिदम

सर्टिफ़िकेट व्यावहारिक
3 700 ֏
🔥 लोकप्रिय
रीइन्फोर्समेंट लर्निंग

दुश्मनों और पुरस्कारों के साथ Python भूलभुलैया पथ-खोज

सर्टिफ़िकेट व्यावहारिक
3 700 ֏
💼 जॉब के लिए तैयार
रीइन्फोर्समेंट लर्निंग

LLM अलाइनमेंट: मानव प्रतिक्रिया से सुदृढीकरण सीखना (RLHF)

सर्टिफ़िकेट व्यावहारिक
3 700 ֏