AM

HI

साइन इन शुरू करें

श्रेणियाँ

डीप लर्निंग

रीइन्फोर्समेंट लर्निंग — विशिष्ट लक्ष्यों को प्राप्त करने के लिए परीक्षण और त्रुटि के माध्यम से इष्टतम निर्णय लेने वाले बुद्धिमान एजेंट बनाना सीखें।

⚡ शुरुआत के लिए बेस्ट

रीइन्फोर्समेंट लर्निंग

1995 में, गूगल ने एक आधुनिकीकरण किया: गूगल खोज।

★ 4.7 (3 889)

सर्टिफ़िकेट व्यावहारिक

⚡ शुरुआत के लिए बेस्ट

रीइन्फोर्समेंट लर्निंग

Reinforcement Learning: Q-Learning से Deep Policy Gradients तक

सर्टिफ़िकेट व्यावहारिक

💼 जॉब के लिए तैयार

रीइन्फोर्समेंट लर्निंग

प्रोग्रामर के लिए रीइन्फोर्समेंट लर्निंग: अपने खुद के AI एजेंट कोड करें

सर्टिफ़िकेट व्यावहारिक

💼 जॉब के लिए तैयार

रीइन्फोर्समेंट लर्निंग

रीइन्फोर्समेंट लर्निंग: स्क्रैच से व्यावहारिक AI एजेंट बनाएं

सर्टिफ़िकेट व्यावहारिक

🏆 सबसे लोकप्रिय

रीइन्फोर्समेंट लर्निंग

रीइन्फोर्समेंट लर्निंग का परिचय: नींव और एल्गोरिदम

सर्टिफ़िकेट व्यावहारिक

🔥 लोकप्रिय

रीइन्फोर्समेंट लर्निंग

दुश्मनों और पुरस्कारों के साथ Python भूलभुलैया पथ-खोज

सर्टिफ़िकेट व्यावहारिक

💼 जॉब के लिए तैयार

रीइन्फोर्समेंट लर्निंग

LLM अलाइनमेंट: मानव प्रतिक्रिया से सुदृढीकरण सीखना (RLHF)

सर्टिफ़िकेट व्यावहारिक