Katalog · Deep Learning · Uczenie przez Wzmacnianie

Uczenie się wzmacniające: od Q-Learning do głębokich gradientów polityki

Name: Uczenie się wzmacniające: od Q-Learning do głębokich gradientów polityki
Price: 799 INR
Availability: InStock

Zbuduj solidne podstawy w uczeniu się wzmacniającym, implementując klasyczne Q-learning, Deep Q-Networks i algorytmy gradientów polityki przy użyciu nowoczesnych bibliotek Pythona.

⏱ 42 min 📚 7 lekcji 🎧 Wersja audio

O tym kursie

Uczenie się wzmacniające jest siłą napędową nowoczesnej sztucznej inteligencji decyzyjnej, od agentów gier po systemy autonomiczne. Zrozumienie, w jaki sposób agenci uczą się metodą prób i błędów, ma kluczowe znaczenie dla każdego, kto wchodzi w dziedzinę zaawansowanej sztucznej inteligencji. Ten kurs tekstowy prowadzi od absolutnych podstaw ram podejmowania decyzji do wdrażania potężnych algorytmów uczenia się głębokiego wzmacniania.Dowiesz się, jak modelować środowiska, definiować nagrody i szkolić agentów, którzy mogą dostosowywać i optymalizować swoje zachowanie w czasie.

Czego się nauczysz:
- Zrozum podstawowe podstawy matematyczne Markowskich procesów decyzyjnych i struktur nagród
- Wdrażaj klasyczne algorytmy Q-learning w celu rozwiązywania problemów decyzyjnych w świecie sieci
- Przejście do głębokiego uczenia wzmacniającego poprzez budowanie głębokich sieci Q-Networks z sieciami neuronowymi
- Zastosuj metody gradientu polityki, w tym REINFORCE i zrozum architektury krytyczne dla aktorów
- Skonfiguruj znormalizowane środowiska za pomocą nowoczesnego interfejsu API Gimnazjum dla agentów szkoleniowych
- Poznaj współczesne zastosowania uczenia się wzmacniającego, w tym koncepcje RLHF

Zaczynamy od podstawowej terminologii, pętli stanu-działania-nagrody i programowania dynamicznego. Stamtąd przejdziesz krok po kroku przez pisemne wyjaśnienia i implementacje kodu zarówno metod głębokiego uczenia opartych na wartościach, jak i zasadach. Ten kurs jest przeznaczony dla początkujących w uczeniu maszynowym, którzy chcą specjalizować się w uczeniu się wzmacniającym. Zalecana jest podstawowa znajomość Pythona i koncepcji sieci neuronowych, ale nie jest wymagane wcześniejsze doświadczenie w uczeniu się wzmacniania.

Co otrzymasz

📜 Certyfikat ukończenia
Dodaj do profilu LinkedIn
💬 Osobisty tutor AI
Utknąłeś na lekcji? Zapytaj wbudowanego tutora o cokolwiek, w dowolnej chwili.
🎧 Wersja audio w zestawie
Ucz się w drodze — bez ekranu
♾️ Dożywotni dostęp
Wracaj, kiedy chcesz — bez wygaśnięcia
📱 Telefon lub komputer
Działa wszędzie, na każdym urządzeniu
💸 Zwrot w 14 dni
Bez pytań
⚡ Krótko i konkretnie
42 min praktycznej treści

Recenzje

Brak recenzji — bądź pierwszą osobą, która podzieli się doświadczeniem.

Inni uczyli się też

⚡ Najlepszy na start

Głębokie uczenie się wzmacniające w Pythonie: nowoczesne wprowadzenie

Python Maze Pathfinding z wrogami i nagrodami

★ 0.0

Certyfikat Praktyka

₹799 →

Najczęstsze pytania

Czego potrzebuję, by wziąć udział w tym kursie? +

Wystarczy telefon lub komputer z internetem. Bez instalacji i specjalnego sprzętu.

Jak zapłacić? +

Kartą przez Stripe. Nie przechowujemy danych karty — robi to bezpiecznie Stripe.

Czy mogę otrzymać zwrot? +

Tak — pełen zwrot w 14 dni, bez pytań.

Jak długo będę mieć dostęp? +

Na zawsze. Po zakupie kurs jest twój — wracaj, kiedy chcesz.

Czy dostanę certyfikat? +

Tak. Po ukończeniu otrzymasz certyfikat, który możesz dodać do profilu LinkedIn.

Stworzony dla uczących się w

IT Design Finanse Marketing Ochrona zdrowia Edukacja Hotelarstwo Produkcja