Katalog · Pembelajaran Mendalam · Pembelajaran Pengukuhan

Pembelajaran Pengukuhan: Dari Q-Learning ke Deep Policy Gradients

Name: Pembelajaran Pengukuhan: Dari Q-Learning ke Deep Policy Gradients
Price: 9.99 USD
Availability: InStock

Bina asas yang kukuh dalam pembelajaran pengukuhan dengan melaksanakan algoritma Q-learning klasik, Deep Q-Networks, dan algoritma policy gradient menggunakan pustaka Python moden.

⏱ 42 min 📚 7 pelajaran 🎧 Versi audio

Tentang kursus ini

Pembelajaran pengukuhan adalah daya penggerak di sebalik AI pembuatan keputusan moden, daripada agen bermain permainan kepada sistem autonomi. Memahami bagaimana agen belajar melalui percubaan dan kesilapan adalah penting bagi sesiapa yang memasuki bidang kecerdasan buatan lanjutan. Kursus berasaskan teks ini membimbing anda dari asas mutlak rangka kerja pembuatan keputusan hingga melaksanakan algoritma pembelajaran pengukuhan mendalam yang berkuasa. Anda akan belajar cara memodelkan persekitaran, menentukan ganjaran, dan melatih agen yang boleh menyesuaikan dan mengoptimumkan tingkah laku mereka dari semasa ke semasa.

Apa yang akan anda pelajari:
- Memahami asas matematik teras Markov Decision Processes dan struktur ganjaran
- Melaksanakan algoritma Q-learning tabular klasik untuk menyelesaikan masalah keputusan grid-world
- Beralih kepada pembelajaran pengukuhan mendalam dengan membina Deep Q-Networks dengan rangkaian saraf
- Mengaplikasikan kaedah policy gradient termasuk REINFORCE dan memahami seni bina actor-critic
- Mengkonfigurasi persekitaran piawai menggunakan Gymnasium API moden untuk melatih agen
- Meneroka aplikasi kontemporari pembelajaran pengukuhan, termasuk konsep di sebalik RLHF

Kami bermula dengan terminologi penting, gelung state-action-reward, dan pengaturcaraan dinamik. Dari situ, anda akan maju melalui penjelasan bertulis langkah demi langkah dan pelaksanaan kod bagi kedua-dua kaedah pembelajaran mendalam berasaskan nilai dan berasaskan polisi. Kursus ini direka untuk pemula dalam pembelajaran mesin yang ingin mengkhusus dalam pembelajaran pengukuhan. Keakraban asas dengan Python dan konsep rangkaian saraf adalah disyorkan, tetapi tiada pengalaman pembelajaran pengukuhan terdahulu diperlukan. Mula membaca hari ini untuk menguasai algoritma yang menggerakkan AI adaptif moden.

Apa yang anda dapat

📜 Sijil tamat
Tambah ke profil LinkedIn anda
💬 Tutor AI peribadi
Tersekat dalam pelajaran? Tanya tutor terbina dalam kamu apa sahaja, bila-bila masa.
🎧 Termasuk versi audio
Belajar sambil bergerak — tanpa skrin
♾️ Akses seumur hidup
Kembali bila-bila masa, tiada tamat tempoh
📱 Telefon atau komputer
Berfungsi di mana-mana, mana-mana peranti
💸 Pulangan 14 hari
Tanpa soalan
⚡ Pendek dan fokus
42 min kandungan praktikal

Ulasan

Belum ada ulasan — jadilah yang pertama berkongsi pengalaman anda.

Pelajar lain juga mengambil

⚡ Terbaik untuk permulaan

Soalan lazim

Apa yang saya perlukan untuk mengikuti kursus ini? +

Hanya telefon atau komputer dengan internet. Tiada pemasangan, tiada perkakasan khas.

Bagaimana untuk membayar? +

Dengan kad melalui Stripe. Kami tidak menyimpan butiran kad — Stripe menguruskannya dengan selamat.

Bolehkah saya dapatkan bayaran balik? +

Ya — pulangan penuh dalam 14 hari, tanpa soalan.

Berapa lama saya akan mempunyai akses? +

Selamanya. Setelah membeli, kursus adalah milik anda — boleh lawat semula bila-bila masa.

Adakah saya akan mendapat sijil? +

Ya. Setelah tamat, anda akan menerima sijil yang boleh ditambah ke profil LinkedIn anda.

Direka untuk pelajar dalam

Teknologi Reka bentuk Kewangan Pemasaran Kesihatan Pendidikan Hospitaliti Pembuatan

Pembelajaran Pengukuhan: Dari Q-Learning ke Deep Policy Gradients

Tentang kursus ini

Apa yang anda dapat

Ulasan

Tulis ulasan

Pelajar lain juga mengambil

Pembelajaran pengukuhan dalam Python: Pengenalan Modern

Pengenalan kepada Pembelajaran Pengukuhan: Asas dan Algoritma

Python Maze Pathfinding dengan Musuh dan Ganjaran

Penjajaran LLM: Pembelajaran Pengukuhan Daripada Maklum Balas Manusia (RLHF)

Soalan lazim