Reinforcement Learning: จาก Q-Learning สู่ Deep Policy Gradients — LearnFlat

Reinforcement Learning: จาก Q-Learning สู่ Deep Policy Gradients

สร้างรากฐานที่แข็งแกร่งใน Reinforcement Learning โดยการนำ Q-learning แบบคลาสสิก, Deep Q-Networks และอัลกอริทึม Policy Gradient มาใช้ด้วยไลบรารี Python ที่ทันสมัย

⏱ 42 นาที 📚 7 บทเรียน 🎧 เวอร์ชันเสียง

เกี่ยวกับคอร์สนี้

Reinforcement Learning เป็นแรงขับเคลื่อนเบื้องหลัง AI ที่ตัดสินใจในยุคปัจจุบัน ตั้งแต่เอเจนต์ที่เล่นเกมไปจนถึงระบบอัตโนมัติ การทำความเข้าใจว่าเอเจนต์เรียนรู้ผ่านการลองผิดลองถูกได้อย่างไรนั้นสำคัญอย่างยิ่งสำหรับทุกคนที่เข้าสู่สาขาปัญญาประดิษฐ์ขั้นสูง หลักสูตรแบบข้อความนี้จะนำคุณตั้งแต่พื้นฐานของการสร้างกรอบการตัดสินใจไปจนถึงการนำอัลกอริทึม Deep Reinforcement Learning ที่ทรงพลังมาใช้ คุณจะได้เรียนรู้วิธีสร้างแบบจำลองสภาพแวดล้อม กำหนดรางวัล และฝึกเอเจนต์ที่สามารถปรับตัวและเพิ่มประสิทธิภาพพฤติกรรมของตนเองได้ตลอดเวลา สิ่งที่คุณจะได้เรียนรู้: - ทำความเข้าใจพื้นฐานทางคณิตศาสตร์หลักของ Markov Decision Processes และโครงสร้างรางวัล - ใช้อัลกอริทึม Q-learning แบบตารางคลาสสิกเพื่อแก้ปัญหาการตัดสินใจในโลกกริด - เปลี่ยนไปสู่ Deep Reinforcement Learning โดยการสร้าง Deep Q-Networks ด้วยโครงข่ายประสาทเทียม - ใช้วิธีการ Policy Gradient รวมถึง REINFORCE และทำความเข้าใจสถาปัตยกรรม actor-critic - กำหนดค่าสภาพแวดล้อมมาตรฐานโดยใช้ Gymnasium API ที่ทันสมัยสำหรับการฝึกเอเจนต์ - สำรวจการประยุกต์ใช้ Reinforcement Learning ในปัจจุบัน รวมถึงแนวคิดเบื้องหลัง RLHF เราจะเริ่มต้นด้วยคำศัพท์ที่จำเป็น, state-action-reward loops และ dynamic programming จากนั้น คุณจะได้เรียนรู้ผ่านคำอธิบายที่เป็นลายลักษณ์อักษรทีละขั้นตอนและการนำโค้ดไปใช้ของวิธีการ Deep Learning ทั้งแบบ value-based และ policy-based หลักสูตรนี้ออกแบบมาสำหรับผู้เริ่มต้นใน Machine Learning ที่ต้องการเชี่ยวชาญใน Reinforcement Learning ขอแนะนำให้มีความคุ้นเคยพื้นฐานกับ Python และแนวคิดโครงข่ายประสาทเทียม แต่ไม่จำเป็นต้องมีประสบการณ์ Reinforcement Learning มาก่อน เริ่มอ่านวันนี้เพื่อเชี่ยวชาญอัลกอริทึมที่เป็นขุมพลังของ AI ที่ปรับตัวได้ในยุคปัจจุบัน

สิ่งที่คุณจะได้รับ

  • 📜 ใบประกาศนียบัตร
    เพิ่มในโปรไฟล์ LinkedIn ของคุณ
  • 💬 ติวเตอร์ AI ส่วนตัว
    ติดขัดในบทเรียน? ถามติวเตอร์ในตัวของคุณได้ทุกอย่าง ทุกเวลา
  • 🎧 รวมเวอร์ชันเสียง
    เรียนได้ทุกที่ ไม่ต้องดูจอ
  • ♾️ เข้าถึงตลอดชีพ
    กลับมาเรียนได้ตลอด ไม่มีหมดอายุ
  • 📱 โทรศัพท์หรือคอมพิวเตอร์
    ใช้งานได้ทุกที่ ทุกอุปกรณ์
  • 💸 คืนเงิน 14 วัน
    ไม่ต้องอธิบาย
  • กระชับและตรงประเด็น
    42 นาที เนื้อหาเชิงปฏิบัติ

รีวิว

ยังไม่มีรีวิว — เป็นคนแรกที่แชร์ประสบการณ์

เขียนรีวิว

หลังจากส่ง เราจะขอให้คุณเข้าสู่ระบบ — ฉบับร่างของคุณถูกบันทึก

ผู้เรียนคนอื่นเรียน

คำถามที่พบบ่อย

ฉันต้องใช้อะไรในการเรียนคอร์สนี้? +

แค่โทรศัพท์หรือคอมพิวเตอร์ที่มีอินเทอร์เน็ต ไม่ต้องติดตั้งหรือใช้อุปกรณ์พิเศษ

ฉันชำระเงินอย่างไร? +

ผ่านบัตรด้วย Stripe เราไม่เก็บข้อมูลบัตร — Stripe จัดการอย่างปลอดภัย

ฉันขอคืนเงินได้ไหม? +

ใช่ — คืนเงินเต็มจำนวนใน 14 วัน ไม่ต้องอธิบาย

ฉันมีสิทธิ์เข้าถึงนานเท่าไร? +

ตลอดไป เมื่อซื้อแล้วคอร์สเป็นของคุณ กลับมาเรียนได้ตลอด

ฉันจะได้ใบประกาศนียบัตรไหม? +

ได้ เมื่อเรียนจบจะได้รับใบประกาศนียบัตรที่เพิ่มในโปรไฟล์ LinkedIn ได้

ออกแบบสำหรับผู้เรียนใน
เทคโนโลยี ดีไซน์ การเงิน การตลาด สาธารณสุข การศึกษา ธุรกิจการบริการ อุตสาหกรรม