บทนำสู่ Reinforcement Learning: พื้นฐานและอัลกอริทึม
เชี่ยวชาญแนวคิดหลักของ Reinforcement Learning ตั้งแต่ Markov Decision Processes ไปจนถึง deep Q-networks ผ่านคำอธิบายที่เป็นลายลักษณ์อักษรที่ชัดเจนและโค้ดที่ใช้งานได้จริง
เกี่ยวกับคอร์สนี้
Reinforcement learning เป็นแรงขับเคลื่อนเบื้องหลังระบบอัตโนมัติสมัยใหม่, เอเจนต์เล่นเกม, และอัลกอริทึมการตัดสินใจแบบปรับตัว การทำความเข้าใจว่าเอเจนต์เรียนรู้จากการโต้ตอบอย่างไรเป็นสิ่งจำเป็นสำหรับทุกคนที่ต้องการเข้าสู่สาขาปัญญาประดิษฐ์ขั้นสูง หลักสูตรแบบข้อความล้วนนี้จะนำคุณตั้งแต่ความน่าจะเป็นพื้นฐานและทฤษฎีการตัดสินใจไปจนถึงการนำอัลกอริทึม Reinforcement Learning แบบคลาสสิกและสมัยใหม่ไปใช้ คุณจะสร้างความเข้าใจเชิงทฤษฎีที่แข็งแกร่งและเรียนรู้วิธีแปลงแนวคิดเหล่านี้ให้เป็นโค้ดที่สะอาดและใช้งานได้จริง
สิ่งที่คุณจะได้เรียนรู้:
- ทำความเข้าใจพื้นฐานทางคณิตศาสตร์ของ Markov Decision Processes (MDPs) และ dynamic programming
- นำวิธีการแบบตารางคลาสสิกไปใช้ รวมถึง Monte Carlo และ Temporal Difference learning
- สำรวจวิธีการแบบ value-based และ policy-based สำหรับสภาพแวดล้อมการตัดสินใจที่ซับซ้อน
- ประยุกต์ใช้แนวคิด deep reinforcement learning โดยใช้ deep Q-networks (DQN) และสถาปัตยกรรมโครงข่ายประสาทเทียมสมัยใหม่
- ฝึกสร้างและฝึกเอเจนต์โดยใช้สภาพแวดล้อมการจำลองมาตรฐานและไลบรารี Python สมัยใหม่
- กำหนดค่าและปรับแต่ง hyperparameters เพื่อทำให้การเรียนรู้มีเสถียรภาพและปรับปรุงประสิทธิภาพของเอเจนต์
หลักสูตรเริ่มต้นด้วยคำศัพท์ที่จำเป็น, พื้นฐานความน่าจะเป็น, และอินเทอร์เฟซระหว่างเอเจนต์กับสภาพแวดล้อม ก่อนที่จะก้าวเข้าสู่ฟังก์ชันค่า, การวนซ้ำนโยบาย, และการรวม deep learning อย่างเป็นระบบ แต่ละแนวคิดจะได้รับการเสริมด้วยคำแนะนำที่เป็นลายลักษณ์อักษรทีละขั้นตอนและตัวอย่างโค้ดที่ชัดเจน หลักสูตรนี้ออกแบบมาสำหรับผู้เริ่มต้นใน machine learning, นักพัฒนาซอฟต์แวร์, และนักเรียนที่ต้องการบทนำ Reinforcement Learning แบบมีโครงสร้างและอิงตามข้อความโดยไม่จำเป็นต้องมีประสบการณ์มาก่อนในหัวข้อนี้ เริ่มสร้างเอเจนต์อัจฉริยะและปรับตัวได้ตั้งแต่วันนี้
สิ่งที่คุณจะได้รับ
-
📜
ใบประกาศนียบัตร
เพิ่มในโปรไฟล์ LinkedIn ของคุณ -
💬
ติวเตอร์ AI ส่วนตัว
ติดขัดในบทเรียน? ถามติวเตอร์ในตัวของคุณได้ทุกอย่าง ทุกเวลา -
♾️
เข้าถึงตลอดชีพ
กลับมาเรียนได้ตลอด ไม่มีหมดอายุ -
📱
โทรศัพท์หรือคอมพิวเตอร์
ใช้งานได้ทุกที่ ทุกอุปกรณ์ -
💸
คืนเงิน 14 วัน
ไม่ต้องอธิบาย -
⚡
กระชับและตรงประเด็น
48 นาที เนื้อหาเชิงปฏิบัติ
รีวิว
ยังไม่มีรีวิว — เป็นคนแรกที่แชร์ประสบการณ์
ผู้เรียนคนอื่นเรียน
⚡ เหมาะสำหรับผู้เริ่มต้น
การเรียนรู้แบบเสริมแรงลึกในภาษาไพทอน: การแนะนำแบบสมัยใหม่
ใบรับรอง
ลงมือทำ
$9.99
→
⚡ เหมาะสำหรับผู้เริ่มต้น
Reinforcement Learning: จาก Q-Learning สู่ Deep Policy Gradients
ใบรับรอง
ลงมือทำ
$9.99
→
🔥 เป็นที่ต้องการ
การค้นหาเส้นทางเขาวงกตด้วย Python พร้อมศัตรูและรางวัล
ใบรับรอง
ลงมือทำ
$9.99
→
💼 พร้อมสำหรับงาน
การจัดเรียง LLM: การเรียนรู้แบบเสริมกำลังจากข้อเสนอแนะของมนุษย์ (RLHF)
ใบรับรอง
ลงมือทำ
$9.99
→
คำถามที่พบบ่อย
ฉันต้องใช้อะไรในการเรียนคอร์สนี้? +
แค่โทรศัพท์หรือคอมพิวเตอร์ที่มีอินเทอร์เน็ต ไม่ต้องติดตั้งหรือใช้อุปกรณ์พิเศษ
ฉันชำระเงินอย่างไร? +
ผ่านบัตรด้วย Stripe เราไม่เก็บข้อมูลบัตร — Stripe จัดการอย่างปลอดภัย
ฉันขอคืนเงินได้ไหม? +
ใช่ — คืนเงินเต็มจำนวนใน 14 วัน ไม่ต้องอธิบาย
ฉันมีสิทธิ์เข้าถึงนานเท่าไร? +
ตลอดไป เมื่อซื้อแล้วคอร์สเป็นของคุณ กลับมาเรียนได้ตลอด
ฉันจะได้ใบประกาศนียบัตรไหม? +
ได้ เมื่อเรียนจบจะได้รับใบประกาศนียบัตรที่เพิ่มในโปรไฟล์ LinkedIn ได้
ออกแบบสำหรับผู้เรียนใน
เทคโนโลยี
ดีไซน์
การเงิน
การตลาด
สาธารณสุข
การศึกษา
ธุรกิจการบริการ
อุตสาหกรรม
×2
เติมครั้งเดียว จ่ายครึ่งเดียว
เพิ่ม $100 → รับ 200 เครดิต แต่ละคลาสราคา $5.00 แทน $9.99 เครดิตไม่มีวันหมดอายุ
$100
200 เครดิต
$5.00 / คลาส
คุ้มที่สุด
$250
550 เครดิต
$4.55 / คลาส
$500
1200 เครดิต
$4.17 / คลาส
ไม่มีการสมัครสมาชิก เครดิตใช้ได้กับทุกคลาสและไม่หมดอายุ