รากฐานของการเรียนรู้แบบเสริมแรงและการตัดสินใจ — LearnFlat

รากฐานของการเรียนรู้แบบเสริมแรงและการตัดสินใจ

ทำความเข้าใจแนวคิดหลักของการตัดสินใจแบบลำดับ ตั้งแต่ทฤษฎีอรรถประโยชน์และปัญหา Multi-Armed Bandits ไปจนถึงอัลกอริทึมการเรียนรู้แบบเสริมแรงที่ทันสมัย

4.4 (24) ⏱ 1 ชม. 17 นาที 📚 3 บทเรียน 🎧 เวอร์ชันเสียง

เกี่ยวกับคอร์สนี้

การทำความเข้าใจว่าระบบอัตโนมัติทำการเลือกที่เหมาะสมที่สุดในสภาพแวดล้อมที่ซับซ้อนและเปลี่ยนแปลงไปอย่างไร เป็นทักษะที่สำคัญในปัญญาประดิษฐ์ยุคใหม่ การเรียนรู้แบบเสริมแรงเป็นกรอบทางคณิตศาสตร์สำหรับการฝึกเอเจนต์ให้เพิ่มรางวัลสูงสุดผ่านการลองผิดลองถูก ในหลักสูตรพื้นฐานนี้ คุณจะได้สำรวจกลไกของการตัดสินใจแบบลำดับ คุณจะเริ่มต้นด้วยหลักการพื้นฐานของทฤษฎีอรรถประโยชน์ และก้าวไปสู่การสร้างอัลกอริทึมที่ช่วยให้เอเจนต์อัจฉริยะเรียนรู้จากสภาพแวดล้อมของตนเอง โดยรักษาสมดุลระหว่างการสำรวจและการใช้ประโยชน์ สิ่งที่คุณจะได้เรียนรู้: • ทำความเข้าใจคำศัพท์หลัก ทฤษฎีอรรถประโยชน์ และวิธีการสร้างแบบจำลองความชอบของเครื่องจักร • แก้ไขปัญหาการตัดสินใจง่ายๆ โดยใช้กลยุทธ์ Multi-Armed Bandit • สร้างแบบจำลองสภาพแวดล้อมที่ซับซ้อนโดยใช้ Finite Markov Decision Processes (MDPs) • ประยุกต์ใช้เทคนิค Dynamic Programming เพื่อประเมินและปรับปรุงนโยบายการตัดสินใจ • ฝึกฝนการจัดโครงสร้างอัลกอริทึมพื้นฐานโดยใช้สภาพแวดล้อมการจำลอง Python ที่ทันสมัย • สำรวจแนวคิดพื้นฐานที่เชื่อมโยงวิธีการแบบตารางคลาสสิกกับการเรียนรู้แบบเสริมแรงเชิงลึกที่ทันสมัย หลักสูตรนี้จะดำเนินไปตั้งแต่คำจำกัดความพื้นฐานและแบบจำลองทางคณิตศาสตร์ ไปจนถึงการออกแบบอัลกอริทึมเชิงปฏิบัติ คุณจะได้อ่านคำอธิบายที่เป็นลายลักษณ์อักษรทีละขั้นตอน และศึกษาตัวอย่างโค้ดที่ชัดเจนซึ่งแปลทฤษฎีที่เป็นนามธรรมให้เป็นตรรกะที่ใช้งานได้จริง หลักสูตรนี้ออกแบบมาสำหรับผู้เริ่มต้นปัญญาประดิษฐ์ ไม่จำเป็นต้องมีประสบการณ์การเรียนรู้แบบเสริมแรงมาก่อน เริ่มต้นการเดินทางสู่การตัดสินใจอย่างชาญฉลาดวันนี้ และสร้างรากฐานสำหรับการพัฒนา AI ที่ทันสมัย

สิ่งที่คุณจะได้รับ

  • 📜 ใบประกาศนียบัตร
    เพิ่มในโปรไฟล์ LinkedIn ของคุณ
  • 💬 ติวเตอร์ AI ส่วนตัว
    ติดขัดในบทเรียน? ถามติวเตอร์ในตัวของคุณได้ทุกอย่าง ทุกเวลา
  • 🎧 รวมเวอร์ชันเสียง
    เรียนได้ทุกที่ ไม่ต้องดูจอ
  • ♾️ เข้าถึงตลอดชีพ
    กลับมาเรียนได้ตลอด ไม่มีหมดอายุ
  • 📱 โทรศัพท์หรือคอมพิวเตอร์
    ใช้งานได้ทุกที่ ทุกอุปกรณ์
  • 💸 คืนเงิน 14 วัน
    ไม่ต้องอธิบาย
  • กระชับและตรงประเด็น
    1 ชม. 17 นาที เนื้อหาเชิงปฏิบัติ

รีวิว

ยังไม่มีรีวิว — เป็นคนแรกที่แชร์ประสบการณ์

เขียนรีวิว

หลังจากส่ง เราจะขอให้คุณเข้าสู่ระบบ — ฉบับร่างของคุณถูกบันทึก

ผู้เรียนคนอื่นเรียน

คำถามที่พบบ่อย

ฉันต้องใช้อะไรในการเรียนคอร์สนี้? +

แค่โทรศัพท์หรือคอมพิวเตอร์ที่มีอินเทอร์เน็ต ไม่ต้องติดตั้งหรือใช้อุปกรณ์พิเศษ

ฉันชำระเงินอย่างไร? +

ผ่านบัตรด้วย Stripe เราไม่เก็บข้อมูลบัตร — Stripe จัดการอย่างปลอดภัย

ฉันขอคืนเงินได้ไหม? +

ใช่ — คืนเงินเต็มจำนวนใน 14 วัน ไม่ต้องอธิบาย

ฉันมีสิทธิ์เข้าถึงนานเท่าไร? +

ตลอดไป เมื่อซื้อแล้วคอร์สเป็นของคุณ กลับมาเรียนได้ตลอด

ฉันจะได้ใบประกาศนียบัตรไหม? +

ได้ เมื่อเรียนจบจะได้รับใบประกาศนียบัตรที่เพิ่มในโปรไฟล์ LinkedIn ได้

ออกแบบสำหรับผู้เรียนใน
เทคโนโลยี ดีไซน์ การเงิน การตลาด สาธารณสุข การศึกษา ธุรกิจการบริการ อุตสาหกรรม