LLM Post-Training: พื้นฐานของการ Fine-Tuning และ Reinforcement Learning — LearnFlat

LLM Post-Training: พื้นฐานของการ Fine-Tuning และ Reinforcement Learning

เชี่ยวชาญสิ่งจำเป็นของการฝึกอบรม LLM หลังการฝึกอบรม เพื่อปรับให้เข้ากัน, เชี่ยวชาญ, และปรับปรุงความปลอดภัยของโมเดลโดยใช้เทคนิค supervised fine-tuning และ reinforcement learning

⏱ 1 ชม. 20 นาที 📚 8 บทเรียน

เกี่ยวกับคอร์สนี้

โมเดลภาษาขนาดใหญ่ที่ผ่านการฝึกอบรมมาแล้วนั้นทรงพลัง แต่การปรับให้เข้ากับงานเฉพาะทางและการปรับให้สอดคล้องกับความต้องการของมนุษย์นั้นต้องอาศัยการฝึกอบรมหลังการฝึกอบรม (post-training) การทำความเข้าใจวิธีชี้นำโมเดลเหล่านี้เป็นสิ่งสำคัญสำหรับการสร้างแอปพลิเคชัน AI ที่ปลอดภัย เชื่อถือได้ และมีความเชี่ยวชาญ ในหลักสูตรแบบข้อความนี้ คุณจะได้เรียนรู้แนวคิดพื้นฐานและขั้นตอนการทำงานจริงเบื้องหลัง LLM post-training โดยเปลี่ยนจากโมเดลดิบไปสู่ผู้ช่วย AI ที่มีประโยชน์และสอดคล้อง สิ่งที่คุณจะได้เรียนรู้: - ทำความเข้าใจความแตกต่างที่สำคัญระหว่าง pre-training, supervised fine-tuning (SFT) และ reinforcement learning - ประยุกต์ใช้วิธีการ parameter-efficient fine-tuning (PEFT) เช่น LoRA เพื่อปรับโมเดลโดยใช้ทรัพยากรการประมวลผลน้อยที่สุด - สำรวจ Reinforcement Learning from Human Feedback (RLHF) และทางเลือกการปรับให้สอดคล้องที่ทันสมัย เช่น Direct Preference Optimization (DPO) - ประเมินพฤติกรรมและความปลอดภัยของโมเดลเพื่อให้แน่ใจว่าผลลัพธ์มีประโยชน์ ซื่อสัตย์ และไม่เป็นอันตราย - วิเคราะห์โค้ดตัวอย่างและคำแนะนำแบบละเอียดเพื่อเตรียมชุดข้อมูลสำหรับงาน fine-tuning ที่กำหนดเอง หลักสูตรนี้เริ่มต้นด้วยคำจำกัดความพื้นฐานของกระบวนทัศน์ post-training ก่อนที่จะนำคุณไปสู่การเตรียมข้อมูล การกำหนดค่า fine-tuning และกลยุทธ์การปรับให้สอดคล้อง คุณจะก้าวหน้าจากแนวคิดเชิงทฤษฎีไปสู่การอ่านและวิเคราะห์โค้ดการใช้งานจริง หลักสูตรนี้ออกแบบมาสำหรับนักพัฒนาซอฟต์แวร์ ผู้ที่ชื่นชอบข้อมูล และผู้เริ่มต้น AI ที่ต้องการทำความเข้าใจว่า LLM ถูกปรับแต่งอย่างไร ไม่จำเป็นต้องมีประสบการณ์ด้าน machine learning ขั้นสูงมาก่อน แต่ความคุ้นเคยกับ Python พื้นฐานจะเป็นประโยชน์ เริ่มต้นอ่านวันนี้เพื่อปลดล็อกพลังของการปรับโมเดลให้สอดคล้องและ post-training ที่กำหนดเอง

สิ่งที่คุณจะได้รับ

  • 📜 ใบประกาศนียบัตร
    เพิ่มในโปรไฟล์ LinkedIn ของคุณ
  • 💬 ติวเตอร์ AI ส่วนตัว
    ติดขัดในบทเรียน? ถามติวเตอร์ในตัวของคุณได้ทุกอย่าง ทุกเวลา
  • ♾️ เข้าถึงตลอดชีพ
    กลับมาเรียนได้ตลอด ไม่มีหมดอายุ
  • 📱 โทรศัพท์หรือคอมพิวเตอร์
    ใช้งานได้ทุกที่ ทุกอุปกรณ์
  • 💸 คืนเงิน 14 วัน
    ไม่ต้องอธิบาย
  • กระชับและตรงประเด็น
    1 ชม. 20 นาที เนื้อหาเชิงปฏิบัติ

รีวิว

ยังไม่มีรีวิว — เป็นคนแรกที่แชร์ประสบการณ์

เขียนรีวิว

หลังจากส่ง เราจะขอให้คุณเข้าสู่ระบบ — ฉบับร่างของคุณถูกบันทึก

ผู้เรียนคนอื่นเรียน

คำถามที่พบบ่อย

ฉันต้องใช้อะไรในการเรียนคอร์สนี้? +

แค่โทรศัพท์หรือคอมพิวเตอร์ที่มีอินเทอร์เน็ต ไม่ต้องติดตั้งหรือใช้อุปกรณ์พิเศษ

ฉันชำระเงินอย่างไร? +

ผ่านบัตรด้วย Stripe เราไม่เก็บข้อมูลบัตร — Stripe จัดการอย่างปลอดภัย

ฉันขอคืนเงินได้ไหม? +

ใช่ — คืนเงินเต็มจำนวนใน 14 วัน ไม่ต้องอธิบาย

ฉันมีสิทธิ์เข้าถึงนานเท่าไร? +

ตลอดไป เมื่อซื้อแล้วคอร์สเป็นของคุณ กลับมาเรียนได้ตลอด

ฉันจะได้ใบประกาศนียบัตรไหม? +

ได้ เมื่อเรียนจบจะได้รับใบประกาศนียบัตรที่เพิ่มในโปรไฟล์ LinkedIn ได้

ออกแบบสำหรับผู้เรียนใน
เทคโนโลยี ดีไซน์ การเงิน การตลาด สาธารณสุข การศึกษา ธุรกิจการบริการ อุตสาหกรรม