การปรับใช้ Local LLMs: vLLM, Quantization, และ Inference — LearnFlat

การปรับใช้ Local LLMs: vLLM, Quantization, และ Inference

เรียนรู้วิธีการปรับใช้ Large Language Models อย่างมีประสิทธิภาพ, การประยุกต์ใช้เทคนิค Quantization เพื่อลดความต้องการด้านฮาร์ดแวร์, และการให้บริการโมเดลในสภาพแวดล้อมการใช้งานจริง (Production)

⏱ 1 ชม. 28 นาที 📚 12 บทเรียน 🎧 เวอร์ชันเสียง

เกี่ยวกับคอร์สนี้

การรัน Large Language Models (LLMs) ภายในเครื่อง (Locally) หรือในสภาพแวดล้อม Production อาจดูเป็นเรื่องยากเนื่องจากความต้องการฮาร์ดแวร์มหาศาลและการตั้งค่าที่ซับซ้อน ในขณะที่ AI ยังคงพัฒนาอย่างต่อเนื่อง ความสามารถในการโฮสต์โมเดลของคุณเองอย่างมีประสิทธิภาพกำลังกลายเป็นทักษะที่จำเป็นสำหรับนักพัฒนาและทีม Operations หลักสูตรนี้จะเจาะลึกกระบวนการปรับใช้และเพิ่มประสิทธิภาพ LLMs โดยเปลี่ยนคุณจากมือใหม่ให้กลายเป็นผู้ที่สามารถให้บริการโมเดล AI ประสิทธิภาพสูงได้อย่างมีประสิทธิภาพ คุณจะได้สำรวจวิธีลดการใช้หน่วยความจำและเพิ่มความเร็ว Inference สูงสุดโดยใช้เทคนิคสมัยใหม่ เพื่อให้มั่นใจว่าคุณสามารถรันโมเดลที่ทรงพลังได้แม้จะมีทรัพยากรการคำนวณที่จำกัด สิ่งที่คุณจะได้เรียนรู้: • เข้าใจแนวคิดพื้นฐานของสถาปัตยกรรม LLM, Inference, และการจัดการหน่วยความจำ • คำนวณความต้องการฮาร์ดแวร์และประมาณการความต้องการ GPU VRAM สำหรับโมเดลขนาดต่างๆ • ประยุกต์ใช้วิธี Quantization สมัยใหม่ เช่น GGUF, AWQ, และ GPTQ เพื่อเพิ่มประสิทธิภาพน้ำหนักของโมเดล (Model Weights) • กำหนดค่าและปรับใช้โมเดลโดยใช้ vLLM เพื่อการทำ Inference ที่มี Throughput สูงและ Latency ต่ำ • สร้าง REST API Endpoints มาตรฐานเพื่อรวมโมเดลภายในเครื่องเข้ากับแอปพลิเคชันของคุณได้อย่างราบรื่น • ฝึกฝนการทำ Containerization สำหรับการปรับใช้ LLM โดยใช้ Docker เพื่อสภาพแวดล้อมที่สม่ำเสมอและขยายขนาดได้ การเดินทางเริ่มต้นด้วยคำศัพท์ AI ที่จำเป็นและพื้นฐานฮาร์ดแวร์ ก่อนจะเข้าสู่แบบฝึกหัดการเขียนเชิงปฏิบัติที่เน้นเรื่อง Quantization และการปรับใช้ คุณจะก้าวหน้าไปทีละขั้นตอนผ่านสคริปต์การกำหนดค่าและรูปแบบการปรับใช้ที่ใช้ใน MLOps สมัยใหม่ ออกแบบมาสำหรับนักพัฒนาซอฟต์แวร์, ว่าที่วิศวกร DevOps, และผู้ที่ชื่นชอบเทคโนโลยีที่ไม่มีประสบการณ์ Machine Learning มาก่อน คู่มือรูปแบบข้อความนี้ต้องการเพียงความเข้าใจพื้นฐานเกี่ยวกับแนวคิดการเขียนโปรแกรมเท่านั้น เริ่มอ่านวันนี้เพื่อสร้างทักษะของคุณในการปรับใช้ AI สมัยใหม่และการเพิ่มประสิทธิภาพ Inference

สิ่งที่คุณจะได้รับ

  • 📜 ใบประกาศนียบัตร
    เพิ่มในโปรไฟล์ LinkedIn ของคุณ
  • 💬 ติวเตอร์ AI ส่วนตัว
    ติดขัดในบทเรียน? ถามติวเตอร์ในตัวของคุณได้ทุกอย่าง ทุกเวลา
  • 🎧 รวมเวอร์ชันเสียง
    เรียนได้ทุกที่ ไม่ต้องดูจอ
  • ♾️ เข้าถึงตลอดชีพ
    กลับมาเรียนได้ตลอด ไม่มีหมดอายุ
  • 📱 โทรศัพท์หรือคอมพิวเตอร์
    ใช้งานได้ทุกที่ ทุกอุปกรณ์
  • 💸 คืนเงิน 14 วัน
    ไม่ต้องอธิบาย
  • กระชับและตรงประเด็น
    1 ชม. 28 นาที เนื้อหาเชิงปฏิบัติ

รีวิว

ยังไม่มีรีวิว — เป็นคนแรกที่แชร์ประสบการณ์

เขียนรีวิว

หลังจากส่ง เราจะขอให้คุณเข้าสู่ระบบ — ฉบับร่างของคุณถูกบันทึก

ผู้เรียนคนอื่นเรียน

คำถามที่พบบ่อย

ฉันต้องใช้อะไรในการเรียนคอร์สนี้? +

แค่โทรศัพท์หรือคอมพิวเตอร์ที่มีอินเทอร์เน็ต ไม่ต้องติดตั้งหรือใช้อุปกรณ์พิเศษ

ฉันชำระเงินอย่างไร? +

ผ่านบัตรด้วย Stripe เราไม่เก็บข้อมูลบัตร — Stripe จัดการอย่างปลอดภัย

ฉันขอคืนเงินได้ไหม? +

ใช่ — คืนเงินเต็มจำนวนใน 14 วัน ไม่ต้องอธิบาย

ฉันมีสิทธิ์เข้าถึงนานเท่าไร? +

ตลอดไป เมื่อซื้อแล้วคอร์สเป็นของคุณ กลับมาเรียนได้ตลอด

ฉันจะได้ใบประกาศนียบัตรไหม? +

ได้ เมื่อเรียนจบจะได้รับใบประกาศนียบัตรที่เพิ่มในโปรไฟล์ LinkedIn ได้

ออกแบบสำหรับผู้เรียนใน
เทคโนโลยี ดีไซน์ การเงิน การตลาด สาธารณสุข การศึกษา ธุรกิจการบริการ อุตสาหกรรม