Katalogo · Artificial Intelligence · Generative AI

Pag-deploy ng mga Local LLM: vLLM, Quantization, at Inference

Name: Pag-deploy ng mga Local LLM: vLLM, Quantization, at Inference
Price: 100 RON
Availability: InStock

Alamin kung paano mag-deploy ng mga large language model nang mahusay, mag-apply ng mga quantization technique para mabawasan ang mga hardware requirement, at mag-serve ng mga model sa mga production environment.

⏱ 1 oras 28 min 📚 12 aralin 🎧 Audio version

Tungkol sa kursong ito

Ang pagpapatakbo ng mga Large Language Models (LLMs) nang lokal o sa production ay maaaring magmukhang nakakatakot dahil sa malalaking hardware requirement at kumplikadong configuration. Habang patuloy na nag-e-evolve ang AI, ang kakayahang mag-host ng sarili mong mga model nang mahusay ay nagiging isang mahalagang kasanayan para sa mga developer at operations team.

Hinihimay ng kursong ito ang proseso ng pag-deploy at pag-optimize ng mga LLM, na nagbabago sa iyo mula sa isang beginner tungo sa isang taong may kakayahang mag-serve ng mga high-performance na AI model nang mahusay. I-e-explore mo kung paano bawasan ang memory footprint at i-maximize ang inference speed gamit ang mga modernong technique, na tinitiyak na mapapatakbo mo ang mga makapangyarihang model kahit na may limitadong computational resource.

Ang iyong matututuhan:
• Unawain ang mga pangunahing konsepto ng LLM architecture, inference, at memory management.
• Mag-calculate ng mga hardware requirement at mag-estimate ng mga GPU VRAM need para sa iba't ibang laki ng model.
• Mag-apply ng mga modernong quantization method tulad ng GGUF, AWQ, at GPTQ para i-optimize ang mga model weight.
• I-configure at i-deploy ang mga model gamit ang vLLM para sa high-throughput, low-latency na inference.
• Gumawa ng mga standard na REST API endpoint para ma-integrate nang maayos ang mga local model sa iyong mga application.
• Mag-practice ng pag-containerize ng iyong mga LLM deployment gamit ang Docker para sa mga consistent at scalable na environment.

Magsisimula ang paglalakbay sa mahahalagang AI terminology at hardware basics bago lumipat sa mga hands-on na written exercise na nakatuon sa quantization at deployment. Magpapatuloy ka nang step-by-step sa pamamagitan ng mga configuration script at deployment pattern na ginagamit sa modernong MLOps.

Idinisenyo para sa mga software developer, mga nagnanais maging DevOps engineer, at mga tech enthusiast na walang naunang karanasan sa machine learning, ang text-based na gabay na ito ay nangangailangan lamang ng pangunahing pag-unawa sa mga konsepto ng programming.

Simulan ang pagbabasa ngayon para mabuo ang iyong mga kasanayan sa modernong AI deployment at inference optimization.

Ang makukuha mo

📜 Certificate ng pagtatapos
Idagdag sa LinkedIn profile mo
💬 Personal na AI tutor
Natigil sa isang aralin? Itanong sa iyong built-in na tutor ang kahit ano, kahit kailan.
🎧 Kasama ang audio version
Mag-aral kahit saan — hindi kailangan ng screen
♾️ Lifetime access
Bumalik anumang oras, walang expiry
📱 Telepono o computer
Gumagana saanman, kahit anong device
💸 14-day refund
Walang tanong
⚡ Maikli at focused
1 oras 28 min ng practical content

Mga Review

Wala pang review — ikaw ang unang magbahagi.

Kinuha rin ng iba

🎓 May sertipiko

Mga madalas itanong

Ano ang kailangan ko para sa kursong ito? +

Telepono o computer na may internet lang. Walang install, walang special hardware.

Paano ako magbabayad? +

Sa pamamagitan ng card via Stripe. Hindi namin iniimbak ang detalye ng card — secure na hinahawakan ng Stripe.

Pwede ba akong mag-refund? +

Oo — full refund sa loob ng 14 araw, walang tanong.

Hanggang kailan ang access ko? +

Habang buhay. Sa pagbili, sa iyo na ang course — balikan mo kahit kailan.

Makakakuha ba ako ng certificate? +

Oo. Pagkatapos, makakatanggap ka ng certificate na maidadagdag sa LinkedIn profile mo.

Para sa mga learner sa

Tech Design Finance Marketing Healthcare Edukasyon Hospitality Manufacturing

Pag-deploy ng mga Local LLM: vLLM, Quantization, at Inference

Tungkol sa kursong ito

Ang makukuha mo

Mga Review

Magsulat ng review

Kinuha rin ng iba

Mga Praktikal na AI Tool para sa mga Guro

Mga Batayan ng Generative AI: Mga Pangunahing Konsepto at Pagpo-prompt

Pagpapatakbo ng AI sa Lokal: Gabay sa LM Studio at Ollama

Pagbuo ng mga Aplikasyon na Pinapagana ng AI gamit ang OpenAI API

Mga madalas itanong