Menghantar LLM Tempatan: vLLM, Quantization, dan Inference — LearnFlat

Menghantar LLM Tempatan: vLLM, Quantization, dan Inference

Pelajari cara menghantar model bahasa besar secara cekap, gunakan teknik quantization untuk mengurangkan keperluan perkakasan, dan hidangkan model dalam persekitaran pengeluaran.

⏱ 1 jam 28 min 📚 12 pelajaran 🎧 Versi audio

Tentang kursus ini

Menjalankan Large Language Models (LLMs) secara tempatan atau dalam pengeluaran boleh kelihatan menakutkan disebabkan oleh keperluan perkakasan yang besar dan konfigurasi yang kompleks. Memandangkan AI terus berkembang, keupayaan untuk mengehos model anda sendiri secara cekap menjadi kemahiran penting bagi pembangun dan pasukan operasi. Kursus ini memperincikan proses menghantar dan mengoptimumkan LLMs, mengubah anda daripada seorang pemula kepada seseorang yang mampu menghidangkan model AI berprestasi tinggi secara cekap. Anda akan meneroka cara mengurangkan jejak memori dan memaksimumkan kelajuan inference menggunakan teknik moden, memastikan anda boleh menjalankan model yang berkuasa walaupun dengan sumber pengkomputeran yang terhad. Apa yang anda akan pelajari: • Memahami konsep asas seni bina LLM, inference, dan pengurusan memori. • Mengira keperluan perkakasan dan menganggarkan keperluan GPU VRAM untuk pelbagai saiz model. • Menggunakan kaedah quantization moden seperti GGUF, AWQ, dan GPTQ untuk mengoptimumkan berat model. • Mengkonfigurasi dan menghantar model menggunakan vLLM untuk inference throughput tinggi dan kependaman rendah. • Mencipta titik akhir REST API standard untuk menyepadukan model tempatan ke dalam aplikasi anda dengan lancar. • Berlatih melakukan containerizing pada penghantaran LLM anda menggunakan Docker untuk persekitaran yang konsisten dan boleh skala. Perjalanan bermula dengan terminologi AI yang penting dan asas perkakasan sebelum beralih ke latihan bertulis praktikal yang tertumpu pada quantization dan penghantaran. Anda akan maju langkah demi langkah melalui skrip konfigurasi dan corak penghantaran yang digunakan dalam MLOps moden. Direka untuk pembangun perisian, bakal jurutera DevOps, dan peminat teknologi tanpa pengalaman pembelajaran mesin sebelum ini, panduan berasaskan teks ini hanya memerlukan pemahaman asas tentang konsep pengaturcaraan. Mula membaca hari ini untuk membina kemahiran anda dalam penghantaran AI moden dan pengoptimuman inference.

Apa yang anda dapat

  • 📜 Sijil tamat
    Tambah ke profil LinkedIn anda
  • 💬 Tutor AI peribadi
    Tersekat dalam pelajaran? Tanya tutor terbina dalam kamu apa sahaja, bila-bila masa.
  • 🎧 Termasuk versi audio
    Belajar sambil bergerak — tanpa skrin
  • ♾️ Akses seumur hidup
    Kembali bila-bila masa, tiada tamat tempoh
  • 📱 Telefon atau komputer
    Berfungsi di mana-mana, mana-mana peranti
  • 💸 Pulangan 14 hari
    Tanpa soalan
  • Pendek dan fokus
    1 jam 28 min kandungan praktikal

Ulasan (1)

Андрій Бондаренко UA Pelajar disahkan
★ 4 · 2025-05-17T09:44:23+00:00

Брался за курс, чтобы разобраться с локальным запуском моделей без облака, и в целом цель достигнута. Тема квантизации объяснена понятно: стало ясно, как ужать модель и не угробить качество, чтобы влезть в скромную видеокарту. Развёртывание через vLLM показали по шагам, я поднял свой инференс-сервер и проверил под нагрузкой. Единственное, хотелось бы чуть глубже про мониторинг в продакшене, этот раздел показался коротковатым. Но в остальном материал плотный и применимый сразу. Для тех, кто хочет держать LLM у себя, это отличная отправная точка.

Tulis ulasan

Selepas hantar kami akan meminta anda log masuk — draf disimpan.

Pelajar lain juga mengambil

Soalan lazim

Apa yang saya perlukan untuk mengikuti kursus ini? +

Hanya telefon atau komputer dengan internet. Tiada pemasangan, tiada perkakasan khas.

Bagaimana untuk membayar? +

Dengan kad melalui Stripe. Kami tidak menyimpan butiran kad — Stripe menguruskannya dengan selamat.

Bolehkah saya dapatkan bayaran balik? +

Ya — pulangan penuh dalam 14 hari, tanpa soalan.

Berapa lama saya akan mempunyai akses? +

Selamanya. Setelah membeli, kursus adalah milik anda — boleh lawat semula bila-bila masa.

Adakah saya akan mendapat sijil? +

Ya. Setelah tamat, anda akan menerima sijil yang boleh ditambah ke profil LinkedIn anda.

Direka untuk pelajar dalam
Teknologi Reka bentuk Kewangan Pemasaran Kesihatan Pendidikan Hospitaliti Pembuatan