Mendeploy LLM Lokal: vLLM, Quantization, dan Inference — LearnFlat

Mendeploy LLM Lokal: vLLM, Quantization, dan Inference

Pelajari cara mendeploy large language models secara efisien, menerapkan teknik quantization untuk mengurangi kebutuhan perangkat keras, dan menyajikan model di lingkungan produksi.

⏱ 1 jam 28 mnt 📚 12 pelajaran 🎧 Versi audio

Tentang kursus ini

Menjalankan Large Language Models (LLMs) secara lokal atau di produksi bisa tampak menakutkan karena kebutuhan perangkat keras yang masif dan konfigurasi yang kompleks. Seiring AI yang terus berkembang, kemampuan untuk meng-host model Anda sendiri secara efisien menjadi keterampilan penting bagi pengembang dan tim operasional. Kursus ini menguraikan proses deployment dan optimasi LLMs, mengubah Anda dari pemula menjadi seseorang yang mampu menyajikan model AI berperforma tinggi secara efisien. Anda akan mengeksplorasi cara mengurangi jejak memori dan memaksimalkan kecepatan inference menggunakan teknik modern, memastikan Anda dapat menjalankan model yang kuat bahkan dengan sumber daya komputasi yang terbatas. Apa yang akan Anda pelajari: • Memahami konsep dasar arsitektur LLM, inference, dan manajemen memori. • Menghitung kebutuhan perangkat keras dan memperkirakan kebutuhan VRAM GPU untuk berbagai ukuran model. • Menerapkan metode quantization modern seperti GGUF, AWQ, dan GPTQ untuk mengoptimalkan bobot model. • Mengonfigurasi dan mendeploy model menggunakan vLLM untuk inference dengan throughput tinggi dan latensi rendah. • Membuat endpoint REST API standar untuk mengintegrasikan model lokal ke dalam aplikasi Anda dengan mulus. • Berlatih melakukan kontainerisasi deployment LLM Anda menggunakan Docker untuk lingkungan yang konsisten dan skalabel. Perjalanan dimulai dengan terminologi AI yang penting dan dasar-dasar perangkat keras sebelum beralih ke latihan tertulis praktis yang berfokus pada quantization dan deployment. Anda akan maju selangkah demi selangkah melalui skrip konfigurasi dan pola deployment yang digunakan dalam MLOps modern. Dirancang untuk pengembang perangkat lunak, calon insinyur DevOps, dan penggemar teknologi tanpa pengalaman machine learning sebelumnya, panduan berbasis teks ini hanya memerlukan pemahaman dasar tentang konsep pemrograman. Mulailah membaca hari ini untuk membangun keterampilan Anda dalam deployment AI modern dan optimasi inference.

Apa yang Anda dapatkan

  • 📜 Sertifikat penyelesaian
    Tambahkan ke profil LinkedIn Anda
  • 💬 Tutor AI pribadi
    Bingung di tengah pelajaran? Tanya tutor bawaan kamu apa saja, kapan saja.
  • 🎧 Termasuk versi audio
    Belajar di mana saja — tanpa layar
  • ♾️ Akses seumur hidup
    Kembali kapan saja, tanpa kedaluwarsa
  • 📱 Ponsel atau komputer
    Berfungsi di mana saja, perangkat apa saja
  • 💸 Pengembalian 14 hari
    Tanpa pertanyaan
  • Singkat dan fokus
    1 jam 28 mnt konten praktis

Ulasan (1)

Андрій Бондаренко UA Pelajar terverifikasi
★ 4 · 2025-05-17T09:44:23+00:00

Брался за курс, чтобы разобраться с локальным запуском моделей без облака, и в целом цель достигнута. Тема квантизации объяснена понятно: стало ясно, как ужать модель и не угробить качество, чтобы влезть в скромную видеокарту. Развёртывание через vLLM показали по шагам, я поднял свой инференс-сервер и проверил под нагрузкой. Единственное, хотелось бы чуть глубже про мониторинг в продакшене, этот раздел показался коротковатым. Но в остальном материал плотный и применимый сразу. Для тех, кто хочет держать LLM у себя, это отличная отправная точка.

Tulis ulasan

Setelah mengirim kami akan meminta masuk — draf Anda tersimpan.

Pelajar lain juga mengambil

Pertanyaan umum

Apa yang saya butuhkan untuk mengikuti kursus ini? +

Cukup ponsel atau komputer dengan internet. Tidak ada instalasi atau perangkat khusus.

Bagaimana cara membayar? +

Dengan kartu via Stripe. Kami tidak menyimpan detail kartu — Stripe menanganinya dengan aman.

Bisakah saya mendapat refund? +

Ya — refund penuh dalam 14 hari, tanpa pertanyaan.

Berapa lama saya akan punya akses? +

Selamanya. Setelah membeli, kursus jadi milik Anda untuk dikunjungi lagi kapan saja.

Apakah saya akan mendapat sertifikat? +

Ya. Setelah selesai, Anda akan menerima sertifikat yang bisa ditambahkan ke profil LinkedIn.

Dibuat untuk pelajar di
Teknologi Desain Keuangan Pemasaran Kesehatan Pendidikan Perhotelan Manufaktur