Mendeploy LLM Lokal: vLLM, Quantization, dan Inference โ€” LearnFlat

Mendeploy LLM Lokal: vLLM, Quantization, dan Inference

Pelajari cara mendeploy large language models secara efisien, menerapkan teknik quantization untuk mengurangi kebutuhan perangkat keras, dan menyajikan model di lingkungan produksi.

โฑ 1 jam 28 mnt ๐Ÿ“š 12 pelajaran ๐ŸŽง Versi audio

Tentang kursus ini

Menjalankan Large Language Models (LLMs) secara lokal atau di produksi bisa tampak menakutkan karena kebutuhan perangkat keras yang masif dan konfigurasi yang kompleks. Seiring AI yang terus berkembang, kemampuan untuk meng-host model Anda sendiri secara efisien menjadi keterampilan penting bagi pengembang dan tim operasional. Kursus ini menguraikan proses deployment dan optimasi LLMs, mengubah Anda dari pemula menjadi seseorang yang mampu menyajikan model AI berperforma tinggi secara efisien. Anda akan mengeksplorasi cara mengurangi jejak memori dan memaksimalkan kecepatan inference menggunakan teknik modern, memastikan Anda dapat menjalankan model yang kuat bahkan dengan sumber daya komputasi yang terbatas. Apa yang akan Anda pelajari: โ€ข Memahami konsep dasar arsitektur LLM, inference, dan manajemen memori. โ€ข Menghitung kebutuhan perangkat keras dan memperkirakan kebutuhan VRAM GPU untuk berbagai ukuran model. โ€ข Menerapkan metode quantization modern seperti GGUF, AWQ, dan GPTQ untuk mengoptimalkan bobot model. โ€ข Mengonfigurasi dan mendeploy model menggunakan vLLM untuk inference dengan throughput tinggi dan latensi rendah. โ€ข Membuat endpoint REST API standar untuk mengintegrasikan model lokal ke dalam aplikasi Anda dengan mulus. โ€ข Berlatih melakukan kontainerisasi deployment LLM Anda menggunakan Docker untuk lingkungan yang konsisten dan skalabel. Perjalanan dimulai dengan terminologi AI yang penting dan dasar-dasar perangkat keras sebelum beralih ke latihan tertulis praktis yang berfokus pada quantization dan deployment. Anda akan maju selangkah demi selangkah melalui skrip konfigurasi dan pola deployment yang digunakan dalam MLOps modern. Dirancang untuk pengembang perangkat lunak, calon insinyur DevOps, dan penggemar teknologi tanpa pengalaman machine learning sebelumnya, panduan berbasis teks ini hanya memerlukan pemahaman dasar tentang konsep pemrograman. Mulailah membaca hari ini untuk membangun keterampilan Anda dalam deployment AI modern dan optimasi inference.

Apa yang Anda dapatkan

  • ๐Ÿ“œ Sertifikat penyelesaian
    Tambahkan ke profil LinkedIn Anda
  • ๐Ÿ’ฌ Tutor AI pribadi
    Bingung di tengah pelajaran? Tanya tutor bawaan kamu apa saja, kapan saja.
  • ๐ŸŽง Termasuk versi audio
    Belajar di mana saja โ€” tanpa layar
  • โ™พ๏ธ Akses seumur hidup
    Kembali kapan saja, tanpa kedaluwarsa
  • ๐Ÿ“ฑ Ponsel atau komputer
    Berfungsi di mana saja, perangkat apa saja
  • ๐Ÿ’ธ Pengembalian 14 hari
    Tanpa pertanyaan
  • โšก Singkat dan fokus
    1 jam 28 mnt konten praktis

Ulasan

Belum ada ulasan โ€” jadilah yang pertama berbagi pengalaman.

Tulis ulasan

โ˜†โ˜†โ˜†โ˜†โ˜†
Setelah mengirim kami akan meminta masuk โ€” draf Anda tersimpan.

Pelajar lain juga mengambil

Pertanyaan umum

Apa yang saya butuhkan untuk mengikuti kursus ini? +

Cukup ponsel atau komputer dengan internet. Tidak ada instalasi atau perangkat khusus.

Bagaimana cara membayar? +

Dengan kartu via Stripe. Kami tidak menyimpan detail kartu โ€” Stripe menanganinya dengan aman.

Bisakah saya mendapat refund? +

Ya โ€” refund penuh dalam 14 hari, tanpa pertanyaan.

Berapa lama saya akan punya akses? +

Selamanya. Setelah membeli, kursus jadi milik Anda untuk dikunjungi lagi kapan saja.

Apakah saya akan mendapat sertifikat? +

Ya. Setelah selesai, Anda akan menerima sertifikat yang bisa ditambahkan ke profil LinkedIn.

Dibuat untuk pelajar di
Teknologi Desain Keuangan Pemasaran Kesehatan Pendidikan Perhotelan Manufaktur