Katalog · Kecerdasan Buatan · AI Generatif

Mendeploy LLM Lokal: vLLM, Quantization, dan Inference

Name: Mendeploy LLM Lokal: vLLM, Quantization, dan Inference
Price: 24.99 USD
Availability: InStock

Pelajari cara mendeploy large language models secara efisien, menerapkan teknik quantization untuk mengurangi kebutuhan perangkat keras, dan menyajikan model di lingkungan produksi.

⏱ 1 jam 28 mnt 📚 12 pelajaran 🎧 Versi audio

Tentang kursus ini

Menjalankan Large Language Models (LLMs) secara lokal atau di produksi bisa tampak menakutkan karena kebutuhan perangkat keras yang masif dan konfigurasi yang kompleks. Seiring AI yang terus berkembang, kemampuan untuk meng-host model Anda sendiri secara efisien menjadi keterampilan penting bagi pengembang dan tim operasional.

Kursus ini menguraikan proses deployment dan optimasi LLMs, mengubah Anda dari pemula menjadi seseorang yang mampu menyajikan model AI berperforma tinggi secara efisien. Anda akan mengeksplorasi cara mengurangi jejak memori dan memaksimalkan kecepatan inference menggunakan teknik modern, memastikan Anda dapat menjalankan model yang kuat bahkan dengan sumber daya komputasi yang terbatas.

Apa yang akan Anda pelajari:
• Memahami konsep dasar arsitektur LLM, inference, dan manajemen memori.
• Menghitung kebutuhan perangkat keras dan memperkirakan kebutuhan VRAM GPU untuk berbagai ukuran model.
• Menerapkan metode quantization modern seperti GGUF, AWQ, dan GPTQ untuk mengoptimalkan bobot model.
• Mengonfigurasi dan mendeploy model menggunakan vLLM untuk inference dengan throughput tinggi dan latensi rendah.
• Membuat endpoint REST API standar untuk mengintegrasikan model lokal ke dalam aplikasi Anda dengan mulus.
• Berlatih melakukan kontainerisasi deployment LLM Anda menggunakan Docker untuk lingkungan yang konsisten dan skalabel.

Perjalanan dimulai dengan terminologi AI yang penting dan dasar-dasar perangkat keras sebelum beralih ke latihan tertulis praktis yang berfokus pada quantization dan deployment. Anda akan maju selangkah demi selangkah melalui skrip konfigurasi dan pola deployment yang digunakan dalam MLOps modern.

Dirancang untuk pengembang perangkat lunak, calon insinyur DevOps, dan penggemar teknologi tanpa pengalaman machine learning sebelumnya, panduan berbasis teks ini hanya memerlukan pemahaman dasar tentang konsep pemrograman.

Mulailah membaca hari ini untuk membangun keterampilan Anda dalam deployment AI modern dan optimasi inference.

Apa yang Anda dapatkan

📜 Sertifikat penyelesaian
Tambahkan ke profil LinkedIn Anda
💬 Tutor AI pribadi
Bingung di tengah pelajaran? Tanya tutor bawaan kamu apa saja, kapan saja.
🎧 Termasuk versi audio
Belajar di mana saja — tanpa layar
♾️ Akses seumur hidup
Kembali kapan saja, tanpa kedaluwarsa
📱 Ponsel atau komputer
Berfungsi di mana saja, perangkat apa saja
💸 Pengembalian 14 hari
Tanpa pertanyaan
⚡ Singkat dan fokus
1 jam 28 mnt konten praktis

Ulasan

Belum ada ulasan — jadilah yang pertama berbagi pengalaman.

Pelajar lain juga mengambil

🎓 Dengan sertifikat

Pertanyaan umum

Apa yang saya butuhkan untuk mengikuti kursus ini? +

Cukup ponsel atau komputer dengan internet. Tidak ada instalasi atau perangkat khusus.

Bagaimana cara membayar? +

Dengan kartu via Stripe. Kami tidak menyimpan detail kartu — Stripe menanganinya dengan aman.

Bisakah saya mendapat refund? +

Ya — refund penuh dalam 14 hari, tanpa pertanyaan.

Berapa lama saya akan punya akses? +

Selamanya. Setelah membeli, kursus jadi milik Anda untuk dikunjungi lagi kapan saja.

Apakah saya akan mendapat sertifikat? +

Ya. Setelah selesai, Anda akan menerima sertifikat yang bisa ditambahkan ke profil LinkedIn.

Dibuat untuk pelajar di

Teknologi Desain Keuangan Pemasaran Kesehatan Pendidikan Perhotelan Manufaktur

Mendeploy LLM Lokal: vLLM, Quantization, dan Inference

Tentang kursus ini

Apa yang Anda dapatkan

Ulasan

Tulis ulasan

Pelajar lain juga mengambil

Alat AI Praktis untuk Pendidik

Dasar-dasar AI Generatif: Konsep Inti dan Prompting

Menjalankan AI Secara Lokal: Panduan LM Studio dan Ollama

Membangun Aplikasi Berbasis AI dengan API OpenAI

Pertanyaan umum