Yerel LLM'leri Dağıtma: vLLM, Quantization ve Inference — LearnFlat

Yerel LLM'leri Dağıtma: vLLM, Quantization ve Inference

Büyük dil modellerini verimli bir şekilde nasıl dağıtacağınızı, donanım gereksinimlerini azaltmak için quantization tekniklerini nasıl uygulayacağınızı ve modelleri üretim ortamlarında nasıl sunacağınızı öğrenin.

⏱ 1 sa 28 dk 📚 12 ders 🎧 Sesli versiyon

Bu kurs hakkında

Büyük Dil Modellerini (LLM) yerel olarak veya üretim ortamında çalıştırmak, devasa donanım gereksinimleri ve karmaşık yapılandırmalar nedeniyle göz korkutucu görünebilir. AI gelişmeye devam ettikçe, kendi modellerinizi verimli bir şekilde barındırma yeteneği, geliştiriciler ve operasyon ekipleri için temel bir beceri haline geliyor. Bu kurs, LLM'leri dağıtma ve optimize etme sürecini parçalara ayırarak sizi bir yeni başlayandan, yüksek performanslı AI modellerini verimli bir şekilde sunabilen birine dönüştürür. Modern teknikleri kullanarak bellek ayak izlerini nasıl azaltacağınızı ve inference hızını nasıl maksimize edeceğinizi keşfedecek, sınırlı hesaplama kaynaklarıyla bile güçlü modelleri çalıştırabilmenizi sağlayacaksınız. Neler öğreneceksiniz: • LLM mimarisi, inference ve bellek yönetiminin temel kavramlarını anlayın. • Çeşitli model boyutları için donanım gereksinimlerini hesaplayın ve GPU VRAM ihtiyaçlarını tahmin edin. • Model ağırlıklarını optimize etmek için GGUF, AWQ ve GPTQ gibi modern quantization yöntemlerini uygulayın. • Yüksek verimli, düşük gecikmeli inference için vLLM kullanarak modelleri yapılandırın ve dağıtın. • Yerel modelleri uygulamalarınıza sorunsuz bir şekilde entegre etmek için standart REST API uç noktaları oluşturun. • Tutarlı, ölçeklenebilir ortamlar için Docker kullanarak LLM dağıtımlarınızı konteynerleştirmeyi deneyimleyin. Yolculuk, quantization ve dağıtıma odaklanan uygulamalı yazılı egzersizlere geçmeden önce temel AI terminolojisi ve donanım temelleri ile başlar. Modern MLOps'ta kullanılan yapılandırma betikleri ve dağıtım kalıpları aracılığıyla adım adım ilerleyeceksiniz. Yazılım geliştiriciler, hevesli DevOps mühendisleri ve önceden machine learning deneyimi olmayan teknoloji meraklıları için tasarlanan bu metin tabanlı kılavuz, yalnızca temel programlama kavramlarının anlaşılmasını gerektirir. Modern AI dağıtımı ve inference optimizasyonu konusundaki becerilerinizi geliştirmek için bugün okumaya başlayın.

Ne elde edeceksin

  • 📜 Tamamlama sertifikası
    LinkedIn profilinize ekleyin
  • 💬 Kişisel AI öğretmeni
    Bir derste takıldın mı? Yerleşik öğretmenine istediğin zaman her şeyi sorabilirsin.
  • 🎧 Sesli versiyon dahil
    Yolda öğren — ekrana gerek yok
  • ♾️ Ömür boyu erişim
    İstediğin zaman dön, son kullanma tarihi yok
  • 📱 Telefon veya bilgisayar
    Her yerde, her cihazda
  • 💸 14 gün iade
    Sorgusuz
  • Kısa ve odaklı
    1 sa 28 dk pratik içerik

Yorumlar

Henüz yorum yok — deneyimini ilk paylaşan sen ol.

Yorum yaz

Gönderdikten sonra giriş yapmanı isteyeceğiz — taslağın kaydedilir.

Diğer öğrenciler şunları da aldı

Sık sorulanlar

Bu kursu almak için neye ihtiyacım var? +

Sadece internetli bir telefon veya bilgisayar yeterli. Kurulum yok, özel donanım yok.

Nasıl ödeme yapabilirim? +

Stripe üzerinden kartla. Kart bilgilerini saklamıyoruz — Stripe güvenli şekilde işliyor.

Para iadesi alabilir miyim? +

Evet — 14 gün içinde tam iade, sorgusuz.

Erişimim ne kadar sürer? +

Sonsuza dek. Bir kez satın aldığında, kurs senindir — istediğin zaman dönebilirsin.

Sertifika alacak mıyım? +

Evet. Tamamladığında, LinkedIn profiline ekleyebileceğin bir sertifika alırsın.

Şu sektörlerdeki öğrenenler için
Teknoloji Tasarım Finans Pazarlama Sağlık Eğitim Konaklama Üretim