Wdrażanie lokalnych LLM: vLLM, kwantyzacja i inferencja — LearnFlat

Wdrażanie lokalnych LLM: vLLM, kwantyzacja i inferencja

Dowiedz się, jak efektywnie wdrażać duże modele językowe, stosować techniki kwantyzacji w celu zmniejszenia wymagań sprzętowych i serwować modele w środowiskach produkcyjnych.

⏱ 1 godz 28 min 📚 12 lekcji 🎧 Wersja audio

O tym kursie

Uruchamianie dużych modeli językowych (LLM) lokalnie lub na produkcji może wydawać się zniechęcające ze względu na ogromne wymagania sprzętowe i złożone konfiguracje. W miarę ewolucji AI, umiejętność efektywnego hostowania własnych modeli staje się niezbędną umiejętnością dla programistów i zespołów operacyjnych. Ten kurs szczegółowo omawia proces wdrażania i optymalizacji LLM, zmieniając Cię z początkującego w osobę zdolną do wydajnego serwowania wysokowydajnych modeli AI. Dowiesz się, jak zmniejszyć zużycie pamięci i zmaksymalizować prędkość inferencji przy użyciu nowoczesnych technik, co pozwoli na uruchamianie potężnych modeli nawet przy ograniczonych zasobach obliczeniowych. Czego się nauczysz: • Zrozumiesz podstawowe koncepcje architektury LLM, inferencji i zarządzania pamięcią. • Obliczysz wymagania sprzętowe i oszacujesz zapotrzebowanie na GPU VRAM dla różnych rozmiarów modeli. • Zastosujesz nowoczesne metody kwantyzacji, takie jak GGUF, AWQ i GPTQ, aby zoptymalizować wagi modeli. • Skonfigurujesz i wdrożysz modele przy użyciu vLLM w celu uzyskania wysokiej przepustowości i niskich opóźnień inferencji. • Utworzysz standardowe punkty końcowe REST API, aby płynnie integrować lokalne modele ze swoimi aplikacjami. • Przećwiczysz konteneryzację wdrożeń LLM przy użyciu Docker dla spójnych i skalowalnych środowisk. Podróż zaczyna się od kluczowej terminologii AI i podstaw sprzętowych, a następnie przechodzi do praktycznych ćwiczeń pisemnych skoncentrowanych na kwantyzacji i wdrażaniu. Będziesz robić postępy krok po kroku, poznając skrypty konfiguracyjne i wzorce wdrażania stosowane w nowoczesnym MLOps. Przeznaczony dla programistów, aspirujących inżynierów DevOps i entuzjastów technologii bez wcześniejszego doświadczenia w uczeniu maszynowym, ten tekstowy przewodnik wymaga jedynie podstawowego zrozumienia koncepcji programistycznych. Zacznij czytać już dziś, aby budować swoje umiejętności w zakresie nowoczesnego wdrażania AI i optymalizacji inferencji.

Co otrzymasz

  • 📜 Certyfikat ukończenia
    Dodaj do profilu LinkedIn
  • 💬 Osobisty tutor AI
    Utknąłeś na lekcji? Zapytaj wbudowanego tutora o cokolwiek, w dowolnej chwili.
  • 🎧 Wersja audio w zestawie
    Ucz się w drodze — bez ekranu
  • ♾️ Dożywotni dostęp
    Wracaj, kiedy chcesz — bez wygaśnięcia
  • 📱 Telefon lub komputer
    Działa wszędzie, na każdym urządzeniu
  • 💸 Zwrot w 14 dni
    Bez pytań
  • Krótko i konkretnie
    1 godz 28 min praktycznej treści

Recenzje (1)

Андрій Бондаренко UA Zweryfikowany kursant
★ 4 · 2025-05-17T09:44:23+00:00

Брался за курс, чтобы разобраться с локальным запуском моделей без облака, и в целом цель достигнута. Тема квантизации объяснена понятно: стало ясно, как ужать модель и не угробить качество, чтобы влезть в скромную видеокарту. Развёртывание через vLLM показали по шагам, я поднял свой инференс-сервер и проверил под нагрузкой. Единственное, хотелось бы чуть глубже про мониторинг в продакшене, этот раздел показался коротковатым. Но в остальном материал плотный и применимый сразу. Для тех, кто хочет держать LLM у себя, это отличная отправная точка.

Napisz recenzję

Po wysłaniu poprosimy o zalogowanie — szkic zostanie zapisany.

Inni uczyli się też

Najczęstsze pytania

Czego potrzebuję, by wziąć udział w tym kursie? +

Wystarczy telefon lub komputer z internetem. Bez instalacji i specjalnego sprzętu.

Jak zapłacić? +

Kartą przez Stripe. Nie przechowujemy danych karty — robi to bezpiecznie Stripe.

Czy mogę otrzymać zwrot? +

Tak — pełen zwrot w 14 dni, bez pytań.

Jak długo będę mieć dostęp? +

Na zawsze. Po zakupie kurs jest twój — wracaj, kiedy chcesz.

Czy dostanę certyfikat? +

Tak. Po ukończeniu otrzymasz certyfikat, który możesz dodać do profilu LinkedIn.

Stworzony dla uczących się w
IT Design Finanse Marketing Ochrona zdrowia Edukacja Hotelarstwo Produkcja