Bereitstellung lokaler LLMs: vLLM, Quantization und Inference — LearnFlat

Bereitstellung lokaler LLMs: vLLM, Quantization und Inference

Lernen Sie, wie Sie Large Language Models effizient bereitstellen, Quantization-Techniken anwenden, um Hardwareanforderungen zu reduzieren, und Modelle in Produktionsumgebungen bereitstellen.

⏱ 1 Std. 28 Min. 📚 12 Lektionen 🎧 Audioversion

Über diesen Kurs

Das Ausführen von Large Language Models (LLMs) lokal oder in der Produktion kann aufgrund massiver Hardwareanforderungen und komplexer Konfigurationen entmutigend wirken. Da sich AI ständig weiterentwickelt, wird die Fähigkeit, eigene Modelle effizient zu hosten, zu einer unverzichtbaren Fähigkeit für Entwickler und Operations-Teams. Dieser Kurs schlüsselt den Prozess der Bereitstellung und Optimierung von LLMs auf und verwandelt Sie von einem Anfänger in jemanden, der in der Lage ist, leistungsstarke AI-Modelle effizient bereitzustellen. Sie werden untersuchen, wie Sie den Speicherbedarf reduzieren und die Inference-Geschwindigkeit mit modernen Techniken maximieren können, um sicherzustellen, dass Sie leistungsstarke Modelle auch mit begrenzten Rechenressourcen ausführen können. Was Sie lernen werden: • Verstehen Sie die grundlegenden Konzepte der LLM-Architektur, Inference und des Speichermanagements. • Berechnen Sie Hardwareanforderungen und schätzen Sie den GPU VRAM-Bedarf für verschiedene Modellgrößen. • Wenden Sie moderne Quantization-Methoden wie GGUF, AWQ und GPTQ an, um Modellgewichte zu optimieren. • Konfigurieren und deployen Sie Modelle mit vLLM für High-Throughput- und Low-Latency-Inference. • Erstellen Sie Standard-REST API-Endpunkte, um lokale Modelle nahtlos in Ihre Anwendungen zu integrieren. • Üben Sie die Containerisierung Ihrer LLM-Deployments mit Docker für konsistente, skalierbare Umgebungen. Die Reise beginnt mit grundlegender AI-Terminologie und Hardware-Basics, bevor sie zu praktischen schriftlichen Übungen übergeht, die sich auf Quantization und Deployment konzentrieren. Sie werden Schritt für Schritt durch Konfigurationsskripte und Deployment-Muster geführt, die in modernem MLOps verwendet werden. Dieser textbasierte Leitfaden wurde für Softwareentwickler, angehende DevOps-Ingenieure und Tech-Enthusiasten ohne vorherige Machine Learning-Erfahrung entwickelt und erfordert lediglich ein grundlegendes Verständnis von Programmierkonzepten. Beginnen Sie noch heute mit dem Lesen, um Ihre Fähigkeiten in modernem AI-Deployment und Inference-Optimierung auszubauen.

Was du erhältst

  • 📜 Abschlusszertifikat
    Füge es deinem LinkedIn-Profil hinzu
  • 💬 Persönlicher AI-Tutor
    Bei einer Lektion nicht weitergekommen? Frag deinen integrierten Tutor jederzeit alles, was du möchtest.
  • 🎧 Audioversion enthalten
    Lerne unterwegs — kein Bildschirm nötig
  • ♾️ Lebenslanger Zugang
    Komme jederzeit zurück, kein Ablauf
  • 📱 Smartphone oder Computer
    Auf jedem Gerät, überall
  • 💸 14 Tage Rückgaberecht
    Ohne Wenn und Aber
  • Kurz und fokussiert
    1 Std. 28 Min. praktische Inhalte

Bewertungen (1)

Андрій Бондаренко UA Verifizierter Lernender
★ 4 · 2025-05-17T09:44:23+00:00

Брался за курс, чтобы разобраться с локальным запуском моделей без облака, и в целом цель достигнута. Тема квантизации объяснена понятно: стало ясно, как ужать модель и не угробить качество, чтобы влезть в скромную видеокарту. Развёртывание через vLLM показали по шагам, я поднял свой инференс-сервер и проверил под нагрузкой. Единственное, хотелось бы чуть глубже про мониторинг в продакшене, этот раздел показался коротковатым. Но в остальном материал плотный и применимый сразу. Для тех, кто хочет держать LLM у себя, это отличная отправная точка.

Bewertung schreiben

Du wirst nach dem Senden zur Anmeldung aufgefordert — dein Entwurf bleibt gespeichert.

Andere belegten auch

Häufige Fragen

Was brauche ich, um diesen Kurs zu belegen? +

Nur Telefon oder Computer mit Internet. Keine Installation, keine spezielle Hardware.

Wie kann ich bezahlen? +

Per Karte über Stripe. Wir speichern keine Kartendaten — Stripe übernimmt das sicher.

Kann ich eine Rückerstattung erhalten? +

Ja — volle Rückerstattung innerhalb von 14 Tagen, ohne Wenn und Aber.

Wie lange habe ich Zugang? +

Für immer. Nach dem Kauf kannst du jederzeit zum Kurs zurückkehren.

Erhalte ich ein Zertifikat? +

Ja. Nach Abschluss erhältst du ein Zertifikat, das du in dein LinkedIn-Profil aufnehmen kannst.

Entwickelt für Lernende in
Tech Design Finanzen Marketing Gesundheit Bildung Gastgewerbe Produktion