Distribuzione di LLM locali: vLLM, Quantizzazione e Inferenza — LearnFlat

Distribuzione di LLM locali: vLLM, Quantizzazione e Inferenza

Impara come distribuire modelli linguistici di grandi dimensioni in modo efficiente, applicare tecniche di quantizzazione per ridurre i requisiti hardware e servire i modelli in ambienti di produzione.

⏱ 1 h 28 min 📚 12 lezioni 🎧 Versione audio

Informazioni sul corso

Eseguire Large Language Models (LLM) localmente o in produzione può sembrare scoraggiante a causa dei massicci requisiti hardware e delle configurazioni complesse. Mentre l'AI continua a evolversi, la capacità di ospitare i propri modelli in modo efficiente sta diventando una competenza essenziale per sviluppatori e team operativi. Questo corso analizza il processo di distribuzione e ottimizzazione degli LLM, trasformandoti da principiante a qualcuno in grado di servire modelli AI ad alte prestazioni in modo efficiente. Esplorerai come ridurre l'ingombro di memoria e massimizzare la velocità di inferenza utilizzando tecniche moderne, assicurandoti di poter eseguire modelli potenti anche con risorse computazionali limitate. Cosa imparerai: • Comprendere i concetti fondamentali dell'architettura LLM, dell'inferenza e della gestione della memoria. • Calcolare i requisiti hardware e stimare le necessità di VRAM della GPU per varie dimensioni di modelli. • Applicare moderni metodi di quantizzazione come GGUF, AWQ e GPTQ per ottimizzare i pesi dei modelli. • Configurare e distribuire modelli utilizzando vLLM per un'inferenza ad alto throughput e bassa latenza. • Creare endpoint REST API standard per integrare perfettamente i modelli locali nelle tue applicazioni. • Praticare la containerizzazione delle tue distribuzioni LLM utilizzando Docker per ambienti coerenti e scalabili. Il viaggio inizia con la terminologia AI essenziale e le basi dell'hardware prima di passare a esercizi scritti pratici focalizzati sulla quantizzazione e sulla distribuzione. Progredirai passo dopo passo attraverso script di configurazione e pattern di distribuzione utilizzati nel moderno MLOps. Progettata per sviluppatori software, aspiranti ingegneri DevOps e appassionati di tecnologia senza precedenti esperienze di machine learning, questa guida testuale richiede solo una comprensione di base dei concetti di programmazione. Inizia a leggere oggi per sviluppare le tue competenze nella moderna distribuzione AI e nell'ottimizzazione dell'inferenza.

Cosa otterrai

  • 📜 Certificato di completamento
    Aggiungilo al tuo profilo LinkedIn
  • 💬 Tutor AI personale
    Bloccato su una lezione? Chiedi al tuo tutor integrato qualsiasi cosa, in qualsiasi momento.
  • 🎧 Versione audio inclusa
    Impara ovunque, senza schermo
  • ♾️ Accesso a vita
    Torna quando vuoi, senza scadenza
  • 📱 Telefono o computer
    Funziona ovunque, su qualsiasi dispositivo
  • 💸 Rimborso entro 14 giorni
    Senza domande
  • Breve e mirato
    1 h 28 min di contenuto pratico

Recensioni (1)

Андрій Бондаренко UA Studente verificato
★ 4 · 2025-05-17T09:44:23+00:00

Брался за курс, чтобы разобраться с локальным запуском моделей без облака, и в целом цель достигнута. Тема квантизации объяснена понятно: стало ясно, как ужать модель и не угробить качество, чтобы влезть в скромную видеокарту. Развёртывание через vLLM показали по шагам, я поднял свой инференс-сервер и проверил под нагрузкой. Единственное, хотелось бы чуть глубже про мониторинг в продакшене, этот раздел показался коротковатым. Но в остальном материал плотный и применимый сразу. Для тех, кто хочет держать LLM у себя, это отличная отправная точка.

Scrivi una recensione

Ti chiederemo di accedere dopo l'invio — la bozza viene salvata.

Altri hanno seguito anche

Domande frequenti

Cosa serve per seguire questo corso? +

Basta un telefono o un computer con internet. Niente installazioni, nessun hardware speciale.

Come si paga? +

Con carta via Stripe. Non conserviamo i dati della carta — Stripe li gestisce in sicurezza.

Posso ottenere un rimborso? +

Sì — rimborso completo entro 14 giorni, senza domande.

Per quanto tempo avrò accesso? +

Per sempre. Una volta acquistato, il corso è tuo e puoi rivederlo quando vuoi.

Riceverò un certificato? +

Sì. Al completamento riceverai un certificato da aggiungere al tuo profilo LinkedIn.

Pensato per chi lavora in
Tech Design Finanza Marketing Sanità Istruzione Ospitalità Produzione