Distribuzione di LLM locali: vLLM, Quantizzazione e Inferenza โ€” LearnFlat

Distribuzione di LLM locali: vLLM, Quantizzazione e Inferenza

Impara come distribuire modelli linguistici di grandi dimensioni in modo efficiente, applicare tecniche di quantizzazione per ridurre i requisiti hardware e servire i modelli in ambienti di produzione.

โฑ 1 h 28 min ๐Ÿ“š 12 lezioni ๐ŸŽง Versione audio

Informazioni sul corso

Eseguire Large Language Models (LLM) localmente o in produzione puรฒ sembrare scoraggiante a causa dei massicci requisiti hardware e delle configurazioni complesse. Mentre l'AI continua a evolversi, la capacitร  di ospitare i propri modelli in modo efficiente sta diventando una competenza essenziale per sviluppatori e team operativi. Questo corso analizza il processo di distribuzione e ottimizzazione degli LLM, trasformandoti da principiante a qualcuno in grado di servire modelli AI ad alte prestazioni in modo efficiente. Esplorerai come ridurre l'ingombro di memoria e massimizzare la velocitร  di inferenza utilizzando tecniche moderne, assicurandoti di poter eseguire modelli potenti anche con risorse computazionali limitate. Cosa imparerai: โ€ข Comprendere i concetti fondamentali dell'architettura LLM, dell'inferenza e della gestione della memoria. โ€ข Calcolare i requisiti hardware e stimare le necessitร  di VRAM della GPU per varie dimensioni di modelli. โ€ข Applicare moderni metodi di quantizzazione come GGUF, AWQ e GPTQ per ottimizzare i pesi dei modelli. โ€ข Configurare e distribuire modelli utilizzando vLLM per un'inferenza ad alto throughput e bassa latenza. โ€ข Creare endpoint REST API standard per integrare perfettamente i modelli locali nelle tue applicazioni. โ€ข Praticare la containerizzazione delle tue distribuzioni LLM utilizzando Docker per ambienti coerenti e scalabili. Il viaggio inizia con la terminologia AI essenziale e le basi dell'hardware prima di passare a esercizi scritti pratici focalizzati sulla quantizzazione e sulla distribuzione. Progredirai passo dopo passo attraverso script di configurazione e pattern di distribuzione utilizzati nel moderno MLOps. Progettata per sviluppatori software, aspiranti ingegneri DevOps e appassionati di tecnologia senza precedenti esperienze di machine learning, questa guida testuale richiede solo una comprensione di base dei concetti di programmazione. Inizia a leggere oggi per sviluppare le tue competenze nella moderna distribuzione AI e nell'ottimizzazione dell'inferenza.

Cosa otterrai

  • ๐Ÿ“œ Certificato di completamento
    Aggiungilo al tuo profilo LinkedIn
  • ๐Ÿ’ฌ Tutor AI personale
    Bloccato su una lezione? Chiedi al tuo tutor integrato qualsiasi cosa, in qualsiasi momento.
  • ๐ŸŽง Versione audio inclusa
    Impara ovunque, senza schermo
  • โ™พ๏ธ Accesso a vita
    Torna quando vuoi, senza scadenza
  • ๐Ÿ“ฑ Telefono o computer
    Funziona ovunque, su qualsiasi dispositivo
  • ๐Ÿ’ธ Rimborso entro 14 giorni
    Senza domande
  • โšก Breve e mirato
    1 h 28 min di contenuto pratico

Recensioni

Ancora nessuna recensione โ€” sii il primo a condividere la tua esperienza.

Scrivi una recensione

โ˜†โ˜†โ˜†โ˜†โ˜†
Ti chiederemo di accedere dopo l'invio โ€” la bozza viene salvata.

Altri hanno seguito anche

Domande frequenti

Cosa serve per seguire questo corso? +

Basta un telefono o un computer con internet. Niente installazioni, nessun hardware speciale.

Come si paga? +

Con carta via Stripe. Non conserviamo i dati della carta โ€” Stripe li gestisce in sicurezza.

Posso ottenere un rimborso? +

Sรฌ โ€” rimborso completo entro 14 giorni, senza domande.

Per quanto tempo avrรฒ accesso? +

Per sempre. Una volta acquistato, il corso รจ tuo e puoi rivederlo quando vuoi.

Riceverรฒ un certificato? +

Sรฌ. Al completamento riceverai un certificato da aggiungere al tuo profilo LinkedIn.

Pensato per chi lavora in
Tech Design Finanza Marketing Sanitร  Istruzione Ospitalitร  Produzione