Catalogo · Intelligenza Artificiale · AI Generativa

Distribuzione di LLM locali: vLLM, Quantizzazione e Inferenza

Name: Distribuzione di LLM locali: vLLM, Quantizzazione e Inferenza
Price: 45 RON
Availability: InStock

Impara come distribuire modelli linguistici di grandi dimensioni in modo efficiente, applicare tecniche di quantizzazione per ridurre i requisiti hardware e servire i modelli in ambienti di produzione.

⏱ 1 h 28 min 📚 12 lezioni 🎧 Versione audio

Informazioni sul corso

Eseguire Large Language Models (LLM) localmente o in produzione può sembrare scoraggiante a causa dei massicci requisiti hardware e delle configurazioni complesse. Mentre l'AI continua a evolversi, la capacità di ospitare i propri modelli in modo efficiente sta diventando una competenza essenziale per sviluppatori e team operativi. 

Questo corso analizza il processo di distribuzione e ottimizzazione degli LLM, trasformandoti da principiante a qualcuno in grado di servire modelli AI ad alte prestazioni in modo efficiente. Esplorerai come ridurre l'ingombro di memoria e massimizzare la velocità di inferenza utilizzando tecniche moderne, assicurandoti di poter eseguire modelli potenti anche con risorse computazionali limitate. 

Cosa imparerai:
• Comprendere i concetti fondamentali dell'architettura LLM, dell'inferenza e della gestione della memoria.
• Calcolare i requisiti hardware e stimare le necessità di VRAM della GPU per varie dimensioni di modelli.
• Applicare moderni metodi di quantizzazione come GGUF, AWQ e GPTQ per ottimizzare i pesi dei modelli.
• Configurare e distribuire modelli utilizzando vLLM per un'inferenza ad alto throughput e bassa latenza.
• Creare endpoint REST API standard per integrare perfettamente i modelli locali nelle tue applicazioni.
• Praticare la containerizzazione delle tue distribuzioni LLM utilizzando Docker per ambienti coerenti e scalabili.

Il viaggio inizia con la terminologia AI essenziale e le basi dell'hardware prima di passare a esercizi scritti pratici focalizzati sulla quantizzazione e sulla distribuzione. Progredirai passo dopo passo attraverso script di configurazione e pattern di distribuzione utilizzati nel moderno MLOps. 

Progettata per sviluppatori software, aspiranti ingegneri DevOps e appassionati di tecnologia senza precedenti esperienze di machine learning, questa guida testuale richiede solo una comprensione di base dei concetti di programmazione. 

Inizia a leggere oggi per sviluppare le tue competenze nella moderna distribuzione AI e nell'ottimizzazione dell'inferenza.

Cosa otterrai

📜 Certificato di completamento
Aggiungilo al tuo profilo LinkedIn
💬 Tutor AI personale
Bloccato su una lezione? Chiedi al tuo tutor integrato qualsiasi cosa, in qualsiasi momento.
🎧 Versione audio inclusa
Impara ovunque, senza schermo
♾️ Accesso a vita
Torna quando vuoi, senza scadenza
📱 Telefono o computer
Funziona ovunque, su qualsiasi dispositivo
💸 Rimborso entro 14 giorni
Senza domande
⚡ Breve e mirato
1 h 28 min di contenuto pratico

Recensioni

Ancora nessuna recensione — sii il primo a condividere la tua esperienza.

Altri hanno seguito anche

🔥 Richiesto

Domande frequenti

Cosa serve per seguire questo corso? +

Basta un telefono o un computer con internet. Niente installazioni, nessun hardware speciale.

Come si paga? +

Con carta via Stripe. Non conserviamo i dati della carta — Stripe li gestisce in sicurezza.

Posso ottenere un rimborso? +

Sì — rimborso completo entro 14 giorni, senza domande.

Per quanto tempo avrò accesso? +

Per sempre. Una volta acquistato, il corso è tuo e puoi rivederlo quando vuoi.

Riceverò un certificato? +

Sì. Al completamento riceverai un certificato da aggiungere al tuo profilo LinkedIn.

Pensato per chi lavora in

Tech Design Finanza Marketing Sanità Istruzione Ospitalità Produzione

Distribuzione di LLM locali: vLLM, Quantizzazione e Inferenza

Informazioni sul corso

Cosa otterrai

Recensioni

Scrivi una recensione

Altri hanno seguito anche

IA generativa per lo sviluppo di app mobili

Pratici strumenti di IA per gli educatori

Fondamenti dell'IA generativa: concetti fondamentali e prompting

Sviluppare applicazioni LLM personalizzate con RAG e agenti

Domande frequenti