Развертывание локальных LLM: vLLM, квантование и инференс — LearnFlat

Развертывание локальных LLM: vLLM, квантование и инференс

Узнайте, как эффективно развертывать большие языковые модели, применять методы квантования для снижения требований к оборудованию и обслуживать модели в производственных средах.

⏱ 1 ч 28 мин 📚 12 уроков 🎧 Аудиоверсия

О курсе

Запуск больших языковых моделей (LLM) локально или в продакшене может показаться сложной задачей из-за огромных требований к оборудованию и сложных конфигураций. По мере развития AI умение эффективно хостить собственные модели становится важным навыком для разработчиков и операционных команд. Этот курс разбирает процесс развертывания и оптимизации LLM, превращая вас из новичка в специалиста, способного эффективно обслуживать высокопроизводительные модели AI. Вы изучите, как уменьшить объем занимаемой памяти и максимизировать скорость инференса с помощью современных методов, что позволит запускать мощные модели даже при ограниченных вычислительных ресурсах. Чему вы научитесь: • Поймете основополагающие концепции архитектуры LLM, инференса и управления памятью. • Научитесь рассчитывать требования к оборудованию и оценивать потребности в VRAM GPU для моделей различных размеров. • Будете применять современные методы квантования, такие как GGUF, AWQ и GPTQ, для оптимизации весов моделей. • Научитесь настраивать и развертывать модели с использованием vLLM для высокопроизводительного инференса с низкой задержкой. • Сможете создавать стандартные эндпоинты REST API для бесшовной интеграции локальных моделей в ваши приложения. • Попрактикуетесь в контейнеризации развертываний LLM с использованием Docker для создания согласованных и масштабируемых сред. Путешествие начинается с основной терминологии AI и основ аппаратного обеспечения, после чего вы перейдете к практическим письменным упражнениям, посвященным квантованию и развертыванию. Вы будете шаг за шагом изучать скрипты конфигурации и паттерны развертывания, используемые в современном MLOps. Это текстовое руководство, предназначенное для разработчиков программного обеспечения, начинающих DevOps-инженеров и технических энтузиастов без предварительного опыта в машинном обучении, требует лишь базового понимания концепций программирования. Начните чтение сегодня, чтобы развить свои навыки в современном развертывании AI и оптимизации инференса.

Что вы получите

  • 📜 Сертификат об окончании
    Добавьте в профиль LinkedIn
  • 💬 Личный AI-наставник
    Застрял на уроке? Спроси встроенного наставника о чём угодно, в любой момент.
  • 🎧 Аудиоверсия включена
    Учитесь в дороге — экран не нужен
  • ♾️ Пожизненный доступ
    Возвращайтесь в любое время, без срока
  • 📱 Телефон или компьютер
    Работает везде и на любом устройстве
  • 💸 Возврат в течение 14 дней
    Без вопросов
  • Кратко и по делу
    1 ч 28 мин практического материала

Отзывы (1)

Андрій Бондаренко UA Подтверждённый учащийся
★ 4 · 2025-05-17T09:44:23+00:00

Брался за курс, чтобы разобраться с локальным запуском моделей без облака, и в целом цель достигнута. Тема квантизации объяснена понятно: стало ясно, как ужать модель и не угробить качество, чтобы влезть в скромную видеокарту. Развёртывание через vLLM показали по шагам, я поднял свой инференс-сервер и проверил под нагрузкой. Единственное, хотелось бы чуть глубже про мониторинг в продакшене, этот раздел показался коротковатым. Но в остальном материал плотный и применимый сразу. Для тех, кто хочет держать LLM у себя, это отличная отправная точка.

Написать отзыв

После отправки попросим войти — черновик сохранится.

Студенты также прошли

Часто спрашивают

Что нужно для прохождения курса? +

Только смартфон или компьютер с доступом в интернет. Никаких установок и оборудования.

Как оплатить? +

Банковской картой через Stripe. Данные карты обрабатывает Stripe — мы их не храним.

Можно ли вернуть деньги? +

Да — полный возврат в течение 14 дней, без вопросов.

Как долго будут доступны материалы? +

Навсегда. После покупки курс остаётся с вами — возвращайтесь в любое время.

Получу ли я сертификат? +

Да. По окончании выдаётся сертификат, который можно добавить в профиль LinkedIn.

Подходит для специалистов в
IT Дизайн Финансы Маркетинг Медицина Образование HoReCa Производство