카탈로그 · 딥러닝 · 강화 학습

LLM 후속 훈련: 미세 조정 및 강화 학습 기초

Name: LLM 후속 훈련: 미세 조정 및 강화 학습 기초
Price: 52000 MMK
Availability: InStock

지도 미세 조정 및 강화 학습 기술을 사용하여 LLM 후속 훈련의 필수 요소를 마스터하여 모델을 정렬하고, 전문화하며, 안전성을 향상시키세요.

⏱ 1시간 20분 📚 8개 레슨

이 과정 소개

사전 훈련된 대규모 언어 모델은 강력하지만, 특정 작업에 맞게 조정하고 인간의 선호도에 맞춰 정렬하려면 후속 훈련이 필요합니다. 이러한 모델을 안내하는 방법을 이해하는 것은 안전하고 신뢰할 수 있으며 전문화된 AI 애플리케이션을 구축하는 데 필수적입니다. 이 텍스트 기반 과정에서는 LLM 후속 훈련의 기본 개념과 실제 워크플로우를 배우고, 원시 모델에서 유용하고 정렬된 AI 비서로 나아가는 방법을 익힐 것입니다.

무엇을 배울 것인가:
- 사전 훈련, 지도 미세 조정(SFT), 강화 학습 간의 주요 차이점을 이해합니다.
- LoRA와 같은 매개변수 효율적 미세 조정(PEFT) 방법을 적용하여 최소한의 컴퓨팅 리소스로 모델을 조정합니다.
- 인간 피드백 기반 강화 학습(RLHF)과 Direct Preference Optimization (DPO)과 같은 최신 정렬 대안을 탐구합니다.
- 모델 동작 및 안전성을 평가하여 출력이 유용하고, 정직하며, 무해한지 확인합니다.
- 코드 스니펫과 서면 설명서를 분석하여 사용자 지정 미세 조정 작업을 위한 데이터셋을 준비합니다.

이 과정은 후속 훈련 패러다임의 기본 정의로 시작하여 데이터 준비, 미세 조정 구성 및 정렬 전략을 안내합니다. 이론적 개념에서 실제 구현 코드를 읽고 분석하는 단계로 나아갈 것입니다.

이 과정은 LLM이 어떻게 맞춤화되는지 이해하고자 하는 소프트웨어 개발자, 데이터 애호가 및 AI 초보자를 위해 설계되었습니다. 고급 머신러닝에 대한 사전 경험은 필요하지 않지만, 기본적인 Python 지식은 도움이 됩니다.

오늘부터 읽기를 시작하여 사용자 지정 모델 정렬 및 후속 훈련의 힘을 잠금 해제하세요.

받게 되는 것

📜 수료증
LinkedIn 프로필에 추가
💬 개인 AI 튜터
수업에서 막혔나요? 내장 튜터에게 언제든지 무엇이든 물어보세요.
♾️ 평생 이용
언제든 다시 보세요, 만료 없음
📱 휴대폰 또는 컴퓨터
어디서든 모든 기기에서
💸 14일 환불
이유 묻지 않음
⚡ 짧고 핵심적
1시간 20분의 실용 학습

리뷰

아직 리뷰가 없습니다 — 첫 경험을 공유해 보세요.

다른 학습자도 수강

⚡ 시작하기 가장 좋은

자주 묻는 질문

이 과정을 듣는 데 무엇이 필요한가요? +

인터넷이 되는 휴대폰이나 컴퓨터만 있으면 됩니다. 설치나 특별한 장비는 필요 없습니다.

결제는 어떻게 하나요? +

Stripe를 통한 카드로. 카드 정보는 저장하지 않으며 Stripe가 안전하게 처리합니다.

환불받을 수 있나요? +

네 — 14일 이내 전액 환불, 이유를 묻지 않습니다.

얼마나 오래 이용할 수 있나요? +

평생. 구매하면 과정은 당신의 것이며 언제든 다시 볼 수 있습니다.

수료증을 받을 수 있나요? +

네. 수료 시 LinkedIn 프로필에 추가할 수 있는 수료증을 받습니다.

이런 분야 학습자에게

테크 디자인 금융 마케팅 의료 교육 호스피탈리티 제조업

LLM 후속 훈련: 미세 조정 및 강화 학습 기초

이 과정 소개

받게 되는 것

리뷰

리뷰 쓰기

다른 학습자도 수강

Python의 딥 리프레시 러닝: 현대적인 소개

강화 학습: Q-Learning부터 Deep Policy Gradients까지

프로그래머를 위한 강화 학습: 나만의 AI 에이전트 코딩하기

강화 학습: 실용적인 AI 에이전트를 처음부터 구축하기

자주 묻는 질문