LLM Alignment: Reinforcement Learning from Human Feedback (RLHF)
RLHF এবং রিওয়ার্ড মডেলিং ব্যবহার করে বৃহৎ ভাষা মডেলগুলির অ্যালাইনমেন্টের মূল বিষয়গুলি আয়ত্ত করুন যাতে আরও নিরাপদ, আরও সহায়ক AI অ্যাপ্লিকেশন তৈরি করা যায়।
এই কোর্স সম্পর্কে
আপনি কী পাবেন
-
📜
সমাপ্তির সনদ
আপনার LinkedIn প্রোফাইলে যোগ করুন -
💬
ব্যক্তিগত AI টিউটর
কোনো পাঠে আটকে গেছ? যেকোনো সময় তোমার বিল্ট-ইন টিউটরকে যেকোনো কিছু জিজ্ঞেস করো। -
🎧
অডিও সংস্করণ অন্তর্ভুক্ত
যেতে যেতে শিখুন — পর্দা লাগবে না -
♾️
আজীবন অ্যাক্সেস
যখন খুশি ফিরে আসুন — মেয়াদ নেই -
📱
ফোন বা কম্পিউটার
যেকোনো জায়গা, যেকোনো ডিভাইস -
💸
৩০-দিনের ফেরত
কোনো প্রশ্ন নয় -
⚡
সংক্ষিপ্ত ও কেন্দ্রীভূত
50 মিনিট ব্যবহারিক বিষয়বস্তু
পর্যালোচনা
এখনো কোনো পর্যালোচনা নেই — প্রথম হয়ে আপনার অভিজ্ঞতা ভাগ করুন।
শিক্ষার্থীরা এটিও নিয়েছেন
পাইথনের গভীর প্রশিক্ষণ: আধুনিক পরিচয়
রিইনফোর্সমেন্ট লার্নিং: কিউ-লার্নিং থেকে ডিপ পলিসি গ্রেডিয়েন্টস পর্যন্ত
রিইনফোর্সমেন্ট লার্নিংয়ের পরিচিতি: ভিত্তি এবং অ্যালগরিদম
Python Maze Pathfinding with Enemies and Rewards
সাধারণ প্রশ্ন
এই কোর্সের জন্য কী প্রয়োজন? +
শুধু ইন্টারনেট সংযুক্ত একটি ফোন বা কম্পিউটার। কোনো ইনস্টল বা বিশেষ হার্ডওয়্যার লাগে না।
কীভাবে পরিশোধ করব? +
Stripe-এর মাধ্যমে কার্ডে। আমরা কার্ডের তথ্য সংরক্ষণ করি না — Stripe নিরাপদে পরিচালনা করে।
আমি কি ফেরত পেতে পারি? +
হ্যাঁ — ৩০ দিনের মধ্যে সম্পূর্ণ ফেরত, কোনো প্রশ্ন নয়।
কতদিন অ্যাক্সেস থাকবে? +
চিরকালের জন্য। একবার কেনার পর কোর্স আপনার — যখন খুশি ফিরে আসুন।
আমি কি সনদ পাব? +
হ্যাঁ। সম্পন্ন করার পর আপনি একটি সনদ পাবেন, যা LinkedIn প্রোফাইলে যোগ করতে পারবেন।
একবার টপ-আপ করুন, অর্ধেক দিন
৳12,000 যোগ করুন → 200 ক্রেডিট পান। প্রতিটি ক্লাস ৳1,200.00 এর পরিবর্তে ৳600.00 খরচ করে। ক্রেডিট কখনও মেয়াদ শেষ হয় না।
কোনো সাবস্ক্রিপশন নেই। ক্রেডিট যেকোনো ক্লাসে চলে এবং কখনো শেষ হয় না।