Machine Learning with PySpark: Distributed Data Science at Scale
Learn to build, evaluate, and deploy machine learning models on massive datasets using PySpark and distributed computing workflows.
حول هذه الدورة
As datasets grow too large for a single machine, traditional data science tools reach their limits. Mastering distributed machine learning allows you to train models on massive datasets efficiently. This text-based course guides you from foundational big data concepts to building and deploying scalable machine learning pipelines. You will learn how to process large-scale data and run machine learning algorithms across clusters using PySpark.
What you'll learn:
- Understand the core concepts of distributed computing, Spark architecture, and PySpark DataFrames.
- Prepare and clean large-scale datasets using PySpark's feature engineering tools.
- Build and train supervised machine learning models for classification and regression.
- Implement unsupervised learning techniques, including clustering and recommendation algorithms.
- Construct end-to-end machine learning pipelines to automate data prep and model training.
- Integrate modern MLflow workflows to track experiments and manage model versions within your Spark pipeline.
You will start with key terminology, basic concepts of distributed architectures, and foundational definitions before moving into practical code walkthroughs. The material progresses logically from data ingestion and cleaning to model evaluation and lifecycle management. Designed for beginner data scientists, analysts, and developers who want to transition to big data, this course requires no prior experience with distributed systems.
Start reading today to unlock the power of distributed machine learning with PySpark.
ما الذي ستحصل عليه
-
📜
شهادة إتمام
أضفها إلى ملفك على LinkedIn -
💬
مدرّس AI شخصي
عالق في درس؟ اسأل مدرّسك المدمج أي شيء، في أي وقت. -
♾️
وصول مدى الحياة
عُد متى شئت، بلا انتهاء -
📱
الهاتف أو الكمبيوتر
يعمل في أي مكان وعلى أي جهاز -
💸
استرداد خلال 14 يومًا
دون أسئلة -
⚡
قصير ومركَّز
1 ساعة 50 دقيقة من المحتوى التطبيقي
المراجعات
لا توجد مراجعات بعد — كن أول من يشارك تجربته.
المتعلمون أخذوا أيضًا
💼 جاهز لسوق العمل
مقدمة في علم البيانات باستخدام MATLAB و AWS
شهادة
تطبيق عملي
SR 90.00
→
🌟 اختيار الطلاب
إزالة الغموض عن علوم البيانات: مقدمة غير تقنية
شهادة
تطبيق عملي
SR 90.00
→
🏆 الأكثر شعبية
استراتيجية التعلم الآلي لقادة الأعمال
شهادة
تطبيق عملي
SR 90.00
→
⚡ الأفضل للبداية
حسابات لعلوم البيانات: أسس التعلم الآلي
شهادة
تطبيق عملي
SR 90.00
→
الأسئلة الشائعة
ما الذي أحتاجه لأخذ هذه الدورة؟ +
يكفي هاتف أو كمبيوتر متصل بالإنترنت. بدون تثبيتات أو أجهزة خاصة.
كيف يمكنني الدفع؟ +
بالبطاقة عبر Stripe. لا نخزن بيانات البطاقة — يتولى Stripe ذلك بأمان.
هل يمكنني استرداد المال؟ +
نعم — استرداد كامل خلال 14 يومًا، دون أسئلة.
إلى متى يستمر وصولي؟ +
إلى الأبد. بمجرد الشراء، الدورة لك تعود إليها متى شئت.
هل سأحصل على شهادة؟ +
نعم. عند الإتمام ستحصل على شهادة يمكنك إضافتها إلى ملفك في LinkedIn.
مصمَّم للعاملين في
التقنية
التصميم
المالية
التسويق
الرعاية الصحية
التعليم
الضيافة
التصنيع
×2
اشحن مرة واحدة وادفع النصف
أضف SR 380 → احصل على 200 أرصدة. كل فئة تكلف SR 47.50 بدلاً من SR 90.00. الأرصدة لا تنتهي أبداً.
SR 380
200 رصيد
SR 47.50 / درس
أفضل قيمة
SR 950
550 رصيد
SR 43.18 / درس
SR 1,900
1200 رصيد
SR 39.58 / درس
بدون اشتراك. الرصيد يصلح لأي درس ولا ينتهي.