Spark และ Databricks: พื้นฐาน ETL สำหรับ Big Data
เรียนรู้วิธีประมวลผลชุดข้อมูลขนาดใหญ่และสร้างไปป์ไลน์ ETL ที่เชื่อถือได้เพื่อเริ่มต้นเส้นทางวิศวกรรมข้อมูลของคุณ
เกี่ยวกับคอร์สนี้
การจัดการและแปลงชุดข้อมูลขนาดใหญ่เป็นข้อกำหนดหลักสำหรับผู้เชี่ยวชาญด้านข้อมูลในปัจจุบัน เนื่องจากองค์กรสร้างข้อมูลมากกว่าที่เคย การทำความเข้าใจวิธีสร้างไปป์ไลน์ที่ปรับขนาดได้โดยใช้ Spark และ Databricks จึงกลายเป็นทักษะที่จำเป็นสำหรับวิศวกรข้อมูลและแมชชีนเลิร์นนิง
หลักสูตรแบบข้อความพื้นฐานนี้จะแนะนำคุณตลอดแนวคิดหลักของการประมวลผลแบบกระจายและกระบวนการประมวลผลข้อมูลที่ทันสมัย คุณจะเปลี่ยนจากการทำความเข้าใจหลักการ Big Data พื้นฐานไปสู่การสร้างไปป์ไลน์ ETL (Extract, Transform, Load) ที่ใช้งานได้จริง ด้วยคำอธิบายที่เป็นลายลักษณ์อักษรโดยละเอียดและตัวอย่างโค้ดที่ใช้งานได้จริง คุณจะได้รับความมั่นใจในการจัดการกับความท้าทายด้านวิศวกรรมข้อมูลในโลกแห่งความเป็นจริง
สิ่งที่คุณจะได้เรียนรู้:
• ทำความเข้าใจแนวคิดพื้นฐานของการประมวลผลข้อมูลแบบกระจายและการประมวลผลแบบคลัสเตอร์
• นำทางในพื้นที่ทำงานของ Databricks เพื่อเขียนและรันสคริปต์การประมวลผลข้อมูลที่แข็งแกร่ง
• ประมวลผลชุดข้อมูลขนาดใหญ่โดยใช้การดำเนินการ Spark DataFrame ที่ทันสมัยและคิวรี SQL
• สร้างไปป์ไลน์ ETL ที่สมบูรณ์เพื่อดึงข้อมูล แปลงข้อมูล และโหลดข้อมูลได้อย่างน่าเชื่อถือ
• ประยุกต์ใช้แนวคิด Data Lakehouse ที่ทันสมัย รวมถึงการแนะนำเบื้องต้นเกี่ยวกับหลักการ Delta Lake
• ฝึกฝนเทคนิคการทำความสะอาดข้อมูล การตรวจสอบความถูกต้อง และการแปลงข้อมูลผ่านแบบฝึกหัดที่เป็นลายลักษณ์อักษรพร้อมคำแนะนำ
หลักสูตรเริ่มต้นด้วยคำศัพท์ Big Data ที่จำเป็นและคำจำกัดความพื้นฐาน ก่อนที่จะเข้าสู่การประยุกต์ใช้การเขียนโค้ดจริง คุณจะก้าวหน้าไปทีละขั้นตอนผ่านสื่อการอ่าน โดยนำความรู้ใหม่ของคุณไปใช้เพื่อสร้างไปป์ไลน์ข้อมูลที่สมบูรณ์ตั้งแต่เริ่มต้น
หลักสูตรนี้ออกแบบมาสำหรับผู้เริ่มต้นโดยเฉพาะ ไม่จำเป็นต้องมีประสบการณ์มาก่อนกับระบบแบบกระจายหรือเครื่องมือ Big Data เริ่มอ่านวันนี้เพื่อสร้างทักษะวิศวกรรมข้อมูลพื้นฐานของคุณและประมวลผล Big Data ด้วยความมั่นใจ
สิ่งที่คุณจะได้รับ
-
📜
ใบประกาศนียบัตร
เพิ่มในโปรไฟล์ LinkedIn ของคุณ -
💬
ติวเตอร์ AI ส่วนตัว
ติดขัดในบทเรียน? ถามติวเตอร์ในตัวของคุณได้ทุกอย่าง ทุกเวลา -
🎧
รวมเวอร์ชันเสียง
เรียนได้ทุกที่ ไม่ต้องดูจอ -
♾️
เข้าถึงตลอดชีพ
กลับมาเรียนได้ตลอด ไม่มีหมดอายุ -
📱
โทรศัพท์หรือคอมพิวเตอร์
ใช้งานได้ทุกที่ ทุกอุปกรณ์ -
💸
คืนเงิน 14 วัน
ไม่ต้องอธิบาย -
⚡
กระชับและตรงประเด็น
1 ชม. 10 นาที เนื้อหาเชิงปฏิบัติ
รีวิว
ยังไม่มีรีวิว — เป็นคนแรกที่แชร์ประสบการณ์
ผู้เรียนคนอื่นเรียน
⚡ เหมาะสำหรับผู้เริ่มต้น
Elasticsearch: การจัดทำดัชนี, การสืบค้น และการปรับแต่งข้อมูล
ใบรับรอง
ลงมือทำ
$9.99
→
🎓 มีใบรับรอง
Snowflake Data Engineering Foundations
ใบรับรอง
ลงมือทำ
$9.99
→
🌟 ที่นิยมในหมู่ผู้เรียน
พื้นฐานของวิศวกรรมข้อมูล: ระบบท่อ, ระบบจัดเก็บ, และกระบวนการทำงาน
ใบรับรอง
ลงมือทำ
$9.99
→
🌟 ที่นิยมในหมู่ผู้เรียน
ฐานข้อมูลการจัดเก็บข้อมูล: การออกแบบการแก้ไขข้อมูลสมัยใหม่
ใบรับรอง
ลงมือทำ
$9.99
→
คำถามที่พบบ่อย
ฉันต้องใช้อะไรในการเรียนคอร์สนี้? +
แค่โทรศัพท์หรือคอมพิวเตอร์ที่มีอินเทอร์เน็ต ไม่ต้องติดตั้งหรือใช้อุปกรณ์พิเศษ
ฉันชำระเงินอย่างไร? +
ผ่านบัตรด้วย Stripe เราไม่เก็บข้อมูลบัตร — Stripe จัดการอย่างปลอดภัย
ฉันขอคืนเงินได้ไหม? +
ใช่ — คืนเงินเต็มจำนวนใน 14 วัน ไม่ต้องอธิบาย
ฉันมีสิทธิ์เข้าถึงนานเท่าไร? +
ตลอดไป เมื่อซื้อแล้วคอร์สเป็นของคุณ กลับมาเรียนได้ตลอด
ฉันจะได้ใบประกาศนียบัตรไหม? +
ได้ เมื่อเรียนจบจะได้รับใบประกาศนียบัตรที่เพิ่มในโปรไฟล์ LinkedIn ได้
ออกแบบสำหรับผู้เรียนใน
เทคโนโลยี
ดีไซน์
การเงิน
การตลาด
สาธารณสุข
การศึกษา
ธุรกิจการบริการ
อุตสาหกรรม
×2
เติมครั้งเดียว จ่ายครึ่งเดียว
เพิ่ม $100 → รับ 200 เครดิต แต่ละคลาสราคา $5.00 แทน $9.99 เครดิตไม่มีวันหมดอายุ
$100
200 เครดิต
$5.00 / คลาส
คุ้มที่สุด
$250
550 เครดิต
$4.55 / คลาส
$500
1200 เครดิต
$4.17 / คลาส
ไม่มีการสมัครสมาชิก เครดิตใช้ได้กับทุกคลาสและไม่หมดอายุ