วิศวกรรมไปป์ไลน์ข้อมูลแบบแบตช์ด้วย Dataflow และ Dataproc
ออกแบบและสร้างเวิร์กโฟลว์ ETL ที่ปรับขนาดได้โดยใช้เครื่องมือคลาวด์แบบไร้เซิร์ฟเวอร์เพื่อแปลงชุดข้อมูลขนาดใหญ่สำหรับระบบธุรกิจอัจฉริยะที่เชื่อถือได้
เกี่ยวกับคอร์สนี้
การประมวลผลชุดข้อมูลขนาดใหญ่ได้อย่างมีประสิทธิภาพเป็นหัวใจสำคัญของระบบธุรกิจอัจฉริยะและการรายงานที่ทันสมัย หลักสูตรนี้จะสอนวิธีเปลี่ยนจากการใช้สคริปต์ข้อมูลแบบง่ายๆ ไปสู่การออกแบบไปป์ไลน์แบบแบตช์ที่แข็งแกร่งและเป็นอัตโนมัติ ซึ่งสามารถจัดการกับการแปลงข้อมูลขนาดใหญ่ได้อย่างง่ายดาย คุณจะได้รับทักษะที่จำเป็นในการจัดการการเคลื่อนย้ายและการแปลงข้อมูลในขนาดใหญ่โดยใช้เทคโนโลยีคลาวด์มาตรฐานอุตสาหกรรม
สิ่งที่คุณจะได้เรียนรู้:
- ทำความเข้าใจแนวคิดพื้นฐานของวิศวกรรมข้อมูล รวมถึงรูปแบบ ETL/ELT และสถาปัตยกรรมประมวลผลแบบแบตช์
- สร้างงานประมวลผลข้อมูลแบบไร้เซิร์ฟเวอร์โดยใช้ Apache Beam บน Dataflow สำหรับการจัดการข้อมูลแบบรวมศูนย์
- กำหนดค่า Dataproc Serverless เพื่อรันแอปพลิเคชัน Spark โดยไม่จำเป็นต้องจัดการโครงสร้างพื้นฐานที่อยู่เบื้องหลัง
- ประยุกต์ใช้การตรวจสอบคุณภาพข้อมูลและรูปแบบการสังเกตการณ์เพื่อให้มั่นใจถึงความน่าเชื่อถือและความถูกต้องของไปป์ไลน์
- จัดการเวิร์กโฟลว์ที่ซับซ้อนและจัดการการพึ่งพาระหว่างขั้นตอนการประมวลผลข้อมูลต่างๆ
- ใช้การตรวจสอบและแจ้งเตือนที่ทันสมัยเพื่อระบุและแก้ไขข้อผิดพลาดของไปป์ไลน์เชิงรุก
หลักสูตรเริ่มต้นด้วยคำจำกัดความหลักและหลักการทางสถาปัตยกรรม ก่อนที่จะเข้าสู่กลยุทธ์การนำไปใช้งานจริงโดยใช้ตรรกะที่อิงตาม SQL และ Python คุณจะได้อ่านคำอธิบายโดยละเอียดเกี่ยวกับการออกแบบไปป์ไลน์และสำรวจวิธีการจัดโครงสร้างโค้ดเพื่อความสามารถในการบำรุงรักษาและประสิทธิภาพ โปรแกรมนี้ออกแบบมาสำหรับผู้เริ่มต้นในวิศวกรรมข้อมูลที่มีความเข้าใจพื้นฐานเกี่ยวกับ SQL และ Python และพร้อมที่จะนำทักษะเหล่านั้นไปใช้กับการประมวลผลข้อมูลขนาดคลาวด์ เริ่มสร้างไปป์ไลน์ข้อมูลที่พร้อมใช้งานจริงได้แล้ววันนี้
สิ่งที่คุณจะได้รับ
-
📜
ใบประกาศนียบัตร
เพิ่มในโปรไฟล์ LinkedIn ของคุณ -
💬
ติวเตอร์ AI ส่วนตัว
ติดขัดในบทเรียน? ถามติวเตอร์ในตัวของคุณได้ทุกอย่าง ทุกเวลา -
🎧
รวมเวอร์ชันเสียง
เรียนได้ทุกที่ ไม่ต้องดูจอ -
♾️
เข้าถึงตลอดชีพ
กลับมาเรียนได้ตลอด ไม่มีหมดอายุ -
📱
โทรศัพท์หรือคอมพิวเตอร์
ใช้งานได้ทุกที่ ทุกอุปกรณ์ -
💸
คืนเงิน 14 วัน
ไม่ต้องอธิบาย -
⚡
กระชับและตรงประเด็น
57 นาที เนื้อหาเชิงปฏิบัติ
รีวิว
ยังไม่มีรีวิว — เป็นคนแรกที่แชร์ประสบการณ์
ผู้เรียนคนอื่นเรียน
⚡ เหมาะสำหรับผู้เริ่มต้น
Elasticsearch: การจัดทำดัชนี, การสืบค้น และการปรับแต่งข้อมูล
ใบรับรอง
ลงมือทำ
฿899
→
🎓 มีใบรับรอง
Snowflake Data Engineering Foundations
ใบรับรอง
ลงมือทำ
฿899
→
🌟 ที่นิยมในหมู่ผู้เรียน
พื้นฐานของวิศวกรรมข้อมูล: ระบบท่อ, ระบบจัดเก็บ, และกระบวนการทำงาน
ใบรับรอง
ลงมือทำ
฿899
→
🌟 ที่นิยมในหมู่ผู้เรียน
ฐานข้อมูลการจัดเก็บข้อมูล: การออกแบบการแก้ไขข้อมูลสมัยใหม่
ใบรับรอง
ลงมือทำ
฿899
→
คำถามที่พบบ่อย
ฉันต้องใช้อะไรในการเรียนคอร์สนี้? +
แค่โทรศัพท์หรือคอมพิวเตอร์ที่มีอินเทอร์เน็ต ไม่ต้องติดตั้งหรือใช้อุปกรณ์พิเศษ
ฉันชำระเงินอย่างไร? +
ผ่านบัตรด้วย Stripe เราไม่เก็บข้อมูลบัตร — Stripe จัดการอย่างปลอดภัย
ฉันขอคืนเงินได้ไหม? +
ใช่ — คืนเงินเต็มจำนวนใน 14 วัน ไม่ต้องอธิบาย
ฉันมีสิทธิ์เข้าถึงนานเท่าไร? +
ตลอดไป เมื่อซื้อแล้วคอร์สเป็นของคุณ กลับมาเรียนได้ตลอด
ฉันจะได้ใบประกาศนียบัตรไหม? +
ได้ เมื่อเรียนจบจะได้รับใบประกาศนียบัตรที่เพิ่มในโปรไฟล์ LinkedIn ได้
ออกแบบสำหรับผู้เรียนใน
เทคโนโลยี
ดีไซน์
การเงิน
การตลาด
สาธารณสุข
การศึกษา
ธุรกิจการบริการ
อุตสาหกรรม
×2
เติมครั้งเดียว จ่ายครึ่งเดียว
เพิ่ม ฿3,600 → รับ 200 เครดิต แต่ละคลาสราคา ฿450.00 แทน ฿899 เครดิตไม่มีวันหมดอายุ
฿3,600
200 เครดิต
฿450.00 / คลาส
คุ้มที่สุด
฿9,000
550 เครดิต
฿409.09 / คลาส
฿18,000
1200 เครดิต
฿375.00 / คลาส
ไม่มีการสมัครสมาชิก เครดิตใช้ได้กับทุกคลาสและไม่หมดอายุ