Kaldi Speech Recognition สำหรับผู้เริ่มต้น: จากทฤษฎีสู่โมเดลที่ใช้งานได้จริง
เข้าใจพื้นฐานของการรู้จำเสียงพูดและสร้างโมเดลอะคูสติกและภาษาแรกของคุณโดยใช้ Kaldi พร้อมคำอธิบายที่ชัดเจน ปราศจากสูตรคณิตศาสตร์
เกี่ยวกับคอร์สนี้
การรู้จำเสียงพูดเป็นหัวใจสำคัญของปัญญาประดิษฐ์ยุคใหม่ แต่การเจาะลึกชุดเครื่องมือ Kaldi ซึ่งเป็นมาตรฐานอุตสาหกรรม อาจรู้สึกท่วมท้นเนื่องจากคณิตศาสตร์ที่ซับซ้อนและเอกสารที่หนาแน่น หลักสูตรนี้จะช่วยไขความกระจ่างของเทคโนโลยีเสียงพูด โดยนำทางคุณผ่านแนวคิดหลักและขั้นตอนการทำงานจริงของ Kaldi โดยใช้คำอธิบายที่เป็นข้อความที่ชัดเจนและเป็นขั้นตอน คุณจะเปลี่ยนจากผู้เริ่มต้นโดยสมบูรณ์ไปสู่ผู้ปฏิบัติงานที่มีความมั่นใจ สามารถเตรียมข้อมูลเสียง แยกคุณสมบัติ ฝึกอบรมโมเดลอะคูสติกและภาษา และเรียกใช้ตัวถอดรหัสเสียงเป็นข้อความ
สิ่งที่คุณจะได้เรียนรู้:
- ทำความเข้าใจแนวคิดพื้นฐานของเสียงดิจิทัล สัทศาสตร์ และการแสดงสัญญาณเสียงพูด
- แยกคุณสมบัติอะคูสติกมาตรฐาน เช่น MFCCs และ filterbanks โดยใช้เครื่องมือบรรทัดคำสั่งของ Kaldi
- สร้างและคอมไพล์โมเดลภาษาและพจนานุกรมการออกเสียงเพื่อนำทางกระบวนการถอดรหัส
- ฝึกอบรมโมเดลอะคูสติก GMM-HMM และทำความเข้าใจว่าพวกมันเปลี่ยนไปสู่สถาปัตยกรรมไฮบริดการเรียนรู้เชิงลึกที่ทันสมัยได้อย่างไร
- ถอดรหัสไฟล์เสียงเป็นข้อความและประเมินความแม่นยำในการรู้จำโดยใช้เมตริก Word Error Rate (WER)
- กำหนดค่าไปป์ไลน์การรู้จำเสียงพูดแบบ end-to-end และแก้ไขปัญหาการจัดตำแหน่งและข้อมูลทั่วไป
หลักสูตรนี้เริ่มต้นด้วยคำศัพท์ที่จำเป็นและฟิสิกส์ของเสียงพูด ก่อนที่จะนำคุณไปสู่การเตรียมข้อมูล การแยกคุณสมบัติ การฝึกอบรมโมเดล และการถอดรหัส คุณจะได้อ่านคำอธิบายโดยละเอียดของคำสั่งและสคริปต์ Kaldi โดยเรียนรู้ว่าข้อมูลไหลผ่านไปป์ไลน์การรู้จำเสียงพูดได้อย่างไร หลักสูตรนี้ออกแบบมาสำหรับวิศวกร AI ที่ต้องการ นักพัฒนาซอฟต์แวร์ และผู้ที่ชื่นชอบเทคโนโลยีที่ต้องการเรียนรู้การรู้จำเสียงพูดตั้งแต่เริ่มต้น ไม่จำเป็นต้องมีประสบการณ์ด้านการประมวลผลเสียงหรือคณิตศาสตร์ขั้นสูงมาก่อน เริ่มอ่านวันนี้เพื่อปลดล็อกพลังของการรู้จำเสียงพูดแบบโอเพนซอร์สด้วย Kaldi
สิ่งที่คุณจะได้รับ
-
📜
ใบประกาศนียบัตร
เพิ่มในโปรไฟล์ LinkedIn ของคุณ -
💬
ติวเตอร์ AI ส่วนตัว
ติดขัดในบทเรียน? ถามติวเตอร์ในตัวของคุณได้ทุกอย่าง ทุกเวลา -
🎧
รวมเวอร์ชันเสียง
เรียนได้ทุกที่ ไม่ต้องดูจอ -
♾️
เข้าถึงตลอดชีพ
กลับมาเรียนได้ตลอด ไม่มีหมดอายุ -
📱
โทรศัพท์หรือคอมพิวเตอร์
ใช้งานได้ทุกที่ ทุกอุปกรณ์ -
💸
คืนเงิน 14 วัน
ไม่ต้องอธิบาย -
⚡
กระชับและตรงประเด็น
1 ชม. 52 นาที เนื้อหาเชิงปฏิบัติ
รีวิว
ยังไม่มีรีวิว — เป็นคนแรกที่แชร์ประสบการณ์
ผู้เรียนคนอื่นเรียน
💼 พร้อมสำหรับงาน
สร้าง Transformers ตั้งแต่เริ่มต้นด้วย PyTorch
ใบรับรอง
ลงมือทำ
$9.99
→
🎓 มีใบรับรอง
แบบจำลองลำดับสำหรับ NLP: สร้าง RNN, LSTM และ GRUs
ใบรับรอง
ลงมือทำ
$9.99
→
⚡ เหมาะสำหรับผู้เริ่มต้น
การเรียนรู้ลึกสำหรับ NLP: การฝังคำและจัดหมวดหมู่ข้อความในภาษาไพธอน
ใบรับรอง
ลงมือทำ
$9.99
→
🏆 ยอดนิยมมากที่สุด
ประมวลผลภาษาธรรมชาติด้วยภาษาไพธอน: จากเวกเตอร์ข้อความไปสู่เอเจนท์ AI
ใบรับรอง
ลงมือทำ
$9.99
→
คำถามที่พบบ่อย
ฉันต้องใช้อะไรในการเรียนคอร์สนี้? +
แค่โทรศัพท์หรือคอมพิวเตอร์ที่มีอินเทอร์เน็ต ไม่ต้องติดตั้งหรือใช้อุปกรณ์พิเศษ
ฉันชำระเงินอย่างไร? +
ผ่านบัตรด้วย Stripe เราไม่เก็บข้อมูลบัตร — Stripe จัดการอย่างปลอดภัย
ฉันขอคืนเงินได้ไหม? +
ใช่ — คืนเงินเต็มจำนวนใน 14 วัน ไม่ต้องอธิบาย
ฉันมีสิทธิ์เข้าถึงนานเท่าไร? +
ตลอดไป เมื่อซื้อแล้วคอร์สเป็นของคุณ กลับมาเรียนได้ตลอด
ฉันจะได้ใบประกาศนียบัตรไหม? +
ได้ เมื่อเรียนจบจะได้รับใบประกาศนียบัตรที่เพิ่มในโปรไฟล์ LinkedIn ได้
ออกแบบสำหรับผู้เรียนใน
เทคโนโลยี
ดีไซน์
การเงิน
การตลาด
สาธารณสุข
การศึกษา
ธุรกิจการบริการ
อุตสาหกรรม
×2
เติมครั้งเดียว จ่ายครึ่งเดียว
เพิ่ม $100 → รับ 200 เครดิต แต่ละคลาสราคา $5.00 แทน $9.99 เครดิตไม่มีวันหมดอายุ
$100
200 เครดิต
$5.00 / คลาส
คุ้มที่สุด
$250
550 เครดิต
$4.55 / คลาส
$500
1200 เครดิต
$4.17 / คลาส
ไม่มีการสมัครสมาชิก เครดิตใช้ได้กับทุกคลาสและไม่หมดอายุ