Konuşmayı metne çevirip multimodal LLM'e bağladığım ilk uygulamayı kurmak şaşırtıcı derecede kolaydı, başlangıç için harika.
การสร้างแอป AI แบบ Multimodal: Speech-to-Text และ LLMs
คู่มือสำหรับผู้เริ่มต้นสำหรับนักพัฒนาในการรวมการจดจำเสียง การวิเคราะห์ภาพ และ Multimodal LLMs เข้ากับแอปพลิเคชันสมัยใหม่โดยใช้ APIs มาตรฐานและรูปแบบ AI ในปัจจุบัน
เกี่ยวกับคอร์สนี้
แอปพลิเคชันสมัยใหม่กำลังก้าวข้ามผ่านเพียงแค่ข้อความธรรมดา ด้วยการรวมความสามารถในการประมวลผลเสียง ภาพ และวิดีโอ นักพัฒนาสามารถสร้างประสบการณ์ผู้ใช้ที่มีการโต้ตอบสูงและชาญฉลาด หลักสูตรนี้จะให้ความเข้าใจพื้นฐานเกี่ยวกับ Multimodal Large Language Models (LLMs) และเทคโนโลยี Speech-to-Text คุณจะได้เรียนรู้วิธีการเขียนโค้ดที่โต้ตอบกับโมเดล AI เพื่อถอดความเสียง วิเคราะห์ข้อมูลภาพ และสร้างการตอบสนองที่ชาญฉลาด ซึ่งจะเปลี่ยนแอปพลิเคชันมาตรฐานให้กลายเป็นเครื่องมือที่ขับเคลื่อนด้วย AI อันทรงพลัง
สิ่งที่คุณจะได้เรียนรู้: ทำความเข้าใจแนวคิดหลักของ Multimodal AI และวิธีที่โมเดลประมวลผลข้อมูลประเภทต่างๆ; เขียนโค้ดเพื่อรวม Speech-to-Text APIs สำหรับการถอดความเสียงที่แม่นยำ; ประมวลผลและวิเคราะห์รูปภาพและเฟรมวิดีโอโดยใช้ความสามารถของ LLM สมัยใหม่; ประยุกต์ใช้เทคนิค Prompt Engineering พื้นฐานที่ปรับให้เหมาะกับอินพุตแบบ Multimodal; นำรูปแบบ Retrieval-Augmented Generation (RAG) พื้นฐานมาใช้สำหรับสื่อที่หลากหลาย; สร้างสคริปต์แบบข้อความที่จัดการเวิร์กโฟลว์ AI ที่ซับซ้อนได้อย่างราบรื่น
หลักสูตรเริ่มต้นด้วยคำศัพท์ AI ที่จำเป็นและแนวคิดพื้นฐานก่อนที่จะเข้าสู่การรวม API และการจัดการข้อมูลในทางปฏิบัติ คุณจะก้าวหน้าผ่านบทเรียนที่เป็นลายลักษณ์อักษรที่มีโครงสร้างและส่วนของโค้ดที่สร้างความมั่นใจในการจัดการสื่อประเภทต่างๆ ผ่านการเขียนโปรแกรม หลักสูตรนี้ออกแบบมาสำหรับนักพัฒนามือใหม่และ Fullstack Engineers ที่ต้องการเข้าสู่แวดวง AI โดยไม่จำเป็นต้องมีประสบการณ์ Machine Learning มาก่อน เริ่มอ่านวันนี้เพื่อปลดล็อกศักยภาพของ Multimodal AI ในโปรเจกต์การพัฒนาถัดไปของคุณ
สิ่งที่คุณจะได้รับ
-
📜
ใบประกาศนียบัตร
เพิ่มในโปรไฟล์ LinkedIn ของคุณ -
💬
ติวเตอร์ AI ส่วนตัว
ติดขัดในบทเรียน? ถามติวเตอร์ในตัวของคุณได้ทุกอย่าง ทุกเวลา -
♾️
เข้าถึงตลอดชีพ
กลับมาเรียนได้ตลอด ไม่มีหมดอายุ -
📱
โทรศัพท์หรือคอมพิวเตอร์
ใช้งานได้ทุกที่ ทุกอุปกรณ์ -
💸
คืนเงิน 14 วัน
ไม่ต้องอธิบาย -
⚡
กระชับและตรงประเด็น
1 ชม. 53 นาที เนื้อหาเชิงปฏิบัติ
รีวิว (1)
ผู้เรียนคนอื่นเรียน
🎓 มีใบรับรอง
เครื่องมือ AI เชิงปฏิบัติสำหรับนักการศึกษา
ใบรับรอง
ลงมือทำ
฿899
→
⚡ เหมาะสำหรับผู้เริ่มต้น
พื้นฐาน Generative AI: แนวคิดหลักและการสร้าง Prompt
ใบรับรอง
ลงมือทำ
฿899
→
💼 พร้อมสำหรับงาน
การรัน AI บนเครื่อง: คู่มือ LM Studio และ Ollama
ใบรับรอง
ลงมือทำ
฿899
→
🎓 มีใบรับรอง
สร้างโปรแกรมที่ใช้พลังงานจากปัญญาประดิษฐ์ด้วย OpenAI API
ใบรับรอง
ลงมือทำ
฿899
→
คำถามที่พบบ่อย
ฉันต้องใช้อะไรในการเรียนคอร์สนี้? +
แค่โทรศัพท์หรือคอมพิวเตอร์ที่มีอินเทอร์เน็ต ไม่ต้องติดตั้งหรือใช้อุปกรณ์พิเศษ
ฉันชำระเงินอย่างไร? +
ผ่านบัตรด้วย Stripe เราไม่เก็บข้อมูลบัตร — Stripe จัดการอย่างปลอดภัย
ฉันขอคืนเงินได้ไหม? +
ใช่ — คืนเงินเต็มจำนวนใน 14 วัน ไม่ต้องอธิบาย
ฉันมีสิทธิ์เข้าถึงนานเท่าไร? +
ตลอดไป เมื่อซื้อแล้วคอร์สเป็นของคุณ กลับมาเรียนได้ตลอด
ฉันจะได้ใบประกาศนียบัตรไหม? +
ได้ เมื่อเรียนจบจะได้รับใบประกาศนียบัตรที่เพิ่มในโปรไฟล์ LinkedIn ได้
ออกแบบสำหรับผู้เรียนใน
เทคโนโลยี
ดีไซน์
การเงิน
การตลาด
สาธารณสุข
การศึกษา
ธุรกิจการบริการ
อุตสาหกรรม
×2
เติมครั้งเดียว จ่ายครึ่งเดียว
เพิ่ม ฿3,600 → รับ 200 เครดิต แต่ละคลาสราคา ฿450.00 แทน ฿899 เครดิตไม่มีวันหมดอายุ
฿3,600
200 เครดิต
฿450.00 / คลาส
คุ้มที่สุด
฿9,000
550 เครดิต
฿409.09 / คลาส
฿18,000
1200 เครดิต
฿375.00 / คลาส
ไม่มีการสมัครสมาชิก เครดิตใช้ได้กับทุกคลาสและไม่หมดอายุ