พื้นฐานการประเมิน AI Agent ด้วย LangSmith — LearnFlat

พื้นฐานการประเมิน AI Agent ด้วย LangSmith

เรียนรู้แนวคิดพื้นฐานของการทดสอบ การติดตาม (tracing) และการวัดผลเปรียบเทียบ (benchmarking) AI Agent โดยใช้ LangSmith เพื่อสร้างแอปพลิเคชันที่เชื่อถือได้และคาดการณ์ผลลัพธ์ได้

⏱ 1 ชม. 26 นาที 📚 7 บทเรียน 🎧 เวอร์ชันเสียง

เกี่ยวกับคอร์สนี้

เมื่อ AI Agent มีความซับซ้อนมากขึ้น การทำให้มั่นใจว่าพวกมันทำงานได้อย่างน่าเชื่อถือในสถานการณ์จริงจึงเป็นเรื่องสำคัญอย่างยิ่ง หากไม่มีการทดสอบและการทำ tracing ที่เหมาะสม การทำความเข้าใจว่าทำไม Agent ถึงทำงานล้มเหลวหรือเกิดอาการหลอน (hallucinated) อาจให้ความรู้สึกเหมือนการเดา คอร์สนี้เป็นคู่มือการเรียนรู้ในรูปแบบการอ่านที่มีโครงสร้างชัดเจนสำหรับการประเมิน AI Agent โดยใช้ LangSmith คุณจะเริ่มต้นด้วยแนวคิดพื้นฐานของ agentic AI และพฤติกรรมของ LLM ก่อนจะเข้าสู่เทคนิคเชิงปฏิบัติสำหรับการทำ tracing เส้นทางการทำงาน การสร้างชุดข้อมูล และการทำ benchmarking ประสิทธิภาพ เมื่อสิ้นสุดการเรียนรู้นี้ คุณจะรู้วิธีวัดความแม่นยำและความน่าเชื่อถือ ซึ่งจะช่วยให้คุณมีความมั่นใจในการนำแอปพลิเคชัน Agent จากขั้นต้นแบบไปสู่การใช้งานจริง (production) สิ่งที่คุณจะได้เรียนรู้: • ทำความเข้าใจคำศัพท์หลักของ AI Agent และเหตุใดการทดสอบซอฟต์แวร์แบบดั้งเดิมจึงไม่เพียงพอ • ทำ tracing เส้นทางการทำงานของ Agent เพื่อดีบั๊ก prompt ที่ซับซ้อนและการเรียกใช้เครื่องมือ (tool calls) • สร้างและจัดการชุดข้อมูลการประเมินเพื่อทำ benchmarking ประสิทธิภาพของ Agent เมื่อเวลาผ่านไป • ประยุกต์ใช้รูปแบบการประเมินสมัยใหม่ รวมถึงเทคนิค LLM-as-a-judge • วัดคุณภาพของ Retrieval-Augmented Generation (RAG) และขั้นตอนการใช้เหตุผลของ Agent • กำหนดค่าโปรเจกต์ LangSmith เพื่อตรวจสอบเวิร์กโฟลว์ของ Agent ที่พร้อมใช้งานจริง เนื้อหาในหลักสูตรนี้เรียงลำดับอย่างเป็นเหตุเป็นผล ตั้งแต่คำจำกัดความพื้นฐานของ AI Agent ไปจนถึงเวิร์กโฟลว์การประเมินเชิงปฏิบัติ โดยใช้คำอธิบายที่ชัดเจนและตัวอย่างโค้ดที่นำไปใช้ได้จริง คุณจะได้อ่านสถานการณ์จำลองแบบทีละขั้นตอนที่แสดงให้เห็นถึงวิธีตรวจจับข้อผิดพลาดและปรับปรุงความน่าเชื่อถือของ Agent คอร์สนี้ออกแบบมาสำหรับผู้เริ่มต้นและนักพัฒนาที่ยังใหม่กับการประเมิน AI โดยไม่จำเป็นต้องมีประสบการณ์กับ LangSmith หรือ machine learning ขั้นสูงมาก่อน เริ่มอ่านวันนี้เพื่อฝึกฝนทักษะที่จำเป็นสำหรับการทดสอบและทำ benchmarking สำหรับ AI Agent สมัยใหม่

สิ่งที่คุณจะได้รับ

  • 📜 ใบประกาศนียบัตร
    เพิ่มในโปรไฟล์ LinkedIn ของคุณ
  • 💬 ติวเตอร์ AI ส่วนตัว
    ติดขัดในบทเรียน? ถามติวเตอร์ในตัวของคุณได้ทุกอย่าง ทุกเวลา
  • 🎧 รวมเวอร์ชันเสียง
    เรียนได้ทุกที่ ไม่ต้องดูจอ
  • ♾️ เข้าถึงตลอดชีพ
    กลับมาเรียนได้ตลอด ไม่มีหมดอายุ
  • 📱 โทรศัพท์หรือคอมพิวเตอร์
    ใช้งานได้ทุกที่ ทุกอุปกรณ์
  • 💸 คืนเงิน 14 วัน
    ไม่ต้องอธิบาย
  • กระชับและตรงประเด็น
    1 ชม. 26 นาที เนื้อหาเชิงปฏิบัติ

รีวิว (2)

เมยาวี ดวงดี TH ผู้เรียนที่ยืนยันแล้ว
★ 4 · 2025-12-12T05:38:40+00:00

ส่วนที่สอนทำ trace กับ benchmark เอเจนต์ด้วย LangSmith ช่วยให้ผมเข้าใจว่าทำไมแอปถึงตอบไม่นิ่งสักที อยากให้เจาะลึกเรื่องการสร้างชุดทดสอบมากกว่านี้อีกนิด แต่โดยรวมเป็นพื้นฐานที่ดีมากครับ แนะนำเลย

Maarten de Boer NL ผู้เรียนที่ยืนยันแล้ว
★ 5 · 2025-04-26T09:15:43+00:00

Ik wist nooit goed hoe ik moest controleren of mijn agent eigenlijk deed wat hij moest doen, en LangSmith bleek precies de oplossing. Het stap-voor-stap opzetten van traces zodat je elke beslissing van de agent kunt terugzien was een eyeopener. Vooral het deel over benchmarken tegen een vaste testset gaf me eindelijk grip op betrouwbaarheid. De voorbeelden zijn helder en lopen netjes door, niks blijft vaag. Na deze cursus durf ik mijn applicatie pas echt richting productie te brengen. Een fundament dat ik veel te lang heb overgeslagen.

เขียนรีวิว

หลังจากส่ง เราจะขอให้คุณเข้าสู่ระบบ — ฉบับร่างของคุณถูกบันทึก

ผู้เรียนคนอื่นเรียน

คำถามที่พบบ่อย

ฉันต้องใช้อะไรในการเรียนคอร์สนี้? +

แค่โทรศัพท์หรือคอมพิวเตอร์ที่มีอินเทอร์เน็ต ไม่ต้องติดตั้งหรือใช้อุปกรณ์พิเศษ

ฉันชำระเงินอย่างไร? +

ผ่านบัตรด้วย Stripe เราไม่เก็บข้อมูลบัตร — Stripe จัดการอย่างปลอดภัย

ฉันขอคืนเงินได้ไหม? +

ใช่ — คืนเงินเต็มจำนวนใน 14 วัน ไม่ต้องอธิบาย

ฉันมีสิทธิ์เข้าถึงนานเท่าไร? +

ตลอดไป เมื่อซื้อแล้วคอร์สเป็นของคุณ กลับมาเรียนได้ตลอด

ฉันจะได้ใบประกาศนียบัตรไหม? +

ได้ เมื่อเรียนจบจะได้รับใบประกาศนียบัตรที่เพิ่มในโปรไฟล์ LinkedIn ได้

ออกแบบสำหรับผู้เรียนใน
เทคโนโลยี ดีไซน์ การเงิน การตลาด สาธารณสุข การศึกษา ธุรกิจการบริการ อุตสาหกรรม