У нас вы можете посмотреть бесплатно Honc Out #38 – Code-Mode Scorers for Evals или скачать в максимальном доступном качестве, видео которое было загружено на ютуб. Для загрузки выберите вариант из формы ниже:
Если кнопки скачивания не
загрузились
НАЖМИТЕ ЗДЕСЬ или обновите страницу
Если возникают проблемы со скачиванием видео, пожалуйста напишите в поддержку по адресу внизу
страницы.
Спасибо за использование сервиса ClipSaver.ru
We are back for episode #38, and today is all about deterministic evals. While LLM-based judging is popular, it isn't always efficient or necessary. We’re exploring code-mode scorers: how to write them, how to implement them, and how to fit them into a broader testing pipeline alongside your qualitative checks. Agenda: Intro: What are code-mode scorers? Implementation: Writing deterministic logic for evals. Comparison: Strengths/weaknesses vs. LLM-as-judge. Join the live chat to troubleshoot your own eval strategies with us. #MCP #AI #Evals #SoftwareEngineering #GenAI #MachineLearning #DevTools #agents