У нас вы можете посмотреть бесплатно In the Arena: How LMSys changed LLM Benchmarking Forever или скачать в максимальном доступном качестве, видео которое было загружено на ютуб. Для загрузки выберите вариант из формы ниже:
Если кнопки скачивания не
загрузились
НАЖМИТЕ ЗДЕСЬ или обновите страницу
Если возникают проблемы со скачиванием видео, пожалуйста напишите в поддержку по адресу внизу
страницы.
Спасибо за использование сервиса ClipSaver.ru
LMArena's leads on pioneering LLM evals with ChatBot Arena and MT-Bench, adjusting for human bias with Style Control, and replacing static benchmarks with dynamic evaluations. https://www.latent.space/p/lmarena 00:00:00 Introductions 00:01:16 Origin and development of Chatbot Arena 00:05:41 Static benchmarks vs. Arenas 00:09:03 Community building 00:13:32 Biases in human preference evaluation 00:18:27 Style Control and Model Categories 00:26:06 Impact of o1 00:29:15 Collaborating with AI labs 00:34:51 RouteLLM and router models 00:38:09 Future of LMSys / Arena