У нас вы можете посмотреть бесплатно Sparse Autoencoders Unlearn Knowledge in LLMs | A Paper-Based Walkthrough или скачать в максимальном доступном качестве, видео которое было загружено на ютуб. Для загрузки выберите вариант из формы ниже:
Если кнопки скачивания не
загрузились
НАЖМИТЕ ЗДЕСЬ или обновите страницу
Если возникают проблемы со скачиванием видео, пожалуйста напишите в поддержку по адресу внизу
страницы.
Спасибо за использование сервиса ClipSaver.ru
I made a video about one of my favorite papers! I hope you enjoy :) ===Summary=== "Applying Sparse Autoencoders to Unlearn Knowledge in Language Models" investigates using SAEs—tools that peer into the inside of LLMs—to remove undesirable capabilities from language models. In this video, I walk through the motivation of this work, the methods used, and the interesting results the authors found. I highly recommend you read it for yourself here: https://arxiv.org/pdf/2410.19278#page... ===My other videos on Sparse Autoencoders=== Matroshkya SAEs: • Matryoshka (Nested) Sparse Autoencoders Ex... SAEs from the Ground Up: • A Window Into LLMs | Sparse Autoencoders ... ===Video Chapters=== 0:00 Intro 0:14 Context/Motivation 0:46 SAE Negative Clamping 1:01 Feature Identification 1:35 Experimental Setup 1:49 Single-Feature Steering 2:24 Multi-Feature Steering 3:29 Investigating RMU Hypothesis