• ClipSaver
  • dtub.ru
ClipSaver
Русские видео
  • Смешные видео
  • Приколы
  • Обзоры
  • Новости
  • Тесты
  • Спорт
  • Любовь
  • Музыка
  • Разное
Сейчас в тренде
  • Фейгин лайф
  • Три кота
  • Самвел адамян
  • А4 ютуб
  • скачать бит
  • гитара с нуля
Иностранные видео
  • Funny Babies
  • Funny Sports
  • Funny Animals
  • Funny Pranks
  • Funny Magic
  • Funny Vines
  • Funny Virals
  • Funny K-Pop

Steering vectors: tailor LLMs without training. Part II: Code (Interpretability Series) скачать в хорошем качестве

Steering vectors: tailor LLMs without training. Part II: Code (Interpretability Series) 1 год назад

скачать видео

скачать mp3

скачать mp4

поделиться

телефон с камерой

телефон с видео

бесплатно

загрузить,

Не удается загрузить Youtube-плеер. Проверьте блокировку Youtube в вашей сети.
Повторяем попытку...
Steering vectors: tailor LLMs without training. Part II: Code (Interpretability Series)
  • Поделиться ВК
  • Поделиться в ОК
  •  
  •  


Скачать видео с ютуб по ссылке или смотреть без блокировок на сайте: Steering vectors: tailor LLMs without training. Part II: Code (Interpretability Series) в качестве 4k

У нас вы можете посмотреть бесплатно Steering vectors: tailor LLMs without training. Part II: Code (Interpretability Series) или скачать в максимальном доступном качестве, видео которое было загружено на ютуб. Для загрузки выберите вариант из формы ниже:

  • Информация по загрузке:

Скачать mp3 с ютуба отдельным файлом. Бесплатный рингтон Steering vectors: tailor LLMs without training. Part II: Code (Interpretability Series) в формате MP3:


Если кнопки скачивания не загрузились НАЖМИТЕ ЗДЕСЬ или обновите страницу
Если возникают проблемы со скачиванием видео, пожалуйста напишите в поддержку по адресу внизу страницы.
Спасибо за использование сервиса ClipSaver.ru



Steering vectors: tailor LLMs without training. Part II: Code (Interpretability Series)

See Part I for an intro into Steering Vectors    • Steering vectors: tailor LLMs without trai...  . Code from this video: https://github.com/abrvkh/explainabil... State-of-the-art foundation models are often seen as black boxes: we send a prompt in and we get out our - often useful - answer. But what happens inside the system as the prompt gets processed remains a bit of a mystery & our ability to control or steer the processing into specific directions is limited. Enter steering vectors! By computing a vector that represents a particular feature or concept, we can use this to steer the model to include any property in the output we want: add more love into the answers, ensure it always answers your prompts (even if harmful!), or make the model such that it cannot stop talking about the Golden Gate Bridge. In this video we will code up fully from scratch a steering vector setup and use it to find refusals and hate-love directions. Disclaimer: the ability to remove refusals (i.e. make the model answer even harmful prompts) so easily is a big downside (instability) of these models. Further reading & references I used: Activation addition: https://arxiv.org/abs/2308.10248 Refusal directions: https://www.alignmentforum.org/posts/... and https://huggingface.co/posts/mlabonne... Golden Gate Claude: https://www.anthropic.com/news/golden... Superposition: https://transformer-circuits.pub/2022... Sparse autoencoders: https://arxiv.org/pdf/2406.04093v1

Comments
  • Steering vectors: tailor LLMs without training. Part I: Theory (Interpretability Series) 1 год назад
    Steering vectors: tailor LLMs without training. Part I: Theory (Interpretability Series)
    Опубликовано: 1 год назад
  • Demystifying Large Language Models in 45 minutes (non-technical) 1 год назад
    Demystifying Large Language Models in 45 minutes (non-technical)
    Опубликовано: 1 год назад
  • Extracting training data from Large Language Models 10 месяцев назад
    Extracting training data from Large Language Models
    Опубликовано: 10 месяцев назад
  • State Space Models (S4, S5, S6/Mamba) Explained 1 год назад
    State Space Models (S4, S5, S6/Mamba) Explained
    Опубликовано: 1 год назад
  • Управление программами магистратуры: как изменить личность ИИ без тонкой настройки. 2 месяца назад
    Управление программами магистратуры: как изменить личность ИИ без тонкой настройки.
    Опубликовано: 2 месяца назад
  • Борис Трушин: Красивые математические задачи с айтишных собеседований 7 дней назад
    Борис Трушин: Красивые математические задачи с айтишных собеседований
    Опубликовано: 7 дней назад
  • Decoding hidden states of Phi-3 with LogitLens (Interpretability Series) 1 год назад
    Decoding hidden states of Phi-3 with LogitLens (Interpretability Series)
    Опубликовано: 1 год назад
  • Detection and Steering in LLMs using Feature Learning Трансляция закончилась 1 год назад
    Detection and Steering in LLMs using Feature Learning
    Опубликовано: Трансляция закончилась 1 год назад
  • Самоудар по яйцам ЧУВИ | Фейк процессор в Chuwi CoreBook X 6 часов назад
    Самоудар по яйцам ЧУВИ | Фейк процессор в Chuwi CoreBook X
    Опубликовано: 6 часов назад
  • Управление поведением LLM без тонкой настройки 2 месяца назад
    Управление поведением LLM без тонкой настройки
    Опубликовано: 2 месяца назад
  • У меня ушло 10+ лет, чтобы понять то, что я расскажу за 11 минут 8 месяцев назад
    У меня ушло 10+ лет, чтобы понять то, что я расскажу за 11 минут
    Опубликовано: 8 месяцев назад
  • Influence functions for large language models - why LLMs generate what they generate 2 года назад
    Influence functions for large language models - why LLMs generate what they generate
    Опубликовано: 2 года назад
  • Как Сделать Настольный ЭЛЕКТРОЭРОЗИОННЫЙ Станок? 2 месяца назад
    Как Сделать Настольный ЭЛЕКТРОЭРОЗИОННЫЙ Станок?
    Опубликовано: 2 месяца назад
  • Редакция Live: Москва без интернета, aмериканский AI против Ирана, «Возьми телефон, детка» Трансляция закончилась 1 день назад
    Редакция Live: Москва без интернета, aмериканский AI против Ирана, «Возьми телефон, детка»
    Опубликовано: Трансляция закончилась 1 день назад
  • Чем ОПАСЕН МАХ? Разбор приложения специалистом по кибер безопасности 3 месяца назад
    Чем ОПАСЕН МАХ? Разбор приложения специалистом по кибер безопасности
    Опубликовано: 3 месяца назад
  • Кто пишет код лучше всех? Сравнил GPT‑5.2, Opus 4.5, Sonnet 4.5, Gemini 3, Qwen 3 Max, Kimi, GLM 1 месяц назад
    Кто пишет код лучше всех? Сравнил GPT‑5.2, Opus 4.5, Sonnet 4.5, Gemini 3, Qwen 3 Max, Kimi, GLM
    Опубликовано: 1 месяц назад
  • 400 часов вайб-кодинга: всё, что нужно знать | Claude, GPT, агенты Трансляция закончилась 1 месяц назад
    400 часов вайб-кодинга: всё, что нужно знать | Claude, GPT, агенты
    Опубликовано: Трансляция закончилась 1 месяц назад
  • Что такое ИИ-АГЕНТЫ и как они работают? 7 месяцев назад
    Что такое ИИ-АГЕНТЫ и как они работают?
    Опубликовано: 7 месяцев назад
  • Claude Code 2.0: Масштабное обновление! (Изменит правила игры) 17 часов назад
    Claude Code 2.0: Масштабное обновление! (Изменит правила игры)
    Опубликовано: 17 часов назад
  • ЦЕНА ОШИБКИ: 13 Инженерных Катастроф, Которые Потрясли Мир! 3 недели назад
    ЦЕНА ОШИБКИ: 13 Инженерных Катастроф, Которые Потрясли Мир!
    Опубликовано: 3 недели назад

Контактный email для правообладателей: u2beadvert@gmail.com © 2017 - 2026

Отказ от ответственности - Disclaimer Правообладателям - DMCA Условия использования сайта - TOS



Карта сайта 1 Карта сайта 2 Карта сайта 3 Карта сайта 4 Карта сайта 5