• ClipSaver
  • dtub.ru
ClipSaver
Русские видео
  • Смешные видео
  • Приколы
  • Обзоры
  • Новости
  • Тесты
  • Спорт
  • Любовь
  • Музыка
  • Разное
Сейчас в тренде
  • Фейгин лайф
  • Три кота
  • Самвел адамян
  • А4 ютуб
  • скачать бит
  • гитара с нуля
Иностранные видео
  • Funny Babies
  • Funny Sports
  • Funny Animals
  • Funny Pranks
  • Funny Magic
  • Funny Vines
  • Funny Virals
  • Funny K-Pop

A Walkthrough of In-Context Learning and Induction Heads Part 1 of 2 (w/ Charles Frye) скачать в хорошем качестве

A Walkthrough of In-Context Learning and Induction Heads Part 1 of 2 (w/ Charles Frye) 3 года назад

скачать видео

скачать mp3

скачать mp4

поделиться

телефон с камерой

телефон с видео

бесплатно

загрузить,

Не удается загрузить Youtube-плеер. Проверьте блокировку Youtube в вашей сети.
Повторяем попытку...
A Walkthrough of In-Context Learning and Induction Heads Part 1 of 2 (w/ Charles Frye)
  • Поделиться ВК
  • Поделиться в ОК
  •  
  •  


Скачать видео с ютуб по ссылке или смотреть без блокировок на сайте: A Walkthrough of In-Context Learning and Induction Heads Part 1 of 2 (w/ Charles Frye) в качестве 4k

У нас вы можете посмотреть бесплатно A Walkthrough of In-Context Learning and Induction Heads Part 1 of 2 (w/ Charles Frye) или скачать в максимальном доступном качестве, видео которое было загружено на ютуб. Для загрузки выберите вариант из формы ниже:

  • Информация по загрузке:

Скачать mp3 с ютуба отдельным файлом. Бесплатный рингтон A Walkthrough of In-Context Learning and Induction Heads Part 1 of 2 (w/ Charles Frye) в формате MP3:


Если кнопки скачивания не загрузились НАЖМИТЕ ЗДЕСЬ или обновите страницу
Если возникают проблемы со скачиванием видео, пожалуйста напишите в поддержку по адресу внизу страницы.
Спасибо за использование сервиса ClipSaver.ru



A Walkthrough of In-Context Learning and Induction Heads Part 1 of 2 (w/ Charles Frye)

A walkthrough of the Anthropic paper In-Context Learning and Induction Heads. Charles Frye and I read through the paper, discuss and give intuitions. Part 2 coming soon! I was a core research contributor on this paper, but Chris Olah, Nelson Elhage and Catherine Olsson deserve far more of the credit! The paper: https://transformer-circuits.pub/2022... Timestamps 00:00:00 Intro 00:01:23 Ch1: Themes and high-level takes 00:01:23 Ch1a: Why mechanistic interpretability? 00:03:28 Ch1b: Why in-context learning? 00:08:11 Ch1c: Universality and in-context learning 00:11:44 Ch1d: Phase transitions and micro/macro lenses 00:14:11 Ch1e: Interpretability during training 00:18:10 Ch1f: Alignment, deployment, and interpretability 00:21:37 Ch2: Recap of arguments 00:22:39 Ch2a: Argument 1 - Macroscopic Co-occurrence 00:22:58 Ch2b: Argument 2 - Macroscopic Co-perturbation 00:24:20 Ch2c: Argument 3 - Direct Ablation 00:24:56 Ch2d: Argument 4 - Specific Examples of Generality 00:26:49 Ch2e: Argument 5 - Mechanistic Plausibility of Generality 00:28:25 Ch2f: Argument 6 - Continuity from Small to Large Models 00:29:13 Ch2g: Per-token loss analysis with PCA 00:35:21 Ch3: Argument 1 - Macroscopic phase change co-occurrence 00:36:41 Ch3a: Aside: Few-shot learning vs in-context learning 00:41:45 Ch3b: Figure - Derivative of loss with respect to token index 00:44:18 Ch3c: Figure - Induction heads from in phase change 00:50:57 Ch3d: Figure - Loss curves diverge during training 00:53:03 Ch3e: Figure - Per-token losses before and after the phase change 00:58:24 Ch3f: Assessing the evidence

Comments
  • A Walkthrough of Progress Measures for Grokking via Mechanistic Interpretability: What? (Part 1/3) 2 года назад
    A Walkthrough of Progress Measures for Grokking via Mechanistic Interpretability: What? (Part 1/3)
    Опубликовано: 2 года назад
  • Scaling-Pilled Interpretability: A Review of Activation Oracles 7 часов назад
    Scaling-Pilled Interpretability: A Review of Activation Oracles
    Опубликовано: 7 часов назад
  • Catherine Olsson - Induction Heads 3 года назад
    Catherine Olsson - Induction Heads
    Опубликовано: 3 года назад
  • What do models learn during finetuning? A model diffing paper walkthrough w/ Clement & Julian 1 месяц назад
    What do models learn during finetuning? A model diffing paper walkthrough w/ Clement & Julian
    Опубликовано: 1 месяц назад
  • Assessing skeptical views of interpretability research 1 месяц назад
    Assessing skeptical views of interpretability research
    Опубликовано: 1 месяц назад
  • Что сейчас имеет значение в механистической интерпретируемости? 1 месяц назад
    Что сейчас имеет значение в механистической интерпретируемости?
    Опубликовано: 1 месяц назад
  • Learning Theory of Transformers: Generalization and Optimization of In-Context Learning Трансляция закончилась 1 год назад
    Learning Theory of Transformers: Generalization and Optimization of In-Context Learning
    Опубликовано: Трансляция закончилась 1 год назад
  • A Walkthrough of Copy Suppression w/ Callum McDougall, Arthur Conmy & Cody Rushing Part 1/3 1 год назад
    A Walkthrough of Copy Suppression w/ Callum McDougall, Arthur Conmy & Cody Rushing Part 1/3
    Опубликовано: 1 год назад
  • LLM и GPT - как работают большие языковые модели? Визуальное введение в трансформеры 1 год назад
    LLM и GPT - как работают большие языковые модели? Визуальное введение в трансформеры
    Опубликовано: 1 год назад
  • «Что не так с квантовой физикой и путешествиями во времени?» – Д. Горбунов, А. Арбузов, А. Семихатов 1 день назад
    «Что не так с квантовой физикой и путешествиями во времени?» – Д. Горбунов, А. Арбузов, А. Семихатов
    Опубликовано: 1 день назад
  • A Walkthrough of A Mathematical Framework for Transformer Circuits 3 года назад
    A Walkthrough of A Mathematical Framework for Transformer Circuits
    Опубликовано: 3 года назад
  • Ilya Sutskever – We're moving from the age of scaling to the age of research 3 недели назад
    Ilya Sutskever – We're moving from the age of scaling to the age of research
    Опубликовано: 3 недели назад
  • Большие языковые модели в пяти формулах 1 год назад
    Большие языковые модели в пяти формулах
    Опубликовано: 1 год назад
  • What Happened With Sparse Autoencoders? 1 месяц назад
    What Happened With Sparse Autoencoders?
    Опубликовано: 1 месяц назад
  • Критическая база знаний LLM за ЧАС! Это должен знать каждый. 1 месяц назад
    Критическая база знаний LLM за ЧАС! Это должен знать каждый.
    Опубликовано: 1 месяц назад
  • Предел развития НЕЙРОСЕТЕЙ 11 месяцев назад
    Предел развития НЕЙРОСЕТЕЙ
    Опубликовано: 11 месяцев назад
  • A Walkthrough of Toy Models of Superposition w/ Jess Smith 2 года назад
    A Walkthrough of Toy Models of Superposition w/ Jess Smith
    Опубликовано: 2 года назад
  • Понимание ICL: Индукционные головки (Обработка естественного языка в Техасском университете в Ост... 2 года назад
    Понимание ICL: Индукционные головки (Обработка естественного языка в Техасском университете в Ост...
    Опубликовано: 2 года назад
  • Can LLMs Introspect? A Live Paper Review 1 месяц назад
    Can LLMs Introspect? A Live Paper Review
    Опубликовано: 1 месяц назад
  • Теренс Тао о том, как Григорий Перельман решил гипотезу Пуанкаре | Лекс Фридман 1 месяц назад
    Теренс Тао о том, как Григорий Перельман решил гипотезу Пуанкаре | Лекс Фридман
    Опубликовано: 1 месяц назад

Контактный email для правообладателей: [email protected] © 2017 - 2025

Отказ от ответственности - Disclaimer Правообладателям - DMCA Условия использования сайта - TOS



Карта сайта 1 Карта сайта 2 Карта сайта 3 Карта сайта 4 Карта сайта 5