У нас вы можете посмотреть бесплатно Момент, когда мы перестали понимать ИИ [AlexNet] или скачать в максимальном доступном качестве, видео которое было загружено на ютуб. Для загрузки выберите вариант из формы ниже:
Если кнопки скачивания не
загрузились
НАЖМИТЕ ЗДЕСЬ или обновите страницу
Если возникают проблемы со скачиванием видео, пожалуйста напишите в поддержку по адресу внизу
страницы.
Спасибо за использование сервиса ClipSaver.ru
Спасибо KiwiCo за спонсорство сегодняшнего видео! Перейдите по ссылке https://www.kiwico.com/welchlabs и используйте код WELCHLABS, чтобы получить скидку 50% на первый месяц ежемесячной подписки и/или скидку 20% на первый ящик Panda. Активация постеров Atlas! https://www.welchlabs.com/resources/5... https://www.welchlabs.com/resources/a... https://www.welchlabs.com/resources/l... https://www.welchlabs.com/resources/a... Особая благодарность спонсорам: Хуану Бенету, Россу Хансону, Яну Бабицки, Эй Джей Энглхардту, Элвину Халеду, Эдуардо Баррасе, Хитоши Ямаути, Джейвону Чону, Mrgoodlight, Шиничи Хаяши, Сиду Сарасвати, Доминику Бомонту, Шеннон Пратер, Ubiquity Ventures, Матиас Форти Welch Labs Видео без рекламы и эксклюзивные бонусы: / welchlabs Смотреть в TikTok: / welchlabs Узнать больше или связаться: https://www.welchlabs.com/ Instagram: / welchlabs X: / welchlabs Ссылки Доклад AlexNet https://proceedings.neurips.cc/paper_... Оригинальная статья об Атласе активации — ознакомьтесь здесь — отличный интерактивный Атлас! https://distill.pub/2019/activation-a... Картер и др., «Атлас активации», Distill, 2019. Статья о визуализации функций: https://distill.pub/2017/feature-visu... `Ола и др., «Визуализация функций», Distill, 2017.` Отличная работа LLM по объяснимости: https://transformer-circuits.pub/2024... Темплтон и др., «Масштабирование моносемантичности: извлечение интерпретируемых признаков из сонета Клода 3», Transformer Circuits Thread, 2024. Видео «Deep Visualization Toolbox» Джейсона Йосински вдохновило на создание множества визуальных образов: • Deep Visualization Toolbox Отлично Вводная статья LLM/GPT https://arxiv.org/pdf/2304.10557 Видео 3B1Bs GPT, как всегда, отличные: • Attention in transformers, step-by-step | ... • Transformers, the tech behind LLMs | Deep ... Пошаговое руководство Андрея Керпати просто потрясающее: • Let's build GPT: from scratch, in code, sp... Книга Гудфеллоу по глубокому обучению https://www.deeplearningbook.org/ Кластер OpenAI V100 из 10 000 графических процессоров (1+ экзафлопс) https://news.microsoft.com/source/fea... Размер GPT-3 и т. д.: Языковые модели — это системы обучения с небольшим количеством попыток, Браун и др. al, 2020. Уникальное количество токенов для ChatGPT: https://cookbook.openai.com/examples/... Размер обучающей базы GPT-4 и т.д., предположительный: https://patmcguinness.substack.com/p/... https://www.semianalysis.com/p/gpt-4-... Исторические видео о нейронных сетях • Convolutional Network Demo from 1989 • Perceptron Research from the 50's & 60's, ... Опечатка 1:40 должно быть: «фрагмент слова добавляется в конец исходного входного сигнала». Спасибо Крису А. за находку.