• ClipSaver
  • dtub.ru
ClipSaver
Русские видео
  • Смешные видео
  • Приколы
  • Обзоры
  • Новости
  • Тесты
  • Спорт
  • Любовь
  • Музыка
  • Разное
Сейчас в тренде
  • Фейгин лайф
  • Три кота
  • Самвел адамян
  • А4 ютуб
  • скачать бит
  • гитара с нуля
Иностранные видео
  • Funny Babies
  • Funny Sports
  • Funny Animals
  • Funny Pranks
  • Funny Magic
  • Funny Vines
  • Funny Virals
  • Funny K-Pop

OpenAI Whisper: Robust Speech Recognition via Large-Scale Weak Supervision | Paper and Code скачать в хорошем качестве

OpenAI Whisper: Robust Speech Recognition via Large-Scale Weak Supervision | Paper and Code 3 года назад

скачать видео

скачать mp3

скачать mp4

поделиться

телефон с камерой

телефон с видео

бесплатно

загрузить,

Не удается загрузить Youtube-плеер. Проверьте блокировку Youtube в вашей сети.
Повторяем попытку...
OpenAI Whisper: Robust Speech Recognition via Large-Scale Weak Supervision | Paper and Code
  • Поделиться ВК
  • Поделиться в ОК
  •  
  •  


Скачать видео с ютуб по ссылке или смотреть без блокировок на сайте: OpenAI Whisper: Robust Speech Recognition via Large-Scale Weak Supervision | Paper and Code в качестве 4k

У нас вы можете посмотреть бесплатно OpenAI Whisper: Robust Speech Recognition via Large-Scale Weak Supervision | Paper and Code или скачать в максимальном доступном качестве, видео которое было загружено на ютуб. Для загрузки выберите вариант из формы ниже:

  • Информация по загрузке:

Скачать mp3 с ютуба отдельным файлом. Бесплатный рингтон OpenAI Whisper: Robust Speech Recognition via Large-Scale Weak Supervision | Paper and Code в формате MP3:


Если кнопки скачивания не загрузились НАЖМИТЕ ЗДЕСЬ или обновите страницу
Если возникают проблемы со скачиванием видео, пожалуйста напишите в поддержку по адресу внизу страницы.
Спасибо за использование сервиса ClipSaver.ru



OpenAI Whisper: Robust Speech Recognition via Large-Scale Weak Supervision | Paper and Code

❤️ Become The AI Epiphany Patreon ❤️   / theaiepiphany   👨‍👩‍👧‍👦 Join our Discord community 👨‍👩‍👧‍👦   / discord   In this video I cover Whisper, an ASR system from OpenAI's "Robust Speech Recognition via Large-Scale Weak Supervision" paper. Trained on a huge multi-lingual, multi-task weakly supervised dataset it achieves a very high effective robustness and accuracy closing the gap with the human baseline using only an off-the-shelf transformer. I walk you through both the paper as well as the actual code. Let me know whether the code part helped! ▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬ ✅ Paper: https://cdn.openai.com/papers/whisper... ✅ Code: https://github.com/openai/whisper ✅ Nice explanation of mel spectrograms:    • Mel Spectrograms Explained Easily   ▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬ ⌚️ Timetable: 00:00:00 Intro 00:02:05 Paper overview 00:07:30 Collecting a large scale weakly supervised dataset 00:13:55 Evaluation metric issues (WER) 00:16:05 Effective robustness 00:18:40 Scaling laws in progress 00:26:30 Decoding is hacky 00:28:30 Code walk-through 00:30:25 Model architecture (diagram vs code) 00:33:30 Transcription task 00:34:10 Loading the audio, mel spectrograms 00:37:50 Language detection 00:45:00 Transcription task continued 00:47:35 Suppressing token logits 00:52:00 Voice activity detection 00:53:35 Decoding and heuristics 01:01:56 Outro ▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬ 💰 BECOME A PATREON OF THE AI EPIPHANY ❤️ If these videos, GitHub projects, and blogs help you, consider helping me out by supporting me on Patreon! The AI Epiphany -   / theaiepiphany   One-time donation - https://www.paypal.com/paypalme/theai... Huge thank you to these AI Epiphany patreons: Eli Mahler Petar Veličković ▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬ 💼 LinkedIn -   / aleksagordic   🐦 Twitter -   / gordic_aleksa   👨‍👩‍👧‍👦 Discord -   / discord   📺 YouTube -    / theaiepiphany   📚 Medium -   / gordicaleksa   💻 GitHub - https://github.com/gordicaleksa 📢 AI Newsletter - https://aiepiphany.substack.com/ ▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬ #whisper #openai #asr

Comments
  • Lucas Beyer (Google DeepMind) - Convergence of Vision & Language 2 года назад
    Lucas Beyer (Google DeepMind) - Convergence of Vision & Language
    Опубликовано: 2 года назад
  • High Fidelity Neural Audio Compression | Paper & Code Explained 3 года назад
    High Fidelity Neural Audio Compression | Paper & Code Explained
    Опубликовано: 3 года назад
  • Whisper Paper Explained: Robust Speech Recognition via Large-Scale Weak Supervision 3 года назад
    Whisper Paper Explained: Robust Speech Recognition via Large-Scale Weak Supervision
    Опубликовано: 3 года назад
  • How to Install & Use Whisper AI Voice to Text 2 года назад
    How to Install & Use Whisper AI Voice to Text
    Опубликовано: 2 года назад
  • Stanford PhD Explains: How to Land an AI Engineer Job Without a PhD 3 месяца назад
    Stanford PhD Explains: How to Land an AI Engineer Job Without a PhD
    Опубликовано: 3 месяца назад
  • State Space Models w/ Albert Gu & Karan Goel (Cartesia AI) 1 год назад
    State Space Models w/ Albert Gu & Karan Goel (Cartesia AI)
    Опубликовано: 1 год назад
  • AudioGen: Textually Guided Audio Generation | Text To Audio | Paper Explained 3 года назад
    AudioGen: Textually Guided Audio Generation | Text To Audio | Paper Explained
    Опубликовано: 3 года назад
  • LLM и GPT - как работают большие языковые модели? Визуальное введение в трансформеры 1 год назад
    LLM и GPT - как работают большие языковые модели? Визуальное введение в трансформеры
    Опубликовано: 1 год назад
  • Низкоранговая адаптация больших языковых моделей: объяснение ключевых концепций LoRA 2 года назад
    Низкоранговая адаптация больших языковых моделей: объяснение ключевых концепций LoRA
    Опубликовано: 2 года назад
  • Чат ПГТ 5.2 - это похоронная. Самый УЖАСНЫЙ релиз в истории ИИ 2 дня назад
    Чат ПГТ 5.2 - это похоронная. Самый УЖАСНЫЙ релиз в истории ИИ
    Опубликовано: 2 дня назад
  • Можно ли использовать Whisper для потоковой передачи ASR в реальном времени? 1 год назад
    Можно ли использовать Whisper для потоковой передачи ASR в реальном времени?
    Опубликовано: 1 год назад
  • Ultimate Guide To Scaling ML Models - Megatron-LM | ZeRO | DeepSpeed | Mixed Precision 3 года назад
    Ultimate Guide To Scaling ML Models - Megatron-LM | ZeRO | DeepSpeed | Mixed Precision
    Опубликовано: 3 года назад
  • Объяснение модели Whisper от OpenAI 3 года назад
    Объяснение модели Whisper от OpenAI
    Опубликовано: 3 года назад
  • OpenAI Whisper - Fine tune to Lithuanian | step-by-step with Python 2 года назад
    OpenAI Whisper - Fine tune to Lithuanian | step-by-step with Python
    Опубликовано: 2 года назад
  • GPT-Fast - blazingly fast inference with PyTorch (w/ Horace He) 1 год назад
    GPT-Fast - blazingly fast inference with PyTorch (w/ Horace He)
    Опубликовано: 1 год назад
  • OpenAI Whisper Demo: Convert Speech to Text in Python 3 года назад
    OpenAI Whisper Demo: Convert Speech to Text in Python
    Опубликовано: 3 года назад
  • Создание нейронной сети С НУЛЯ (без Tensorflow/Pytorch, только NumPy и математика) 5 лет назад
    Создание нейронной сети С НУЛЯ (без Tensorflow/Pytorch, только NumPy и математика)
    Опубликовано: 5 лет назад
  • BigScience BLOOM | 3D Parallelism Explained | Large Language Models | ML Coding Series 3 года назад
    BigScience BLOOM | 3D Parallelism Explained | Large Language Models | ML Coding Series
    Опубликовано: 3 года назад
  • MIT 6.S191: Automatic Speech Recognition 3 года назад
    MIT 6.S191: Automatic Speech Recognition
    Опубликовано: 3 года назад
  • Но что такое нейронная сеть? | Глава 1. Глубокое обучение 8 лет назад
    Но что такое нейронная сеть? | Глава 1. Глубокое обучение
    Опубликовано: 8 лет назад

Контактный email для правообладателей: [email protected] © 2017 - 2025

Отказ от ответственности - Disclaimer Правообладателям - DMCA Условия использования сайта - TOS



Карта сайта 1 Карта сайта 2 Карта сайта 3 Карта сайта 4 Карта сайта 5