У нас вы можете посмотреть бесплатно Еженедельный обзор ClueCon с Адамом Кэлси [Выпуск 15, Эпизод 17]: Решения в области голосового ИИ... или скачать в максимальном доступном качестве, видео которое было загружено на ютуб. Для загрузки выберите вариант из формы ниже:
Если кнопки скачивания не
загрузились
НАЖМИТЕ ЗДЕСЬ или обновите страницу
Если возникают проблемы со скачиванием видео, пожалуйста напишите в поддержку по адресу внизу
страницы.
Спасибо за использование сервиса ClipSaver.ru
В этом выпуске ClueCon Weekly ведущий Джон Грей и Адам Кэлси (вице-президент по продуктам SignalWire) разбирают вопрос, с которым команды постоянно сталкиваются при разработке голосовых агентов: использовать ли традиционный конвейер обработки голосового ИИ (STT → LLM → TTS) или более современный подход, основанный на преобразовании речи в речь / аудио-языковых моделях? Они подробно рассматривают реальные компромиссы — задержка против контроля, простота против наблюдаемости, и почему «один вызов API» может быть отличным решением для прототипирования, но рискованным, если вам нужны такие вещи, как журналы аудита, редактирование, детерминированная бизнес-логика или соответствие отраслевым стандартам. Вы также узнаете, в чем преимущества преобразования речи в речь (например, в улавливании тона и эмоциональных нюансов) и почему многие производственные системы выбирают гибридный подход — используя модели там, где они приносят пользу, и код там, где необходима детерминированность. Кроме того: практическое предупреждение о чрезмерной оптимизации задержки, из-за которой оператор чувствует себя неестественно во время звонка.