• ClipSaver
  • dtub.ru
ClipSaver
Русские видео
  • Смешные видео
  • Приколы
  • Обзоры
  • Новости
  • Тесты
  • Спорт
  • Любовь
  • Музыка
  • Разное
Сейчас в тренде
  • Фейгин лайф
  • Три кота
  • Самвел адамян
  • А4 ютуб
  • скачать бит
  • гитара с нуля
Иностранные видео
  • Funny Babies
  • Funny Sports
  • Funny Animals
  • Funny Pranks
  • Funny Magic
  • Funny Vines
  • Funny Virals
  • Funny K-Pop

Prof. Furong Huang: Towards AI Security – An Interplay of Stress-Testing and Alignment скачать в хорошем качестве

Prof. Furong Huang: Towards AI Security – An Interplay of Stress-Testing and Alignment 5 месяцев назад

скачать видео

скачать mp3

скачать mp4

поделиться

телефон с камерой

телефон с видео

бесплатно

загрузить,

Не удается загрузить Youtube-плеер. Проверьте блокировку Youtube в вашей сети.
Повторяем попытку...
Prof. Furong Huang: Towards AI Security – An Interplay of Stress-Testing and Alignment
  • Поделиться ВК
  • Поделиться в ОК
  •  
  •  


Скачать видео с ютуб по ссылке или смотреть без блокировок на сайте: Prof. Furong Huang: Towards AI Security – An Interplay of Stress-Testing and Alignment в качестве 4k

У нас вы можете посмотреть бесплатно Prof. Furong Huang: Towards AI Security – An Interplay of Stress-Testing and Alignment или скачать в максимальном доступном качестве, видео которое было загружено на ютуб. Для загрузки выберите вариант из формы ниже:

  • Информация по загрузке:

Скачать mp3 с ютуба отдельным файлом. Бесплатный рингтон Prof. Furong Huang: Towards AI Security – An Interplay of Stress-Testing and Alignment в формате MP3:


Если кнопки скачивания не загрузились НАЖМИТЕ ЗДЕСЬ или обновите страницу
Если возникают проблемы со скачиванием видео, пожалуйста напишите в поддержку по адресу внизу страницы.
Спасибо за использование сервиса ClipSaver.ru



Prof. Furong Huang: Towards AI Security – An Interplay of Stress-Testing and Alignment

Talk Abstract: As large language models (LLMs) become increasingly integrated into critical applications, ensuring their robustness and alignment with human values is paramount. This talk explores the interplay between stress-testing LLMs and alignment strategies to secure AI systems against emerging threats. We begin by motivating the need for rigorous stress-testing approaches that expose vulnerabilities, focusing on three key challenges: hallucinations, jailbreaking, and poisoning attacks. Hallucinations—where models generate incorrect or misleading content—compromise reliability. Jailbreaking methods that bypass safety filters can be exploited to elicit harmful outputs, while data poisoning undermines model integrity and security. After identifying these challenges, we propose alignment methods that embed ethical and security constraints directly into model behavior. By systematically combining stress-testing methodologies with alignment interventions, we aim to advance AI security and foster the development of resilient, trustworthy LLMs. Bio: Furong Huang is an Associate Professor of the Department of Computer Science at the University of Maryland. Specializing in trustworthy machine learning, Security in AI, AI for sequential decision-making, and generative AI, Dr. Huang focuses on applying principles to solve practical challenges in contemporary computing to develop efficient, robust, scalable, sustainable, ethical, and responsible machine learning algorithms. She is recognized for her contributions with awards including best paper awards, the MIT Technology Review Innovators Under 35 Asia Pacific, the MLconf Industry Impact Research Award, the NSF CRII Award, the Microsoft Accelerate Foundation Models Research award, the Adobe Faculty Research Award, three JP Morgan Faculty Research Awards and Finalist of AI in Research - AI researcher of the year for Women in AI Awards North America.

Comments
  • Prof. Manling Li: RAGEN: Training Agents by Reinforcing Reasoning 4 месяца назад
    Prof. Manling Li: RAGEN: Training Agents by Reinforcing Reasoning
    Опубликовано: 4 месяца назад
  • Dr. Akshara Rai: Sim2Real Learning for Home Robots 6 месяцев назад
    Dr. Akshara Rai: Sim2Real Learning for Home Robots
    Опубликовано: 6 месяцев назад
  • Fireside chat with Mr. Aditya Puri & Mr. Narayana Murthy at IIM  Bangalore 11 часов назад
    Fireside chat with Mr. Aditya Puri & Mr. Narayana Murthy at IIM Bangalore
    Опубликовано: 11 часов назад
  • Prof. Huan Sun: Advancing the Capability and Safety of Computer-Use Agents Together 2 месяца назад
    Prof. Huan Sun: Advancing the Capability and Safety of Computer-Use Agents Together
    Опубликовано: 2 месяца назад
  • Prof. Eric Xin Wang: Building AI Agents that Reason and Act Like Humans 3 месяца назад
    Prof. Eric Xin Wang: Building AI Agents that Reason and Act Like Humans
    Опубликовано: 3 месяца назад
  • Metagov Seminar - Turning to Trust Experience Design with Dr. Helena Rong 4 недели назад
    Metagov Seminar - Turning to Trust Experience Design with Dr. Helena Rong
    Опубликовано: 4 недели назад
  • ИИ - ЭТО ИЛЛЮЗИЯ ИНТЕЛЛЕКТА. Но что он такое и почему совершил революцию? 2 месяца назад
    ИИ - ЭТО ИЛЛЮЗИЯ ИНТЕЛЛЕКТА. Но что он такое и почему совершил революцию?
    Опубликовано: 2 месяца назад
  • Лучший документальный фильм про создание ИИ 4 недели назад
    Лучший документальный фильм про создание ИИ
    Опубликовано: 4 недели назад
  • Мы стоим на пороге нового конфликта! Что нас ждет дальше? Андрей Безруков про США, Россию и кризис 9 дней назад
    Мы стоим на пороге нового конфликта! Что нас ждет дальше? Андрей Безруков про США, Россию и кризис
    Опубликовано: 9 дней назад
  • Великая галлюцинация реальности. Есть ли выход? | Академия смысла: открытые лекции 10 дней назад
    Великая галлюцинация реальности. Есть ли выход? | Академия смысла: открытые лекции
    Опубликовано: 10 дней назад
  • Катастрофа возобновляемой энергии 10 дней назад
    Катастрофа возобновляемой энергии
    Опубликовано: 10 дней назад
  • Prof. Natasha Jaques: Multi-agent Reinforcement Learning (MARL) for LLMs 3 месяца назад
    Prof. Natasha Jaques: Multi-agent Reinforcement Learning (MARL) for LLMs
    Опубликовано: 3 месяца назад
  • Debate on the Global Economy: Shaping Economic Policies in the Face of Disruptive Change Трансляция закончилась 3 месяца назад
    Debate on the Global Economy: Shaping Economic Policies in the Face of Disruptive Change
    Опубликовано: Трансляция закончилась 3 месяца назад
  • Илон Маск (свежее интервью 2026): энергетика, ИИ, технологии, освоение космоса, андроиды, другое 1 месяц назад
    Илон Маск (свежее интервью 2026): энергетика, ИИ, технологии, освоение космоса, андроиды, другое
    Опубликовано: 1 месяц назад
  • Prof. Peter Stone: Human-in-the-Loop Machine Learning for Robot Navigation and Manipulation 3 месяца назад
    Prof. Peter Stone: Human-in-the-Loop Machine Learning for Robot Navigation and Manipulation
    Опубликовано: 3 месяца назад
  • LLM и GPT - как работают большие языковые модели? Визуальное введение в трансформеры 1 год назад
    LLM и GPT - как работают большие языковые модели? Визуальное введение в трансформеры
    Опубликовано: 1 год назад
  • Prof. Diyi Yang: Automation or Augmentation? Optimizing Human-AI Collaboration 1 месяц назад
    Prof. Diyi Yang: Automation or Augmentation? Optimizing Human-AI Collaboration
    Опубликовано: 1 месяц назад
  • Prof. Alane Suhr: Training Language-Based Agents 4 месяца назад
    Prof. Alane Suhr: Training Language-Based Agents
    Опубликовано: 4 месяца назад
  • Самая сложная модель из тех, что мы реально понимаем 1 месяц назад
    Самая сложная модель из тех, что мы реально понимаем
    Опубликовано: 1 месяц назад
  • Вселенная состоит из информации? Объясняю на пальцах 9 дней назад
    Вселенная состоит из информации? Объясняю на пальцах
    Опубликовано: 9 дней назад

Контактный email для правообладателей: u2beadvert@gmail.com © 2017 - 2026

Отказ от ответственности - Disclaimer Правообладателям - DMCA Условия использования сайта - TOS



Карта сайта 1 Карта сайта 2 Карта сайта 3 Карта сайта 4 Карта сайта 5