• ClipSaver
  • dtub.ru
ClipSaver
Русские видео
  • Смешные видео
  • Приколы
  • Обзоры
  • Новости
  • Тесты
  • Спорт
  • Любовь
  • Музыка
  • Разное
Сейчас в тренде
  • Фейгин лайф
  • Три кота
  • Самвел адамян
  • А4 ютуб
  • скачать бит
  • гитара с нуля
Иностранные видео
  • Funny Babies
  • Funny Sports
  • Funny Animals
  • Funny Pranks
  • Funny Magic
  • Funny Vines
  • Funny Virals
  • Funny K-Pop

Engineering AI Ethics: What Meta Missed and Anthropic Got Right скачать в хорошем качестве

Engineering AI Ethics: What Meta Missed and Anthropic Got Right 6 месяцев назад

скачать видео

скачать mp3

скачать mp4

поделиться

телефон с камерой

телефон с видео

бесплатно

загрузить,

Не удается загрузить Youtube-плеер. Проверьте блокировку Youtube в вашей сети.
Повторяем попытку...
Engineering AI Ethics: What Meta Missed and Anthropic Got Right
  • Поделиться ВК
  • Поделиться в ОК
  •  
  •  


Скачать видео с ютуб по ссылке или смотреть без блокировок на сайте: Engineering AI Ethics: What Meta Missed and Anthropic Got Right в качестве 4k

У нас вы можете посмотреть бесплатно Engineering AI Ethics: What Meta Missed and Anthropic Got Right или скачать в максимальном доступном качестве, видео которое было загружено на ютуб. Для загрузки выберите вариант из формы ниже:

  • Информация по загрузке:

Скачать mp3 с ютуба отдельным файлом. Бесплатный рингтон Engineering AI Ethics: What Meta Missed and Anthropic Got Right в формате MP3:


Если кнопки скачивания не загрузились НАЖМИТЕ ЗДЕСЬ или обновите страницу
Если возникают проблемы со скачиванием видео, пожалуйста напишите в поддержку по адресу внизу страницы.
Спасибо за использование сервиса ClipSaver.ru



Engineering AI Ethics: What Meta Missed and Anthropic Got Right

My site: https://natebjones.com My substack: https://natesnewsletter.substack.com/ Takeaways: 1. Meta’s Ethics Failure: A leaked AI ethics policy approved by 200+ staff, including Meta’s chief AI ethicist, revealed allowances for harmful outputs—highlighting a systemic, deliberate approval process rather than a simple mistake. 2. Bolt-On Guardrails Don’t Work: Meta’s approach adds minimal ethical restrictions after training rather than embedding them into the model’s core behavior, leaving large safety gaps. 3. Constitutional AI as Engineering: Anthropic’s method trains models to critique and revise outputs based on a set of principles, fostering an “ethical intuition” instead of rigid rule-following. 4. Who Writes the Rules?: Ethical frameworks depend on who authors them; without diverse stakeholders (e.g., child safety experts), values can be skewed or incomplete. 5. Industry-Wide Standards Needed: Common core ethical principles, stakeholder involvement, reviewer protections, and transparent fixed guidelines could raise the baseline for AI safety. 6. Red Teaming & Synthetic Data: Properly staffed red teams and refusal-focused synthetic training data can help prevent harmful behaviors before deployment. 7. Transparency as Trust: Companies should disclose their ethical guidelines and fixes; secrecy undermines public and partner confidence. Quotes: “We need to treat ethics as a central engineering problem, not a PR exercise.” “Bolting on minimal guardrails after training is like locking the barn door after the cow has escaped.” “Without diverse experts in the room, you risk building AI that’s blind to the very harms it should prevent.” Summary: In this talk, I unpack Meta’s leaked AI ethics policy and why it signals deeper systemic issues. The policy, approved by over 200 staff, allowed for troubling behaviors like romantic AI-child conversations. Meta’s bolt-on guardrails approach fails compared to Anthropic’s “Constitutional AI,” which builds ethical reasoning into models from training. I argue ethics must be treated as an engineering discipline, with diverse stakeholders, strong red teaming, and refusal-based synthetic training data. Industry-wide standards, transparency, and proactive safeguards are needed to avoid repeating Meta’s mistakes and to ensure models handle harmful requests responsibly. Keywords: Meta, AI ethics, Anthropic, Constitutional AI, red teaming, synthetic data, RLHF, ethical AI, AI safety, stakeholder involvement, transparency, harmful content, AI policy, child safety, industry standards

Comments
  • Дороничев: ИИ — пузырь, который скоро ЛОПНЕТ. Какие перемены ждут мир? 13 дней назад
    Дороничев: ИИ — пузырь, который скоро ЛОПНЕТ. Какие перемены ждут мир?
    Опубликовано: 13 дней назад
  • Claude Blackmailed Its Developers. Here's Why the System Hasn't Collapsed Yet. 1 день назад
    Claude Blackmailed Its Developers. Here's Why the System Hasn't Collapsed Yet.
    Опубликовано: 1 день назад
  • Кодекс Клода против Кодекса: решение, которое усугубляется с каждой неделей промедления и о котор... 4 дня назад
    Кодекс Клода против Кодекса: решение, которое усугубляется с каждой неделей промедления и о котор...
    Опубликовано: 4 дня назад
  • Электричество НЕ течёт по проводам — тревожное открытие Ричарда Фейнмана 6 дней назад
    Электричество НЕ течёт по проводам — тревожное открытие Ричарда Фейнмана
    Опубликовано: 6 дней назад
  • 6 Structural Gaps ChatGPT Can't Close—And 12 Killer AI Tools That Do 7 месяцев назад
    6 Structural Gaps ChatGPT Can't Close—And 12 Killer AI Tools That Do
    Опубликовано: 7 месяцев назад
  • Андрей Девятов. По-простому о сложном 23 часа назад
    Андрей Девятов. По-простому о сложном
    Опубликовано: 23 часа назад
  • Интернет помнит всё: 5 МЕТОДОВ НАЙТИ скрытую информацию от специалиста по кибербезопасности 1 день назад
    Интернет помнит всё: 5 МЕТОДОВ НАЙТИ скрытую информацию от специалиста по кибербезопасности
    Опубликовано: 1 день назад
  • 🔥Мой Источник из ФСБ подтвердил! Ваши мессенжи читают спецслужбы России! Христо Грозев 1 день назад
    🔥Мой Источник из ФСБ подтвердил! Ваши мессенжи читают спецслужбы России! Христо Грозев
    Опубликовано: 1 день назад
  • Claude Skills 2.0: используй их как 1%. Полный гайд от новичка до Pro о котором вам не рассказали. 3 дня назад
    Claude Skills 2.0: используй их как 1%. Полный гайд от новичка до Pro о котором вам не рассказали.
    Опубликовано: 3 дня назад
  • RAG: The $40B AI Technique 80% of Enterpises Use—Finally Explained 8 месяцев назад
    RAG: The $40B AI Technique 80% of Enterpises Use—Finally Explained
    Опубликовано: 8 месяцев назад
  • ЛУЧШАЯ БЕСПЛАТНАЯ НЕЙРОСЕТЬ Google, которой нет аналогов 3 месяца назад
    ЛУЧШАЯ БЕСПЛАТНАЯ НЕЙРОСЕТЬ Google, которой нет аналогов
    Опубликовано: 3 месяца назад
  • ChatGPT 5 Won't Save You: 10 Reasons Why Your AI Strategy is Failing 7 месяцев назад
    ChatGPT 5 Won't Save You: 10 Reasons Why Your AI Strategy is Failing
    Опубликовано: 7 месяцев назад
  • Anthropic Vs. OpenAI: How Safety Became The Advantage In AI 2 месяца назад
    Anthropic Vs. OpenAI: How Safety Became The Advantage In AI
    Опубликовано: 2 месяца назад
  • Ян Лекун: Мы не достигнем AGI, масштабируя LLMS 9 месяцев назад
    Ян Лекун: Мы не достигнем AGI, масштабируя LLMS
    Опубликовано: 9 месяцев назад
  • Европа потеряла независимость? Как союз преклоняется перед США - Джеффри Сакс 1 день назад
    Европа потеряла независимость? Как союз преклоняется перед США - Джеффри Сакс
    Опубликовано: 1 день назад
  • Building Anthropic | A conversation with our co-founders 1 год назад
    Building Anthropic | A conversation with our co-founders
    Опубликовано: 1 год назад
  • Вода нарушает законы физики — тревожное объяснение Фейнмана, которое пугает учёных 1 день назад
    Вода нарушает законы физики — тревожное объяснение Фейнмана, которое пугает учёных
    Опубликовано: 1 день назад
  • Безопасность AI или контроль? Что происходит внутри крупнейших AI-компаний 6 дней назад
    Безопасность AI или контроль? Что происходит внутри крупнейших AI-компаний
    Опубликовано: 6 дней назад
  • AI Lab Report 2025: Ranking OpenAI, Google, Anthropic, Meta & xAI on Trust 7 месяцев назад
    AI Lab Report 2025: Ranking OpenAI, Google, Anthropic, Meta & xAI on Trust
    Опубликовано: 7 месяцев назад
  • Claude Code: полный гайд по AI-кодингу (хаки, техники и секреты) 4 месяца назад
    Claude Code: полный гайд по AI-кодингу (хаки, техники и секреты)
    Опубликовано: 4 месяца назад

Контактный email для правообладателей: u2beadvert@gmail.com © 2017 - 2026

Отказ от ответственности - Disclaimer Правообладателям - DMCA Условия использования сайта - TOS



Карта сайта 1 Карта сайта 2 Карта сайта 3 Карта сайта 4 Карта сайта 5