У нас вы можете посмотреть бесплатно Сходства и различия между контролируемым обучением и кластеризацией или скачать в максимальном доступном качестве, видео которое было загружено на ютуб. Для загрузки выберите вариант из формы ниже:
Если кнопки скачивания не
загрузились
НАЖМИТЕ ЗДЕСЬ или обновите страницу
Если возникают проблемы со скачиванием видео, пожалуйста напишите в поддержку по адресу внизу
страницы.
Спасибо за использование сервиса ClipSaver.ru
В этом рабочем процессе показано, что самообучение не то же самое, что кластеризация, но оба метода могут быть использованы для выявления структуры в неразмеченных данных. Используя набор данных mtcars, был создан шумоподавляющий автокодировщик на Python с помощью PyTorch для обучения сжатым эмбеддингам на основе числовых характеристик автомобилей, таких как расход топлива, количество цилиндров, рабочий объём двигателя, мощность, вес и коробка передач. Модель обучалась путем добавления случайного шума к стандартизированным входным данным, а затем восстановления исходных чистых значений, что сделало процесс обучения самообучающимся, поскольку внешние метки не использовались. По мере того, как обучение продолжалось более 400 эпох, ошибка восстановления неуклонно снижалась, показывая, что кодировщик обучался полезным внутренним представлениям автомобилей. Затем эти обученные эмбеддинги были визуализированы с помощью Plotly как в 2D, так и в 3D, где выявились закономерности, отражающие количество цилиндров, тип трансмиссии и характеристики производительности. Например, эмбеддинги показали, что автомобили с четырехцилиндровыми двигателями, автомобили с механической коробкой передач и более легкие экономичные автомобили группируются иначе, чем более тяжелые автомобили с высокой мощностью. В блокноте также сравнивались эти полученные эмбеддинги с исходными графиками пространства признаков, демонстрируя, как обучение представлений может упростить визуальную интерпретацию скрытой структуры. В отличие от этого, кластеризация была продемонстрирована отдельно с использованием алгоритма K-средних на стандартизированных переменных mtcars, а также с помощью диаграммы «локоть» для выбора количества кластеров. Результаты кластеризации позволили выделить такие группы, как тяжелые восьмицилиндровые автомобили, более компактные экономичные четырехцилиндровые автомобили и автомобили, ориентированные на производительность, и они были обобщены с помощью 2D и 3D визуализаций Plotly, а также средних значений кластеров. В целом, пример показывает, что самообучение сначала лучше изучает признаки, в то время как кластеризация группирует похожие наблюдения позже, что делает эти методы связанными, но принципиально разными.