У нас вы можете посмотреть бесплатно Hướng dẫn trọn bộ: Hands-On Machine Learning with Scikit-Learn, Keras & TensorFlow. Confusion Matrix или скачать в максимальном доступном качестве, видео которое было загружено на ютуб. Для загрузки выберите вариант из формы ниже:
Если кнопки скачивания не
загрузились
НАЖМИТЕ ЗДЕСЬ или обновите страницу
Если возникают проблемы со скачиванием видео, пожалуйста напишите в поддержку по адресу внизу
страницы.
Спасибо за использование сервиса ClipSaver.ru
Hướng dẫn trọn bộ: Hands-On Machine Learning with Scikit-Learn, Keras & TensorFlow. Confusion Matrix Tóm tắt video: Hướng dẫn trọn bộ: Hands-On Machine Learning với Scikit-Learn, Keras & TensorFlow - Confusion Matrix, Precision, Recall, F1 Score 📖 Video trước đã giới thiệu bộ dữ liệu MNIST và bài toán phân loại (classification), kết thúc ở phần Confusion Matrix. 📝 Ôn lại các bước đã học trong video trước: thiết lập dataset, huấn luyện mô hình phân loại nhị phân (binary classifier), và đánh giá bằng chỉ số accuracy. 🧠 Hiểu về vấn đề khi dùng chỉ số accuracy trong trường hợp dữ liệu không cân đối (bộ dữ liệu có nhiều lớp tiêu cực và ít lớp tích cực). 🔍 *Chuẩn bị dữ liệu:* 📊 Sử dụng Scikit-Learn để tải và chuẩn bị bộ dữ liệu MNIST. 📂 Bộ dữ liệu gồm 60,000 hình ảnh để huấn luyện và 10,000 hình ảnh để kiểm tra. 🧩 *Chi tiết về dữ liệu:* ✏️ Bộ dữ liệu là các chữ số viết tay với 784 đặc trưng (28 x 28 pixels). 🖼️ Các hình ảnh được chuyển thành vector và tạo thành ma trận dữ liệu để huấn luyện. 🔬 *Thực hiện huấn luyện mô hình:* 🧑🏫 Sử dụng mô hình Stochastic Gradient Descent (SGD) để huấn luyện binary classifier. 🔄 Chuyển dữ liệu thành các vector và ma trận, huấn luyện mô hình để phân loại liệu một hình ảnh có phải là số 5 hay không. 📊 *Đánh giá và kiểm tra mô hình:* 🛠️ Đánh giá mô hình bằng cách chia dữ liệu thành training set và test set. 📊 Huấn luyện với 60,000 hình ảnh và kiểm tra với 10,000 hình ảnh còn lại. 🎨 *Trực quan hóa dữ liệu:* 🖼️ Sử dụng thư viện matplotlib để trực quan hóa các hình ảnh và ma trận số. 📉 Các giá trị pixel được biểu diễn từ 0 đến 255, giúp hiển thị hình ảnh rõ ràng. 📈 *Đánh giá mô hình:* 📊 Sử dụng cross-validation để đánh giá độ chính xác của mô hình trên nhiều tập dữ liệu khác nhau. 🔍 Đánh giá bằng Confusion Matrix, Precision và Recall để có cái nhìn tổng quan về hiệu suất của mô hình. 📊 *Confusion Matrix:* 📝 Confusion Matrix giúp đánh giá hiệu suất của một mô hình phân loại. 📈 Nó cung cấp thông tin về số lượng dự đoán đúng và sai, phân biệt theo từng loại dự đoán (True Positive, True Negative, False Positive, False Negative). 🎯 *Precision và Recall:* 📏 *Precision (Độ chính xác):* Tỷ lệ giữa số dự đoán đúng (True Positives) so với tổng số dự đoán là đúng (bao gồm cả False Positives). Công thức: Precision = TP / (TP + FP) Giúp đo lường mức độ chính xác của các dự đoán dương tính (positive prediction) 📏 *Recall (Độ nhạy):* Tỷ lệ giữa số dự đoán đúng (True Positives) so với tổng số mẫu thực sự dương tính (bao gồm cả False Negatives). Công thức: Recall = TP/(TP + FN) Giúp đo lường khả năng phát hiện các mẫu dương tính thực sự. 📊 *Precision-Recall Trade-Off:* ⚖️ *Trade-Off Giữa Precision và Recall:* Tăng precision thường làm giảm recall và ngược lại. Precision cao nghĩa là ít cảnh báo sai, nhưng có thể bỏ sót nhiều trường hợp thực sự cần phát hiện (low recall). Recall cao nghĩa là ít bỏ sót, nhưng có thể nhiều cảnh báo sai (low precision). 📈 *Đường Cong Precision-Recall (PR Curve):* Để hiểu rõ trade-off, ta sử dụng đường cong Precision-Recall, giúp hình dung mối quan hệ giữa precision và recall ở các ngưỡng khác nhau. 🛠️ *Cách Chọn Ngưỡng (Threshold):* 📉 *Thay Đổi Ngưỡng:* Thay đổi ngưỡng quyết định (threshold) của mô hình giúp điều chỉnh độ nhạy và độ chính xác. Ngưỡng thấp tăng recall nhưng giảm precision, trong khi ngưỡng cao tăng precision nhưng giảm recall. 🧮 *Tối Ưu Ngưỡng:* Chọn ngưỡng tối ưu dựa trên mục tiêu cụ thể. Ví dụ, trong một số ứng dụng y tế, recall có thể được ưu tiên hơn precision để đảm bảo không bỏ sót bất kỳ trường hợp dương tính nào. 🔧 *Thực Hiện Trên Scikit-Learn:* Sử dụng `precision_recall_curve` từ thư viện Scikit-Learn để tính toán các giá trị precision và recall tại các ngưỡng khác nhau. Tạo biểu đồ PR Curve để tìm ngưỡng tối ưu. 💡 *Kết Luận:* Hiểu và điều chỉnh trade-off giữa precision và recall giúp cải thiện hiệu suất của mô hình phân loại. Sử dụng các công cụ và kỹ thuật để chọn ngưỡng phù hợp với mục tiêu cụ thể của bài toán.