Machine Learning cho mọi người - 3: Học không giám sát (Unsupervised Learning)

3. Học không giám sát (Unsupervised Learning) Phân nhóm và giảm chiều: phân nhóm theo k trung bình, phân nhóm theo cấu trúc, phân tích thành phần chính, SVD. Làm thế nào bạn tìm được cấu trúc bên dưới một tập dữ liệu? Bạn tổng hợp và nhóm nó thế nào để hiệu quả nhất? Làm sao bạn biểu diễn dữ liệu dưới dạng nén một cách hiệu quả? Đó là những mục tiêu của học không giám sát, gọi là “không giám sát” vì bạn bắt đầu với dữ liệu không được gán nhãn (không có Y). Có 2 loại học không giám sát chúng ta sẽ khám phá, chúng đều phân dữ liệu thành các nhóm dựa theo sự tương đồng và giảm chiều để nén dữ liệu trong khi vẫn duy trì được cấu trúc và tính hữu dụng của nó. Ví dụ về chỗ các phương pháp học không giám sát có thể hữu ích: - Nền tảng quảng cáo phân đoạn dân số Mỹ thành các nhóm nhỏ hơn dựa trên nhân khẩu học tương đồng và thói quen mua sắm, nhờ đó các nhà quảng cáo có thể đạt được mục tiêu thị trường bằng các quảng ...