Feature Engineering - Machine learning cơ bản https://machinelearningcoban.com/ PDF

Title Feature Engineering - Machine learning cơ bản https://machinelearningcoban.com/
Author Minh Huệ
Course Machine Learning
Institution Đại học Quốc gia Thành phố Hồ Chí Minh
Pages 2
File Size 75.5 KB
File Type PDF
Total Downloads 516
Total Views 736

Summary

Feature Engineering  Feature vector của tất cả các điểm dữ liệu thường có kích thước như nhau  Trích chọn đặc trưng ( feature engineering hay feature extraction )? Là quá trình tìm cách loại ra những dữ liệu nhiễu, và để đưa dữ liệu thô với các kích thước, số chiều khác nhau về cùng 1 chuẩn (cùng ...


Description

Feature Engineering  Feature vector của tất cả các điểm dữ liệu thường có kích thước như nhau  Trích chọn đặc trưng (feature engineering hay feature extraction)? Là quá trình tìm cách loại ra những dữ liệu nhiễu, và để đưa dữ liệu thô với các kích thước, số chiều khác nhau về cùng 1 chuẩn (cùng là các vector hoặc ma trận). "Coming up with features is difficult, time-consuming, requires expert knowledge. “Applied machine learning” is basically feature engineering." Andrew Ng  Trainning phase o Feature Extraction  Feature Extraction có nhiệm vụ? tạo ra một vector đặc trưng cho mỗi dữ liệu đầu vào. (tạo ra các vector có cùng kích thước).  Các yếu tố đầu vào của Feature Extration:  Dữ liệu thô ban đầu (raw training input) bao gồm? Tất cả các thông tin biết được về dữ liệu  output của trainning set:  Prior knowledge about data là? Các thông tin khác được biết về loại dữ liệu (ngoài những thông tin về raw input và output).  Extracted feature là gì? Các vector đặc trưng tương ứng được tạo ra sau khi dữ liệu thô được đưa qua mô hình của bộ feature extraction. Các extraction feature này sẽ được đưa vào huấn luyện các thuật toán  Mô hình end-to-end? Mô hình xây dựng bộ trích chọn đặc trưng và các thuật toán chính cùng lúc.

Thường mang lại kết quả tốt hơn.  Testing phase Sau khi có dữ liệu thô mới, sử dụng bộ trích chọn đặc trưng để tìm ra các vector đặc trưng tương ứng. Các vector này được đưa vào thuật toán chính để đưa ra quyết định.  Các ví dụ về Feature Engineering o Trực tiếp lấy dữ liệu thô thực hiện kéo dài ma trận các kích thích thành 1 vector có n phần tử, giá trị mỗi đặc trưng sẽ là một giá trị của một phần tử ban đầu. Kỹ thuật này còn được gọi là vector hóa ( vectorization) Việc làm này làm mất thông tin về không gian (spatial ìnormation) giữa các phần tử. o Lựa chọn đặc trưng Trường hợp các điểm dữ liệu có số đặc trưng khác nhau, số lượng đặc trưng là cực lớn. Cần chọn một số lượng đặc trưng nhỏ hơn phù hợp với bài toán. o Giảm chiều dữ liệu (dimendionality) dùng để? Giảm bộ nhớ và khối lượng tính toán. o Bag of words o Bag of words trong computer vision o Transfer learning cho bài toán phân loại ảnh  Transfer learning là gì? phương pháp sử dụng các mô hình đã được huấn luyện có sẵn...


Similar Free PDFs