Tại sao cần chia dữ liệu Học máy thành hai phần: dữ liệu huấn luyện và dữ liệu kiểm tra
Sách bài tập Tin học 12 Bài 25: Làm quen với Học máy - Kết nối tri thức
Câu 25.4 trang 91 SBT Tin học 12: Tại sao cần chia dữ liệu Học máy thành hai phần: dữ liệu huấn luyện và dữ liệu kiểm tra?
A. Để máy tính có thể học từ cả hai loại dữ liệu một cách cân bằng.
B. Để đánh giá khách quan hiệu suất của mô hình học máy.
C. Để tăng khối lượng dữ liệu mà máy tính có thể học.
D. Để có thể dự đoán kết quả của mô hình trên dữ liệu thực tế.
Lời giải:
Đáp án: B: Việc chia dữ liệu thành hai phần giúp đảm bảo rằng khi mô hình được kiểm tra, nó không "nhìn thấy" dữ liệu kiểm tra trong quá trình huấn luyện. Điều này cho phép đánh giá khách quan về hiệu suất của mô hình trên dữ liệu mà nó chưa thấy, từ đó xác định khả năng tổng quát của mô hình.
Lời giải sách bài tập Tin học 12 Bài 25: Làm quen với Học máy hay khác:
Câu 25.5 trang 91 SBT Tin học 12: Trong Học máy, dữ liệu có nhãn là gì? ....
Câu 25.7 trang 91 SBT Tin học 12: Học không giám sát trong Học máy dựa trên loại dữ liệu nào? ....
Câu 25.9 trang 92 SBT Tin học 12: Mục đích của việc chuẩn bị dữ liệu trong Học máy là gì? ....
Câu 25.10 trang 92 SBT Tin học 12: Việc huấn luyện mô hình Học máy dựa trên điều gì? ....
Câu 25.11 trang 92 SBT Tin học 12: Sử dụng mô hình Học máy trong thực tế phục vụ mục đích gì? ....
Câu 25.14 trang 92 SBT Tin học 12: Khi sử dụng Học máy có giám sát, điều gì quan trọng nhất? ....
Câu 25.15 trang 93 SBT Tin học 12: Mục đích chính của việc phân loại trong Học máy là gì? ....