Haylamdo biên soạn và sưu tầm 15 câu hỏi trắc nghiệm Tin học 12 Bài 2: Giới thiệu về khoa học dữ liệu có đáp án chi tiết đầy đủ các mức độ sách Cánh diều sẽ giúp học sinh lớp 12 ôn luyện trắc nghiệm Tin 12.
Trắc nghiệm Tin học 12 Bài 2: Giới thiệu về khoa học dữ liệu - Cánh diều
PHẦN I.Câu trắc nghiệm nhiều phương án lựa chọn. Thí sinh trả lời từ câu 1 đến câu 10. Mỗi câu hỏi thí sinh chỉ lựa chọn một phương án.
Câu 1: Khoa học dữ liệu là gì?
A. Một lĩnh vực chỉ sử dụng toán học để phân tích dữ liệu.
B. Một lĩnh vực nghiên cứu các ứng dụng của máy tính trong lĩnh vực nghệ thuật.
C. Một lĩnh vực liên ngành kết hợp toán học, thống kê và khoa học máy tính để phân tích và trực quan hóa dữ liệu.
D. Một lĩnh vực nghiên cứu về cách thức hoạt động của các thiết bị điện tử.
Đáp án: C
Giải thích: Khoa học dữ liệu là một lĩnh vực liên ngành kết hợp toán học, thống kê, và khoa học máy tính để phân tích và trực quan hóa dữ liệu nhằm phát hiện vấn đề và đưa ra quyết định.
Câu 2: Giai đoạn nào sau đây không phải là một phần của dự án Khoa học dữ liệu?
A. Xác định vấn đề
B. Thu thập dữ liệu
C. Thực hiện quảng cáo
D. Đánh giá và giải thích
Đáp án: C
Giải thích: Giai đoạn thực hiện quảng cáo không nằm trong các giai đoạn của một dự án Khoa học dữ liệu. Các giai đoạn chính bao gồm xác định vấn đề, thu thập dữ liệu, chuẩn bị dữ liệu, phân tích và khai phá dữ liệu, đánh giá và giải thích, và ra quyết định.
Câu 3: Dự án Bộ gen người (HGP) kéo dài bao lâu và tiêu tốn khoảng bao nhiêu chi phí?
A. 10 năm và 2 triệu USD
B. 5 năm và 1 triệu USD
C. 13 năm và 3 tỉ USD
D. 20 năm và 5 tỉ USD
Đáp án: C
Giải thích: Dự án Bộ gen người kéo dài 13 năm (1990-2003) và tiêu tốn khoảng 3 tỉ USD.
Câu 4: Kính thiên văn Kepler thu thập bao nhiêu dữ liệu về độ sáng của các ngôi sao?
A. 100 GB
B. 678 GB
C. 1 TB
D. 2 TB
Đáp án: B
Giải thích: Kính thiên văn Kepler thu thập khoảng 678 GB dữ liệu về độ sáng của khoảng 150 nghìn ngôi sao trong 9 năm hoạt động.
Câu 5: Hệ thống Giám sát đánh bắt cá toàn cầu (Global Fishing Watch) sử dụng công nghệ gì để ngăn chặn đánh bắt cá bất hợp pháp?
A. Dữ liệu từ cảm biến nhiệt độ
B. Dữ liệu vệ tinh từ hệ thống của Google
C. Dữ liệu từ cảm biến âm thanh dưới nước
D. Dữ liệu từ camera theo dõi
Đáp án: B
Giải thích: Hệ thống Giám sát đánh bắt cá toàn cầu sử dụng dữ liệu vệ tinh từ hệ thống của Google để ghi lại vị trí của tàu cá và phát hiện đánh bắt cá bất hợp pháp.
Câu 6: Mô hình ngôn ngữ lớn (LLM) nổi tiếng nhất hiện nay là gì?
A. BERT
B. GPT-3
C. RoBERTa
D. T5
Đáp án: B
Giải thích: GPT-3 là mô hình ngôn ngữ lớn nổi tiếng với 175 tỉ tham số và đạt được nhiều thành tựu trong xử lý ngôn ngữ tự nhiên.
Câu 7: Dự án nào sau đây không phải là một thành tựu của Khoa học dữ liệu?
A. Dự án Bộ gen người HGP
B. Phát triển trí tuệ nhân tạo với các trợ lý ảo
C. Nghiên cứu và phát triển các phương pháp dạy học truyền thống
D. Phát hiện gian lận trong giao dịch tài chính
Đáp án: C
Giải thích: Nghiên cứu và phát triển các phương pháp dạy học truyền thống không phải là một thành tựu của Khoa học dữ liệu. Các thành tựu của Khoa học dữ liệu bao gồm dự án Bộ gen người, phát triển trí tuệ nhân tạo, và phát hiện gian lận tài chính.
Câu 8: Kỹ thuật nào được sử dụng trong Dự án Bộ gen người để nghiên cứu cấu trúc và chức năng của các gen?
A. Phân tích dữ liệu văn bản
B. Giải trình tự gen
C. Phát hiện đối tượng trong ảnh
D. Phân tích chuỗi thời gian
Đáp án: B
Giải thích: Dự án Bộ gen người sử dụng kỹ thuật giải trình tự gen để nghiên cứu cấu trúc và chức năng của các gen trong bộ gen người.
Câu 9: American Express đã cải thiện khả năng phát hiện gian lận bằng cách nào?
A. Triển khai mô hình học máy
B. Tăng cường đội ngũ nhân viên kiểm tra
C. Sử dụng phần mềm chống virus mới
D. Cải thiện giao diện người dùng
Đáp án: A
Giải thích: American Express đã cải thiện khả năng phát hiện gian lận bằng cách triển khai mô hình học máy, nâng cao hiệu quả phát hiện gian lận lên 30% so với hệ thống cũ.
Câu 10: Trong các dự án nghiên cứu không gian vũ trụ, dữ liệu về hành tinh được thu thập từ đâu?
A. Kính thiên văn Kepler
B. Cảm biến dưới mặt đất
C. Hệ thống giám sát hải dương
D. Máy tính cá nhân
Đáp án: A
Giải thích: Kính thiên văn Kepler thu thập dữ liệu về độ sáng của các ngôi sao và các hành tinh quay quanh chúng, tạo ra khoảng 100 GB dữ liệu mỗi ngày.
PHẦN II. Câu trắc nghiệm đúng sai.Thí sinh trả lời từ câu 1 đến câu 2. Trong mỗi ý a), b), c), d) ở mỗi câu, thí sinh chọn đúng hoặc sai
Câu 1: Phát biểu sau đây đúng hay sai về các khía cạnh của khoa học dữ liệu?
a) Khoa học dữ liệu chỉ liên quan đến toán học và thống kê, không bao gồm khoa học máy tính.
b) Một trong những mục tiêu chính của khoa học dữ liệu là phát hiện tri thức từ dữ liệu và phát triển kiến thức mới.
c) Trong các giai đoạn của dự án khoa học dữ liệu, việc ra quyết định và triển khai không cần dựa vào kết quả phân tích dữ liệu.
d) Để tối ưu hóa quyết định, khoa học dữ liệu sử dụng thuật toán tối ưu hóa và điều chỉnh quyết định dựa trên dữ liệu.
a) Sai: Khoa học dữ liệu không chỉ kết hợp toán học và thống kê, mà còn liên quan đến khoa học máy tính và các lĩnh vực ứng dụng khác như kinh doanh, tài chính, y tế.
b) Đúng: Một trong những mục tiêu chính của Khoa học dữ liệu là phát hiện tri thức từ dữ liệu và phát triển kiến thức mới.
c) Sai: Ra quyết định và triển khai cần phải dựa trên kết quả phân tích để đảm bảo quyết định được thông tin và chính xác.
d) Đúng: Khoa học dữ liệu sử dụng thuật toán tối ưu hóa và điều chỉnh quyết định dựa trên dữ liệu để đưa ra quyết định tốt nhất.
Câu 2: Phát biểu sau đây đúng hay sai về thành tựu và ứng dụng của khoa học dữ liệu:
a) Dự án Bộ gen người (HGP) tiêu tốn khoảng 3 triệu USD và kéo dài trong 3 năm.
b) Kính thiên văn Kepler thu thập khoảng 678 GB dữ liệu về độ sáng của 150 triệu ngôi sao trong 9 năm.
c) Hệ thống Giám sát đánh bắt cá toàn cầu sử dụng dữ liệu vệ tinh để theo dõi và ngăn chặn đánh bắt cá bất hợp pháp.
d) Các mô hình ngôn ngữ lớn (LLM) như GPT-3 có số lượng tham số rất nhỏ, không thể xử lý ngôn ngữ tự nhiên hiệu quả.
a) Sai: Dự án Bộ gen người tiêu tốn khoảng 3 tỷ USD và kéo dài trong 13 năm.
b) Sai: Kính thiên văn Kepler thu thập khoảng 678 GB dữ liệu về độ sáng của 150 nghìn ngôi sao trong 9 năm.
c) Đúng: Hệ thống Giám sát đánh bắt cá toàn cầu sử dụng dữ liệu vệ tinh để ngăn chặn đánh bắt cá bất hợp pháp và xác định mục đích chuyến đi của tàu cá.
d) Sai: Các mô hình ngôn ngữ lớn (LLM) như GPT-3 có số lượng tham số rất lớn, giúp xử lý ngôn ngữ tự nhiên tinh vi hơn.
PHẦN III. Câu trả lời ngắn. Thí sinh trả lời từ câu 1 đến câu 3
Câu 1: Khoa học dữ liệu bao gồm những phương pháp và lĩnh vực nào?
Đáp án: Khoa học dữ liệu kết hợp các phương pháp từ toán học, thống kê, và khoa học máy tính với kiến thức chuyên môn trong các lĩnh vực ứng dụng như kinh doanh, tài chính, y tế, và giáo dục.
Giải thích: Khoa học dữ liệu là một lĩnh vực liên ngành, sử dụng các công cụ và phương pháp từ toán học, thống kê, và khoa học máy tính để giải quyết các vấn đề trong nhiều lĩnh vực ứng dụng khác nhau.
Câu 2: Mục tiêu chính của khoa học dữ liệu bao gồm việc gì?
Đáp án: Mục tiêu chính của Khoa học dữ liệu bao gồm phân tích và trực quan hóa dữ liệu, xây dựng mô hình dự đoán, tối ưu hóa quyết định, và phát hiện tri thức từ dữ liệu.
Giải thích: Khoa học dữ liệu nhằm giúp hiểu và biểu diễn dữ liệu một cách trực quan, dự đoán sự kiện tương lai, điều chỉnh quyết định dựa trên dữ liệu, và phát hiện các quy luật ẩn trong dữ liệu.
Câu 3: Dự án Bộ gen người (HGP) kéo dài bao lâu và tiêu tốn bao nhiêu chi phí?
Đáp án: Dự án Bộ gen người kéo dài 13 năm (1990-2003) và tiêu tốn khoảng 3 tỉ USD.
Giải thích: Dự án Bộ gen người là một trong những dự án khoa học dữ liệu lớn nhất, kéo dài 13 năm với chi phí khoảng 3 tỉ USD, nhằm nghiên cứu cấu trúc và chức năng của các gen trong bộ gen người.
Xem thêm câu hỏi trắc nghiệm Tin học lớp 12 Cánh diều có đáp án hay khác: