Phân tích dữ liệu đầu tư vốn nước ngoài trong một thành phố trang 157 Tin học 12
Phân tích dữ liệu đầu tư vốn nước ngoài trong một thành phố.
Giải Tin học 12 Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu - Chân trời sáng tạo
Thực hành trang 157 Tin học 12: Phân tích dữ liệu đầu tư vốn nước ngoài trong một thành phố.
Truy cập vào tệp data.csv (do giáo viên cung cấp) nhằm phân tích bộ dữ liệu Dự án đầu tư vốn nước ngoài trong một thành phố. Bộ dữ liệu này bao gồm tổng cộng 12 cột và gần 9500 bản ghi, lưu trữ thông tin của các dự án có vốn đầu tư nước ngoài như: Tên dự án đầu tư; Số chứng nhận đầu tư; Ngày cấp chứng nhận đầu tư; Tên đơn vị cấp phép; Loại hình đầu tư; Mục tiêu dự án; Quy mô dự án; Tổng vốn USD; Tổng vốn VND; Thời gian thực hiện; Tiến độ thực hiện; Các ưu đãi.
Yêu cầu: Em hãy sử dụng phần mềm bảng tính Microsoft Excel (Excel) để nhằm trích xuất thông tin và tri thức hữu ích. Cụ thể như sau:
a) Sử dụng Power Query của Excel, em hãy thực hiện tiền xử lí dữ liệu (làm sạch dữ liệu, xoá cột, tách cột, thêm cột mới vào bộ dữ liệu).
b) Em hãy sử dụng PivotTable của Excel để tổng hợp tổng số dự án đầu tư theo Đơn vị cấp phép.
c) Sử dụng PivotChart của Excel, thực hiện trực quan hoá dữ liệu Đơn vị cấp phép bằng biểu đồ và rút ra các nhận xét.
Lời giải:
a) Thực hiện các bước như sau để tiền xử lí dữ liệu:
1 Để mở tệp dữ liệu trên ta thực hiện như sau:
Khởi động Excel, nháy chọn thẻ Data, chọn Get Data, chọn From File, chọn From Text/CSV. Chọn tệp data.csv do giáo viên cung cấp. Ở hộp thoại xuất hiện, tại mục File Origin chọn Unicode (UTF-8), tại mục Delimiters chọn Comma. Nháy chọn Load để hoàn thành. i muc Delimiters con Commy. Nay Kết quả như Hình 1.
Dùng Power Query của Excel để tiền xử lý dữ liệu và lưu trữ dữ liệu được làm sạch sang 1 bảng tính khác.
Trong tệp Excel hiện tại, nháy chọn thẻ Data, chọn From Table/Range,
Pb Thực hiện xoá cột: tại cửa sổ hiện ra, lần lượt chọn các cột không cần thiết hoặc không có giá trị tìm hiểu ở thời điểm hiện tại (trong trường hợp này ta bỏ cột MucTieuDA và cột CacUuDai), chọn Remove Column. Các cột đã chọn sẽ được loại bỏ.
Dc Tách cột để lấy thông tin hữu dụng: ở cột NgayCNDauTu ta chỉ cần giữ lại dữ liệu ngày (thời gian cụ thể tính theo giờ trong ngày là không cần thiết). Cách để tách cột thực hiện như sau: Chọn cội cần tách, chọn Split, chọn By Delimiter, chọn Space. Cột được chọn sẽ được phân tách thành nhiều cột nhỏ hơn, chọn giữ cột mà em cần và bỏ các cột còn lại. Làm tương tự với cột Tien Do Thuchien.
Od Tạo cột mới: em cần có cái nhìn tổng quát về bộ dữ liệu đang có để xác định cần tạo thêm cột mới hay không. Trong trường hợp này, cột USD cần được chuyển sang đơn vị VND để dễ dàng so sánh. Cách làm như sau: chọn Add Column, chọn Custom Column chọn Insert cột TongVonUSD, Tạo cột mới DTNN_VND bằng cách nhân với tỉ giá giữa VND và USD.
Đc Lưu dữ liệu được làm sạch: Nháy chọn Close Load to, chọn Table, chọn New Worksheet. Dữ liệu làm sạch sẽ được tách ra một trang mới, các thao tác phân tích và trực quan hoá về sau được thực hiện dựa trên bảng này. Kết quả như Hình 2.
b) Bảng tổng hợp dữ liệu là kết quả thống kê trên bộ dữ liệu nhằm trực quan và rút trích các thông tin hữu ích. Sử dụng chức năng PivotTable để tổng hợp và khám phá dữ liệu đạt độ chính xác cao và tốn ít thời gian hơn so với việc dùng các hàm thông thường trực tiếp ngay trên bảng tính. Cụ thể:
1 Chọn thẻ Insert, chọn PivotTable, chọn From Table/Range. Chọn cột của trang tính muốn tổng hợp. Ở đây, ta sẽ để dạng mặc định là toàn bộ bảng.
2 Chọn các cột và giá trị muốn tổng hợp. Vùng Rows là các hàng cần tổng hợp, nói cách khác, Rows sẽ là tiêu chí mà ta muốn nhóm các mẫu thông tin lại với nhau. Ví dụ, muốn tính tổng số dự án đầu tư theo Đơn vị cấp phép, kéo thả cột TenDVCP vào vùng Rows và kéo thả cột TenDuAnDauTu vào vùng Values. Khi đó, kết quả sẽ tương tự như Hình 3.
c) Thực hiện các bước sau để trực quan hoá dữ liệu:
1 Để tạo biểu đồ cho Đơn vị cấp phép, ta chọn vùng dữ liệu từ bảng tổng hợp (Hình 3). Nháy thẻ Insert, chọn PivotChart, chọn biểu đồ "Pie". Thay đổi tên biểu đồ thành “Đơn vị cấp phép” (Hình 4).
Lời giải bài tập Tin học 12 Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu hay khác: