• 024.385.84943
  • Thứ 2 - Thứ 6: 8:00 - 17:00
Trường Đại học Khoa học Tự nhiên - Đại học Quốc gia Hà Nội
Khoa Khí tượng Thủy văn và Hải dương học

Phân tích dữ liệu trong tài nguyên và môi trường nước

Mô tả:

Trí tuệ nhân tạo (Artificial Intelligence), Máy học (Machine Learning), Khoa học dữ liệu (Data Science), Khoa học dữ liệu ứng dụng hay Phân tích dữ liệu (Data Analytics), và Khai thác dữ liệu (Data Mining) là các lĩnh vực có sự giao thoa và ranh giới phân tách nhưng không thực sự rõ ràng.

“Phân tích dữ liệu là ngành khoa học liên quan đến việc phân tích các dữ liệu thô để thu được các kiến thức hữu ích từ dữ liệu đó” (Moreira et al., 2019).  Quá trình phân tích dữ liệu bao gồm: thu thập dữ liệu, tổ chức, tiền xử lý, chuyển đổi, mô hình hóa và diễn giải kết quả.

Phân tích dữ liệu khoa học trái đất (Earth Science Data Analytics - ESDA) còn đang trong giai đoạn sơ khai nên chưa có một định nghĩa nào được công nhận rông rãi (Kempler & Mathews, 2017). Theo hai học giả này, phân tích dữ liệu (Data analytics) được nhìn nhận là ngành khoa học dữ liệu ứng dụng (applied data science), sử dụng các công cụ, kiến thức, thành tựu của Khoa học dữ liêu vào các ngành/ lĩnh vực cụ thể để đạt được các mục tiêu cụ thể (ví dụ như giải quyết các bài toán dự báo trong Khí tượng hay Thủy văn). Từ việc tổng quan rất nhiều các nghiên cứu liên quan đến phân tích dữ liệu khoa học trái đất, các tác giả đã tổng hợp được 5 loại DA, gồm: DA mô tả, chẩn đoán, dự báo, tư vấn, và khám phá. Tuy nhiên họ nhận thấy rằng cách phân loại này là không phù hợp cho các bài toán liên quan đến khối ngành Khoa học trái đất. Họ đưa ra định nghĩ về ESDA là “Quá trình tìm hiểu, chuẩn bị, rút gọn và phân tích một lượng lớn dữ liệu không gian (đa chiều), dữ liệu thời gian hoặc dữ liệu phổ, bao gồm nhiều loại dữ liệu khác nhau. ESDA cho phép tìm ra các các mẫu/quy luật, mối tương quan và thông tin khác để hiểu rõ hơn về Trái đất của chúng ta.” Quá trình ESDA bao gồm 3 giai đoạn chính: i) Chuẩn bị dữ liệu (Preparation); ii) Thu gọn dữ liệu (Reduction); iii) Phân tích dữ liệu (Analysis).

 

Các đề tài liên quan

Không có đề tài nào liên quan.

Messenger