Download as txt, pdf, or txt
Download as txt, pdf, or txt
You are on page 1of 1

💻 Tháng 1: Luyện tập sử dụng Python với các tác vụ liên quan đến xử lý dữ liệu.

Đây là một ngôn ngữ sinh ra để làm dữ liệu, có nhiều thư viện được xây dựng giúp
cho việc xử lý dữ liệu được dễ dàng và hiệu quả.
💻 Tháng 2: Luyện tập sử dụng SQL và tối ưu câu truy vấn. Không chỉ đơn thuần là
truy vấn dữ liệu mà phải biết các truy vấn một cách tối ưu và tiết kiệm.
💻 Tháng 3: BigQuery & GCS - đây là bộ đôi thần thánh cho các Data Engineer khi làm
với Google Cloud Platform. Thực tế các doanh nghiệp lớn ở Việt Nam như MoMo hay
Tiki đã và đang sử dụng dịch vụ Cloud của Google cho hầu hết các tác vụ xử lý dữ
liệu của mình. Và 2 công cụ BigQuery & GCS đã chứng minh rất tốt vai trò của chúng
khi lưu trữ và xử lý hàng TB dữ liệu mỗi ngày. Xu hướng hiện tại chính là là mọi
dịch vụ sẽ lên “Mây” và khi nói về xử lý dữ liệu lớn, hay nghĩ đến Google đầu tiên.
For sure!!!
💻 Tháng 4: Luyện tập về Data Processing và sử dụng Airflow để quản lý pipeline ETL
dữ liệu. Đây cũng là một công cụ quốc dân khi xử lý dữ liệu giúp Data engineer quản
lý hàng trăm luồng dữ liệu khác nhau phục vụ cho các nhu cầu khác nhau.
💻 Tháng 5: Mở rộng thêm kiến thức về các công cụ nổi tiếng khác như là Kafka,
Spark để có cái nhìn toàn cảnh về Data Engineering và các phương án xử lý data khác
nhau khi đưa ra quyết định về mặt giải pháp.

You might also like