Download as docx, pdf, or txt
Download as docx, pdf, or txt
You are on page 1of 2

MỘT SỐ CÂU HỎI ÔN TẬP THI GIỮA KỲ MÔN

NHẬP MÔN DỮ LIỆU LỚN


HKI 2020 – 2021

Phần lý thuyết
1. Big Data là gì?
2. Các đặc trưng của Big Data.
3. Giới thiệu về hệ thống Hadoop. Các thành phần của hệ sinh thái Hadoop.
4. Giới thiệu về hệ thống Spark.
5. So sánh Hadoop và Spark.
6. HDFS là gì? Kiến trúc HDFS?
7. NameNode là gì? DataNode là gì? Vai trò của chúng?
8. Mô hình MapReduce là gì? Hoạt động MapReduce?

Phần thực hành


Mỗi nhóm (2-3 SV) thực hiện các chức năng sau:
1. Hoàn thiện tất cả các bài lab đã làm trên lớp
2. Trả lời vấn đáp các câu hỏi liên quan đến các bài lab

Một số nguồn tham khảo:


[1] Tài liệu GV đã cung cấp
[2] https://topdev.vn/blog/hadoop-la-gi/
[3] https://iot1995.wordpress.com/2018/04/13/hdfs-la-gi/
[4] https://blog.itnavi.com.vn/mapreduce-nhung-uu-diem-va-cach-thuc-hoat-dong-
cua-nen-tang-nay/
[5] https://data-flair.training/blogs/big-data-hadoop-quiz-part-1/
[6] https://data-flair.training/blogs/apache-spark-online-quiz-part-1/
[7] Google

You might also like