Professional Documents
Culture Documents
Bigdata - Mini Project (Mapreduce - Hive)
Bigdata - Mini Project (Mapreduce - Hive)
Mục tiêu của project này là thực hiện phân tích cảm xúc trên tập dữ liệu
Twitter và tìm các tweet tích cực, tiêu cực và trung tính. Sử dụng Hive và
MapReduce cùng với danh sách AFINN-111 để thực hiện phân tích.
Các bước:
Phân tích tập dữ liệu ở định dạng JSON và xóa tất cả các ký hiệu đặc
biệt, siêu liên kết khỏi các tweet.
Tính giá trị cảm xúc của tweet
Đầu ra: Id , Tweet được xử lý và giá trị cảm xúc của tweet đó.
Tải dữ liệu đã xử lý vào Hive và thực hiện phân tích cảm xúc.
Hướng dẫn này sẽ được chia làm 2 phần. Đây là hướng file hướng dẫn phần 1 của Project
PHẦN 1 - MAPREDUCE
Toàn bộ dữ liêu và source code có tại link Github trong phần mô tả: https://github.com/nv-thang/BigDataTraining
Download
PHẦN 1 - MAPREDUCE