Download as docx, pdf, or txt
Download as docx, pdf, or txt
You are on page 1of 3

- Kết nối JDBC :

--connect jdbc:mysql://mysqlserver/mydatabase
--user myuser
--password mypassword

- Liệt kê tất cả các cơ sở dữ liệu / bảng (list-tables):

$ sqoop list-databases --username myuser –P \


--connect jdbc:mysql://dbserver.example.com

- Nhập bảng từ CSDL thử nghiệm :


$ sqoop import-all-tables \
--username myuser --password mypassword \
--connect jdbc:mysql://dbserver.example.com/test
--warehouse-dir /some/directory/path (chỉ định thư mục lưu)

- Nhập bảng vào HDFS mặc định :


$ sqoop import \
--table sometable \
--connect jdbc:mysql://dbhost/somedatabase \
--username somename --password somepassword
--target-dir /some/other/directory (chỉ định vị trí lưu khác)

- Nhập cột và hàng được chỉ định :


$ sqoop import \
--table sometable \
--connect jdbc:mysql://dbhost/somedatabase \
--username somename --password somepassword \
--columns "fname, lname, address, state, zip" (cột)
--where " state='CA' " (hàng)

- Chỉ định dấu tách văn bản :


$ sqoop import \
--table sometable \
--connect jdbc:mysql://dbhost/somedatabase \
--username somename --password somepassword \
--fields-terminated-by '\t'

- Định dạng dữ liệu :

$ sqoop import \
--table sometable \
--connect jdbc:mysql://dbhost/somedatabase \
--username somename --password somepassword \
--as-parquetfile
- Tuỳ chọn nén :
$ sqoop import \
--table sometable \
--connect jdbc:mysql://dbhost/somedatabase \
--username somename --password somepassword \
--compress --compression-codec \
org.apache.hadoop.io.compress.SnappyCodec

- Chế độ nhập thêm tăng dần append:


$ sqoop import \
--table sometable \
--connect jdbc:mysql://dbhost/somedatabase \
--username somename --password somepassword \
--incremental append \
--check-column some_id --last-value 245

- Chế độ nhập tăng dần LastModified :


$ sqoop import \
--table sometable \
--connect jdbc:mysql://dbhost/somedatabase \
--username somename --password somepassword \
--incremental lastmodified \
--check-column some_timestamp \
--last-value "2021-06-26 18:19:25"

- Nhập dựa trên truy vấn :


$ sqoop import \
--connect jdbc:mysql://dbhost/somedatabase \
--username somename --password somepassword \
--query 'SELECT a.*, b.* from a JOIN b on (a.id == b.id) WHERE $CONDITIONS' \
--split-by a.id --target-dir /user/myuser/results

- Xuất dữ liệu sang RDBMS :


$ sqoop export \
--connect jdbc:mysql://dbhost/somedatabase \
--username somename --password somepassword \
--table sometable \
--export-dir /path/to/data/directory

- Cập nhật bảng RDBMS:


$ sqoop export \
--connect jdbc:mysql://dbhost/somedatabase \
--username somename --password somepassword \
--table sometable \
--export-dir /path/to/data/directory \
--update-key some_column
- Cập nhật hoặc chèn bảng RDBMS :
$ sqoop export \
--connect jdbc:mysql://dbhost/somedatabase \
--username somename --password somepassword \
--table sometable \
--export-dir /path/to/data/directory \
--update-key some_column \
--update-mode allowinsert

- Chạy truy vấn đơn giản :


$ sqoop eval \
--connect jdbc:mysql://dbhost/somedatabase \
--username somename --password somepassword \
--query "SELECT * from MYTABLE LIMIT 10"

- Tạo job :
$ sqoop job --create jobId -- import \
--connect jdbc:mysql://dbhost/somedatabase \
--username somename --password somepassword \
--table sometable

$ sqoop job --list


Available jobs:
Myjob

$ sqoop job --exec myjob

You might also like