Professional Documents
Culture Documents
Nhanband
Nhanband
Data Replication
06/05/2024 Hoa.Nguyen@vnu.edu.vn
Distributed Databases – Department of Information Systems 1
VI . Nhân bản dữ liệu Cơ sở dữ liệu phân tán
Người dùng cần phải biết về sự nhân bản tùy theo mức độ trong suốt
được hỗ trợ
o Khi giao dịch cập nhật hoàn thành, có thể có bản sao chưa cập
nhật
o Nó sẽ được đồng bộ sau khoảng thời gian nào đó
Lịch trình tổng thể tuần tự: HA: T1→ T2, HB: T1→ T2
Dữ liệu nhất quán: xA=10, xB=10; yA= yB= 16
Lịch trình tổng thể phi tuần tự: HA: T1→ T2, HB: T2→ T1
Dữ liệu không nhất quán: xA=10, xB=6
Lịch trình tổng thể không tuần tự: HB: T1→T2, HC: T2→T3→T1
nhưng nhất quán dữ liệu: xA=xB=xC=20, yB=yC=35, zC=3.5
Ưu điểm:
o Mọi bản sao luôn đồng bộ, nhất quán mạnh
o Cập nhật các bản sao có tính nguyên tử, việc khôi phục khi bị
lỗi sẽ đơn giản
Nhược điểm:
o Giao dịch phải đợi tới khi mọi bản sao được cập nhật
Nói cách khác : tiến trình cập nhật có thể commit mà không
cần đợi các bản sao cập nhật. Cập nhật lan truyền có thể được
thực hiện sau khoảng thời gian nào đó.
Trong khoảng thời gian nhất định (tùy vào mỗi ứng dụng), các bản
sao có thể không nhất quán.
Distributed Databases – Department of Information Systems 14
3.2. Chiến lược cập nhật lan truyền
3.2.b. Chiến lược Lazy
Ưu điểm: Giảm thời gian chờ đợi commit của giao dịch
Việc cập nhật luôn phát sinh tại master, sau đó lan truyền tới
slave
Distributed Databases – Department of Information Systems 16
3.2. Chiến lược cập nhật lan truyền
3.2.c. Kiểu trung tâm hóa
Ưu điểm:
o Dễ cho ứng dụng cập nhật vì việc định vị cập nhật chỉ xảy ra
tại master.
o Luôn xác định ít nhất 1 site, trên đó dữ liệu được đã cập nhật
(up-to-date)
Nhược điểm:
o single master: quá tải cho master
o primary copy: hạn chế về tính nhất quán dữ liệu
Phát sinh cập nhật có thể xảy ra tại bất kỳ site (bản copy) nào.
Tức là có thể xảy ra tại site phát sinh ra giao dịch, sau đó lan
truyền tới site khác.
Eager Centralized
+ Dữ liệu luôn nhất quán + Luôn có 1 site luôn được cập
+ Đọc dữ liệu cục bộ luôn là hợp lệ nhật phản ánh đúng dữ liệu
+ Thay đổi có tính nguyên tử − Có thể quá tải tại master
− Giao dịch phải cập nhật mọi bản sao
− Dữ liệu cục bộ của thao tác đọc
− Thời gian chậm
có thể chưa được cập nhật
− Tính sẵn sàng thấp
Lazy Distributed
+ Các giao dịch thực hiện cục bộ, giảm + Giao dịch có thể khởi chạy tại
thời gian commit bất kỳ site nào
− Dữ liệu có thể không nhất quán, + Phân tải trên các site
− Hạn chế về tính trong suốt nhân bản − Việc đồng bộ trên các bản sao
sẽ phức tạp.
Lazy
Eager
Eager Centralized protocol Eager Distibuted protocol
Centralized Distributed
o Có một “trung tâm” cho mỗi dữ liệu logic. Giao dịch cập
nhật dữ liệu luôn thực hiện tại “trung tâm” rồi lan truyền
tới các bản sao.
o Lan truyền cập nhật tới các bản sao (copy) theo phương
thức “tích cực” (ngay lập tức)
o Commit chỉ xảy ra khi mọi bản sao đã được cập nhật
thành công.
Tại Slaves : Nhận và thực hiện thao tác ghi lan truyền từ master
Ứng dụng chuyển giao dịch chỉ đọc tới slave phù hợp
Tại Slave
o read: thi hành đọc dữ liệu
o write từ master : thực hiện ghi theo trật tự FIFO
o write từ client: từ chối
o commit : thực hiện commit cục bộ
o tham dự 2PC với master
Mỗi dữ liệu logic (gồm tập các bản sao vật lý) có một trung tâm
(master riêng biệt) có một TM riêng (cục bộ)
Lan truyền cập nhật với chiến lược tích cực
Tương ứng có 2 mức độ trong suốt nhân bản : hoàn toàn, giới
hạn; tuy nhiên chỉ xét tới kiểu trong suốt hoàn toàn.
Đặc điểm:
o Trình tự thực hiện (tương tranh) writes tại các site khởi tạo
(đóng vai trò như master); các site khác tương tự như đối với
các slave
o Lịch trình cục bộ là tuần tự