Download as doc, pdf, or txt
Download as doc, pdf, or txt
You are on page 1of 15

Câu 1:

Trong suốt di trú: che giấu việc tài nguyên chuyển đến địa
điểm khác

Truy cập:che giấu sự khác nhau trong biểu diễn dữ liệu và cách thức truy
cập tài nguyên
Địa điểm:che giấu vị trí của tài nguyên
Chuyển địa điểm: che giấu việc tài nguyên chuyển đến địa điểm khác trong
khi đang được sử dụng
Sao lưu: Che giấu việc dữ liệu được cung cấp từ nhiều bản sao khác nhau.
Tương tranh: che giấu việc tài nguyên được truy cập đồng thời bởi nhiều nsd
Thứ lỗi:Che giấu lỗi và quá trình phục hồi của tài nguyên.
Bền vững: che giấu việc tài nguyên/dl được lưu trữ bền vững(disk) hoặc
không(RAM)

Câu 2: Hệ thông CAN(Content Addresable Netwwork),chord


Có kiến trúc không tập trung,có cấu trúc

Câu 3:UDP là một giao thức :không hướng kết nối,không tin
cậy,không đồng bộ.

Câu 4: Đồng bộ hóa đồng hồ logic khác đồng bộ hóa vật lý ở điểm
nào?
Đồng bộ hóa đồng hồ logic sắp xếp các sự kiện thực hiện theo
đúng thứ tự chúng được kích hoạt. ***

Câu 5:Đâu là nhược điểm của giải pháp định danh dựa vào Home
Agent?
+ Mỗi khi muốn liên lạc với mọi thực thể,client phải liên lạc trc
tiên vs home agent dù nó ở rất xa.độ trễ trao đổi thông tin
+địa chỉ của home agent là tĩnh ..

Câu 6:Ht Linux dùng thủ tục gì để sinh ra 1 tiến trình nhẹ?
fork()
Câu 7: Vị trí của tầng Middleware trong hpt?
Nằm giữa tầng dos(tầng ứng dụng) và nos

Câu 8:Hệ thống phân tầng theo chiều ngang là?


Chỉ có một tầng và chia tải cho nh máy tính(cân = tải)

Câu 9 :PP định danh trong ht Chord có sd bảng băm phân tán.Mđ chính để
làm gì?
Tối ưu hóa việc tìm kiếm thực thể thay vì phải tìm tuần tự các nút
trong vòng

Câu 10: Tác dụng của đồng bộ hóa đồng hồ logic theo nguyên lý của
Lamport có tác dụng gì?
Đảm bảo thống nhất toàn cục cho quá trình gửi theo nhóm (totally
Ordered Multic asting)

Câu 11: Trong các kiểu kiến trúc server đa luồng ,kiến trúc luồng cho mỗi
kết nối (thread-per-connection) có ưu điểm gì?
K tốn nhiều overhead để hủy và tạo luồng
K cần queue

Câu 12: Trong ngôn ngữ lập trình Java ,lớp nào được dùng để khởi tạo 1
socket cho giao thức UDP?
DatagramSocket ***
Giao thức TCP là : ServerSocket

Câu 13 Vấn đề gặp phải trong cơ chế RPC khi truyền tham số là tham biến
Máy client và máy server có qui ước biểu diễn dl #

Câu 14 :Chỉ ra định nghĩa đúng nhất của hpt


Tập hợp các máy tính độc lập có kết nối vs nhau ,cung ứng dịch vụ cho
ng sd như một máy tính đơn duy nhất

Câu 15 Hệ thống Chord là một hệ thống Có kiến trúc k tập trung và có


cấu trúc
Câu 16 Trong các mô hình di trú mã ,mô hình di trú yếu (Weak mobility ) có
đặc điểm gì?
Chỉ di chuyển phần mã(code segment)

Câu 17 Trong các mô hình di trú mã ,mô hình di trú mạnh (Strong mobility )
có đặc điểm gì?
di chuyển phần mã(code segment) và phần trạng thái

Câu 18 Đâu k phải nhược điểm của cơ chế chuyển tiếp con trỏ ?
Khi 1 server stub k đk trỏ đến bởi bất kỳ client nào thì nó có thể bị
loại bỏ

Câu 19 Đặc điểm của hđh NOS là


Đảm bảo tính mở nhưng k đảm bảo tính trong suốt
DOS không Đảm bảo tính mở ,đảm bảo tính trong suốt
Middleware-based OS đảm bảo tính mở ,đảm bảo tính trong suốt

Câu 20 Hệ thống máy chủ biên (edge server system ) là ht:


Có kiến trúc hỗn hợp

Câu 21 Giao thức nào là giao thức cơ sở cho RPC?


Request-reply

Câu 23 Hệ thống phân tầng theo chiều dọc là?


Phân thành nh tầng ,mỗi tầng có chức năng riêng

Câu 24 : Trong kiến trúc hướng sự kiện,các thành phần hệ thống trao đổi
thông tin vs nhau thông qua các :
Sự kiện

Câu 26 Tại sao không đk dùng địa chỉ của Access Point như 1 tên của thực
thể?
Vì các thực thể có thể dịch chuyển từ AP này sang AP khác ..

Câu 27 : Nta gọi hệ thống phân tán hợp tác (CollaborTIVE Distric.. System)
là hệ thống có kiến trúc hỗn hợp là vì?
Kết hợp kiến trúc tập trung và kiên trúc không tập trung
Câu 28 :Đâu là ưu điểm của hướng tiếp cận xd bộ thư viện luồng chạy hoàn
toàn ở mức user mode
Tiết kiệm tài nguyên ht để tạo và hủy luồng và việc chuyển ngữ cảnh
đk thực hiện nhanh

Câu 29 Đặc điểm của hđh DOS là:


Đảm bảo ht có tính trong suốt lý tưởng tuy nhiên yêu cầu các thành
phần của ht phải hoàn toàn đồng nhất

Câu 31: Đặc điểm nào k phải của trao đổi thông tin hướng thông
điệp bền vững?
Yêu cầu độ trễ thời gian thấp

Câu 32: Mobile agent hoạt động trên cơ chế nào?


Kỹ thuật mã tự trị (autonomous code) mobile agent hoạt động
theo phương pháp này.
Tự quyết định đóng gói, không để lại bản sao và di trú đến đâu là
điểm khác biệt của mobile agent với hai kĩ thuật kéo mã(pull)v đẩy
mã(pushcode)

Câu 33 : Đâu k phải là đặc tính của 1 định danh(identifier)?


Khi một thực thể xóa đi ,định danh của nó sẽ đk dùng để gán cho 1 thực
thể #

Câu 34:Trao đổi thông tin hướng thông điệp bền vững đk áp dụng phù hợp
cho dịch vụ nào?
EMail

Câu 22 Nhược điểm của giải thuật tập trung trong nhóm các giải thuật loại
trừ lẫn nhau (mutual exclusion)là gì?
Tiến trình coordinator có nguy cơ bị quá tải do hiện tượng thắt nút cổ
chai

Câu 25 : Giao thức nào là giao thức điển hình của phương pháp quảng bá?
ARP

Câu 35: Để đảm bảo tính mở trong hpt,các thành phần muốn trao đổi
và phối hợp hoạt động vs nhau qua GiAO DIỆN
Câu 36:Vấn đề idempotent trong kiến trúc client-server là gì?
Vấn đề nảy sinh khi client k nhận đk thông báo nhận từ phía
server.Client sẽ k biết là do server chưa nhận đk yêu cầu hay thông điệp
bị mất trên đường truyền

Câu 37:Đâu là những ưu điểm trong việc sd các tiến trình nhẹ (lightweight
processes) trong cài đặt luồng :
+ Khi tiến trình có đủ số lightweight process thì nếu có 1 lời gọi blocking
system,nó sẽ k tắt toàn bộ tiến trình
* Nhược điểm:Việc tạo và hủy các tiến trình nhẹ có chi phí rất cao vì ở
tầng nhân .Tuy nhiên việc này diễn ra k thường xuyên
* Ưu điểm:
+ Các thao tác vs luồng có chi phí thấp và hoàn toàn k có sự can thiệp
của tầng nhân.
+ Khi một tiến trình có đủ các tiến trình nhẹ một lời gọi ht dừng sẽ k
làm dừng cả ht mà chỉ làm dừng 1 tiến trình nhẹ
+ Ứng dụng k cần phải biết về các tiến trình nhẹ ,nó chỉ nhìn thấy các
luồng ở mức user
+Tiến trình nhẹ có thể được sd trong môi trường đa vi xử lý,mỗi tiến
trình nhẹ gắn với một CPU

Câu 39: Khi trao đổi thông tin qua kết nối socket,lập trình viên khi xd
tiến trình client có cần phải gọi hàm bind() k?
K cần

Câu 38 Giao tiếp đồng bộ hóa và bất đồng bộ hóa khác nhau ntn?
Với giao tiếp đồng bộ thì cả thao tác gửi và nhận đều là các
thao tác dừng. Còn với giao tiếp không đồng bộ thì thao tác
gửi k là thao tác dừng.

Câu 40Trong trao đổi thông tin hướng dòng, việc thực thi QoS là
tác động vào tầng nào của hệ thống mạng?
Tầng mạng (IP)

1 Những đặc tính của mức tổng thể của hệ phân tán trong không gian
phân tán tên là gì?
A It is formed by highest-level nodes including the root one.
C Directory tables in this layer are rarely changed
D Nodes of this layer represent organizations or group of organizations

A Nó được hình thành bởi các nút cao nhất cấp bao gồm cả một gốc.
C Các bảng danh mục trong lớp này hiếm khi được thay đổi
D Các nút của lớp này đại diện cho các tổ chức hoặc nhóm các tổ chức

2Trong dịch cụ thư mục ngta dùng gì để tìm kiếm các thực thể?
The associated attributesof these entities:Các thuộc tính liên quan của các
thực thể.

3 Hệ thống GPS gặp phải vấn đề đồng hồ gì?


+ Tín hiệu phải mất một thời gian để gửi từ vệ tinh đến bộ thu
+ Đồng hồ của bộ thu không phù hợp với đồng hồ của vệ tinh

4 Thống nhất thứ tự toàn cục theo nhóm “totally-ordered multicast” là


gì?
(Vs những hệ thống mà csdl đk phân tán trên nh bản sao khác nhau để cái
thiện hiệu năng của toàn ht với việc dịch chuyển dl về phía gần ng dùng
hơn.có 1 yc đặt ra đó là đồng bộ dl trên tất cả bản sao dl đó nó yc đảm bảo
thống nhất toàn cục về thứ tự cập nhật gửi theo nhóm.
Các thông điệp gửi theo nhóm phải được đến với cùng thứ tự với tất cả các
bên nhận.
5 Thuật toán Berkeley hoạt động ntn?
The time daemon …
6 Các tiến trình thực hiện đồng bộ hóa ntn?
Multiple processes are ..(do not0

7 Chúng ta sd bộ đệm để giảm ảnh hưởng của jitter ntn?


Lưu trữ các gói tin nhận đk trong 1 bộ đệm trong 1 khoảng time.Việc làm
này sẽ giúp bên nhận sẽ gửi cacs gói tin đó đến cho bên nhận một cách đều
hơn.
8 mđ chính của FEC là gì?
Để phục hồi các gói tin bị mất.

9 Sự khác nhau giữa phân bố ngang và phân bố dọc là gì?


Phân bố dọc có nghĩa là các tầng khác nhau trong kiến trúc đa tầng,có nghĩa
là phân bố ngang đảm nhận sự phân phối trên 1 tầng đơn
10 Nếu 1 client và 1 server ở xa nhau cta có thể thấy độ trế time …cách
nào?
Chia các đoạn mã và cho chạy đọc lập;thay thế trao đổi thông tin bất đồng
bộ = trao đổi tt đồng bộ 1 chiều; thiết kế client sao cho nó làm việc khác
nhau..

11 Vai trò của Middleware trong hpt là gì?


+ Cải thiện độ trong suốt pt mà hđh còn thiếu
+Để cải thiện cái nhìn đơn ht mà ht pt cần có.

12 Tại sao không phải lúc nào cũng tốt khi cố triển khai mức độ trong
suốt ở mức cao nhất có thể?
+ nó có thể dẫn đến một mất mát đáng kể về hiệu năng ht mà ng dùng k
lường trc đk

13 Kiến trúc client-server 3 bên là gì?


Kt bao gồm 3 cặp client-server.

14 Ht email bao gồm? các mt k đồng nhất

15 mt cá nhân đk sd theo chế độ nào?


+1 mt nh ng sd
+ 1 mt 1 ngsd
16 Việc giới hạn số lượng luồng trong 1 tiến trình server k?
Có để tiết kiệm bộ nhớ, tránh việc giảm hiệu năng do vđ trào trang nhớ do
bộ nhớ ảo

18 What are the advantages of thread implementation in kernel-mode?


Lợi ích của việc thực hiện thread trong chế độ hạt nhân là gì?
Do not block the entire process(k chặn toàn bộ tiến trình)

19 Trong giao thức phân tầng,mỗi tầng có header riêng của mk để gắn
vào gói tin,có 1 cách làm khác là tổng hợp all các gói tin vào 1 header
duy nhất cho all các tầng.Tại sao cách này k đk áp dụng?
+ Mỗi tầng cần phải độc lập vs các tầng #
+ Có 1 phần header duy nhất để all các tầng cùng đọc và ghi sẽ khiến làm
mất tính trong suốt giữa các tầng
+ Nó làm cho các thay đổi của mỗi tầng sẽ khiến cho các tầng # biết đk.
20 Trong gt yêu cầu-trả lời server có gửi thông điệp báo nhận cho client
k?Why?
K Vì thông điệp trả lời cũng đóng vai trò của 1 thông điệp báo nhận

21 Trong trao đổi information,server có biết trc địa chỉ ip of cổng


socket client trc khi nhận k?
K , server biết đk thông tin sau khi nhận đk yc của client

22 Vai trò của trong hàng đợi thông điệp là gì?


it converts incoming message so that they can be understood by the
destination application Nó có vai trò chuyển đổi thông điệp chúng có thể
được hiểu bởi các ứng dụng đích.

23 Giao thức ARP là gì?


1 máy sẽ quảng bá 1 gói tin cho mạng nội bộ để hỏi ai có địa chỉ ip như vậy
,khi thông điệp đến mỗi máy,máy nhận sẽ kiểm tra xem có phải ip của mk k
nếu đúng sẽ gửi thông điệp trả lời tới địa chỉ ấy

24 Một định danh có cho phép chứa thông tin của thực thể mà nó chỉ
định?
Có nhưng thông tin đó không cho phép thay đổi vì nó sẽ kéo theo thay đổi
định danh.Nhưng định danh cũ vẫn tồn tại thực thể đó sẽ có 2 định danh trái
vs đặc tính thứ 2 của định danh

25 Cơ chế chuyển tiếp con trỏ gặp phải những vấn đề gì?
+ Chuỗi dài vô hạn
+ Lưu trữ vô số các tham chiếu
+ Khi 1 con trỏ tham chiếu bị hỏng k thể tìm đk thực thể đó.

26 điểm yếu của hướng tiếp cận homebase trong k gian tên phẳng là gì?
|+ ìt the home is far from the entity,the communication latency is increased
+ it must be ensured that the home location alwways exists

27 Liên kết vật lý là gì?


Multiple absolute paths names to refer to the same node in a naming graph.
28 Chỉ ra những ưu điểm quan trọng của phân giải k đệ quy?
+Caching results is more effective compared to iterative name resolution.
+ Communication costs are reduced
30 Có bao nhiêu thông điệp trong hpt đk sd trong giải thuật loại trừ lẫn
nhau?
2(n-1) với n là số tiến trình
31 Giải thuật vòng trong loại trừ lẫn nhau gặp phải vấn đề gì?
+ Mất token
+ Tiến trình bị lỗi
29: Đặc tính nào của RMI được coi là "kém" hơn RPC?
b. Tính mở
Câu 9: Phát biểu nào sau đây về socket là sai?
Các tiến trình có thể dùng chung 1 cổng để nhận thông điệp.
Câu 1: Tính trong suốt của Hệ Phân Tán là gì?
. Người sử dụng không thể biết chi tiết các hoạt động chi
tiết bên trong của hệ thống
:Câu 2: Tính mở của Hệ Phân Tán là gì?
Hệ thống đảm bảo các thành phần của các nhà sản xuất
khác nhau có thể kết nối và phối hợp lẫn nhau.
BÀI TẬP CHƯƠNG CONSISTENCY AND REPLICATION

Câu hỏi 1: Tại sao phải thực hiện sao lưu dữ liệu?
- Về độ tin cậy,thực hiện sao lưu dữ liệu sẽ giúp tăng tính
sẵn sàng của hệ thống.Rõ ràng khi có nhiều bản sao thì
chúng có thể makeup lẫn nhau trong trường hớp có bản
sao bị hỏng,bị treo.
- Về hiệu năng: người dùng có thể chọn các bản sao gần
nhất để yêu cầu phục vụ dịch vụ,từ đó giúp hệ thống có
chi phí kết nối rẻ nhất có thể.
- Về khả năng co dãn:hệ thống có thể phân tải cho các bản
sao để tăng khả năng phục vụ cho hệ thống.Tuy nhiên
khó đánh giá khả năng co giãn vì việc phân tải cho các
bản sao đó rất mất thời gian và phải đầu tư cho thuật
toán để thực hiện những tác vụ đó.Về mặt thuật toán gọi
là nhân bản.
- Ví dụ:Sao lưu giữa các server,giữa các client.
- Yêu cầu đặt ra là tất cả các dữ liệu phải giống nhau ở các
bản sao-Yêu cầu về tính thống nhất dữ liệu giữa các bản
sao trong hệ thống.

Câu hỏi 2: 1. Xét một kho dữ liệu phân tán với 5 tiến trình
độc lập P1, P2, P3, P4, và P5. Mỗi tiến trình chỉ tác động lên
được bản sao cục bộ riêng của mình. Các bản sao cục bộ kết
nối thành kho dữ liệu phân tán. Xét các tiến trình chỉ tương
tác (ghi, đọc) lên thành phần dữ liệu x ở bản sao cục bộ
riêng của mình. Hoạt động của mô hình ở các thời điểm t
tương ứng, các thao tác được thực hiện như sau:
t1: P1 ghi giá trị a
t2: P3 đọc giá trị a
t3: P2 ghi giá trị b và P3 ghi giá trị c
t4: P5 đọc được giá trị b
t5: P4 và P5 đều đọc được giá trị a
t6: P4 đọc được giá trị b
t7: P4 và P5 đọc được giá trị c
(biết rằng ti < ti+1 với i=(1..6)
Câu hỏi:
a) Mô hình trên có thoả mãn thống nhất nhân quả không?
Giải thích.
b) Mô hình trên có thoả mãn thống nhất tuần tự không? Giải
thích.

Trả lời:

Từ thứ tự trên ta được bảng

P1: W(x)a

P2: W(x)b

P3: R(x)a W(x)c

P4: R(x)a R(x)b R(x)c

P5 R(x)b R(x)a R(x)c


a)Dễ thấy mô hình trên thỏa mãn thống nhất nhân quả. Với W(x)b và
W(x)a, W(x)b và W(x)c là 2 thao tác ghi tương tranh -> không cần
thỏa mãn nhân quả, với W(a) và W(c) cần thỏa mãn nhân quả do P3
thực hiển R(x)a trước W(x)c. ta thấy ở P4 và P5 đều có thứ tự R(x)a
trước R(x)c sau -> thỏa mãn nhân quả.

b)Tương tự mô hình không thỏa mãn thống nhất tuần tự, do ta thấy
ở P4 và P5 có thứ tự R(x)a và R(x)b ngược nhau -> không thỏa mãn
tính tuần tự

Câu hỏi 3: Conit là gì? Nếu đặt kích thước Conit quá lớn thì
sẽ gây ra vấn đề gì? Tương tự với kích thước Conit quá nhỏ?
- Conit dùng để định nghĩa độ không thống nhất từ đó
dùng để đánh giá độ thống nhất.
* Kích thước conit:
Kích thước conit cần phải được lựa chọn khi cài đặt:
+ Sỗ lượng conit ít ,kích thước conit lớn thì khả năng xuất
hiện sai lệch cao dẫn đến chi phí cao.Đặc biệt không hiệu
quả với các dữ liệu độc lập.
VD:Sau khi các thao tác cập nhật thứ 2 thì cần tiếp tục cập
nhật bản sao 2
+Nếu số lượng conit nhiều, Kích thước conit nhỏ thì sẽ giảm
khả năng xuất hiện sai lệch.Tuy nhiên chi phí đối với quản lý
bản sao lớn
- Nếu đặt kích thước Conit quá lớn thì các bản sao sẽ sớm
bị rơi vào trạng thái không thống nhất
- Nếu đặt kích thước Conit quá nhỏ:số lượng conit
nhiều:quản lý phức tạp.

Câu hỏi 4: Tại sao thống nhất nhân quả có tính thống nhất
yếu hơn thống nhất tuần tự? Cho ví dụ để làm rõ điều này.
Thống nhất nhân quả có tính thống nhất yếu hơn thống
nhất tuần tự vì: thống nhất nhân quả không yêu cầu các
thao tác ghi tương tranh phải thống nhất thứ tự toàn cục.
VD:
P1: W(x)a
P2: W(x)b
P3: R(x)b R(x)a
P4: R(x)a R(x)b
Trong ví dụ trên không có thao tác đọc R2(x)a nữa.Vì vậy
W1 và W2 được coi là 2 thao tác ghi tương tranh. Thống
nhất nhân quả không yêu cầu các thao tác ghi tương tranh
phải thống nhất thứ tự toàn cục.Vì vậy mô hình này thỏa
mãn thống nhất nhân quả nhưng không thỏa mãn thống
nhất tuần tự.

Câu hỏi 5: Vấn đề của mô hình Eventual Consistency là gì?


Từ đó đưa ra định nghĩa mô hình thống nhất hướng client.
Vấn đề của mô hình Eventual Consistency là:Nếu tiến
trình khách luôn luôn truy cập vào một bản sao dẫn đến
thống nhất luôn được đảm bảo. Nếu tiến trình khách truy
cập vào các bản sao khác nhau thì đó trở nên vấn đề.
Mô hình thống nhất hướng client cung ứng đảm bảo thống
nhất cho các truy cập của một client đơn vào kho dữ liệu.
Câu hỏi 6: Một ngân hàng quyết định sử dụng dịch vụ CDN
(Content Delivery Network) của một công ty mới khởi nghiệp
cung cấp.
a) Với bước đặt máy chủ, công ty chọn thuật toán chọn đặt
các máy chủ bản sao (replica) dựa trên khoảng cách với các
chi nhánh ngân hàng. Hãy đề xuất thuật toán chọn đặt k
replica với N vị trí có thể đặt máy chủ. Biết rằng đây là thuật
toán dựa trên khoảng cách và công ty biết trước các vị trí
các chi nhánh ngân hàng.

Có 2 giải pháp chính:

Giải pháp 1: Dựa vào khoảng cách tới các client giúp giảm tối đa khoảng
cách trung bình từ các bản sao tới các bản sao khác và client. Sau khi đã lựa
chọn (k-1) bản sao sẽ xác định bản sao thứ k để khoảng cách trung bình từ
bản sao đến các client là nhỏ nhất, khoảng cách có thể được đo bằng thời
gian hoặc các tiêu chí khác.

Giải pháp 2: Không phụ thuộc vào vị trí client, được thực hiện như sau: hệ
thống sẽ được chia thành các hệ tự trị (cell-autonomous systems-AS), sau đó
giải thuật sẽ chọn AS lớn nhất và đặt server ở vị trí có nhiều link nhất, tiếp
tục lần lượt đặt server vào các AS nhỏ hơn cho đến hết server.
b) Với thuật toán để quản lý nội dung dữ liệu ở các replica,
công ty quyết định chọn thuật toán dựa trên bản sao kích
hoạt bởi server (server-initiated replicas). Hãy mô tả cơ chế
đó với việc xem xét một đơn vị dữ liệu X là thông tin tài
khoản một người dùng cùng với 2 ngưỡng là del(X) và
rep(X).

Cơ chế: Mỗi server theo dõi số lượng và nguồn gốc các truy cập vào từng
phần tử dữ liệu

Với ngưỡng dell(X): khi số lượng truy cập vào phần tử dữ liệu X xuống dưới
giá trị ngưỡng dell(X) thì phần tử đó sẽ bị xóa khỏi server, nếu làm như vậy
số lượng các bản sao giảm xuống dẫn đến tăng tải cho các server khác, từ đó
cần có cơ chế đảo bảo tồn tại 1 bản sao của các phần tử dữ liệu

Với ngưỡng rep(X): khi số lượng truy cập vượt quá rep(X) server sẽ tạo các
bản sao mơi trên các server khác.

Nếu không rơi vào các trường họp trên tức là các yêu cầu nằm giữa khoảng
dell(X) và rep(X) thì sẽ giữ nguyên số lượng các bản sao, chuyển bản sao
đến server có số lượng truy cập lớn hơn.

c) Liên quan đến giao thức đảm bảo thống nhất, công ty
quyết định chọn giao thức ghi trên các bản sao (replicated
write), tuy nhiên công ty băn khoăn giữa giao thức sao lưu
tích cực và giao thức sao lưu dựa trên túc số. Bạn hãy giúp
công ty lựa chọn giao thức phù hợp bằng việc so sánh 2 giao
thức trên với việc chỉ ra ưu nhược điểm của chúng.

Sao lưu tích cực Sao lưu dựa trên túc số


Một tiến trình chịu trách nhiệm phổ Sao lưu theo vote-giải thuật quorum:
biến thao tác cập nhật đến tất cả các
bản sao + Để có thống nhất mạnh => cần cập
nhật tất cả các bản sao
Cần có 1 cơ chế trật tự toàn cục gọi
là totol ordered mechanism: + Sau khi cập nhật với chi phí tốn
kém => không phải tất cả các bản
+ Có thể sử dụng thời gian logic của sao đều được đọc => chi phí vô ích
Lamport => không co dãn được Khi đọc dữ liệu:

+ Có thể sử dụng sequencer đảm bảo + Có khả năng đọc phải dữ liệu cũ
trật tự toàn cục
+ Đọc thêm dữ liệu ở một số bản
sao khác => lựa chọn bản sao có dữ
liệu mới nhất

Câu hỏi 7: Liên quan đến các mô hình thống nhất hướng dữ
liệu và các mô hình thống nhất hướng người dùng:
a. Giải thích vắn tắt ý tưởng của 2 loại mô hình thống nhất
hướng dữ liệu trên.
b. Một công ty startup mới mở chuyên triển khai thương mại
hóa dịch vụ CDN (Content Delivery Network) cho 2 loại hình
dịch vụ là thư điện tử và WWW. Để đảm bảo thống nhất dữ
liệu cho 2 loại dịch vụ đó thì tầng middleware sẽ áp dụng mô
hình thống nhất dữ liệu nào (ở câu a) cho mỗi loại dịch vụ
trên? Giải thích.
c. Công ty đó triển khai 3000 server bản sao vật lý và chọn
hình thức sao lưu dữ liệu dựa trên túc số (quorum) với Nw =
1600 và Nr = 1100. Vậy hệ thống đó sẽ tránh được xung đột
đọc-ghi và xung đột ghi-ghi hay không? Giải thích.
Trả lời
a. * Với mô hình thống nhất hướng dữ liệu hướng cung cấp một khung
nhìn chung cho kho dữ liệu trên cả hệ thống.Vì vậy khi có thao tác cập
nhật,thao tác này cần được phổ biến trên các bản sao khác.Điều đó dẫn
tới chi phí tốn kém và chưa chắc các tiến trình đã sử dụng phần tử dữ
liệu.Giải pháp đưa ra đó là chỉ cập nhật với các tiến trình nào có sử dụng
dữ liệu, các tiến trình khác thì thôi;đảm bảo các tiến trình sử dụng dữ
liệu có một khung nhìn thống nhất về dữ liệu.Đây là ý tưởng của mô
hình thống nhất hướng người dùng.
* Mô hình thống nhất là mô hình trừu tượng các yêu cầu thống nhất.Các yêu
cầu thống nhất có thể dựa trên nhiều tiêu chí đánh giá :
+ Giá trị thực thể của dữ liệu
+ Thứ tự thực tế các thao tác dữ liệu
..
Mức độ thống nhất mà kho dữ liệu đảm bảo khi tiến trình đọc, dữ liệu trả về
luôn luôn là dữ liệu của thao tác ghi cuối cùng .Nếu mức độ thống nhất lỏng
thì quá trình thực hiện là đồng bộ ,nếu là chặt là toàn cục .Nếu là thực hiện
mô hình thống nhất lỏng thì là ràng buộc thao tác đọc nhiều và dễ thực
hiện.Đối với chặt sẽ là ràng buộc thao tác đọc ít và sẽ khó thực hiện.Ngoài
ra yêu câu thống nhất còn liên quan đến thỏa thuận mà kho dữ liệu cung cấp
cho các tiến trình.Mức độ thống nhất mà kho dữ liệu đảm bảo cung cấp cho
các tiến trình cần có một mô hình tìm hiểu tính thống nhất và so sánh đánh
giá các phương pháp sao lưu. Đây là ý tưởng của mô hình thống nhất hướng
dữ liệu
b. Để đảm bảo thống nhất dữ liệu cho 2 loại dịch vụ đó thì
tầng middleware sẽ áp dụng mô hình thống nhất dữ liệu
hướng người dùng cho loại hình dịch vụ WWW.Vì với loại
hình dịch vụ này công ty cần cung cấp một kho dữ liệu cho
từng người dùng đơn mà mô hình thống nhất hướng người
dùng lại cung ứng đảm bảo thống nhất cho các truy cập của
một client đơn vào kho dữ liệu.
Để đảm bảo thống nhất dữ liệu cho 2 loại dịch vụ đó thì
tầng middleware sẽ áp dụng mô hình thống nhất dữ liệu
hướng client cho loại hình dịch vụ thư điện tử .Vì chủ yếu các
tiến trình thực hiện đọc rất ít các tiến trình thực hiện cập
nhật.
c. Công ty đó triển khai 3000 server bản sao vật lý và chọn
hình thức sao lưu dữ liệu dựa trên túc số (quorum) với Nw =
1600 và Nr = 1100. Vậy hệ thống đó sẽ tránh được xung đột
đọc-ghi và xung đột ghi-ghi hay không? Giải thích.
Ta thấy Nw+Nr = 2700< 3000 -> không tránh được xung đột đọc-ghi
Nw =1600 > 3000/2 = 1500 -> tránh được xung đột ghi- ghi

You might also like