Download as pdf or txt
Download as pdf or txt
You are on page 1of 25

ĐẠI HỌC QUỐC GIA HÀ NỘI

TRƯỜNG ĐẠI HỌC CÔNG NGHỆ


---------------------------------

ĐỀ TÀI: BÁO CÁO SPATIAL DATA MANAGEMENT

Lớp môn học: INT3202_3 - Hệ quản trị cơ sở dữ liệu


Nhóm : 6
Thành viên: Trần Xuân Đức - 19020257
Lữ Thị Thùy Linh - 19020172
Đặng Thị Hà Ngân - 19020382
Đinh Thanh Nhàn - 19020387

1
Mục lục
Trang
I. Giới thiệu 3
1. Cơ sở dữ liệu không gian là gì? 3
2. Đặᴄ trưng ᴄủa CSDL không gian 3
3. Quản lý cơ sở dữ liệu không gian 3
4. Lịch sử phát triển của quản lý dữ liệu không gian 4
II. Dữ liệu không gian 5
1. Các kiểu dữ liệu không gian 5
1.1. Dữ liệu điểm
1.2. Dữ liệu vùng
2. Các mối quan hệ không gian 6
2.1. Mối quan hệ topo 6
2.2. Mối quan hệ theo hướng 7
2.3. Mối quan hệ dựa trên khoảng cách 8
3. Truy vấn không gian 8
3.1. Truy vấn theo phạm vi không gian 8
3.2. Truy vấn láng giềng gần nhất 10
3.3. Truy vấn liên kết không gian 11
III. Lập chỉ mục 14
1. B+ tree 14
2. R tree 15
3. Q tree 17

IV. Một số ứng dụng của công nghệ quản lý dữ liệu không gian 18
1. Quản lý dữ liệu không gian-thời gian 18
2. Quản lý dữ liệu chiều cao 19
3. GIS 21
Tài liệu tham khảo 24
2
I. Giới thiệu
1. Cơ sở dữ liệu không gian là gì?
Là một hệ thống csdl quan hệ cung cấp các kiểu dữ liệu không gian trong mô hình
dữ liệu và các ngôn ngữ truy vấn. Các kiểu dữ liệu không gian như: Point, Line, Polygon...
CSDL cung cấp mô hình trừu tượng cơ bản cho cấu trúc của thực thể hình học trong không
gian cũng như mối quan hệ giữa chúng như: giao nhau, thuộc nhau…
Với CSDL không gian khi mà áp dụng với bất kỳ ngôn ngữ hay hệ quản trị nào thì
việc đánh chỉ mục(index) cho loại dữ liệu này là khá quan trọng, nó giúp ích cho việc tối ưu
hóa truy vấn dữ liệu, giảm thời gian truy vấn và giảm bộ nhớ lưu trữ..
2. Đặᴄ trưng ᴄủa CSDL không gian
Cơ ѕở dữ liệu không gian ѕử đụng đánh ᴄhỉ mụᴄ không gian để tăng tốᴄ hoạt động
ᴄủa ᴄơ ѕở dữ liệu. Ngoài ᴄáᴄ truу ᴠẫn SQL điển hình như ᴄâu lệnh SELECT, CSDL không
gian ᴄó thể thựᴄ thi đa dạng ᴄáᴄ thao táᴄ không gian như:
● Đo lường không gian : nó ᴄó khả năng tìm khoảng ᴄáᴄh giữa ᴄáᴄ điểm, ᴄáᴄ
ᴠùng…
● Hàm không gian : ᴠí dụ như, ѕửa đối ᴄáᴄ hàm hiện thời để tạo ra những
hình mới: hàm tìm điểm haу ᴠùng giao nhau…
● Xáᴄ nhận không gian : nó ᴄho phép thựᴄ hiện những truу ᴠấn True/Falѕe.
● Hàm tạo : tạo ra ᴄáᴄ hình mới, như ᴄhỉ ra ᴄáᴄ điểm nút ᴄó thể tạo nên
đường haу nếu đỉnh đầu ᴠà đỉnh ᴄuối trùng nhau, ᴄhúng ᴄó thể tạo nên một
đa giáᴄ.
● Hàm theo dõi : ᴄáᴄ ᴄâu truу ᴠấn trả ᴠề thông tin ᴄụ thể như : ᴠị trí tâm ᴄủa
một đường tròn haу điểm đầu, điểm ᴄuối ᴄủa một đường
3. Quản lý cơ sở dữ liệu không gian
Quản lý cơ sở dữ liệu không gian liên quan đến việc lưu trữ, lập chỉ mục và truy vấn
dữ liệu với các đặc điểm không gian, chẳng hạn như vị trí và phạm vi hình học. Nhiều ứng
dụng yêu cầu quản lý hiệu quả dữ liệu không gian, bao gồm Hệ thống Thông tin Địa lý,
Thiết kế Hỗ trợ Máy tính và Dịch vụ Dựa trên Vị trí. Mục tiêu của cuốn sách này là cung
cấp cho người đọc một cái nhìn tổng quan về công nghệ quản lý dữ liệu không gian, trong
đó chú trọng đến các kỹ thuật lập chỉ mục và tìm kiếm. Đầu tiên, nó giới thiệu các mô hình
và truy vấn dữ liệu không gian và thảo luận các vấn đề chính của việc mở rộng hệ thống cơ
sở dữ liệu để hỗ trợ dữ liệu không gian. Nó trình bày các cách tiếp cận lập chỉ mục cho dữ
liệu không gian, tập trung vào R-tree. Các kỹ thuật đánh giá và tối ưu hóa truy vấn cho các
loại truy vấn không gian phổ biến nhất (lựa chọn, tìm kiếm láng giềng gần nhất và kết nối
không gian) được mô tả cho dữ liệu trong không gian Euclide và mạng không gian. Cuốn
3
sách kết thúc bằng cách chứng minh ứng dụng phong phú của công nghệ quản lý dữ liệu
không gian trên một loạt các lĩnh vực ứng dụng liên quan: quản lý dữ liệu không gian-thời
gian và vectơ đặc trưng chiều cao, xếp hạng đa tiêu chí, khai thác dữ liệu và OLAP, xuất
bản dữ liệu bảo vệ quyền riêng tư và tìm kiếm từ khóa theo không gian.
4. Lịch sử phát triển của quản lý dữ liệu không gian
Vào những năm 1980, quản lý dữ liệu không gian bắt đầu như một phần mở rộng
cho công nghệ cơ sở dữ liệu quan hệ hiện có để hỗ trợ các loại dữ liệu phức tạp hơn được
tìm thấy trong hệ thống thông tin địa lý. Trong thập kỷ đầu tiên này, trọng tâm nghiên cứu là
các phương pháp lập chỉ mục thích hợp cho dữ liệu không gian, do sự thiếu sót của các chỉ
mục quan hệ, như B – tree. Điều này dẫn đến sự phát triển của một loạt các chỉ số. Những
năm 1990, với sự xuất hiện của mô hình hướng đối tượng (OO), trọng tâm chuyển sang mô
hình cơ sở dữ liệu không gian bằng cách sử dụng trực tiếp OO hoặc mở rộng mô hình quan
hệ. Những nỗ lực sau này đã dẫn đến định nghĩa về mô hình quan hệ đối tượng (OR), mô
hình này hiện được hầu hết các DBMS sử dụng. Ngoài ra, cộng đồng xử lý việc xử lý hiệu
quả các truy vấn không gian, như các truy vấn hàng xóm gần nhất hoặc các phép nối không
gian và các chỉ mục đầu tiên cho dữ liệu trên mạng không gian (đường) đã được phát triển.
Vào những năm 2000, nghiên cứu đã phù hợp với các xu hướng gần đây và nhu cầu ứng
dụng: quản lý dữ liệu theo không gian-thời gian, đánh giá liên tục các truy vấn không gian
về dữ liệu truyền trực tuyến, quản lý dữ liệu để lưu trữ và khai thác dữ liệu không gian, truy
xuất thông tin địa lý.
Cụ thể:
- Trong năm 1970, một số hệ thống giống GIS xử lý việc lập bản đồ tự động và
quản lý cơ sở vật chất đã được phát triển; mục tiêu của họ là số hóa bản đồ của cơ sở hạ
tầng thành phố (ví dụ: đường ống hoặc đường dây tải điện). Ngoài ra, các GIS ban đầu đã
được phát triển để quản lý dữ liệu (ví dụ: thủy văn). Tất cả các hệ thống này là độc lập và
được lưu trữ dữ liệu trực tiếp trên các hệ thống tệp.
- Kể từ năm 1981, ESRI đã dẫn đầu sự phát triển của GIS thương mại, với loạt
ArcInfo (hiện được tích hợp vào hệ thống ArcGIS). ArcInfo, hiện đã có phiên bản thứ 10, là
một GIS chính thức hỗ trợ cả mô hình dữ liệu trường và không gian vectơ. Các GIS khác
được biết đến bao gồm Mapinfo (từ 1986), GE Smallworld GIS (từ 1990) và GRASS GIS
mã nguồn mở (từ 1997). Các nhà cung cấp DBMS lớn đã mở rộng sản phẩm của họ để xử
lý dữ liệu không gian.
- Kể từ năm 1995, Informix (sau đó được IBM mua lại) bao gồm hỗ trợ dữ liệu
không gian và triển khai chỉ mục R-cây. Oracle đã bao gồm các khả năng dữ liệu không
gian cơ bản ngay từ năm 1984. Khi Oracle 8 được phát hành vào năm 1997, nó bao gồm
phần mở rộng Oracle Spatial, với hỗ trợ tìm kiếm và lập chỉ mục không gian hoàn thiện.
DB2 của IBM bao gồm Bộ mở rộng không gian từ cuối những năm 1990, hỗ trợ các kiểu dữ
liệu không gian, các vị từ không gian và lập chỉ mục không gian dựa trên lưới.
4
- Trong bản phát hành năm 2008, Microsoft SQL Server đã cung cấp hỗ trợ quản
lý dữ liệu không gian, với sự lựa chọn về lập chỉ mục (lưới nhiều lớp, đường cong lấp đầy
không gian và cây B). Máy chủ truy vấn không gian của Công ty Boeing (từ năm 2006) là
một sản phẩm có sẵn trên thị trường cho phép cơ sở dữ liệu Sybase chứa các tính năng
không gian.
II. Dữ liệu không gian
Thuật ngữ dữ liệu không gian (spatial data) được sử dụng theo nghĩa rộng, bao gồm
các điểm đa chiều, các đường thẳng, hình khối... và các đối tượng hình học nói chung. Mỗi
đối tượng dữ liệu này chiếm một vùng không gian (spatial extent) được đặc trưng bởi hai
thuộc tính vị trí (location) và biên (boundary).
1. Các kiểu dữ liệu không gian
Dưới góc nhìn từ một hệ quản trị cơ sở dữ liệu, có thể phân chia dữ liệu không gian
thành hai kiểu: dữ liệu điểm (point data) và dữ liệu vùng (region data)
1.1. Dữ liệu điểm
Với kiểu dữ liệu này, không gian ứng với một điểm được đặc trưng bởi tọa độ của
nó; theo trực giác thì nó không chiếm một vùng không gian hay một đơn vị thể tích nào cả.
Dữ liệu điểm là tập hợp các điểm trong không gian nhiều chiều, được lưu trữ trong CSDL
dựa trên các tọa độ được tính toán trực tiếp, hoặc được sinh ra nhờ quá trình chuyển hóa dữ
liệu thu được từ các phép đo khiến cho việc lưu trữ và thực hiện truy vấn trở nên dễ dàng
hơn. Chẳng hạn Raster data là một ví dụ dữ liệu điểm được lưu trữ trực tiếp thông qua các
bit maps hoặc pixel maps (chẳng hạn như ảnh vệ tinh, hoặc phim điện não đồ 3 chiều, …).
Trong khi đó, feature vectors data được lưu trữ thông qua các dữ liệu được trích chọn,
chuyển đổi từ một đối tượng dữ liệu điểm (thu được từ ảnh, văn bản...). Có thể thấy rằng, sử
dụng các dữ liệu đã được biểu diễn để trả lời các truy vấn luôn dễ dàng hơn sử dụng ảnh
hoặc ký hiệu nguyên bản
1.2. Dữ liệu vùng
Được xác định dựa trên tập các vùng không gian (spatial extents), trong đó mỗi
vùng được đặc trưng bởi hai thuộc tính vị trí và biên. Dữ liệu vùng được lưu trữ trong
CSDL như một đối tượng hình học đơn giản, xấp xỉ đúng với đối tượng dữ liệu thực sự.
Việc mô tả các phép xấp xỉ đó được đặc tả thông qua vector dữ liệu, được xây dựng từ các
điểm, các đoạn thẳng, các hình đa giác, hình cầu, hình ống... Rất nhiều ví dụ dữ liệu vùng
được đưa ra trong các ứng dụng địa lý, chẳng hạn đường xá, sông ngòi có thể được biểu
diễn dưới dạng tập hợp của các đoạn thẳng; quốc gia, thành phố có thể được biểu diễn dưới
dạng các hình đa giác…

5
2. Các mối quan hệ không gian
Là mối quan hệ giữa các đối tượng không gian theo vị trí không gian và cách sắp
xếp không gian của chúng. Ba loại quan hệ không gian chung đã được xác định: quan hệ
dựa trên khoảng cách, quan hệ tôpô và quan hệ hướng.
2.1. Mối quan hệ topo
Là mối quan hệ logic giữa vị trí của các đối tượng không gian. Loại quan hệ không
gian này không bị ảnh hưởng bởi sự biến đổi liên tục, chẳng hạn như kéo dài, dịch chuyển,
quay hoặc uốn cong của các đối tượng không gian liên quan.
Tùy thuộc vào kiểu hình học của hai đối tượng địa lý liên quan, giữa chúng có thể
tồn tại các tập hợp các quan hệ tôpô khác nhau như là: Giao nhau(intersects), bằng(equals),
bên trong(inside)/được chứa bởi(contained by), chứa(contains), liền kề(adjacent), chồng
chéo(overlaps) hoặc phân chia(disjoint) với việc minh họa một hệ thống phân cấp các mối
quan hệ tôpô đơn giản có thể tồn tại giữa hai đối tượng như đồ thị sau:

Cụ thể hơn về các mối quan hệ topo giữa hai đối tượng không gian được minh họa
qua 2 bảng:

Bảng 1. Phân loại một số mối quan hệ tôpô phổ biến giữa hai đối tượng không gian

6
Bảng 2. Phân loại một số mối quan hệ tôpô phổ biến giữa hai đối tượng không gian bằng biểu thức logic

Trong đó: interior(𝑜𝑖) là vùng nội địa của đối tượng 𝑜𝑖


boundary(𝑜𝑖) là ranh giới(biên) của đối tượng 𝑜𝑖

2.2. Mối quan hệ theo hướng


Mối quan hệ theo hướng liên kết hai đối tượng dựa trên định hướng (tương đối) của
chúng đối với hệ quy chiếu toàn cục.Ví dụ về mối quan hệ theo hướng là: bắc, nam, đông,
tây, đông bắc, v.v.
Hệ quy chiếu cũng có thể được xác định theo hướng của người xem hoặc đối tượng
tham chiếu. Có thể được phân biệt thành quan hệ hướng bên ngoại và quan hệ hướng nội.
● Một quan hệ hướng nội chỉ định vị trí của một đối tượng bên trong đối
tượng tham chiếu. Ví dụ: mặt trên, mặt sau,...
● Một quan hệ hướng ngoại chỉ định vị trí của đối tượng bên ngoài các đối
tượng tham chiếu. Ví dụ: phía trên, phía trước, bên phải,..
Các mối quan hệ theo hướng có thể mang tính chủ quan. Ví dụ, có thể không có
biên giới rõ ràng giữa tây nam và tây. Do đó, các mô hình dữ liệu không gian thường sử
dụng các định nghĩa mờ về hướng (ví dụ: 20% hướng bắc, 80% hướng đông).
Hiện nay, một số mô hình phân tích không gian đã được phát triển thêm để đối phó
với các tình huống phức tạp hơn hoặc làm cho quy trình trở nên hợp lý hơn về mặt tính
toán. Trong số đó, mô hình ma trận quan hệ hướng (DRM)- xác định quan hệ hướng với ma
trận là một ví dụ được áp dụng rộng rãi.

Minh họa các tập hợp điểm và phương trình xác định cho ma trận quan hệ hướng
7
2.3. Mối quan hệ dựa trên khoảng cách
Mối quan hệ khoảng cách liên kết hai đối tượng dựa trên khoảng cách của chúng,
được đo bằng thước đo khoảng cách (hình học), ví dụ: khoảng cách Euclide. Các giá trị
khoảng cách thực tế không phải lúc nào cũng hữu ích vì con người có xu hướng phân loại
chúng theo các phạm vi (chủ quan hoặc khách quan). Ví dụ: chúng ta có thể chia miền
khoảng cách có thể có giữa các đối tượng trong thành phố cho khoảng cách lên đến 100
mét, được đặc trưng bởi mối quan hệ gần, khoảng cách từ 100 mét đến 1km, được đặc trưng
bởi mối quan hệ có thể tiếp cận, khoảng cách từ 1km đến 10km, có đặc điểm là mối quan hệ
xa, và khoảng cách lớn hơn 10km, có đặc điểm là mối quan hệ rất xa. Do đó, các mối quan
hệ về khoảng cách có thể được thể hiện một cách rõ ràng (bằng khoảng cách hình học thực
tế giữa các đối tượng) hoặc ngầm định (bằng một khoảng cách).
Một truy vấn không gian không nhất thiết phải giới hạn trong một quan hệ không
gian.Thực tế, các mối quan hệ tôpô, khoảng cách và hướng có thể được kết hợp để mô tả
đặc điểm của một cặp đối tượng không gian (ví dụ: “ngôi nhà của tôi nằm cách biệt nhau,
cách 100 mét, về phía tây bắc Bờ Tây”). Mối quan hệ không gian được sử dụng để hỗ trợ
việc thể hiện các truy vấn không gian.
3. Truy vấn không gian
Truy vấn không gian được áp dụng trên một (hoặc nhiều) quan hệ không gian và
yêu cầu các đối tượng (hoặc tổ hợp các đối tượng) thỏa mãn một số mối quan hệ không gian
với đối tượng truy vấn tham chiếu (hoặc giữa chúng). Truy vấn không gian là lý do để đưa
ra các phương pháp quản lý chuyên biệt cho dữ liệu không gian, giống như truy vấn quan hệ
xác định cách dữ liệu quan hệ được lưu trữ, lập chỉ mục và truy cập.
3.1.1. Truy vấn theo phạm vi không gian
Truy vấn phạm vi không gian là truy vấn hỏi về các đối tượng không gian nhất định
liên quan đến các đối tượng không gian khác trong một khoảng cách nhất định. Vị từ
khoảng cách của các truy vấn này có thể được trừu tượng hóa thành dạng sau :
Dmin < distance (A, B) ≤ Dmax.
Trong đó Dmin và Dmax là các biến khoảng cách đã cho và khoảng cách là một
hàm để tìm khoảng cách giữa hai đối tượng A và B. Khoảng cách trường hợp (A, B) ≤
Dmax có thể được coi là một trường hợp đặc biệt khi Dmin = 0. Trong một truy vấn phạm
vi tại ít nhất một thuộc tính được chỉ định dưới dạng phạm vi thay vì giá trị. Một ví dụ về
truy vấn phạm vi đơn giản là tìm tất cả các thành phố trong vòng 50 dặm từ Minneapolis.
Một truy vấn phức tạp hơn sẽ là tìm tất cả các hồ trong vòng 50 dặm từ bất kỳ thành phố
lớn nào trong một tiểu bang. Ở đây đầu tiên chúng ta phải tìm tất cả các thành phố lớn. Sau
đó tìm tất cả các hồ gần các thành phố đó. Một dạng khác của truy vấn phạm vi là truy vấn
8
cửa sổ. Ở đây chúng tôi quan tâm đến việc tìm kiếm các đối tượng trong một vùng hình chữ
nhật (cửa sổ) trong không gian. Biểu mẫu này đặc biệt hữu ích khi chúng tôi đang cố gắng
xem hoặc in một phần hình ảnh. Chỉ các vật thể rơi bên trong cửa sổ hình chữ nhật mới
được hiển thị. Khi người dùng di chuyển vùng cửa sổ trong không gian, các đối tượng được
hiển thị sẽ thay đổi. Một số đối tượng không còn được nhìn thấy, trong khi những đối tượng
khác có thể nhìn thấy được.
Trong các mối quan hệ thì Mối quan hệ dựa trên khoảng cách sẽ được chuyển trực
tiếp đến truy vấn phạm vi không gian. Tuy nhiên 2 môn quan hệ còn lại cũng có thể được
ánh xạ đến truy vấn phạm vi không gian. Tất cả các quan hệ không gian này có thể được
thực hiện bằng cách sử dụng các thuật toán tìm kiếm trên MBR.

Bảng 1. Cho thấy cách các mối quan hệ không gian giữa các đối tượng có thể được ánh xạ thành các ràng
buộc của tọa độ MBR

Bảng 2. cho thấy những ràng buộc nào cần thiết đối với các nút trung gian khi tìm kiếm cây R để tìm các
MBR phù hợp.
9
Nhưng vì MBR là một giá trị gần đúng đối với đối tượng không phải đối tượng thực
nên chúng ta có thể gặp trường hợp MBR thỏa mãn một hoặc nhiều quan hệ không gian
trong khi đối tượng thực tế thì không. Vì lý do này, các truy vấn không gian sử dụng một
bước tinh chỉnh bổ sung trong đó mỗi ứng cử viên MBR phù hợp được kiểm tra bằng cách
sử dụng các kỹ thuật hình học tính toán và sau đó các lần truy cập sai bị loại bỏ.
Nói chung, việc xử lý truy vấn dạng "tìm tất cả các đối tượng p thỏa mãn một quan
hệ không gian nhất định đối với đối tượng q" bằng cách sử dụng R-tree bao gồm các bước
sau:
B1: Bắt đầu từ nút trên cùng, loại trừ các nút trung gian P không thể bao gồm
các MBR thỏa mãn quan hệ không gian và tìm kiếm đệ quy các nút còn lại. Sử dụng Bảng 2.
B2: Trong số các nút lá được truy xuất, hãy chọn những nút thỏa mãn quan hệ
không gian. Sử dụng Bảng 1.
B3: Nếu cần, hãy thực hiện theo một bước tinh chỉnh cho các MBR đã chọn.
3.2. Truy vấn láng giềng gần nhất
Là truy vấn về các đối tượng không gian gần nhất đến một đối tượng truy vấn. Ví
dụ: người lái xe ô tô có thể yêu cầu trạm xăng gần nhất với vị trí hiện tại của nó. Lưu ý rằng
người hàng xóm gần nhất có thể không phải là duy nhất; ví dụ: có thể có hai (hoặc nhiều)
trạm xăng với cùng khoảng cách (tối thiểu) từ vị trí của người lái xe. Trong trường hợp
chung này, chúng ta có thể quan tâm đến bất kỳ người hàng xóm nào gần nhất hoặc tất cả
những người hàng xóm gần nhất.
Định nghĩa có thể được mở rộng để bao gồm một tham số k, thể hiện số lân cận gần
nhất được truy xuất. Một truy vấn k-nearest neighbor truy xuất k đối tượng gần nhất với đối
tượng truy vấn, chẳng hạn như “Đưa ra tên 10 thành phố gần Hà Nội nhất”.
Hiện tại, các truy vấn hàng xóm gần nhất có thể được xử lý hiệu quả bằng cách lập
chỉ mục bởi R – tree cho các quan hệ. Và một trong các thuật toán được dùng phổ biến là
tìm láng giềng gần nhất theo chiều sâu, nó sử dụng thông tin về láng giềng gần nhất được
phát hiện để ràng buộc tìm kiếm và cắt bớt các phần của R – tree.
Giả sử rằng chúng ta tìm kiếm hàng xóm gần nhất NN (q, R) của q trong R-tree R.
Với mindist (q, M) là khoảng cách nhỏ nhất giữa q và bất kỳ điểm nào trong một hình chữ
nhật có giới hạn nhỏ nhất (MBR) M, bắt đầu từ gốc, tất cả các mục nhập được sắp xếp theo
mindist từ q, và mục nhập có mindist nhỏ nhất được truy cập đầu tiên. Quá trình này được
lặp lại một cách đệ quy cho đến khi nút lá (láng giềng gần nhất) được tìm thấy. Khi trở lại
các nút cao hơn, chỉ truy cập đến các nút có mindist nhỏ hơn khoảng cách của láng giềng
gần nhất tìm được tính đến thời điểm đó. Ví dụ:

10
Với hình trên đầu tiên sẽ truy cập vào nút của mục nhập gốc E1 (vì nó có mindist tối
thiểu), và sau đó là nút được trỏ bởi E4, trong đó ứng cử viên đầu tiên (a) được lấy. Khi
quay trở lại mức trước đó,mục E6 bị loại trừ vì mindist của nó lớn hơn khoảng cách của a,
vì E5 có mindist bằng với khoảng cách của a nên nó sẽ được truy cập và sau đó quay lại với
E2. Tương tự như vậy với E2 cho đến hết.
Bên cạnh thuật toán tìm láng giềng gần nhất theo chiều sâu(DF) còn các thuật toán
hiệu quả như A best-first nearest neighbor search algorithm (BF).

3.3. Truy vấn liên kết không gian


Nếu truy vấn theo phạm vi không gian và truy vấn láng giềng gần nhất chỉ áp dụng
trên một quan hệ không gian duy nhất thì với truy vấn liên kết không gian có thể kết hợp
thông tin từ hai quan hệ dựa trên một vị từ/thuộc tính không gian.

11
Ví dụ minh họa với liên kết không gian giữa các thành phố và các dòng sông. Qua đó, đưa ra các
dạng truy vấn như: “đưa ra các cặp sông và thành phố giao nhau” hay “tìm các con sông gần thành phố
C3” ,...

Các dạng truy vấn này thường rất mất thời gian để tính toán. Nếu chúng ta xem xét
một quan hệ trong đó mỗi một phần tử là một điểm biểu diễn một thành phố hoặc một dòng
sông thì truy vấn trên có thể được thực hiện bằng phép nối quan hệ này với chính nó với
điều kiện nối chỉ ra khoảng cách giữa hai phần tử tương ứng. Đương nhiên, nếu các thành
phố và sông được biểu diễn chi tiết hơn và có vùng không gian của chúng, ngữ nghĩa của
truy vấn (chúng ta tìm kiếm hai thành phố mà trung tâm của chúng cách nhau 200km hay
hai thành phố mà biên của chúng cách nhau 200km) và việc thực thi truy vấn đều trở nên
phức tạp hơn nhiều.
Tùy thuộc vào sự tồn tại của các chỉ mục, các thuật toán liên kết không gian khác
nhau có thể được áp dụng. Với thuật toán R-tree join(RJ), tính liên kết không gian của hai
quan hệ đầu vào với điều kiện cả hai đều được lập chỉ mục bởi R – tree, RJ đi qua cả 2 cây
một cách đồng bộ bắt đầu từ gốc và theo các cặp đường giao nhau. Gọi nR, nS là hai nút thư
mục (không phải lá) của cây R-tree chỉ mục cho các quan hệ R và S tương ứng. RJ dựa trên
quan sát sau: nếu hai mục ei ∈ nR và ej ∈ nS không giao nhau, không thể có cặp (oR, oS)
là các đối tượng giao nhau, trong đó oR và oS nằm dưới cây con được chỉ bởi ei và ej
tương ứng. Một mã giả đơn giản cho RJ xuất ra kết quả của bước nối không gian bộ lọc (tức
là xuất ra các cặp đối tượng có MBR giao nhau) được cho trong hình sau:

Mã giả RJ với giả định rằng cả hai cây đều có cùng chiều cao

12
Để minh họa cho các bước hoạt động của thuật toán RJ

Ban đầu, RJ được thực thi với các tham số gốc cây. Các cặp mục nhập đủ điều kiện
ở cấp cơ sở là (A1, B1) và (A2, B2). Lưu ý rằng vì A1 không cắt B2 nên không thể có cặp
đối tượng nào dưới các mục này giao nhau. RJ được gọi đệ quy cho các nút được trỏ bởi các
mục đủ điều kiện cho đến khi đạt đến mức lá, nơi các cặp giao nhau (a1, b1) và (a2, b2) là
đầu ra.
Nếu chỉ có một tập dữ liệu (cho A) được lập chỉ mục, một phương pháp phổ biến là
xây dựng cây R-tree cho B và sau đó áp dụng RJ. Khi cả hai quan hệ đều không được lập
chỉ mục, thuật toán đơn giản và trực quan nhất mà chúng ta có thể sử dụng để nối chúng là
phép nối các vòng lặp lồng nhau. Phương pháp này có thể được áp dụng cho bất kỳ loại
phép nối nào (không gian, phi không gian) và các vị từ điều kiện (cấu trúc liên kết, hướng,
2
khoảng cách, v.v.). Tuy nhiên, các vòng lặp lồng nhau là thuật toán đắt nhất (𝑂 ) bởi vậy có
những thuật toán khác để nối 2 quan hệ không được lập chỉ mục như: Spatial Hash Join,
Partition Based Spatial Merge Join, Size Separation Spatial Join, Scalable Sweeping-Based
Spatial Join. Các thuật toán nối không gian cho các đầu vào không được lập chỉ mục xử lý
việc nối theo hai bước; đầu tiên các đối tượng từ cả hai đầu vào được sắp xếp và / hoặc xử
lý trước bằng cách sử dụng cấu trúc dữ liệu và sau đó các cấu trúc này được sử dụng để
nhanh chóng tìm các đối tượng nằm trong cùng vùng và giao nhau.

13
III. Lập chỉ mục
B+ tree
B+ Tree là một cấu trúc dữ liệu dạng cây ‘đa phân cân bằng’. Cấu trúc một node
của nó thường được chia làm nhiều phần. Cây được tổ chức với một qui tắc nhất định
được tạo ra từ đầu. Thường thì giá trị của các node tăng dần từ trái qua phải, node con bên
trái sẽ chứa giá trị nhỏ hơn node con bên phải
B + Tree là một sự tổng quát hóa của cây nhị phân tìm kiếm (BST). Sự khác biệt
chính giữa chúng là số lượng node con của B+Tree nó sẽ nhiều hơn chứ không bị giới hạn
bởi hai phần tử như của cây nhị phân tìm kiếm. Mục tiêu ở đây là làm sao để giảm tối đa số
lần truy xuất các thiết bị ngoại vi (ở đây là đĩa). Tại bất cứ thời điểm nào chúng ta sẽ thử
định vị những bản ghi, chúng ta muốn độ cao của cây đa phân này phải là nhỏ nhất để giảm
chi phí tìm kiếm, để đạt được mục tiêu này thì số lượng nhánh trong cây phải lớn.
Nếu B+Tree có bậc là m thì một node của nó sẽ có tối đa m nhánh con và có m-1
khóa để tìm kiếm:
● Các bản ghi chỉ được lưu ở nút lá của cây
● Tất cả các nút (ngoại trừ nút gốc) có tối thiểu là m/2 và tối đa là m
cây(nhánh) con.
● Nút gốc và lá phái ít nhất có 2 con.
● Bên trong một node lưu giá trị tìm kiếm, một vài khóa được sử dụng như
những “người chỉ đường” cho quá trình tìm kiếm. Những khóa này cần
phải được sắp xếp theo một thứ tự thống nhất trừ trước (thường thì tăng
dần từ trái qua phải).
● Tùy thuộc vào kích thước của một bản ghi so với kích thước của một khóa
thì node lá của B+Tree bậc m có thể lưu nhiều hơn hoặc ít hơn m bản ghi.
Thông thường kích thước của một node là bội số của một khối dữ liệu
trong ổ đĩa (bên windows mặc định là 512byte).
● Các node lá của cây thường được liên kết với nhau để tạo thành một danh
sách liên kết, điều này nhằm mục tiêu là để không phải duyệt trở lại node
gốc trong quá trình duyệt tìm kiếm.

14
Ví dụ. Cây B+ tree

BTree Index được dùng để giúp truy vấn các câu truy vấn dạng Insert, Update,
Delete. Nó áp dụng được cho những yêu cầu từ một table cho những trường có tính chất đặc
biệt. Ví như chúng ta có thể lấy ra những sinh viên có số điểm tích lũy trung bình trong
khoảng từ 8.0 tới 9.5 trong bảng sinh viên.
Trong BTree Index thì mỗi khóa tương ứng với một dòng của dữ liệu thực. Nó sẽ
được chọn khi độ trùng lặp dữ liệu là số ít.
BTree Index sẽ được tạo nếu chúng ta tạo một bảng và chỉ định khóa chính cho nó,
thì khóa chính chính là một chỉ mục kiểu B+tree. Hoặc khi chúng ta tạo khóa ngoại thì mặc
định cái trường khóa ngoại đó cũng được sử dụng BTree Index.
R-tree
2.1. R-tree là gì?
R-tree là cấu trúc được sử dụng rộng rãi và đã xuất hiện trong các bản DBMS
thương mại, do tính đơn giản và khả năng áp dụng cho cả hai dạng dữ liệu điểm và vùng.
R-tree là phương pháp phân chia không gian dữ liệu thành các khối có thể lồng
nhau hoặc chồng chéo lên nhau. Đơn giản nhất, hình khối thường được sử dụng là hình chữ
nhật nhỏ nhất chứa dữ liệu (Minimum Bounding Rectangle – MBR). Như vậy, chính các
MBR được lưu trữ trên cấu trúc cây chứ không phải bản thân dữ liệu.
Các nút không phải lá được biểu diễn bởi cặp: (R, childpointer) trong đó R là MBR
của đối tượng và child-pointer là con trỏ trỏ tới nút con.
Các nút lá được biểu diễn bởi cặp: (R, obj-pointer) trong đó R là MBR của đối
tượng và obj-pointer là con trỏ trỏ tới mô tả chi tiết của đối tượng.

15
Mỗi nút trong cây tương ứng với một trang bộ nhớ. Và mặc dù các MBR có thể
chồng chéo lên nhau, tức là các nút có thể chứa dữ liệu giống nhau, nhưng mỗi đối tượng dữ
liệu phải được lưu trữ trọn vẹn trên một nút lá.
Để R-Tree hợp lệ cần thỏa mãn các tính chất :
● Mỗi nút lá trong cây R-tree có thể giữ tối đa M mục nhập thì giới hạn dưới
m phải thỏa mãn sao cho 𝑚 ≤ 𝑀/2.
● Mỗi nút lá nên chứa từ m đến M bản ghi chỉ mục.
● Mỗi nút chỉ mục nên có từ m đến M nút con trừ khi nó là nút gốc.
● MBR phải là hình chữ nhật nhỏ nhất có tổng diện tích được bao phủ bởi
các nút con của nó trong trường hợp các nút chỉ mục.
● Nút gốc phải có ít nhất hai nút con trừ khi nó là một lá.
● Tất cả các lá phải xuất hiện trên cùng một mức.

Cấu trúc đánh chỉ mục R-tree

Chúng ta có thể thấy R-tree là một biến thể của B+ tree và nó là một cây cân bằng.
Tuy nhiên, do các MBR có thể chồng chéo lên nhau và sự chồng chéo này gia tăng khi
lượng dữ liệu gia tăng nên cấu trúc này có yếu điểm là kéo theo sự gia tăng các truy cập tìm
kiếm không cần thiết. Thêm nữa, chúng ta bắt buộc phải tiến hành tìm kiếm tại mọi mức
của cây, ngay cả trong các trường hợp không có (hoặc có rất ít) đối tượng dữ liệu thỏa mãn
yêu cầu.

16
2.2. Chèn, Tìm kiếm, Xóa, Cập nhật.
Việc chèn các bản ghi vào R-Tree phải sao cho các thuộc tính của R-Tree được thỏa
mãn trước và sau khi chèn. Khi một bản ghi được chèn và cây chỉ có một nút, thì hãy chèn
bản ghi vào nút đó. Nếu có nhiều hơn một nút, thì hãy đi ngang cây từ trên xuống dưới cho
đến khi thu được một nút không phải là lá có thể chứa mục nhập với MBR được phóng to ít
nhất. Sau đó, chèn đối tượng và truyền tải các thay đổi đến tận gốc. Trường hợp trên tốt nếu
số lượng mục nhập nằm trong giới hạn tối thiểu và tối đa. Nếu khi chèn số lượng mục nhập
vượt quá giới hạn tối đa, thì các nút được tách ra sao cho mỗi nút có các mục nhập giữa giới
hạn tối thiểu và tối đa.
Tìm kiếm các bản ghi nằm trong một cửa sổ nhất định là truy vấn thường được sử
dụng nhất. Cây luôn được chuyển từ trên xuống dưới. Các bản ghi không phải lá chồng lên
cửa sổ đã cho được chọn trong quá trình truyền tải để khám phá thêm. Điều này được thực
hiện ở mọi cấp độ cho đến khi đạt được các nút lá. Các nút lá chồng lên cửa sổ đã cho là các
bản ghi đủ điều kiện.
Xóa bản ghi cũng phải đáp ứng các thuộc tính trước và sau khi xóa. Bản ghi cụ thể
sẽ bị xóa được tìm kiếm bằng thuật toán tìm kiếm. Sau khi bản ghi được tìm thấy, bản ghi sẽ
bị xóa. Những thay đổi sau đó được truyền tới tận gốc. Số lượng bản ghi trở nên ít hơn dung
lượng tối thiểu và luồng dưới có thể có cơ hội. Các nút được hợp nhất để đáp ứng các thuộc
tính.
Cập nhật bản ghi bao gồm việc xóa các giá trị cũ và chèn các giá trị mới.

3.Q tree
Q - tree là phương pháp đánh chỉ số dựa trên đường cong Space-Filling Curves để
sắp xếp các điểm dữ liệu. Việc đánh chỉ số được thực hiện dựa trên việc phân chia không
gian dữ liệu một cách đệ quy, nhưng khác với R-tree, phương pháp này được thực hiện độc
lập đối với tập dữ liệu thực sự. Space-Filling Curves được xây dựng dựa trên giả thiết rằng
mọi giá trị thuộc tính nào đó đều có thể biểu diễn bởi một số bit xác định nào đó gọi là k bit,
do đó số lượng các giá trị thuộc về cùng một chiều dữ liệu có thể đạt tới nhiều nhất là 2k .
Để đơn giản, hình vẽ dưới đây mô phỏng một tập dữ liệu 2- chiều mặc dù thực tế là phương
pháp này có thể áp dụng với dữ liệu có số chiều bất kỳ. Hình vẽ thứ nhất sử dụng 2 bit để
biểu diễn giá trị thuộc tính; hình thứ hai sử dụng 3 bit; và hình thứ ba là đường cong Hilbert
với 3 bit.

17
Space-Filling Curves

Trên ý tưởng này, Q-tree là phương pháp phân chia một cách đệ quy không gian dữ
liệu thành các góc phần tư. Trong cấu trúc này, mỗi nút có 4 con lần lượt ứng với các góc
phần tư 00 (góc phần tư bên trái phía dưới), 01 (góc phần tư bên trái phía trên), 10 (góc
phần tư bên phải phía dưới) và 11 (góc phần tư bên phải phía trên). Trên hình vẽ, chúng ta
có thể thấy rằng nếu không gian dữ liệu không được phân bố một cách đối xứng thì cây
Q-tree sẽ bị lệch, bởi vì Q-tree không phải là một cấu trúc cây cân bằng, do đó trên những
tập dữ liệu lớn, hiệu suất truy cập dữ liệu sẽ kém hiệu quả.

Cấu trúc đánh chỉ mục Q-tree

Một mặt khác, trong các ứng dụng đòi hỏi việc lưu trữ dữ liệu có tính chất liên tục
(chẳng hạn dữ liệu về một đối tượng chuyển động) thay vì các dữ liệu xác định, chúng ta
gặp phải một vấn đề rất khó để cân nhắc bởi vì: việc sử dụng cây Q-tree có độ sâu càng lớn
thì độ chính xác biểu diễn dữ liệu càng tốt, tuy nhiên nó lại khiến cho việc xây dựng cấu
trúc này trở nên kém hiệu quả trên cả phương diện không gian lưu trữ và thời gian xử lý các
thao tác.

18
IV. Một số ứng dụng của công nghệ quản lý dữ liệu không gian
1. Quản lý dữ liệu không gian-thời gian
Dữ liệu không gian-thời gian có thể đơn giản là các sự kiện được đánh dấu thời gian.
Ví dụ: Xét mối quan hệ cơ sở dữ liệu lưu trữ các cuộc gọi khẩn cấp trong một thành
phố được gắn thẻ vị trí không gian và dấu thời gian. Trong mối quan hệ này, mọi bộ (tức là
đối tượng) được liên kết với một giá trị ba chiều trong không gian 3D không-thời gian. Đối
với dữ liệu như vậy, chiều thứ ba (thời gian) về bản chất không khác gì so với hai tọa độ
không gian. Do đó, dữ liệu có thể đơn giản được xem như các đối tượng không gian ba
chiều. Lưu trữ và lập chỉ mục có thể được thực hiện như trong trường hợp 2D, để tạo điều
kiện thuận lợi cho các truy vấn lựa chọn không gian-thời gian.
Các truy vấn như vậy chỉ định phạm vi trong thứ nguyên không gian và thời gian, có
thể được kết hợp thành một vùng 3D.
Ví dụ: truy vấn “tìm tất cả các cuộc gọi khẩn cấp từ khu trung tâm trong khoảng thời
gian từ 2 giờ sáng đến 4 giờ sáng hôm qua” xác định phạm vi 3D bao gồm tất cả các vị trí ở
khu trung tâm trong một khoảng thời gian. Truy vấn phạm vi cũng có thể được kết hợp với
tìm kiếm hàng xóm gần nhất. Ví dụ: truy vấn "tìm các cuộc gọi khẩn cấp gần nhất đến hiện
trường vụ án trong 2 giờ sáng đến 4 giờ sáng hôm qua", thực hiện tìm kiếm hàng xóm gần
nhất theo không gian, loại trừ các sự kiện nằm ngoài phạm vi lựa chọn thời gian được chỉ
định (2 giờ sáng đến 4 giờ sáng, hôm qua)
2. Quản lý dữ liệu chiều cao
Dữ liệu không gian có thể được xem như một trường hợp đặc biệt của dữ liệu đa
chiều. Trong nhiều ứng dụng, các đối tượng được trừu tượng hóa và mô hình hóa bằng các
vectơ đặc trưng, ​do đó, chúng có thể được xem như các điểm trong không gian đặc trưng
chiều cao. Trong khai phá dữ liệu, sự gần gũi trong không gian đặc trưng như vậy được sử
dụng để mô hình hóa sự giống nhau giữa các đối tượng tương ứng. Cơ sở dữ liệu của vectơ
đặc trưng được thu thập và lập chỉ mục để hỗ trợ tìm kiếm và phân tích hiệu quả. Có hai
điểm khác biệt chính giữa dữ liệu không gian và vectơ đặc trưng. Đầu tiên, dữ liệu không
gian là hai hoặc ba chiều, trong khi số chiều của các vectơ đặc trưng có thể cao tùy ý (thông
thường, hàng chục đến hàng trăm chiều). Thứ hai, vectơ đặc trưng không có phạm vi không
gian; chúng là những điểm đơn giản có chiều cao. Mặc dù những khác biệt này đủ quan
trọng để phân biệt quản lý dữ liệu không gian với quản lý dữ liệu chiều cao, hai vấn đề này
có những điểm chung trong mô hình hóa và đánh giá truy vấn.
Ví dụ, xét vấn đề truy xuất hình ảnh dựa trên nội dung trong cơ sở dữ liệu hình ảnh.
Trong vấn đề này, người dùng tìm kiếm hình ảnh trong cơ sở dữ liệu tương tự như hình ảnh
đầu vào. Ví dụ: một khách du lịch có thể chụp ảnh một địa danh trong thành phố và yêu cầu
các ảnh tương tự trong cơ sở dữ liệu công cộng để xác định các ảnh tương tự và sau đó tìm
thông tin về địa danh từ những ảnh này. Các hệ thống truy xuất dựa trên nội dung điển hình

19
trích xuất các đặc điểm trực quan (ví dụ: màu sắc, kết cấu, ...) từ các hình ảnh trong cơ sở
dữ liệu và lập mô hình từng hình ảnh dưới dạng vectơ đặc trưng chiều cao.
Ví dụ hình dưới cho thấy việc trích xuất biểu đồ d màu từ một hình ảnh, đến lượt nó,
có thể được xem như một điểm d chiều p = (p1, p2, ..., pd). Biểu đồ lưu trữ cho mỗi màu
trong số d màu (hoặc nhóm màu) phần trăm màu trong pixel hình ảnh. Biểu đồ màu là
phương tiện thuận tiện để đánh giá độ giống nhau giữa các đối tượng đa phương tiện. Nếu
hai hình ảnh giống nhau (theo màu sắc), chúng phải có biểu đồ tương tự. Các biểu đồ tương
tự tương ứng với các điểm rất gần nhau trong không gian chiều cao được xác định bởi các
thùng màu. Do đó, có thể đánh giá từng ví dụ về truy vấn đa phương tiện như sau. Đầu tiên,
chúng ta trích xuất tất cả các biểu đồ cho các hình ảnh đã biết trong cơ sở dữ liệu và tạo tập
hợp các điểm chiều cao tương ứng P. Sau đó, đối với một hình ảnh truy vấn người dùng cụ
thể Iq, chúng tôi tính toán biểu đồ q và tìm kiếm một tập hợp các điểm trong P, gần với q.
Những điểm này tương ứng với những hình ảnh có màu sắc tương tự như q, và kết quả là
những hình ảnh này sẽ có xác suất cao là kết quả mong muốn của người dùng. Tất nhiên,
trong thực tế, tìm kiếm độ tương đồng về màu sắc được kết hợp với tìm kiếm dựa trên các
đặc điểm khác (ví dụ: kết cấu, bố cục màu không gian, hình dạng, ...) để thu hẹp tập hợp các
kết quả hoặc xác định xếp hạng thích hợp hơn của các đối tượng cơ sở dữ liệu liên quan đến
sự tương tự của chúng với truy vấn.

Biểu đồ màu và biểu diễn điểm chiều cao của hình ảnh

Bên cạnh truy xuất đa tầng dựa trên nội dung, có một loạt các ứng dụng, trong đó
các đối tượng dữ liệu được mô hình hóa dưới dạng các điểm có chiều cao và khoảng cách
gần nhau được sử dụng để đánh giá độ tương đồng. Trong dữ liệu quan hệ, chúng ta có thể
lập mô hình mọi hàng của bảng dưới dạng một điểm trong không gian đa chiều được xác
định bởi các thuộc tính của bảng. Trong cơ sở dữ liệu văn bản, mỗi tài liệu f có thể được mô
hình hóa như một điểm chiều cao p(f), trong đó mọi chiều thứ i tương ứng với một số hạng
và giá trị thứ i của p(f) là tần suất của số hạng tương ứng trong f . Trong cơ sở dữ liệu chuỗi
thời gian, mỗi dấu thời gian có thể được ánh xạ tới một thứ nguyên và mỗi chuỗi có thể
được mô hình hóa như một điểm chiều cao trong miền kết hợp dấu thời gian.

20
3. GIS
Hệ thống Thông tin Địa lý (GIS- Geographic Information System) là một công cụ
dựa trên máy tính để lập bản đồ và phân tích các sự vật và sự kiện tồn tại xảy ra trên trái
đất. Công nghệ GIS tích hợp các hoạt động cơ sở dữ liệu không gian phổ biến như truy vấn
và phân tích thống kê với các lợi ích trực quan hóa và phân tích địa lý độc đáo do bản đồ
cung cấp. Ngày nay, với sự phát triển của Internet, GIS dựa trên web, xử lý thông tin địa lý
trên Internet, đã xuất hiện và đang phát triển nhanh chóng khi công nghệ Internet và Web
thay đổi. Bản đồ là phương tiện chính của thông tin địa lý và các đối tượng cơ bản được
thao tác trong GIS, biểu diễn đồ họa của các bề mặt địa lý trên mặt phẳng, được khái quát
hóa bằng các quy tắc toán học và được biểu diễn bằng các ký hiệu trực quan cho các mục
đích khác nhau. Bản đồ thể hiện sự phân bố, trạng thái và sự liên kết của các hiện tượng tự
nhiên hoặc xã hội đa dạng.
Có nhiều cách tiếp cận để biểu diễn thông tin địa lý trong GIS, chẳng hạn như cách
tiếp cận dựa trên lớp và cách tiếp cận dựa trên đối tượng địa lý, v.v. Trong cách tiếp cận dựa
trên lớp, dữ liệu không gian được biểu diễn trong một tập hợp các bản đồ chuyên đề, lớp
được đặt tên, biểu thị một số các chủ đề như đường, tòa nhà, tàu điện ngầm, đường bao,
biên giới, v.v. Phương pháp dựa trên lớp có một ưu điểm là dễ dàng xử lý truy vấn không
gian và phân tích không gian. Như chúng ta đã biết, sự chồng chất (chồng chéo) của các đối
tượng không gian là một vấn đề cần xử lý trong cơ sở dữ liệu không gian. Việc quản lý như
xử lý truy vấn điểm, xử lý truy vấn vùng và xử lý phân tích thông tin không gian của dữ liệu
chồng chéo trong các đối tượng không gian rất khó xử lý vì có quá nhiều ứng viên của đối
tượng không gian. Có thể tránh vấn đề này một cách hiệu quả bằng cách sử dụng cách tiếp
cận dựa trên lớp vì nói chung không có sự chồng chất (chồng chéo) của đối tượng không
gian trong một bản đồ chuyên đề của thế giới thực.

Bản đồ bao gồm các lớp được thể hiện

Dữ liệu GIS có thể được tách thành hai loại: dữ liệu được tham chiếu theo không
gian được biểu thị bằng các dạng vectơ và raster (bao gồm cả hình ảnh) và các bảng thuộc
tính được biểu diễn dưới dạng bảng. Trong nhóm dữ liệu tham chiếu không gian, dữ liệu
GIS có thể được phân loại thêm thành hai loại khác nhau: vectơ(Dữ liệu vectơ được chia
thành ba loại: dữ liệu điểm, đường (hoặc cung) và đa giác.) và raster. Hầu hết các ứng dụng

21
phần mềm GIS chủ yếu tập trung vào việc sử dụng và thao tác với cơ sở dữ liệu địa lý vectơ
với các thành phần được bổ sung để hoạt động với cơ sở dữ liệu địa lý dựa trên raster.

Dữ liệu điểm

Dữ liệu đường

Dữ liệu vùng

22
Dữ liệu radar

23
TÀI LIỆU THAM KHẢO

1. A State-of-Art in R-Tree Variants for Spatial Indexing - Lakshmi Balasubramanian, M.


Sugumaran

2. Spatial Data Management - Nikos Mamoulis


3. Ứng dụng cây QR tạo chỉ mục trong cơ sở dữ liệu không gian Dư Phương Hạnh
4.GIS&T Body of Knowledge - University consortium for Geographic Information Science
5. All-Nearest-Neighbors Queries in Spatial Databases - Jun Zhang, Nikos MamoulisDimitris
Papadias, Yufei Tao

6.SPATIAL RANGE QUERY - Rooma Rathore,Graduate Student University of Minnesota


7.Spatial data management - Geir-Harald Strand Survey and statistics division, NIBIO
8.SPATIAL DATA MANAGEMENT: TOPIC OVERVIEW - Gary J. Hunter Department of
Geomatics, University of Melbourne, Australia

24
Phân công công việc
● Lý thuyết: B4. Tìm hiểu về quản trị không gian(Spatial Data Management)
- Đinh Thanh Nhàn: III. Lập chỉ mục, IV. Một số ứng dụng của công nghệ quản
lý dữ liệu không gian
- Đặng Thị Hà Ngân: I. Giới thiệu, II. Dữ liệu không gian
● Thực hành: A4. Thiết lập nhân bản 1 master, 2 sleve; áp dụng thử nghiệm với
CSDL quản lý hồ sơ sinh viên của 1 trường đại học
- Trần Xuân Đức
- Lữ Thị Thùy Linh

25

You might also like