Schoenberger2016sfm (1) - VI

Machine Translated by Google
Xem lại cấu trúc từ chuyển động
1,2
Johannes L. Schonberger ¨ , Jan-Michael Frahm1
1Đại học Bắc Carolina ở Đồi Chapel
¨
2Eidgenossische Technische Hochschule Z urich¨
jsch@inf.ethz.ch, jmf@cs.unc.edu
trừu tượng
Cấu trúc gia tăng từ chuyển động là một chiến lược phổ biến để tái
tạo 3D từ các bộ sưu tập hình ảnh không có thứ tự. Trong khi các hệ
thống tái thiết gia tăng có
cực kỳ tiên tiến về mọi mặt, tính mạnh mẽ, chính xác, đầy đủ và khả
năng mở rộng vẫn là những vấn đề chính

Hình 1. Kết quả của Rome với 21K được đăng ký trong tổng số 75K hình ảnh.
hướng tới việc xây dựng một đường ống thực sự có mục đích chung. Chúng
tôi đề xuất một kỹ thuật SfM mới nhằm cải thiện trạng thái
nghệ thuật để thực hiện một bước xa hơn hướng tới mục tiêu cuối cùng này. 2. Đánh giá cấu trúc từ chuyển động
Quá trình tái thiết đầy đủ được phát hành ra công chúng dưới dạng
SfM là quá trình tái tạo lại cấu trúc 3D từ
một triển khai nguồn mở.
các hình chiếu của nó thành một loạt các hình ảnh được lấy từ các nguồn khác nhau
quan điểm. SfM tăng dần (ký hiệu là SfM trong bài viết này)
1. Giới thiệu là một đường dẫn xử lý tuần tự với thành phần tái thiết lặp lại (Hình
2). Nó thường bắt đầu bằng việc trích xuất và so khớp đặc điểm, sau đó
Cấu trúc từ chuyển động (SfM) từ hình ảnh không có thứ tự là xác minh hình học. Biểu đồ cảnh kết quả đóng vai trò là nền tảng
đã chứng kiến sự phát triển to lớn trong những năm qua. Sớm
hệ thống tái tạo số liệu tự hiệu chỉnh [42, 6, 19, cho giai đoạn tái thiết, tạo mầm cho mô hình
16, 46] đóng vai trò là nền tảng cho các hệ thống đầu tiên trên tái tạo hai chế độ xem được lựa chọn cẩn thận, trước khi đăng ký dần
bộ sưu tập ảnh Internet không có thứ tự [48, 53] và đô thị dần các hình ảnh mới, lập tam giác các điểm cảnh,
cảnh [45]. Lấy cảm hứng từ những tác phẩm này, các hệ thống tái tạo quy lọc các ngoại lệ và tinh chỉnh việc xây dựng lại bằng cách sử dụng điều
mô ngày càng lớn đã được phát triển cho hàng trăm nghìn [1] và hàng chỉnh nhóm (BA). Các phần sau đây trình bày chi tiết về
triệu [20, 62, 51, 47] cho đến gần đây là một trăm triệu bức ảnh trên quá trình này, xác định các ký hiệu được sử dụng xuyên suốt bài báo,
Internet [30]. Nhiều và giới thiệu công việc liên quan.
của các chiến lược SfM đã được đề xuất bao gồm các phương pháp tiếp cận
tăng dần [53, 1, 20, 62], phân cấp [23] và các phương pháp tiếp cận toàn cầu 2.1. Tìm kiếm thư từ
[14, 61, 56]. Có thể cho rằng, SfM tăng dần là phổ biến nhất Giai đoạn đầu tiên là tìm kiếm thư từ để tìm thấy
chiến lược tái thiết các bộ sưu tập ảnh không có thứ tự.
cảnh chồng chéo trong ảnh đầu vào I = {Ii | tôi = 1...NI }
Mặc dù được sử dụng rộng rãi nhưng chúng ta vẫn chưa đạt được và xác định các hình chiếu của cùng một điểm trong sự chồng chéo
để thiết kế một hệ thống SfM thực sự có mục đích chung. Trong khi hình ảnh. Đầu ra là một tập hợp hình ảnh đã được xác minh về mặt hình học
các hệ thống hiện tại đã nâng cao công nghệ tiên tiến một cách vượt bậc, cặp C¯ và biểu đồ chiếu hình ảnh cho mỗi điểm.
mạnh mẽ, chính xác, đầy đủ và khả năng mở rộng
Khai thác tính năng. Với mỗi ảnh Ii , SfM phát hiện các tập hợp
vẫn là những vấn đề chính trong SfM gia tăng ngăn cản nó
Fi = {(xj ,fj ) | j = 1...NFi } của các đặc điểm cục bộ tại vị trí xj
sử dụng như một phương pháp có mục đích chung. Trong bài báo này, chúng tôi đề xuất 2
R được đại diện bởi một bộ mô tả ngoại hình fj .
một thuật toán SfM mới để tiếp cận mục tiêu cuối cùng này. Các
Các tính năng phải bất biến dưới các thay đổi về bức xạ và hình học để
phương pháp mới được đánh giá trên nhiều bộ dữ liệu đầy thách thức
SfM có thể nhận ra chúng một cách duy nhất
và mã được đóng góp cho cộng đồng nghiên cứu như một
trong nhiều hình ảnh [41]. SIFT [39], các dẫn xuất của nó [59], và
triển khai nguồn mở có tên COLMAP có sẵn tại
các tính năng được học gần đây hơn [9] là tiêu chuẩn vàng trong
https://github.com/colmap/colmap.
về độ bền. Ngoài ra, các tính năng nhị phân cung cấp
Công việc này được thực hiện tại Đại học Bắc Carolina ở Đồi Chapel. hiệu quả tốt hơn với chi phí giảm độ bền [29].
Tìm kiếm thư từ Tái thiết gia tăng Tái thiết

Hình ảnh
tái cấu trúc hai khung nhìn được chọn [7, 52]. Việc lựa chọn một cặp
Khai thác tính năng Khởi tạo
ban đầu phù hợp là rất quan trọng vì việc xây dựng lại có thể
Kết hợp Đăng ký hình ảnh Lọc ngoại lệ
không bao giờ phục hồi được sau một lần khởi tạo tồi. Hơn nữa, độ tin
Xác minh hình học Tam giác Điều chỉnh gói
cậy, độ chính xác và hiệu suất của việc tái thiết
Hình 2. Đường dẫn Cấu trúc từ Chuyển động tăng dần. phụ thuộc vào vị trí hạt giống của quá trình gia tăng.
Khởi tạo từ một vị trí dày đặc trong biểu đồ hình ảnh với
Phù hợp. Tiếp theo, SfM phát hiện những hình ảnh có nội dung giống nhau nhiều camera chồng chéo thường mang lại kết quả mạnh mẽ hơn
phần cảnh bằng cách tận dụng các tính năng Fi làm diện mạo và tái thiết chính xác do tính dư thừa tăng lên. TRONG
mô tả của các hình ảnh. Cách tiếp cận ngây thơ kiểm tra mọi tương phản, việc khởi tạo từ một vị trí thưa thớt hơn sẽ dẫn đến kết quả thấp hơn
cặp hình ảnh cho cảnh chồng chéo; nó tìm kiếm các đặc điểm tương ứng thời gian chạy, vì BA xử lý các vấn đề tổng thể thưa thớt hơn được
bằng cách tìm đặc điểm giống nhất trong hình ảnh tích lũy trong quá trình tái thiết.
Ia cho mọi đặc điểm trong ảnh Ib, sử dụng thước đo độ tương tự so sánh Đăng ký hình ảnh. Bắt đầu từ việc xây dựng lại số liệu, hình ảnh mới
hình thức fj của các đặc điểm. Phương pháp này có độ phức tạp tính có thể được đăng ký cho mô hình hiện tại bằng cách
toán O(N2 N2 ) và là giải bài toán Phối cảnh-n-Điểm (PnP) [18] bằng cách sử dụng
TÔI Fi
cấm đối với các bộ sưu tập hình ảnh lớn. Một loạt các phương pháp giải tính năng tương ứng với các điểm tam giác đã có
quyết vấn đề kết hợp hiệu quả và có thể mở rộng [1, 20, 37, 62, 28, hình ảnh đã đăng ký (tương ứng 2D-3D). Vấn đề PnP liên quan đến việc
50, 30]. Đầu ra là một tập hợp các cặp hình ảnh có khả năng chồng chéo ước tính tư thế Pc và đối với trường hợp chưa được hiệu chỉnh
C = {{Ia, Ib} | Ia, Ib máy ảnh, các thông số nội tại của nó. Do đó, tập P được mở rộng bởi
I, a < b} và các đặc điểm tương ứng liên quan của chúng tư thế Pc của hình ảnh mới được đăng ký. Từ
Mab Fa × Fb. sự tương ứng 2D-3D thường bị ô nhiễm ngoại lệ,
Xác minh hình học. Giai đoạn thứ ba xác minh các cặp hình ảnh có khả tư thế cho máy ảnh được hiệu chỉnh thường được ước tính bằng cách sử dụng
năng chồng lấp C. Vì việc so khớp là RANSAC và bộ giải bài toán tối thiểu, ví dụ [22, 34]. Đối với máy ảnh
chỉ dựa vào hình thức bên ngoài, không đảm bảo rằng các đối tượng địa chưa được hiệu chỉnh, nhiều bộ giải tối thiểu khác nhau, ví dụ [10] hoặc
lý tương ứng thực sự ánh xạ tới cùng một điểm cảnh. các phương pháp tiếp cận dựa trên lấy mẫu, ví dụ [31], tồn tại. Chúng tôi đề xuất một
Do đó, SfM xác minh các kết quả trùng khớp bằng cách cố gắng ước tính một phương pháp lựa chọn hình ảnh tốt nhất tiếp theo mạnh mẽ mới cho độ chính xác
phép biến đổi ánh xạ các điểm đặc trưng giữa các hình ảnh bằng cách sử đưa ra ước tính và tam giác hóa đáng tin cậy trong Sec. 4.2.
dụng hình học xạ ảnh. Tùy thuộc vào cấu hình không gian của một cặp Tam giác. Hình ảnh mới đăng ký phải tuân thủ
ảnh, các ánh xạ khác nhau mô tả chúng điểm cảnh hiện có. Ngoài ra, nó còn có thể làm tăng cảnh
quan hệ hình học. Một homoography H mô tả sự chuyển đổi của một máy phạm vi bao phủ bằng cách mở rộng tập hợp các điểm X thông qua phép
ảnh quay hoàn toàn hoặc chuyển động đo tam giác. Một điểm cảnh Xk mới có thể được tam giác hóa và thêm vào
một cảnh phẳng [26]. Hình học epi cực [26] mô tả tới X ngay khi có ít nhất một hình ảnh nữa, cũng bao gồm
mối quan hệ cho một camera chuyển động thông qua ma trận thiết yếu phần cảnh mới nhưng từ một góc nhìn khác đã được đăng ký.
E (đã hiệu chuẩn) hoặc ma trận cơ bản F (chưa hiệu chuẩn), Phép tam giác hóa là một bước quan trọng trong SfM, vì nó làm tăng
và có thể được mở rộng thành ba khung nhìn bằng cách sử dụng ten-sor tính ổn định của mô hình hiện có thông qua tính dư thừa [58] và nó
ba tiêu điểm [26]. Nếu một phép biến đổi hợp lệ ánh xạ một số đủ cho phép đăng ký hình ảnh mới bằng cách cung cấp thêm
của các đặc điểm giữa các hình ảnh, chúng được coi là đã được xác minh tương ứng 2D-3D. Một số lượng lớn các phương pháp để
về mặt số liệu địa lý. Vì sự tương ứng từ việc so khớp thường bị tạp tam giác đa góc nhìn tồn tại [27, 5, 25, 35, 40, 3, 44, 32].
nhiễm ngoại lệ nên cần phải có các kỹ thuật ước lượng mạnh mẽ, chẳng Các phương pháp này có độ bền hạn chế hoặc chi phí tính toán cao khi
hạn như RANSAC [18] . Đầu ra sử dụng trong SfM, chúng tôi giải quyết vấn đề này bằng cách đề xuất
của giai đoạn này là một tập hợp các cặp hình ảnh đã được xác minh về mặt hình học C¯, một phương pháp tam giác mạnh mẽ và hiệu quả trong Sec. 4.3.
sự tương ứng nội tại liên quan của chúngM¯ ab, và tùy chọn Điều chỉnh gói. Đăng ký hình ảnh và tam giác hóa là các thủ tục riêng
một mô tả về mối quan hệ hình học của họ Gab. Để quyết định biệt, mặc dù sản phẩm của chúng
mối quan hệ phù hợp, tiêu chí quyết định như GRIC [57] có mối tương quan cao – sự không chắc chắn trong máy ảnh đặt cổng
hoặc các phương pháp như QDEGSAC [21] có thể được sử dụng. Đầu ra truyền tới các điểm tam giác và ngược lại, đồng thời các góc tam giác
của giai đoạn này được gọi là biểu đồ cảnh [54, 37, 49, 30] với bổ sung có thể cải thiện tư thế máy ảnh ban đầu thông qua độ dư thừa
hình ảnh dưới dạng các nút và các cặp hình ảnh được xác minh dưới dạng các cạnh.
tăng lên. Nếu không sàng lọc thêm, SfM thường nhanh chóng chuyển sang
trạng thái không thể phục hồi. BA [58] là

2.2. Tái thiết gia tăng
tinh chỉnh phi tuyến tính chung của các thông số camera Pc và
Đầu vào của giai đoạn tái thiết là biểu đồ cảnh. tham số điểm Xk giúp giảm thiểu lỗi từ chối
Đầu ra là các ước tính đặt ra P = {Pc SE(3) | c =

E =
2
1...NP } cho hình ảnh đã đăng ký và cảnh được dựng lại (1)
ρj π (Pc, Xk) xj 2
3 j
cấu trúc dưới dạng tập hợp các điểm X = {Xk R | k = 1...NX}.
Khởi tạo. SfM khởi tạo mô hình một cách cẩn thận sử dụng hàm π chiếu cảnh trỏ tới không gian hình ảnh
và hàm mất mát ρj đối với các ngoại lệ có khả năng giảm trọng số.
4. Đóng góp
Levenberg-Marquardt [58, 26] là phương pháp được lựa chọn cho
Phần này trình bày một thuật toán mới cải tiến trên
giải quyết vấn đề BA. Cấu trúc đặc biệt của các tham số
những thách thức chính trong SfM. Đầu tiên, chúng tôi giới thiệu chiến
trong các bài toán BA thúc đẩy thủ thuật bù Schur [8],
lược xác minh số liệu địa lý giúp tăng cường biểu đồ cảnh
trong đó đầu tiên người ta giải quyết hệ thống camera thu gọn và
với thông tin sau đó cải thiện tính mạnh mẽ của
sau đó cập nhật điểm thông qua thay thế ngược. Đề án này
các thành phần khởi tạo và tam giác hóa. Thứ hai, một
thường hiệu quả hơn vì số lượng camera
Lựa chọn chế độ xem tốt nhất tiếp theo sẽ tối đa hóa độ mạnh mẽ và độ
thường nhỏ hơn số điểm. Có hai
chính xác của quá trình tái thiết tăng dần. Ngày thứ ba,
Các lựa chọn để giải hệ: thuật toán bước chính xác và không chính xác.
một phương pháp tam giác mạnh mẽ tạo ra đáng kể
Các phương pháp chính xác giải quyết hệ thống bằng cách lưu trữ và
cấu trúc cảnh hoàn chỉnh hơn trạng thái hiện đại tại
phân tích nó thành một ma trận dày đặc hoặc thưa thớt [13, 38] với một khoảng trắng
giảm chi phí tính toán. Thứ tư, chiến lược BA lặp lại, tam giác lại và
độ phức tạp của O(N2 P ) và độ phức tạp về thời gian là O(N3 P ). lọc ngoại lệ có tác dụng đáng kể
Các phương pháp không chính xác giải gần đúng hệ thống, thường
cải thiện tính đầy đủ và chính xác bằng cách giảm thiểu hiệu ứng trôi
bằng cách sử dụng một bộ giải lặp, ví dụ như liên hợp tiền điều kiện
dạt. Cuối cùng, việc tham số hóa BA hiệu quả hơn cho
gradient (PCG), có độ phức tạp về thời gian và không gian O(NP ) [4,
bộ sưu tập ảnh dày đặc thông qua việc khai thác chế độ xem dư thừa.
63]. Thuật toán trực tiếp là phương pháp được lựa chọn
Điều này dẫn đến một hệ thống rõ ràng vượt trội so với hiện trạng hiện
cho tới vài trăm máy ảnh nhưng chúng quá đắt ở quy mô lớn. Trong khi
đại về độ mạnh mẽ và hoàn thiện
các phương pháp trực tiếp thưa thớt làm giảm độ phức tạp xuống một
trong khi vẫn duy trì hiệu quả của nó. Chúng tôi đối chiếu những đóng
lượng lớn đối với các vấn đề thưa thớt,
góp của mình với các hệ thống hiện đại nhất Bundler (nguồn mở) [52] và
chúng bị cấm đối với các bộ sưu tập ảnh lớn không có cấu trúc
VisualSFM (nguồn đóng) [62]. Hệ thống được đề xuất được phát hành dưới
do đồ thị kết nối thường dày đặc hơn nhiều [54, 4].
dạng triển khai nguồn mở.
Trong trường hợp này, thuật toán gián tiếp là phương pháp được lựa chọn.
Đặc biệt đối với ảnh Internet, BA dành thời gian đáng kể 4.1. Tăng cường đồ thị cảnh
về việc tối ưu hóa nhiều hình ảnh gần như trùng lặp. Trong giây. 4.5, chúng tôi
Chúng tôi đề xuất chiến lược xác minh hình học đa mô hình để tăng
đề xuất một phương pháp xác định và tham số hóa các hình ảnh có độ
cường biểu đồ cảnh với mối quan hệ số liệu địa lý thích hợp. Đầu tiên,
chồng chéo cao để BA hiệu quả cho các bộ sưu tập dày đặc.
chúng tôi ước tính một ma trận cơ bản. Nếu như
ít nhất các nội dung NF được tìm thấy, chúng tôi xem xét cặp hình ảnh
như đã được xác minh về mặt hình học. Tiếp theo, chúng tôi phân loại
3. Thử thách phép biến đổi bằng cách xác định số lượng nội dung đồng nhất
NH cho cùng một cặp ảnh. Để ước tính các phương pháp lựa chọn mô hình
Trong khi các thuật toán SfM hiện đại nhất hiện nay có thể như GRIC, chúng tôi giả sử một camera chuyển động
xử lý sự phân bố đa dạng và phức tạp của hình ảnh trong trong một cảnh chung nếu NH/NF < HF . Đối với các hình ảnh đã
bộ sưu tập ảnh Internet quy mô lớn, chúng thường không thành công được hiệu chỉnh, chúng tôi cũng ước tính một ma trận thiết yếu và số lượng của nó
tạo ra kết quả hoàn toàn thỏa đáng về mặt tính đầy đủ của nội bộ NE. Nếu NE/NF > EF , bration. chúng tôi giả sử đúng cali-
và sự vững chắc. Thông thường, hệ thống không đăng ký được Trong trường hợp hiệu chuẩn chính xác và NH/NF < HF ,
phần lớn hình ảnh có thể đăng ký được theo kinh nghiệm [20, 30] hoặc chúng tôi phân tách ma trận thiết yếu, tam giác hóa các điểm từ
hệ thống tạo ra các mô hình bị hỏng do tương ứng nội hơn và xác định góc tam giác trung bình αm. Sử dụng αm,
đăng ký sai hoặc trôi dạt. Đầu tiên, điều này có thể do việc tìm kiếm chúng ta phân biệt giữa
tương ứng tạo ra một biểu đồ cảnh không đầy đủ, trường hợp quay thuần túy (toàn cảnh) và cảnh phẳng (pla-nar). Hơn nữa,
ví dụ: do các phép tính gần đúng phù hợp và do đó không cung cấp kết một vấn đề thường gặp trong các bức ảnh trên Internet là
nối cần thiết cho các mô hình hoàn chỉnh hình mờ, dấu thời gian và khung (WTF) [ 60, 30]
cũng không đủ dự phòng để ước tính đáng tin cậy. Thứ hai, liên kết không chính xác hình ảnh của các địa danh khác nhau. Chúng tôi phát hiện
điều này có thể được gây ra bởi giai đoạn tái thiết không thành công các cặp hình ảnh như vậy bằng cách ước tính một phép biến đổi tương tự
đăng ký hình ảnh do cấu trúc cảnh bị thiếu hoặc không chính xác với nội dung NS ở viền hình ảnh. Bất kỳ cặp hình ảnh nào với
– đăng ký hình ảnh và tam giác hóa có mối quan hệ cộng sinh trong đó NS/NF > SF NS/NE > SE được coi là WTF và
hình ảnh chỉ có thể được đăng ký với hình ảnh hiện có không được chèn vào biểu đồ cảnh. Đối với các cặp hợp lệ, chúng tôi gắn nhãn
cấu trúc cảnh và cấu trúc cảnh chỉ có thể được tam giác hóa biểu đồ cảnh với loại mô hình (chung, toàn cảnh, phẳng) cùng với các
từ các hình ảnh đã đăng ký [64]. Tối đa hóa độ chính xác và phần bên trong của mô hình với sự hỗ trợ tối đa NH, NE hoặc NF .
sự hoàn thiện của cả hai ở mỗi bước trong quá trình tăng dần Loại mô hình được tận dụng để gieo hạt
tái thiết là một thách thức chính trong SfM. Trong bài báo này, chúng tôi chỉ tái tạo từ chế độ không toàn cảnh và tốt nhất là
giải quyết thách thức này và cải thiện đáng kể kết quả trong cặp hình ảnh được hiệu chỉnh. Biểu đồ cảnh đã được tăng cường
tình trạng hiện tại (Phần 5) về mức độ hoàn thiện, cho phép tìm ra cách khởi tạo tối ưu một cách hiệu quả cho quá trình
mạnh mẽ và chính xác đồng thời nâng cao hiệu quả. tái thiết ro-bust. Ngoài ra, chúng tôi không tam giác
Điểm = 66 Điểm = 146

điểm. Việc theo dõi số liệu thống kê này có thể hiệu quả
được thực hiện bằng cách sử dụng biểu đồ các rãnh tính năng. Dành cho Internet
tập dữ liệu, biểu đồ này có thể rất dày đặc, vì nhiều hình ảnh
có thể thấy cấu trúc tương tự. Do đó, có nhiều chế độ xem ngày tháng ứng
viên để lựa chọn ở mỗi bước trong quá trình tái thiết.
Tuyên truyền hiệp phương sai triệt để theo đề xuất của Haner et
al. là không khả thi vì hiệp phương sai sẽ cần được tính toán và phân tích
Điểm = 80 Điểm = 200
cho từng ứng viên ở mỗi bước. Của chúng tôi
Hình 3. Điểm cho số điểm khác nhau (trái và phải) với phương pháp được đề xuất gần đúng với cách tiếp cận dựa trên sự không chắc
các phân phối khác nhau (trên và dưới) trong ảnh cho L = 3. chắn của họ bằng cách sử dụng phân tích đa độ phân giải hiệu quả.
Chúng ta phải đồng thời theo dõi số lượng

trễ từ các cặp ảnh toàn cảnh để tránh điểm suy biến
các điểm có thể nhìn thấy và sự phân bố của chúng trong từng độ tuổi hình
và do đó cải thiện tính mạnh mẽ của phép đo tam giác và đăng ký hình ảnh
ảnh ứng viên. Nhiều điểm dễ thấy hơn và phân bố đồng đều hơn
tiếp theo.
trong số những điểm này sẽ dẫn đến điểm S cao hơn [31], chẳng hạn
4.2. Lựa chọn chế độ xem tốt nhất tiếp theo những hình ảnh có cấu hình điểm nhìn thấy được điều hòa tốt hơn sẽ được
đăng ký trước tiên. Để đạt được mục tiêu này, chúng tôi giải mã hình ảnh
Quy hoạch tầm nhìn tốt nhất tiếp theo đã được nghiên cứu trên thực địa
thành một lưới có kích thước cố định với các thùng Kl ở cả hai
về thị giác máy tính, quang trắc và robot [12].
kích thước. Mỗi ô có hai trạng thái khác nhau: trống và
Việc chọn chế độ xem tốt nhất tiếp theo trong SfM mạnh mẽ nhằm mục đích
đầy. Bất cứ khi nào một điểm trong ô trống hiển thị trong quá trình tái cấu
giảm thiểu lỗi tái thiết [17, 24]. Ở đây, chúng tôi đề xuất một
trúc, trạng thái của ô sẽ thay đổi thành
chiến lược xem tốt nhất tiếp theo hiệu quả theo cách tiếp cận dựa trên sự
đầy và điểm Si của hình ảnh được tăng lên một trọng số
không chắc chắn nhằm tối đa hóa khả năng tái thiết mạnh mẽ.
wl . Với sơ đồ này, chúng tôi định lượng số lượng hiển thị
Việc chọn chế độ xem tốt nhất tiếp theo là rất quan trọng vì mọi quyết định đều
điểm. Vì các ô chỉ đóng góp vào tổng điểm một lần,
ảnh hưởng đến quá trình tái thiết còn lại. Một quyết định tồi có thể dẫn
chúng tôi ủng hộ việc phân phối đồng đều hơn trong trường hợp khi
đến hàng loạt lần đăng ký sai máy ảnh và
các điểm được nhóm lại thành một phần của hình ảnh (tức là chỉ một
tam giác sai. Ngoài ra, việc lựa chọn điều tốt nhất tiếp theo
vài ô chứa tất cả các điểm nhìn thấy được). Tuy nhiên, nếu số
chế độ xem tác động lớn đến cả chất lượng ước tính tư thế và
số điểm nhìn thấy được là Nt K2 tôi , kế hoạch này có thể không giới hạn
tính đầy đủ và chính xác của phép tính tam giác. Ước tính tư thế có tỷ lệ
đảm bảo việc phân phối điểm tốt vì mọi điểm đều có khả năng
chính xác là điều cần thiết cho SfM mạnh mẽ, vì phép tính ba góc điểm có
rơi vào một ô riêng biệt. Do đó, chúng tôi mở rộng cách tiếp cận được mô
thể thất bại nếu tư thế không chính xác. Quyết định
tả trước đó cho kim tự tháp đa độ phân giải
về việc chọn chế độ xem tốt nhất tiếp theo là một thách thức, vì đối với
với mức l = 1...L bằng cách phân vùng ảnh sử dụng mức cao hơn
Bộ sưu tập ảnh trên Internet thường không có thông tin sơ bộ về phạm vi
độ phân giải Kl = 2l ở mỗi cấp độ liên tiếp. Điểm số
cảnh và thông số máy ảnh, và
được tích lũy trên tất cả các cấp với độ phân giải phụ thuộc
do đó, quyết định hoàn toàn dựa trên thông tin được rút ra từ sự xuất hiện
trọng lượng wl = K2 Cấu trúc dữ liệu này và điểm số của nó có thể được
tôi .
[17], sự tương ứng giữa hai quan điểm và

cập nhật trực tuyến một cách hiệu quả. Hình 3 hiển thị điểm số cho các cấu
cảnh được xây dựng lại dần dần [53, 24].
hình khác nhau và Phần. 5 thể hiện độ tin cậy và độ chính xác của việc tái
Một chiến lược phổ biến là chọn hình ảnh được nhìn thấy nhiều nhất
xây dựng được cải thiện khi sử dụng chiến lược này.
các điểm tam giác [52] với mục đích giảm thiểu sự không chắc chắn trong
việc cắt bỏ camera. Haner và cộng sự. [24] đề xuất một

4.3. Tam giác mạnh mẽ và hiệu quả
cách tiếp cận dựa trên sự không chắc chắn giúp giảm thiểu lỗi tái thiết.
Thông thường, camera nhìn thấy số lượng lớn nhất Đặc biệt đối với các bộ sưu tập hình ảnh được so khớp thưa thớt, việc
của các điểm tam giác được chọn, ngoại trừ khi cấu hình quan sát không khai thác các tương ứng bắc cầu sẽ tăng cường phép tính tam giác
được điều chỉnh tốt. Để đạt được mục đích này, đầy đủ và chính xác, và do đó cải thiện
Lepetit và cộng sự. [34] bằng thực nghiệm cho thấy rằng độ chính xác của đăng ký hình ảnh. Các kỹ thuật đối sánh gần đúng thường ưu tiên các cặp
tư thế máy ảnh sử dụng PnP phụ thuộc vào số lượng quan sát và sự phân bố hình ảnh có bề ngoài giống nhau và do đó, kết quả tương ứng giữa hai góc
của chúng trong ảnh. Dành cho Internet nhìn thường xuất phát từ các cặp hình ảnh.
Trong ảnh, bài toán PnP tiêu chuẩn được mở rộng sang việc ước tính các với một đường cơ sở nhỏ. Tận dụng tính chuyển tiếp thiết lập
tham số nội tại trong trường hợp hiệu chuẩn trước bị thiếu hoặc không chính sự tương ứng giữa các hình ảnh với đường cơ sở lớn hơn và
xác. Một số lượng lớn các kết quả tương ứng 2D-3D cung cấp sự dư thừa cho do đó cho phép tam giác hóa chính xác hơn. Do đó, chúng tôi hình thành
ước tính này [34], các bản nhạc đặc trưng bằng cách nối các thư từ hai chế độ xem.
trong khi việc phân bổ các điểm đồng đều sẽ tránh được cấu hình xấu và cho Một loạt các phương pháp tiếp cận đã được đề xuất cho phép tam giác
phép ước tính nội tại một cách đáng tin cậy [41]. hóa nhiều góc nhìn từ các quan sát ảnh nhiễu [27, 40,
Các ứng cử viên cho góc nhìn tốt nhất tiếp theo vẫn chưa phải là 5]. Mặc dù một số phương pháp được đề xuất là mạnh mẽ đối với
hình ảnh đã đăng ký có ít nhất Nt > 0 tam giác mức độ ô nhiễm ngoại lệ nhất định [25, 35, 3, 44, 32],
theo hiểu biết tốt nhất của chúng tôi, không có phương pháp tiếp cận nào Pb (ràng buộc về độ cheirality), với độ sâu được xác định là
có thể xử lý tỷ lệ ngoại lệ cao thường xuất hiện trong các rãnh đặc trưng
T
(Hình 6). Chúng tôi đề cập đến Kang et al. [32] để biết tổng quan chi tiết 1 , (4)
d = p31 p32 p33 p34 XT bụng
về các phương pháp tam giác đa góc nhìn hiện có. Trong phần này, chúng
tôi đề xuất một phương pháp tam giác dựa trên việc lấy mẫu hiệu quả, có trong đó pmn biểu thị phần tử ở hàng m và cột n của P. Phép
thể ước tính chính xác tất cả các điểm trong một rãnh tính năng bị ô nhiễm đo Tn được coi là phù hợp với mô hình nếu nó có độ sâu dương
ngoại lệ. dn và nếu lỗi chiếu lại của nó
Các rãnh đặc trưng thường chứa một số lượng lớn các điểm
x
ngoại lệ do xác minh hai chế độ xem sai lầm đối với các kết
x / Xab
en = x¯n với y = Pn (5)
quả khớp không rõ ràng dọc theo đường biểu cực. Một sự không 1
zy /z
2 z
khớp duy nhất sẽ hợp nhất các đường đi của hai hoặc nhiều điểm
độc lập. Ví dụ: việc hợp nhất sai bốn rãnh đặc trưng có độ dài
nhỏ hơn một ngưỡng nhất định t. RANSAC tối đa hóa K như một cách tiếp cận
bằng nhau sẽ dẫn đến tỷ lệ ngoại lệ là 75%. Ngoài ra, tư thế
lặp đi lặp lại và nói chung nó lấy mẫu thống nhất tập hợp kích thước tối
máy ảnh không chính xác có thể làm mất hiệu lực của các thành
thiểu hai một cách ngẫu nhiên. Tuy nhiên, vì có khả năng lấy mẫu cùng một
phần đường đua do lỗi trình chiếu cao. Do đó, để tam giác hóa
tập hợp tối thiểu nhiều lần cho NT nhỏ , nên chúng tôi xác định bộ lấy mẫu
mạnh mẽ, cần phải tìm một tập hợp đồng thuận các phần tử rãnh
ngẫu nhiên của mình để chỉ tạo ra các mẫu duy nhất. Để đảm bảo với độ tin
ghi trước khi thực hiện sàng lọc bằng cách sử dụng nhiều khung
cậy η rằng ít nhất một tập tối thiểu không có ngoại lệ đã được lấy mẫu,
nhìn. Hơn nữa, để khôi phục nhiều điểm tiềm năng của một rãnh
đối tượng từ việc hợp nhất bị lỗi, cần phải có sơ đồ tam giác đệ quy. RANSAC phải chạy trong ít nhất K lần lặp. Vì tỷ lệ nội tại tiên nghiệm
không xác định nên chúng tôi đặt nó ở giá trị ban đầu nhỏ và điều chỉnh K
Bundler lấy mẫu tất cả các kết hợp theo cặp của các phần tử
bất cứ khi nào chúng tôi tìm thấy tập hợp đồng thuận lớn hơn (tiêu chí
0
đường ray, thực hiện phép đo tam giác hai góc nhìn, sau đó kiểm
dừng thích ứng). Bởi vì một rãnh tính năng có thể chứa nhiều điểm độc lập
tra xem liệu ít nhất một giải pháp có đủ góc tam giác hay không.
nên chúng tôi chạy quy trình này một cách đệ quy bằng cách loại bỏ tập hợp
Nếu tìm thấy giải pháp được điều hòa tốt, phép tam giác đa góc
đồng thuận khỏi các phép đo còn lại. Quá trình đệ quy dừng lại nếu kích
nhìn được thực hiện trên toàn bộ đường đi và được chấp nhận nếu
thước của tập đồng thuận cuối cùng nhỏ hơn ba. Các đánh giá trong Sec. 5
tất cả các quan sát vượt qua ràng buộc về độ chính xác [26].
chứng minh tính hoàn chỉnh của phép tam giác tăng lên với chi phí tính
Phương pháp này không hiệu quả đối với các ngoại lệ vì không thể
toán giảm cho phương pháp đề xuất.
bao phủ lại các điểm độc lập được hợp nhất thành một rãnh. Ngoài
ra, nó có chi phí tính toán đáng kể do tam giác từng cặp đầy đủ.
Phương pháp của chúng tôi khắc phục được cả hai hạn chế.
Để xử lý các mức độ ô nhiễm ngoại lệ tùy ý, chúng tôi xây dựng bài toán
4.4. Điều chỉnh gói
tam giác hóa nhiều góc nhìn bằng RANSAC. Chúng tôi xem xét đường đặc trưng
T = {Tn | n = 1...NT } dưới dạng một tập hợp các phép đo với tỷ lệ nội bộ Để giảm thiểu lỗi tích lũy, chúng tôi thực hiện BA sau khi
chưa xác định trước. Một phép đo Tn bao gồm và đăng ký tuổi hình ảnh và tam giác hóa. Thông thường, không cần
thực hiện BA toàn cục sau mỗi bước vì SfM tăng dần chỉ ảnh hưởng
2
quan sát hình ảnh được chuẩn hóa x¯n R tư thế đến mô hình cục bộ. Do đó, chúng tôi thực hiện BA cục bộ trên
camera phản hồi Pn SE(3) xác định phép chiếu từ thế giới tới tập hợp các ảnh được kết nối nhiều nhất sau mỗi lần đăng ký ảnh.
khung máy ảnh P = RT RT t với R SO(3) và t R mize sự hỗ Tương tự như VisualSFM, chúng tôi chỉ thực hiện BA toàn cầu sau
3
trợ của các phép đo phù hợp với . Mục tiêu của chúng tôi là tối đa hóa khi phát triển mô hình theo một tỷ lệ phần trăm nhất định, dẫn
tam giác hai góc nhìn được điều hòa tốt đến thời gian chạy tuyến tính được khấu hao của SfM.
Tham số hóa. Để tính đến các giá trị ngoại lệ tiềm ẩn, chúng tôi
sử dụng hàm Cauchy làm hàm tổn thất mạnh ρj trong BA cục bộ. Đối
Xab τ (x¯a, x¯b, Pa, Pb) với a = b, (2)
với các vấn đề lên tới vài trăm camera, chúng tôi sử dụng bộ giải
trực tiếp thưa thớt và đối với các vấn đề lớn hơn, chúng tôi dựa
trong đó τ là bất kỳ phương pháp tam giác nào được chọn (trong
vào PCG. Chúng tôi sử dụng Ceres Solver [2] và cung cấp tùy chọn
trường hợp của chúng tôi là phương pháp DLT [26]) và Xab là điểm tam giác.
chia sẻ các mẫu máy ảnh có độ phức tạp tùy ý giữa bất kỳ tổ hợp
Lưu ý rằng chúng tôi không lập tam giác từ các cặp ảnh toàn cảnh
hình ảnh nào. Đối với các ảnh Internet không có thứ tự, chúng
(Phần 4.1) để tránh các góc tam giác sai do ước tính tư thế
tôi dựa vào một mẫu máy ảnh đơn giản với một tham số biến dạng
không chính xác. Một mô hình được điều hòa tốt thỏa mãn hai ràng
xuyên tâm, vì việc ước tính dựa vào khả năng tự hiệu chỉnh thuần túy.
buộc. Đầu tiên, một góc tam giác đủ α
Lọc. Sau BA, một số quan sát không phù hợp với mô hình. Theo đó,
ta Xab tb Xab chúng tôi lọc các quan sát có lỗi từ chối lớn [53, 62]. Ngoài
cos α = · . (3)
ra, đối với mỗi điểm, chúng tôi kiểm tra hình học được điều hòa
ta Xab2 tb Xab2
tốt bằng cách thực thi góc tam giác tối thiểu trên tất cả các
Thứ hai, độ sâu dương da và db ghi các quan điểm Pa và cặp tia nhìn
[53]. Sau BA toàn cầu, chúng tôi cũng kiểm tra các máy ảnh bị suy vấn đề cắt đồ thị trên đồ thị của các thông số camera và điểm được kết
thoái, ví dụ như những máy ảnh gây ra bởi ảnh toàn cảnh hoặc hình ảnh nối. BA sau đó luân phiên giữa việc cố định camera và điểm và tinh
được tăng cường nhân tạo. Thông thường, những camera đó chỉ có những chỉnh các biến phân tách và ngược lại. Một cách tiếp cận khác của
Carlone et al. [11] thu gọn nhiều điểm có thứ hạng thấp thành một yếu
quan sát ngoại lệ hoặc nội tại của chúng hội tụ đến mức tối thiểu không có thật.
Do đó, chúng tôi không giới hạn các tham số độ dài tiêu cự và độ méo trong tố duy nhất áp đặt ràng buộc thứ hạng cao trên máy ảnh, mang lại lợi
một phạm vi cố định tiên nghiệm mà để chúng tự do tối ưu hóa trong BA. Vì thế tính toán khi máy ảnh chia sẻ nhiều điểm.
việc hiệu chỉnh điểm chính là một vấn đề không được giải quyết tốt [15]
nên chúng tôi giữ nó cố định ở trung tâm hình ảnh đối với các máy ảnh chưa Phương pháp đề xuất của chúng tôi được thúc đẩy bởi những công trình
được hiệu chỉnh. Máy ảnh có trường nhìn bất thường hoặc cường độ hệ số trước đó. Tương tự như Ni và cộng sự, chúng tôi phân chia vấn đề thành
biến dạng lớn được coi là ước tính và lọc không chính xác sau BA toàn cầu. các sơ đồ con có các tham số bên trong được tính toán. Chúng tôi có ba
đóng góp chính: Thứ nhất, một sơ đồ nhóm máy ảnh hiệu quả tận dụng các
Tái tam giác. Tương tự như VisualSfM, chúng tôi thực hiện phép tính lại đặc tính vốn có của SfM và thay thế phương pháp cắt biểu đồ đắt tiền
tam giác (RT) để tính đến các hiệu ứng trôi trước BA toàn cầu (tiền BA được Ni et al sử dụng. Thứ hai, thay vì nhóm nhiều camera vào một sơ đồ
RT). Tuy nhiên BA thường cải thiện đáng kể thông số camera và điểm. Do đó, con, chúng tôi phân vùng cảnh thành nhiều nhóm camera nhỏ, có tính
chúng tôi đề xuất mở rộng giai đoạn tiền BA RT rất hiệu quả bằng một bước chồng chéo cao. Các camera trong mỗi nhóm được thu gọn thành một camera
bổ sung sau BA RT. Mục đích của bước này là để cải thiện tính hoàn chỉnh duy nhất, do đó giảm chi phí giải quyết hệ thống camera bị thu gọn. Thứ
của việc tái thiết (so sánh Phần 4.3) bằng cách tiếp tục theo dõi các điểm ba, do hậu quả của các nhóm camera nhỏ hơn, chồng chéo cao hơn nhiều,
mà trước đây không thể tam giác hóa, ví dụ: do tư thế không chính xác, chúng tôi loại bỏ sơ đồ xen kẽ của Ni et al. bằng cách bỏ qua tối ưu
v.v. Thay vì tăng ngưỡng tam giác, chúng tôi chỉ tiếp tục theo dõi với các hóa biến phân cách.
quan sát có sai số nằm dưới ngưỡng lọc. Ngoài ra, chúng tôi cố gắng hợp
nhất các bản nhạc và do đó tăng độ dư thừa cho bước BA tiếp theo.
SfM nhóm các hình ảnh và điểm thành hai bộ dựa trên việc các tham
số của chúng có bị ảnh hưởng bởi phần mở rộng mô hình gia tăng mới
nhất hay không. Đối với các vấn đề lớn, hầu hết cảnh vẫn không bị ảnh
hưởng do mô hình thường mở rộng cục bộ. BA tự nhiên tối ưu hóa nhiều
Tinh chỉnh lặp đi lặp lại. Bundler và VisualSfM thực hiện một phiên bản
hơn cho các bộ phận mới được mở rộng trong khi các bộ phận khác chỉ
BA và lọc duy nhất. Do sự trôi dạt hoặc RT trước BA, thông thường một
cải thiện trong trường hợp bị trôi [62]. Hơn nữa, các bộ sưu tập ảnh
phần đáng kể các quan sát trong BA là các giá trị ngoại lệ và sau đó
trên Internet thường có sự phân bố camera không đồng đều, có nhiều góc
được lọc. Vì BA bị ảnh hưởng nghiêm trọng bởi các giá trị ngoại lệ nên
nhìn dư thừa.
bước thứ hai của BA có thể cải thiện đáng kể kết quả. Do đó, chúng tôi
Được thúc đẩy bởi những quan sát này, chúng tôi phân chia các phần cảnh
đề xuất thực hiện BA, RT và lọc theo cách tối ưu hóa lặp lại cho đến
không bị ảnh hưởng thành các nhóm G = {Gr | r = 1...NG} gồm các hình ảnh
khi số lượng quan sát được lọc và các điểm RT sau BA giảm đi. Trong hầu
có độ chồng chéo cao và tham số hóa từng nhóm Gr dưới dạng một camera duy
hết các trường hợp, sau lần lặp thứ hai, kết quả được cải thiện đáng kể
nhất. Các hình ảnh bị ảnh hưởng bởi tiện ích mở rộng mới nhất được nhóm
và sự tối ưu hóa hội tụ.
độc lập để cho phép tinh chỉnh tối ưu các thông số của chúng. Lưu ý rằng
điều này dẫn đến việc tham số hóa BA tiêu chuẩn (Phương trình 1). Đối với
Giây. Hình 5 chứng minh rằng việc sàng lọc lặp đi lặp lại được đề xuất
những hình ảnh không bị ảnh hưởng, chúng tôi tạo ra các nhóm số lượng NGr .
sẽ tăng cường đáng kể tính hoàn thiện của quá trình tái thiết.
Chúng tôi coi một hình ảnh là bị ảnh hưởng nếu nó được thêm vào trong lần
4.5. Khai thác chế độ xem dư thừa mở rộng mô hình mới nhất hoặc nếu nhiều hơn một tỷ lệ quan sát của nó có
lỗi chiếu lại lớn hơn r pixel (để tinh chỉnh các camera được tái tam giác).
r
BA là điểm nghẽn hiệu suất lớn trong SfM. Trong phần này, chúng tôi
đề xuất một phương pháp khai thác các đặc điểm vốn có của bộ sưu tập
Các hình ảnh trong một nhóm phải càng dư thừa càng tốt [43] và số
ảnh dày đặc và SfM gia tăng để tham số hóa BA hiệu quả hơn bằng cách
lượng điểm cùng nhìn thấy giữa các hình ảnh là thước đo để mô tả mức
phân cụm các camera dư thừa thành các nhóm có cảnh chồng chéo cao.
độ tương tác lẫn nhau của chúng [33]. Đối với cảnh có điểm NX , mỗi ảnh
có thể được mô tả bằng vectơ hiển thị nhị phân vi {0, 1} mục nhập
Các bộ sưu tập ảnh trên Internet thường có kiểu hiển thị rất không
thứ n trong vi là 1 nếu điểm Xn hiển thị trong ảnh i và 0
NX , Ở đâu
đồng nhất do mức độ phổ biến của các địa điểm ưa thích khác nhau. Hơn
nếu ngược lại. Mức độ tương tác giữa ảnh a và b được tính bằng các phép
nữa, các bộ sưu tập không có thứ tự thường được nhóm lại thành các
toán bitwise trên vectơ vi của chúng
mảnh điểm có thể nhìn thấy được trong nhiều hình ảnh. Một số công trình
trước đây khai thác thực tế này để nâng cao hiệu quả của BA, bao gồm
Kushal et al. [33] người phân tích mô hình hiển thị để điều kiện tiên Vab = va vb / va vb . (6)
quyết hiệu quả cho hệ thống camera thu nhỏ. Ni và cộng sự. [43] phân
vùng các camera và điểm thành các sơ đồ con, được kết nối thông qua các Để xây dựng nhóm, chúng tôi sắp xếp các hình ảnh như I¯ = {Ii | vi ≥
biến phân cách, bằng cách đặt phân vùng dưới dạng vi+1}. Chúng ta khởi tạo một nhóm Gr bằng cách loại bỏ hình ảnh Ia
đầu tiên khỏi I¯ và tìm hình ảnh Ib tối đa hóa Vab.

×105 ×105 σ = 0
1
10 10
σ = 0,03
µ = 0 0,9 1
σ = 0,06
µ = 0,1
số 8 số 8
Điểm
Điểm
σ = 0,09
µ = 0,2 0,8
6 6 σ = 0,12 0,8
µ = 0,3
σ = 0,15
0,7
trung
bình
[m]
Sai
số
µ = 0,4 Kim tự tháp
4 4 Kim Tự Tháp - Con Số 0,6 Tỉ lệ
µ = 0,5
nhất
Giao
hợp
qua
lộ
0,6 Kim tự tháp - Tỷ lệ Con số
2 2 Số - Tỉ Lệ
0,4
0,5
0 0 0 1000 2000 3000 4000 5000 50 100 150 200
0 0,05 0,1 0,15 0 200 400 600 800 1000
Số lượng hình ảnh đã đăng ký Số lượng hình ảnh thực tế đã đăng ký
Độ lệch chuẩn σ Số điểm
Hình 4. Điểm xem tốt nhất tiếp theo cho các điểm phân phối Gaussian Hình 5. Kết quả xem tốt nhất tiếp theo cho Quad: Số lượng hình ảnh đã đăng
ký được chia sẻ và lỗi tái tạo trong SfM tăng dần.

xj [0, 1]×[0, 1] với giá trị trung bình µ và std. dev. σ. Điểm S viết về
6 4
tính đồng nhất (trái) và số điểm cho µ = 0,5 (phải). Đầy đủ, không rec.
RANSAC, không ghi, η = 0,999
RANSAC, không ghi lại, η = 0,5
3 Đầy đủ, khuyến nghị.
4 RANSAC, rec., η = 0,999
RANSAC, rec., η = 0,5
2
Nếu Vab > V và |Gr| < S, hình ảnh Ib bị xóa khỏi I¯ và
log10
điểm
Số.
số
2
log10
mẫu
Số.
được thêm vào nhóm Gr. Ngược lại, một nhóm mới sẽ được khởi tạo. 1
Để giảm thời gian tìm Ib, chúng tôi sử dụng phương pháp heuristic 0 0
0 0,2 0,4 0,6 Tỷ 0,8 1 0 20 40 60 80 100
giới hạn tìm kiếm ở các vùng lân cận gần nhất trong không gian Kr lệ ngoại lệ Theo dõi độ dài
với hướng xem chung trong phạm vi ±β độ, được thúc đẩy bởi thực tế Hình 6. Thống kê tam giác cho tập dữ liệu Dubrovnik. Bên trái: Phân bổ tỷ
là những hình ảnh đó có độ phân giải cao lệ ngoại vi của các rãnh đặc trưng. Phải: Số lượng trung bình của
các mẫu cần thiết để tam giác hóa điểm N-view.

khả năng chia sẻ nhiều điểm.
Đăng ký hình ảnh
Mỗi hình ảnh trong một nhóm sau đó được tham số hóa bằng một 1
Tam giác
2 Cử nhân địa phương
khung tọa độ nhóm-cục bộ chung. Hàm chi phí BA (Phương trình 1) cho Cử nhân toàn cầu
0 20 40 60 80 100 Lọc
các hình ảnh được nhóm là

Hình 7. Thời gian chạy tương đối trung bình sử dụng BA toàn cầu tiêu chuẩn và
đầy đủ, khuyến nghị. tam giác (1), và nhóm BA và RANSAC,

2
Ví dụ = ρj πg (Gr, Pc, Xk) xj 2 (7) đề nghị tam giác (2). Thời gian chạy để khởi tạo và tốt nhất tiếp theo
j
Lựa chọn chế độ xem (tất cả các chiến lược) nhỏ hơn 0,1%.
sử dụng các tham số nhóm bên ngoài Gr SE(3) và cố định

Lựa chọn chế độ xem tốt nhất tiếp theo. Thí nghiệm tổng hợp
Máy tính. Khi đó ma trận chiếu của ảnh thuộc nhóm r là
(Hình 4) đánh giá mức độ S phản ánh số lượng và sự phân bổ điểm.
được định nghĩa là sự kết hợp của nhóm và tư thế hình ảnh
Chúng tôi sử dụng kim tự tháp L = 6
Pcr = PcGr. Tổng chi phí E¯ là tổng của nhóm
các cấp độ và chúng tôi tạo ra các điểm hình ảnh được phân phối Gaussian
và đóng góp chi phí chưa được nhóm lại. Để ghép nối hiệu quả các
với độ trải σ và vị trí µ. Giá trị σ lớn hơn và µ ở trung tâm hơn
thành phần quay của Gr và Pi , chúng tôi dựa vào
tương ứng với sự phân bố đồng đều hơn và tạo ra điểm số cao hơn một
quaternion. Quy mô nhóm lớn hơn sẽ mang lại lợi ích về hiệu suất cao
hơn do chi phí tính toán πg trên π tương đối nhỏ hơn. Lưu ý rằng ngay cách chính xác. Tương tự, điểm số bị chi phối bởi số lượng điểm khi
có ít và mặt khác bởi sự phân bổ của chúng trong ảnh. Một thử nghiệm
cả đối với trường hợp của một nhóm
khác (Hình 5) so sánh phương pháp của chúng tôi (Kim tự tháp) với
kích thước bằng hai, chúng tôi quan sát thấy một lợi ích tính toán.
phương pháp hiện có
Ngoài ra, lợi ích thực hiện còn phụ thuộc vào quy mô vấn đề,
vì việc giảm số lượng camera ảnh hưởng đến khối chiến lược liên quan đến lỗi tái thiết. Cái khác
phương thức là Số [53], giúp tối đa hóa số lượng
độ phức tạp tính toán của các phương pháp trực tiếp lớn hơn
điểm tam giác và Tỷ lệ tối đa hóa tỷ lệ
độ phức tạp tuyến tính của các phương pháp gián tiếp (Phần 2).
của khả năng nhìn thấy trên các điểm có khả năng nhìn thấy. Sau mỗi
5. Thí nghiệm lần đăng ký độ tuổi hình ảnh, chúng tôi đo lường số lượng hình ảnh
đã đăng ký được chia sẻ giữa các chiến lược (giao nhau trên liên kết)
Chúng tôi chạy thử nghiệm trên nhiều bộ dữ liệu khác nhau để và lỗi tái thiết là khoảng cách trung bình đến
đánh giá cả các thành phần được đề xuất và toàn bộ hệ thống
vị trí camera thực tế. Mặc dù tất cả các chiến lược đều hội tụ về
so với các hệ thống gia tăng tiên tiến nhất (Bundler [53], Vi-
cùng một tập hợp hình ảnh đã đăng ký, phương pháp của chúng tôi tạo
sualSFM [62]) và các hệ thống SfM toàn cầu (DISCO [14], Theia
1
ra sự tái tạo chính xác nhất bằng cách chọn một phương pháp tốt hơn
[55] ). 17 bộ dữ liệu chứa tổng cộng 144.953 dữ liệu không có thứ tự
thứ tự đăng ký hình ảnh.
Hình ảnh trên Internet, được phân phối trên một khu vực rộng lớn và có độ phân giải cao
Tam giác mạnh mẽ và hiệu quả. Một thí nghiệm trên
mật độ camera khác nhau Ngoài ra, Quad [14] còn có vị trí camera
bộ dữ liệu Dubrovnik (Hình 6 và Bảng 2) đánh giá
chân thực. Trong suốt tất cả các thí nghiệm, chúng tôi sử dụng
phương pháp trên 2,9 triệu bản nhạc nổi bật được tạo từ 47 triệu
Tính năng RootSIFT và khớp từng hình ảnh với 100 hình ảnh của nó
kết quả phù hợp đã được xác minh. Chúng tôi so sánh với Bundler và
những người hàng xóm gần nhất sử dụng cây từ vựng được đào tạo trên
một chiến lược toàn diện lấy mẫu tất cả các kết hợp theo cặp trong một
các tập dữ liệu không liên quan. Để đảm bảo khả năng so sánh giữa
theo dõi. Chúng ta đặt α = 2 , t = 8px và bùng
0 = 0,03. Tránh
các phương pháp khác nhau, tìm kiếm tương ứng không được bao gồm trong
nổ tổ hợp, chúng tôi hạn chế cách tiếp cận toàn diện
định thời gian trên máy 2.7GHz với RAM 256GB.
đến 10K lần lặp, tức là tối thiểu ≈ 0,02 với η = 0,999. Phân bố tỷ
1Kết quả cho Theia được các tác giả vui lòng cung cấp [55]. lệ đa chiều trong hơn (như được xác định bằng hàm định kỳ
# hình ảnh # Đăng ký # Điểm (Độ dài bản nhạc trung bình) Thời gian [giây] Trung bình khiển trách. Lỗi [px]
Theia Bundler VSFM Của chúng tôi Theia người đóng gói VSFM Của chúng tôi Theia Bundler VSFM Của chúng tôi Theia Bundler VSFM Của chúng tôi
– – –
La Mã [14] 74.394 – 13.455 14.797 20.918 5.028 5,4 triệu 12,9 triệu 5,3 triệu – 295.200 6.012 10.912 –
– –
– – 10,5M 0,8M – –
Bốn [14] 6.514 5.624 5.860 – 5.913 1,2 triệu 223.200 2.124 3.791 – 3.821
– –
– – – – – – – – –
Dubrovnik [36] 6.044 1,35 triệu – –
Alamo [61] 2.915 582 647 609 666 146K (6.0) 127K (4.5) 124K (8.9) 94K (11.6) 874 22.025 94 495 882 1,47 2,29 0,70 0,68
Đảo Ellis [61] 2.587 231 286 297 315 29K (4,9) 39K (4,1) 61K (5,5) 64K (6,8) 12.798 240 202 465.213 332 2,41 2,24 0,71 0,70
Quảng trường hiến binh [61] 1.463 703 302 807 861 87K (3,8) 93K (3,7) 138K (4,9) 123K (6,1) 412 95 21.633 207 627 2.19 1,59 0,71 0,68
Thủ đô Madrid [61] 1.344 351 330 309 368 47K (5.0) 27K (3.2) 48K (5.2) 43K (6.6) 112.171 418 203 251 1,48 1,62 0,59 0,60
Montréal Notre Dame [61] 2.298 464 501 506 491

453400 411 154K (5.4) 135K (4.6) 110K (7.1) 98K (8.7) 723 194 36.462 327 420 89 33.805 2,01 1,92 0,88 0,81
Thư viện New York [61] 2.550 339 376 403 437 1.087 66K (4.1) 71K (3.7) 95K (5.5) 77K (7.1) 275 380 1.427 478.956 1.236 1.961 1,89 1,84 0,67 0,69
Quảng trường Popolo [61] 2.251 335 2.161 2.336 885 1.320 36K (5.2) 34K (3.7) 50K (7.2) 47K (8.8) 1.302 587.451 748 1.041 201 2,11 1,76 0,76 0,72
Piccadilly [61] 7.351 2.270 1.409 569 547 578 1.257 197K (4,9) 197K (3,9) 245K (6,9) 260K (7,9) 184.905 497 678 1.494 612.452 3.921 2,33 1,79 0,79 0,75
Diễn đàn La Mã [61] 2.364 1.074 5.087 5.211 649 658 261K (4,9) 281K (4,4) 278K (5,7) 222K (7,8) 5.122 131 56.317 556 693 764 2,07 1,66 0,69 0,70
Tháp Luân Đôn [61] 1.576 468 76 3 853 890 933 379 140K (5.2) 151K (4.8) 143K (5.7) 109K (7.4) 567.213 899 1.244 1 64 34.641 661 1,86 1,54 0,59 0,61
Trafalgar [61] 15.685 5.067 427 456 381K (4,8) 196K (3,7) 497K (8,7) 450K (10,1) 997 2,09 2,07 0,79 0,74
Quảng trường Thống nhất [61] 5.961 720 35K (5.3) 48K (3.7) 43K (7.1) 53K (8.2) 2,36 3,22 0,68 0,67
Nhà thờ Vienna [61] 6.288 858 259K (4,9) 276K (4,6) 231K (7,6) 190K (9,8) 2,45 1,69 0,80 0,74
Yorkminster [61] 3.368 429 143K (4,5) 71K (3,9) 130K (5,2) 105K (6,8) 2,38 2,61 0,72 0,70
Bảng 1. Kết quả tái thiết các hệ thống SfM tiên tiến trên các bộ sưu tập ảnh Internet không có thứ tự quy mô lớn.
#Điểm #Yếu tố Trung bình Theo dõi độ dài #Mẫu
người đóng gói 713.824 5,58 triệu 7.824 136,34 triệu
Không đệ quy
đầy đủ 861.591 7,64 triệu 8,877 120,44 triệu
RANSAC, η1 861.591 7,54 triệu 8,760 3,89 triệu
đệ quy
đầy đủ 894.294 8,05 triệu 9,003 145,22 triệu

Hình 9. Tái thiết Gendarmenmarkt [61] cho Bundler
(trái) và phương pháp của chúng tôi (phải).
Bảng 2. Kết quả tam giác sử dụng η1 = 0,99 và η2 = 0,5.
150 của hệ thống tổng thể và từ đó cũng đánh giá hiệu suất của các thành
BA tiêu chuẩn
100 Nhóm BA, V = 0,6 phần riêng lẻ được đề xuất của hệ thống. Đối với mỗi tập dữ liệu, chúng
Nhóm BA, V = 0,5
Nhóm BA, V = 0,4
tôi báo cáo dữ liệu được xây dựng lại lớn nhất
ảnh
máy
Số.
50 Nhóm BA, V = 0,3

Nhóm BA, V = 0,2
thành phần. Theia là phương pháp nhanh nhất, trong khi phương pháp của chúng tôi
0
2 4 6 10 12 14 16 18 20
đạt được thời gian kém hơn một chút so với VisualSFM và hơn thế nữa
số 8
Số lượng điều chỉnh gói toàn cầu
Hình 8. Số lượng camera trong BA tiêu chuẩn và được nhóm lại bằng cách sử dụng nhanh hơn 50 lần so với Bundler. Hình 7 hiển thị thời gian tương đối của
r = 0,02, S = 10 và cảnh chồng chéo khác nhau V . từng mô-đun riêng lẻ. Đối với tất cả các tập dữ liệu, chúng tôi
vượt trội hơn đáng kể so với bất kỳ phương pháp nào khác về tính hoàn
cách tiếp cận sâu sắc và toàn diện) chứng tỏ sự cần thiết phải có một phương pháp mạnh mẽ chỉnh, đặc biệt đối với các mô hình lớn hơn. Điều quan trọng là,
phương pháp tam giác. Phương pháp đệ quy được đề xuất của chúng tôi độ dài đường dẫn tăng dẫn đến độ dư thừa cao hơn trong BA.
phục hồi các bản nhạc dài hơn đáng kể và tổng thể có nhiều phần tử bản Ngoài ra, chúng tôi còn đạt được độ chính xác tư thế tốt nhất cho Quad
nhạc hơn so với các bản sao không đệ quy của chúng. Lưu ý rằng tập dữ liệu: DISCO 1,16m, Bundler 1,01m, VisualSFM 0,89m,
số điểm cao hơn cho phương pháp dựa trên RANSAC đệ quy và của chúng tôi là 0,85m. Hình 9 cho thấy kết quả của Bundler so với
các phương pháp tương ứng với độ dài đường ray giảm đi một chút. phương pháp của chúng tôi. Chúng tôi khuyến khích độc giả xem
Cách tiếp cận dựa trên RANSAC chỉ mang lại kết quả kém hơn một chút nhưng tài liệu bổ sung để so sánh trực quan bổ sung
nhanh hơn nhiều (10-40 lần). Bằng cách thay đổi η, đó là của các kết quả, chứng tỏ tính mạnh mẽ, đầy đủ và chính xác vượt trội
dễ dàng cân bằng tốc độ với sự hoàn chỉnh. của phương pháp của chúng tôi.
Khai thác chế độ xem dư thừa. Chúng tôi đánh giá quan điểm dư thừa
6. Kết luận
khai thác trên một bộ sưu tập không có thứ tự được phân bố dày đặc
hình ảnh. Hình 8 cho thấy tốc độ tăng trưởng của tham số hóa Bài báo này đề xuất thuật toán SfM khắc phục lỗi khóa
camera trong BA toàn cầu sử dụng một số lần lặp BA cố định. Tùy thuộc những thách thức để thực hiện một bước xa hơn hướng tới một mục đích chung
vào sự chồng chéo cảnh được thực thi V giảm thời gian giải , chúng ta có thể
Hệ thống SfM Các thành phần đề xuất của thuật toán
quyết hệ thống camera bị giảm bớt bằng cách nâng cao trình độ tiên tiến về tính hoàn chỉnh, tính hiệu quả, độ chính
một yếu tố quan trọng Tăng tốc hiệu quả của tổng thời gian chạy là 5% (V xác và hiệu quả. Các thử nghiệm toàn diện trên các bộ dữ liệu quy mô lớn
= 0,6), 14% (V = 0,3) và 32% (V = 0,1), đầy thách thức chứng minh
trong khi lỗi chiếu lại trung bình giảm từ 0,26px Hiệu suất của các thành phần riêng lẻ và tổng thể
(BA tiêu chuẩn) lần lượt là 0,27px, 0,28px và 0,29px. hệ thống. Toàn bộ thuật toán được phát hành ra công chúng dưới dạng
Chất lượng tái thiết có thể so sánh được với tất cả các lựa chọn của triển khai nguồn mở.
V > 0,3 và ngày càng suy giảm khi V nhỏ hơn. sử dụng
Sự nhìn nhận. Chúng tôi cảm ơn J. Heinly và T. Price vì
V = 0,4, thời gian chạy của toàn bộ quy trình cho Colosseum
hiệu đính. Chúng tôi cũng cảm ơn C. Sweeney vì đã sản xuất cuốn sách này.
giảm 36% nhưng vẫn mang lại kết quả tái thiết tương đương.
Thí nghiệm của Theia. Được hỗ trợ một phần bởi NSF số IIS-1349074, số
Hệ thống. Bảng 1 và Hình 1 thể hiện hiệu suất CNS-1405847 và MITER Corp.
Người giới thiệu [23] R. Gherardi, M. Farenzena, và A. Fusiello. Nâng cao hiệu quả của cấu trúc và
chuyển động có thứ bậc. CVPR, 2010. 1

[1] S. Agarwal, Y. Furukawa, N. Snavely, I. Simon, B. Curless, S.
Seitz và R. Szeliski. Xây dựng Rome trong một ngày ICCV, 2009. 1,
[24] S. Haner và A. Heyden. Tuyên truyền hiệp phương sai và lập kế hoạch
2
xem tốt nhất tiếp theo cho việc tái thiết 3d. ECCV, 2012. 4
[2] S. Agarwal, K. Mierle và những người khác. Bộ giải Ceres. http:
[25] R. Hartley và F. Schaffalitzky. L∞ giảm thiểu về mặt địa lý
//ceres-solver.org. 5
vấn đề xây dựng lại số liệu. CVPR, 2004. 2, 4
[3] S. Agarwal, N. Snavely và S. Seitz. Thuật toán nhanh cho các bài
[26] R. Hartley và A. Zisserman. Hình học nhiều góc nhìn trong
toán L∞ trong hình học nhiều góc nhìn. CVPR, 2008. 2, 4
tầm nhìn máy tính. 2003. 2, 3, 5
[4] S. Agarwal, N. Snavely, S. Seitz, và R. Szeliski. Điều chỉnh bó
[27] RI Hartley và P. Sturm. Tam giác. 1997. 2, 4 [28] M.
trong phạm vi lớn. ECCV, 2010. 3
Havlena và K. Schindler. Vocmatch: Tương ứng nhiều chế độ xem hiệu quả
[5] C. Aholt, S. Agarwal và R. Thomas. Phương pháp tiếp cận QCQP đối
với tam giác. ECCV, 2012. 2, 4 [6] P. cho cấu trúc từ chuyển động. ECCV, 2014. 2 [29] J. Heinly, E.
Beardsley, P. Torr, và A. Zisserman. mua lại mô hình 3d Dunn, và J.-M. Frahm. Đánh giá so sánh các tính năng nhị phân. ECCV. 1
từ chuỗi hình ảnh mở rộng. 1996. 1 [30] J. Heinly, JL Schonberger,

¨
[7] C. Beder và R. Steffen. Xác định cặp hình ảnh ban đầu để sửa tỷ lệ E. Dunn, và J.-M. Frahm. Tái xây dựng thế giới* trong sáu ngày *(Được
tái tạo 3d từ chuỗi hình ảnh. Nhận dạng mẫu, 2006. 2 [8] DC ghi lại bởi Bộ dữ liệu hình ảnh 100 triệu của Yahoo). CVPR, 2015.
Brown. Một giải pháp cho vấn đề chung về 1, 2, 3 [31] A. Irschara, C. Zach, J.-M. Frahm và H. Bischof.
tam giác lập thể phân tích nhiều trạm. 1958. 3 [9] M. Brown, G. Hua, Từ các đám mây điểm cấu trúc từ chuyển động đến nhận dạng vị trí nhanh
và S. Winder. Học tập phân biệt các mô tả hình ảnh chóng. CVPR, 2009. 2, 4 [32] L. Kang, L. Wu, và Y.-H. Dương. Khả
địa phương. IEEE PAMI, 2011. 1 [10] M. Bujnak, Z. Kukelova và T. năng điều chỉnh trian l2
Pajdla. Giải pháp chung cho vấn đề P4P dành cho máy đa góc nhìn mạnh mẽ thông qua lựa chọn bên trong tối ưu và tinh chỉnh
ảnh có tiêu cự không xác định. cấu trúc 3d. Nhận dạng mẫu, 2014. 2, 4, 5 [33] A. Kushal và S.
Agarwal. Điều kiện tiên quyết dựa trên khả
CVPR, 2008. 2 năng hiển thị để điều chỉnh gói. CVPR, 2012. 6
[11] L. Carlone, P. Fernandez Alcantarilla, H.-P. Chiu, Z. Kira và F.
Dellaert. Khai thác các mảnh cấu trúc để điều chỉnh gói thông [34] V. Lepetit, F. Moreno-Noguer, và P. Fua. EPnP: Một giải pháp O(n)
minh. BMVC, 2014. 6 [12] S. chính xác cho vấn đề PnP. IJCV, 2009. 2, 4
Chen, YF Li, J. Zhang và W. Wang. Lập kế hoạch cảm biến hoạt động cho [35] H.Lý. Một thuật toán thực tế cho tam giác L∞ với các ngoại lệ.
các nhiệm vụ tầm nhìn đa góc nhìn. 2008. 4 [13] CVPR, 2007. 2, 4
Y. Chen, TA Davis, WW Hager, và S. Rajamanickam.
[36] Y. Li, N. Snavely, và DP Huttenlocher. Nhận dạng vị trí bằng cách
Thuật toán 887: Cholmod, cơ chế cholesky thưa thớt siêu nút và
sử dụng kết hợp tính năng ưu tiên. ECCV, 2010. 8 [37] Y.
cập nhật/hạ cấp. ACM TOMS, 2008. 3 [14] D. Crandall, A.
Lou, N. Snavely, và J. Gehrke. MatchMiner: Khai thác cấu trúc kéo dài
Owens, N. Snavely, và DP Huttenlocher.
hiệu quả trong các bộ sưu tập hình ảnh lớn.
Tối ưu hóa rời rạc-liên tục cho cấu trúc quy mô lớn từ chuyển
ECCV, 2012. 2
động. CVPR, 2011. 1, 7, 8
[38] MI Lourakis và AA Argyros. SBA: Gói phần mềm để điều chỉnh gói thưa
[15] L. de Agapito, E. Hayman và I. Reid. Tự hiệu chỉnh camera quay với các
thớt chung. ACM TOMS, 2009. 3 [39] DG Lowe. Các tính năng hình
thông số nội tại khác nhau. BMVC, 1998. 6
ảnh đặc biệt từ các điểm chính bất biến theo tỷ lệ. IJCV, 2004. 1
[16] F. Dellaert, S. Seitz, CE Thorpe và S. Thrun. Cấu trúc từ chuyển

[40] F. Lu và R. Hartley. Một thuật toán tối ưu nhanh cho phép điều
động mà không có sự tương ứng. CVPR. 1 [17] E. Dunn
chỉnh tam giác L2 . ACCV,
và J.-M. Frahm. Kế hoạch xem tốt nhất tiếp theo để cải thiện mô hình
2007. 2, 4 [41] C. McGlone, E. Mikhail, và J. Bethel. Hướng dẫn đo ảnh.
đang hoạt động. BMVC, 2009. 4 [18] MA
1980. 1, 4
Fischler và RC Bolles. Sự đồng thuận mẫu ngẫu nhiên: một mô hình cho
[42] R. Mohr, L. Quan, và F. Veillon. Tái tạo 3D tương đối bằng cách sử
mô hình phù hợp với các ứng dụng phân tích hình ảnh và bản đồ tự
dụng nhiều hình ảnh chưa được hiệu chỉnh. IJR, 1995. 1
động. ACM, 1981. 2
[19] A. Fitzgibbon và A. Zisserman. Tự động phục hồi camera cho chuỗi [43] K. Ni, D. Steedly, và F. Dellaert. Điều chỉnh gói ngoài lõi để
hình ảnh đóng hoặc mở. ECCV, 1998. 1 [20] J.-M. Frahm, P. tái tạo 3D quy mô lớn. ICCV, 2007. 6 [44] C. Olsson, A.
Fite-Georgel, D. Gallup, T. Johnson, R. Raguram, C. Wu, Y.-H. Jen, E. Eriksson, và R. Hartley. Loại bỏ ngoại lệ chúng tôi-
Dunn, B. Clipp, S. Lazeb-nik và M. Pollefeys. Xây dựng Rome vào có tính nhị nguyên. CVPR, 2010. 2, 4
`
một ngày không mây. [45] M. Pollefeys, D. Nister, J.-M. Frahm, A. Akbarzadeh, P. Mordohai,
ECCV, 2010. 1, 2, 3 B. Clipp, C. Engels, D. Gallup, S.-J. Kim, P. Merrell và cộng sự.
[21] J.-M. Frahm và M. Pollefeys. RANSAC cho dữ liệu suy biến (gần như) Tái thiết chi tiết 3D đô thị theo thời gian thực từ video. IJCV,
(QDEGSAC). CVPR, 2006. 2 [22] X.-S. Cao, X.- 2008. 1
R. Hou, J. Tang và H.-F. Cheng. Phân loại giải pháp hoàn chỉnh cho bài [46] M. Pollefeys, L. Van Gool, M. Vergauwen, F. Verbiest, K. Cornelis,
toán phối cảnh ba điểm. IEEE PAMI, 2003. 2 J. Tops và R. Koch. Mô hình hóa trực quan bằng máy ảnh cầm tay.
IJCV, 2004. 1
` ¨
[47] F. Radenovic, JL Sch onberger, D. Ji, J.-M. Frahm, O. Chum và J.
Matas. Từ hoàng hôn đến bình minh: Làm người mẫu

trong bóng tối. CVPR, 2016. 1
[48] F. Schaffalitzky và A. Zisserman. Kết hợp nhiều chế độ xem
dành cho các bộ ảnh không có thứ tự hoặc Làm cách nào để tổ chức kỳ nghỉ của tôi
chụp nhanh? ECCV, 2002. 1

¨
[49] JL Schonberger, AC Berg, và J.-M. Frahm. Phân loại hình học hai góc
nhìn hiệu quả. GCPR, 2015. 2

¨
[50] JL Schonberger, AC Berg, và J.-M. Frahm. PAIGE: Mã hóa hình học hình
ảnh PAirwise để cải thiện hiệu quả trong cấu trúc từ chuyển động.
CVPR, 2015. 2
¨ `
[51] JL Schonberger, F. Radenovi c, O. Chum, và J.-M. Frahm.
Từ truy vấn hình ảnh đơn lẻ đến tái tạo 3D chi tiết.
CVPR, 2015. 1
[52] N. Snavely. Tái tạo cảnh và trực quan hóa từ trong
bộ sưu tập ảnh internet. Luận án Tiến sĩ, 2008. 2, 3, 4
[53] N. Snavely, S. Seitz, và R. Szeliski. Du lịch ảnh: khám phá bộ sưu
tập ảnh 3D. ACM TOG, 2006. 1, 4, 5, 6,

7
[54] N. Snavely, S. Seitz, và R. Szeliski. Đồ thị xương cho

cấu trúc hiệu quả từ chuyển động. CVPR, 2008. 2, 3
[55] C. Sweeney. Thư viện hình học Theia multiview: Hướng dẫn &
thẩm quyền giải quyết. http://theia-sfm.org. 7
[56] C. Sweeney, T. Sattler, T. Hollerer, M. Turk, và M. Polle-feys. Tối
ưu hóa biểu đồ xem cho cấu trúc từ chuyển động. CVPR, 2015. 1
[57] PH Torr. Đánh giá các tiêu chí thông tin về chuyển động
lựa chọn mô hình. CVPR, 1997. 2
[58] B. Triggs, PF McLauchlan, RI Hartley và A. Fitzgibbon.
Điều chỉnh bó một sự tổng hợp hiện đại. 2000. 2, 3
[59] T. Tuytelaars và K. Mikolajczyk. Tính chất bất biến cục bộ
máy dò: một cuộc khảo sát. CGV, 2008. 1
[60] T. Weyand, C.-Y. Tsai và B. Leibe. Sửa lỗi wtfs: Phát hiện hình ảnh
trùng khớp do hình mờ, dấu thời gian và
khung trong ảnh internet. WACV, 2015. 3
[61] K. Wilson và N. Snavely. Bản dịch toàn cầu mạnh mẽ với

1dsfm. ECCV, 2014. 1, 8
[62] C. Ngô. Hướng tới cấu trúc gia tăng theo thời gian tuyến tính từ mo-
sự. 3DV, 2013. 1, 2, 3, 5, 6, 7
[63] C. Wu, S. Agarwal, B. Curless, và S. Seitz. Bun đa lõi-
điều chỉnh dle. CVPR, 2011. 3
[64] E. Zheng và C. Wu. Cấu trúc từ chuyển động sử dụng cấu trúc-
ít phải cắt bỏ hơn. ICCV, 2015. 3

Schoenberger2016sfm (1) - VI

Uploaded by

Document Information

Original Title

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

Schoenberger2016sfm (1) - VI

Uploaded by

Copyright:

Available Formats

Machine Translated by Google

Xem lại cấu trúc từ chuyển động

thống tái thiết gia tăng có

năng mở rộng vẫn là những vấn đề chính

Internet [30]. Nhiều và giới thiệu công việc liên quan.

Tìm kiếm thư từ Tái thiết gia tăng Tái thiết

cậy, độ chính xác và hiệu suất của việc tái thiết

Mab Fa × Fb. sự tương ứng 2D-3D thường bị ô nhiễm ngoại lệ,

trạng thái không thể phục hồi. BA [58] là

Đầu ra là các ước tính đặt ra P = {Pc SE(3) | c =

Điểm = 66 Điểm = 146

Chúng ta phải đồng thời theo dõi số lượng

[17], sự tương ứng giữa hai quan điểm và

việc cắt bỏ camera. Haner và cộng sự. [24] đề xuất một

đầu tiên khỏi I¯ và tìm hình ảnh Ib tối đa hóa Vab.

ký được chia sẻ và lỗi tái tạo trong SfM tăng dần.

các mẫu cần thiết để tam giác hóa điểm N-view.

các hình ảnh được nhóm là

đầy đủ, khuyến nghị. tam giác (1), và nhóm BA và RANSAC,

sử dụng các tham số nhóm bên ngoài Gr SE(3) và cố định

Montréal Notre Dame [61] 2.298 464 501 506 491

#Điểm #Yếu tố Trung bình Theo dõi độ dài #Mẫu

người đóng gói 713.824 5,58 triệu 7.824 136,34 triệu

RANSAC, η1 861.591 7,54 triệu 8,760 3,89 triệu

RANSAC, η2 860.422 7,46 triệu 8,682 3,03 triệu

RANSAC, η1 902.844 8,03 triệu 8,888 12,69 triệu

(trái) và phương pháp của chúng tôi (phải).

Bảng 2. Kết quả tam giác sử dụng η1 = 0,99 và η2 = 0,5.

50 Nhóm BA, V = 0,3

Số lượng điều chỉnh gói toàn cầu

chuyển động có thứ bậc. CVPR, 2010. 1

từ chuỗi hình ảnh mở rộng. 1996. 1 [30] J. Heinly, JL Schonberger,

[16] F. Dellaert, S. Seitz, CE Thorpe và S. Thrun. Cấu trúc từ chuyển

(QDEGSAC). CVPR, 2006. 2 [22] X.-S. Cao, X.- 2008. 1

Matas. Từ hoàng hôn đến bình minh: Làm người mẫu

[48] F. Schaffalitzky và A. Zisserman. Kết hợp nhiều chế độ xem

chụp nhanh? ECCV, 2002. 1

nhìn hiệu quả. GCPR, 2015. 2

[52] N. Snavely. Tái tạo cảnh và trực quan hóa từ trong

bộ sưu tập ảnh internet. Luận án Tiến sĩ, 2008. 2, 3, 4

[53] N. Snavely, S. Seitz, và R. Szeliski. Du lịch ảnh: khám phá bộ sưu

tập ảnh 3D. ACM TOG, 2006. 1, 4, 5, 6,

[54] N. Snavely, S. Seitz, và R. Szeliski. Đồ thị xương cho

[56] C. Sweeney, T. Sattler, T. Hollerer, M. Turk, và M. Polle-feys. Tối

lựa chọn mô hình. CVPR, 1997. 2

[58] B. Triggs, PF McLauchlan, RI Hartley và A. Fitzgibbon.

Điều chỉnh bó một sự tổng hợp hiện đại. 2000. 2, 3

[59] T. Tuytelaars và K. Mikolajczyk. Tính chất bất biến cục bộ

máy dò: một cuộc khảo sát. CGV, 2008. 1

trùng khớp do hình mờ, dấu thời gian và

khung trong ảnh internet. WACV, 2015. 3

[61] K. Wilson và N. Snavely. Bản dịch toàn cầu mạnh mẽ với

sự. 3DV, 2013. 1, 2, 3, 5, 6, 7

[63] C. Wu, S. Agarwal, B. Curless, và S. Seitz. Bun đa lõi-

điều chỉnh dle. CVPR, 2011. 3

You might also like