SIFT LÀ GÌ
Có hình ảnh mẫu của một thiết bị thể (ví dụ: ô tô), và hình ảnh thật cất một vài đồ dùng thể ấy (ví dụ: những ô đánh trong kho bãi đỗ xe). Làm sao để dìm dạng được vị trí của những vật thể trong hình ảnh thường? Đây là vụ việc rất căn phiên bản trong xử lí ảnh.
Bạn đang xem: Sift là gì
Bạn đang xem: Sift là gì

Giải được sự việc này, không ngừng mở rộng ra ta hoàn toàn có thể làm được không hề ít thứ: nhấn dạng chữ viết, dấn dạng khuôn mặt, dấn dạng đại dương số xe, đăng nhập bằng hình hình ảnh thay mang lại mật khẩu, theo dõi quĩ đạo của đồ dùng thể v.v.
Có nhiều phương pháp để giải quyết vấn đề trên. Bài viết này reviews SIFT, lời giải siêu mạnh áp dụng được cho phần đông các tình huống.
Giới thiệu
SIFT là sáng tạo đã được đăng kí bạn dạng quyền của David Lowe, ý muốn dùng mang lại mục đích dịch vụ thương mại thì cần xin phép.
Ý tưởng:
Từ hình ảnh tìm ra các điểm hình ảnh đặc biệt, điện thoại tư vấn là feature point hay keypoint. Đầu vào và áp sạc ra của phép thay đổi SIFT: hình ảnh -> SIFT -> các keypointĐể hoàn toàn có thể phân biệt keypoint này cùng với keypoint khác buộc phải tìm ra tham số gì đó, gọi là descriptor. 2 keypoint khác biệt thì cần descriptor khác nhau. Thường xuyên thì descriptor là chuỗi số có 128 số (vector 128 chiều).Đặc điểm:
Keypoint phụ thuộc vào rất không nhiều vào cường độ sáng, nhiễu, bít khuất (một phần hình ảnh bị che), góc xoay (ảnh bị xoay trong phương diện phẳng 2D), đổi khác của bốn thế (pose chuyển đổi trong không khí 3D).Nhanh, vận tốc xử lí gần như thời hạn thực (realtime).Như vậy việc khớp ảnh mẫu với ảnh thường chính là việc khớp các keypoint vào 2 ảnh với nhau:
Áp dụng SIFT mang lại từng tấm.So sánh descriptor của keypoint trong hình ảnh này cùng với descriptor của keypoint trong hình ảnh kia. Giả dụ 2 keypoint có descriptor tương tự nhau thì coi như 2 điểm bên trên 2 tấm ảnh cùng ở trong về một đồ dùng (hoặc vật dụng giống nhau).Dựa vào yêu thương của scale với hiệu của orientation của 2 keypoint, có thể biết thêm thứ trong hình này to thêm vật vào hình kia bao nhiêu, trang bị trong hình này xoay bao nhiêu độ so với trang bị trong hình tê bao nhiêu.Xem thêm: Phép Dịch " Hẹ Tiếng Anh Là Gì : Định Nghĩa, Ví Dụ Anh Việt, Cây Hẹ Tiếng Anh Là Gì
Đề bài bác tập áp dụng
Tìm ra vị trí trong hình ảnh thật tất cả chứa ảnh mẫu. Bao gồm 3 độ khó:
Trong ảnh thật, hình ảnh mẫu bị phóng to/thu nhỏTrong ảnh thật, ảnh mẫu bị phóng to/thu nhỏ dại và xoayTrong hình ảnh thật, hình ảnh mẫu bị phóng to/thu nhỏ, luân chuyển và khuất một phầnGiải bài tập bằng SIFT
Áp dụng SIFT đến 2 ảnh.Dùng khoảng cách Euclid giữa các descriptor nhằm tìm keypoint khớp nhau (gần giống như nhau, nghĩa là khoảng cách nhỏ thêm hơn giá trị THRESHOLD như thế nào đó) trong 2 ảnh. Đây là bài toán tìm "hàng xóm" (ví dụ biết tọa độ của N điểm trong phương diện phẳng 2D, hãy kiếm tìm 2 điểm gần nhau nhất), có không ít cách giỏi hơn nhưng tinh vi hơn nhiều.Ở địa điểm của keypoint như thế nào khớp, thì dựa vào scale với orientation nên dán mask của ảnh mẫu vào ảnh thật vào địa điểm đó, để đánh dấu khu vực quanh vị trí khớp đã được kiểm tra (search). Keypoint nào nằm trong khu vực này sẽ bị xoá khỏi danh sách keypoint của hình ảnh thật, để tránh bị lấy ra xử lí tiếp.Lặp lại cách 3 đến bao giờ không còn keypoint khớp nhau. Ở những lần lặp ở bước 3 ta phần nhiều thu được vị trí, chính là lời giải buộc phải tìm.Ngoài ra, đọc kĩ đề bài bác ta thấy ảnh mẫu chỉ bị phóng to lớn thu nhỏ dại và xoay chứ không cần bị đổi khác màu sắc hay độ sáng. Cho nên vì vậy để tăng độ đúng đắn của SIFT, trước bước 1 rất có thể dùng thêm màu sắc filter như sau:
Liệt kê tất cả các màu có trong ảnh mẫu (nghĩa là tính màu sắc histogram). Rất có thể dùng không gian màu RGB hoặc HSV.Xoá (bôi đen) tất cả các điểm hình ảnh trong hình ảnh thật trường hợp màu của bọn chúng quá khác (khi phóng to thu nhỏ và xoay, màu của điểm hình ảnh có thể biến hóa chút ít tuỳ vào cách thức phóng lớn thu bé dại và xoay) color trong ảnh mẫu.Ở bên trên là giải thuật. Việc dùng thư viện nhằm viết thành chương trình rõ ràng xin giành riêng cho độc giả.
(Ngoc Dao - kipalog)
Có thể các bạn quan tâm:
Hướng dẫn lập trình dấn dạng hình hình ảnh với Opencv
Số nhận dạng tàu biển khơi IMO
VietOCR.NET ứng dụng nhận dạng hình hình ảnh và sử lý văn bạn dạng trên ...
Những ứng dụng bất thần của technology Nhận diện khuôn mặt nhưng ...
Xem thêm: Cách Nấu Bò Kho Nhanh Mềm, Thơm Ngon Chuẩn Vị, 4 Bước Nấu Bò Kho Mau Mềm Đơn Giản Mà Cực Ngon
Series phản nghịch Phác Qui Chân – học thuật toán để gia công việc gì?
Giới thiệu đơn giản phân tích độ tinh vi thuật toán
Hướng dẫn xác định chi phí, giá bán phần mềm, giá chỉ website, giá ứng dụng
Tất cả về AI - Trí tuệ nhân tạo - Artificial Intelligence
tanhailonghotel.com.vn chuyên: - bốn vấn, xây dựng, gửi giao công nghệ Blockchain, mạng xã hội,... - support ứng dụng cho điện thoại và máy tính bảng, hỗ trợ tư vấn ứng dụng vận tải đường bộ thông minh, thực tiễn ảo, game mobile,... - tư vấn các khối hệ thống theo mô hình kinh tế chia sẻ như Uber, Grab, áp dụng giúp việc,... - Xây dựng những giải pháp thống trị vận tải, làm chủ xe công vụ, thống trị xe doanh nghiệp, ứng dụng và áp dụng logistics, kho vận, vé xe năng lượng điện tử,... - support và kiến tạo mạng thôn hội, tứ vấn giải pháp CNTT đến doanh nghiệp, startup,...
Vì sao lựa chọn tanhailonghotel.com.vn? - tanhailonghotel.com.vn nắm rõ nhiều technology phần mềm, mạng và viễn thông. Như Payment gateway, SMS gateway, GIS, VOIP, iOS, Android, Blackberry, Windows Phone, cloud computing,… - tanhailonghotel.com.vn có kinh nghiệm triển khai các hệ thống trên các nền tảng năng lượng điện toán đám mây khét tiếng như Google, Amazon, Microsoft,… - tanhailonghotel.com.vn tất cả kinh nghiệm thực tiễn tư vấn, xây dựng, triển khai, chuyển giao, gia công các giải pháp phần mềm cho người tiêu dùng Việt Nam, USA, Singapore, Germany, France, những tập đoàn của quốc tế tại Việt Nam,… Quý khách xem hồ nước sơ năng lực của tanhailonghotel.com.vn tại trên đây >> Quý khách gửi yêu cầu tư vấn và làm giá tại đây >>