Bỏ qua đến nội dung chính

Cách loại bỏ các đỉnh trùng lặp (duplicated vertices) trong polygon bằng QGIS

Xử lý lỗi các đỉnh trùng (không liên tiếp) làm sai lệch dữ liệu không gian, giúp dữ liệu thửa đất sạch, tuân thủ và đáng tin cậy.

P
Được viết bởi Phuong Nguyen

Giới thiệu

Hướng dẫn thực hành này tập trung vào việc xử lý một lỗi khá phổ biến nhưng thường bị bỏ qua trong GIS: các đỉnh trùng lặp trong polygon. Nếu bạn đã từng làm việc với dữ liệu không gian, bạn sẽ hiểu việc giữ geometry sạch và chính xác quan trọng như thế nào.

Một số đỉnh trùng có thể không gây vấn đề lớn, nhưng đặc biệt là các đỉnh trùng không liên tiếp, chúng có thể làm sai lệch dữ liệu một cách âm thầm, ảnh hưởng đến phân tích và hiển thị bản đồ.

Trong Meridia Verify portal, dữ liệu có đỉnh trùng sẽ được phát hiện thông qua bài test GET04 (Farm plot has duplicate boundary vertices after rounding to 6 decimals).

Xác định và xử lý các đỉnh trùng lặp

Trong hướng dẫn này, chúng ta sẽ cùng tìm hiểu cách phát hiện và xử lý các lỗi này bằng QGIS.

Hiểu các loại đỉnh trùng lặp

Khi kiểm tra polygon, bạn có thể gặp hai loại đỉnh trùng lặp. Phần này sẽ phân biệt giữa đỉnh trùng liên tiếp (Consecutive Duplicates)đỉnh trùng không liên tiếp (Non-Consecutive Duplicates).

  • Consecutive Duplicates
    Đây là các đỉnh bị lặp lại ngay sau nhau. Chúng thường không ảnh hưởng đến hình dạng polygon hay gây lỗi topology, và hầu hết các công cụ GIS sẽ bỏ qua chúng. Bài test GET04 của Meridia Verify cũng không gắn cờ các trường hợp này vì lý do tương tự.

  • Non-Consecutive Duplicates
    Đây là trường hợp phức tạp hơn. Các đỉnh trùng này không nằm liền nhau mà bị ngăn cách bởi các đỉnh khác, có thể khiến polygon bị gập lại hoặc tự cắt chính nó. Đây chính là các lỗi được bài test GET04 phát hiện và cần phải xử lý.

⚠️ Lưu ý:

Do các đỉnh trùng liên tiếp không gây ra vấn đề trong ngữ cảnh này, phần còn lại của bài viết sẽ tập trung vào việc xử lý các đỉnh trùng không liên tiếp trong QGIS.


Bước 01: Kiểm tra dữ liệu trong QGIS để tìm các đỉnh trùng không liên tiếp

Mở dữ liệu của bạn trong QGIS để bắt đầu kiểm tra.

  1. Nhấp chuột phải vào layer cần kiểm tra.

  2. Chọn Open Attribute Table. Kiểm tra các Farm Plot ID bị gắn cờ bởi bài test GET04.

Sau khi xác định được polygon cần xử lý, bạn có thể bắt đầu chỉnh sửa.

Bước 02: Xử lý lỗi bằng hai phương pháp hiệu quả

Phương pháp 1: Tự động làm sạch geometry bằng v.clean

QGIS tích hợp các công cụ của GRASS GIS, trong đó một công cụ rất hiệu quả là v.clean.

  1. Mở Processing Toolbox: vào Processing > Toolbox.

  2. Tìm v.clean: nhập “v.clean” vào ô tìm kiếm và mở công cụ.

Trong cửa sổ v.clean, thực hiện các bước sau để sử dụng công cụ đúng cách:

  1. Thiết lập Input Layer: chọn layer polygon có vấn đề.

  2. Thiết lập Cleaning tool: chọn rmd_upl (Remove Duplicate Points).

  3. Chạy công cụ: nhấn Run. Một layer mới đã được làm sạch sẽ được tạo ra.

Polygon sau khi được làm sạch có thể bị tách thành nhiều phần. Đây không phải là lỗi — mà phản ánh những vị trí trước đó geometry bị sai lệch.

Bước tiếp theo: Bạn có thể cần:

  • Xóa các phần không liên quan, hoặc

  • Gộp (merge) lại nếu chúng thuộc cùng một đối tượng ban đầu.

Phương pháp này nhanh, nhưng giả định rằng bạn chấp nhận việc polygon có thể bị tách thành nhiều phần.

Phương pháp 2: Chỉnh sửa thủ công bằng Vertex Tool

Khi bạn cần kiểm soát chi tiết hơn — ví dụ để giữ nguyên một đối tượng duy nhất — chỉnh sửa thủ công là lựa chọn tốt nhất.

  1. Nhấp chuột phải vào layer để mở menu.

  2. Bật chế độ chỉnh sửa: nhấn Toggle Editing (biểu tượng cây bút) trên thanh công cụ.

  3. Kích hoạt Vertex Tool để thao tác trực tiếp với các đỉnh của polygon.

  4. Nhấp vào các đỉnh của polygon cần chỉnh sửa.

Tìm các tọa độ trùng nhau nhưng không nằm liền kề trong chuỗi. Bạn có thể:

  • Xóa đỉnh dư thừa nếu không cần thiết.

  • Di chuyển đỉnh nếu nó bị đặt sai vị trí (ví dụ do lỗi ngoài thực địa). Nếu có thể, nên đối chiếu với dữ liệu thực địa để đảm bảo độ chính xác.

Sau khi hoàn tất, nhấn lại Toggle Editing và chọn Save Layer Edits để lưu thay đổi.

Phương pháp này giúp bạn giữ nguyên hình dạng và tính nhất quán của đối tượng ban đầu, nhưng sẽ mất nhiều thời gian hơn.


Kết quả cuối cùng & các lưu ý quan trọng

Dù bạn sử dụng v.clean hay chỉnh sửa thủ công, mục tiêu vẫn giống nhau: tạo ra các polygon sạch về topology và phản ánh đúng thực tế thửa đất.

  • Với v.clean, bạn thường sẽ nhận được nhiều polygon tách biệt — hữu ích khi đối tượng ban đầu bị gộp nhầm.

  • Với chỉnh sửa thủ công, bạn có thể khôi phục đúng hình dạng mong muốn mà vẫn giữ nguyên một đối tượng duy nhất.

Cả hai phương pháp đều giúp tạo ra dữ liệu sẵn sàng cho việc lập bản đồ chính xác, phân tích và ra quyết định — không còn các lỗi tiềm ẩn do đỉnh trùng gây ra.

📌Các lưu ý quan trọng

  • Consecutive Duplicates: Các đỉnh trùng liên tiếp thường không gây vấn đề và thường không cần xử lý.

  • Luôn kiểm tra thủ công: Dù bạn chọn phương pháp nào, việc kiểm tra và chỉnh sửa thủ công vẫn rất cần thiết để đảm bảo độ chính xác, thay vì chỉ phụ thuộc vào công cụ tự động. Hãy cân nhắc kỹ khi lựa chọn phương pháp:

  • Sử dụng v.clean khi cần tốc độ hoặc khi việc tách polygon là chấp nhận được.

  • Sử dụng chỉnh sửa thủ công khi cần độ chính xác cao và hiểu rõ bối cảnh dữ liệu.

  • Đối chiếu với dữ liệu thực địa: Khi có nghi ngờ, hãy so sánh với dữ liệu gốc hoặc ảnh vệ tinh để đảm bảo tính đúng đắn.

  • Thường xuyên lưu: Luôn lưu dữ liệu trong quá trình chỉnh sửa để tránh mất tiến độ, đặc biệt khi chỉnh sửa thủ công.


Tóm tắt

Việc xử lý các đỉnh trùng lặp có thể trông là một công việc nhỏ, nhưng lại đóng vai trò quan trọng trong việc đảm bảo chất lượng dữ liệu không gian. Bằng cách phân biệt giữa các đỉnh trùng không gây hại và các đỉnh trùng cần xử lý — cùng với việc sử dụng hiệu quả các công cụ trong QGIS — bạn có thể giữ cho dataset của mình luôn sạch, đáng tin cậy và sẵn sàng sử dụng.

Hy vọng hướng dẫn này giúp quy trình làm việc GIS của bạn trở nên trơn tru hơn và dữ liệu của bạn đáng tin cậy hơn.

Nội dung này có giải đáp được câu hỏi của bạn không?