Hướng dẫn tải lên dữ liệu
Dưới đây, bạn sẽ tìm thấy hướng dẫn ngắn về cách tải dữ liệu lên cổng Xác minh. Bên dưới đó cũng có một hướng dẫn bằng văn bản từng bước.
Tổng quan về màn hình tập dữ liệu (Dataset Screen Overview)
Màn hình đầu tiên bạn thấy khi đăng nhập là trang 'Datasets'. Nó liệt kê tất cả các tập dữ liệu(datasets) bạn đã tạo hoặc có quyền truy cập với tư cách là người dùng.
Bạn có thể lọc các tập dữ liệu này theo hàng hóa(commodity), nguồn gốc(origin) hoặc ngày tháng(date) và lưu trữ bất kỳ tập dữ liệu nào không còn liên quan. Lưu trữ giúp giữ cho màn hình gọn gàng và tập trung vào các tập dữ liệu đang hoạt động.
Tạo tập dữ liệu mới(Creating a New Dataset)
Hãy tiếp tục và tạo một bộ dữ liệu hoàn toàn mới:
Bước 1: Lựa chọn hàng hóa và xuất xứ(Commodity and Origin Selection)
Đầu tiên, chọn một mặt hàng. Ví dụ, cà phê(coffee)
Tiếp theo, chọn một điểm xuất phát. Ví dụ, Indonesia.
Cuối cùng, hệ thống sẽ gợi ý tên dựa trên đơn vị-hàng hóa-xuất xứ nhưng bạn có thể tự do chỉnh sửa điều này
Bước 2: Lựa chọn phiên bản hồ sơ và phương pháp kiểm tra
Sau đó, bạn sẽ có tùy chọn để chọn hồ sơ thử nghiệm và phiên bản phương pháp. Hiện tại, chúng tôi có một hồ sơ để tuân thủ EUDR (EUDR compliance).
Bạn có thể xem lại các bài kiểm tra có trong hồ sơ. Hiện tại, chúng bao gồm các phiên bản cũ hơn của phương pháp luận của chúng tôi. Chúng tôi khuyên bạn nên chọn phiên bản phương pháp mới nhất sẽ là phiên bản đầu tiên. Sau khi hài lòng, hãy tiếp tục bằng cách chọn chuyên nghiệpfile và nhấp vào 'Lưu và tiếp tục'('Save and Continue')
Bước 3: Chọn Dữ liệu bạn muốn tải lên
Tiếp theo, tải lên dữ liệu thực tế. Điều này thường bao gồm:
Dữ liệu không gian địa lý (Geospatial Data): Đây có thể là một điểm địa lý của một trang trại hoặc phổ biến hơn là một đa giác phác thảo trang trại.
Siêu dữ liệu (Metadata): Điều này bao gồm các chi tiết cần thiết như ID nông dân, ID lô trang trại, loại hàng hóa và các thông tin liên quan khác.
Đây là cách nó hoạt động:
Hệ thống chấp nhận các tệp xlsx, geojson, csv, kml và shape files
Chọn một tệp và tải nó lên cơ sở dữ liệu.
Sau khi tải lên, màn hình sẽ hiển thị các tùy chọn để xóa tệp hoặc tải lên các tệp bổ sung.
Vì dữ liệu không gian địa lý và siêu dữ liệu có thể nằm trong các tệp riêng biệt, người dùng có thể tải lên bao nhiêu tệp nếu cần.
Bước 4: Ánh xạ các thuộc tính của dữ liệu của bạn (Map the Attributes of your data)
Bước thứ tư liên quan đến việc lập bản đồ dữ liệu (mapping the data), cho hệ thống biết nơi tìm các trường cụ thể trong các tệp đã tải lên. Điều quan trọng là phải hoàn thành bước này một cách chính xác để đảm bảo hệ thống có thể đọc dữ liệu của bạn đúng cách và tối đa hóa số lượng thử nghiệm áp dụng. Bước này cung cấp cho hệ thống dữ liệu cần thiết để chạy thử nghiệm.
Mã thửa đất canh tác (farm plot ID) là trường bắt buộc và phải được chọn.
Bạn cũng có thể ánh xạ các trường khác, chẳng hạn như ID nông dân (Farmer ID), ngày lập bản đồ, đơn vị tập hợp(aggregator), v.v. và tiếp tục ánh xạ theo yêu cầu.
Bạn càng vạch ra nhiều trường càng tốt vì điều này sẽ cho phép hệ thống chạy nhiều thử nghiệm nhất có thể áp dụng cho tập dữ liệu của bạn
Chi tiết cụ thể về GIS
Trong phần cuối cùng, bạn có thể thêm một cấp độ chi tiết cụ thể cho GIS nếu bạn đang sử dụng tệp excel hoặc csv chẳng hạn. Sau khi mọi thứ được xác nhận, hệ thống sẽ chạy các bài kiểm tra và bạn sẽ thấy kết quả.
Mẹo: Để đơn giản hóa bước này, hãy sử dụng tên tiêu đề rõ ràng và mô tả tương ứng trực tiếp với các trường trong Cổng thông tin xác minh, giúp khớp chính xác chúng dễ dàng hơn ở giai đoạn này.
Bước 5: Tạo bộ lọc(Create filters)
Tiếp theo, chúng ta có thể tạo một số bộ lọc có thể giúp chúng ta ghép dữ liệu sau này.
Để tạo bộ lọc, chỉ cần chọn dữ liệu bạn muốn lọc, đây là các tùy chọn cho tập dữ liệu này và sau đó đặt tên cho bộ lọc của bạn.
Bạn có thể tạo các bộ lọc bổ sung bằng cách nhấp vào 'Tạo bộ lọc' (‘Create Filter’ )và lặp lại quy trình tương tự.
Trong ví dụ bên dưới, chúng ta đã chọn giá trị Mapping_date và sau đó đặt cùng tên cho bộ lọc đó.
Bước 6: Tìm hiểu trang Kết quả kiểm tra cuối cùng
Ở đây bạn có thể thấy rằng đơn vị sẽ được phân tích cho hồ sơ thử nghiệm này là lô trang trại (farm plot). Nó cũng nhắc nhở bạn hồ sơ kiểm tra nào bạn đang sử dụng (trong trường hợp này là EUDR).
Trong ví dụ này, tổng số thử nghiệm mà cổng thông tin đã xác minh có thể chạy là 38. Tuy nhiên, bộ dữ liệu cụ thể này bên dưới chúng tôi thấy rằng chỉ có 33 bài kiểm tra sẽ được áp dụng cho bộ dữ liệu này.
Nếu chúng tôi nhấp vào nút 'Xem tất cả các bài kiểm tra' ('view all tests' ) thì điều này sẽ cung cấp cho chúng tôi thông tin bổ sung về lý do tại sao tổng số bài kiểm tra có thể khác với số bài kiểm tra hiện hành.
Một số xét nghiệm có thể hiển thị là Không (No). Điều này có thể do:
Thử nghiệm bị bỏ qua (ví dụ: do vấn đề hình học). Trong ví dụ dưới đây, bộ dữ liệu chúng tôi tải lên chỉ có đa giác, không có điểm địa lý, vì vậy hệ thống sẽ tự động bỏ qua kiểm tra điểm địa lý, ATT04 - Farm plot được ghi lại dưới dạng điểm địa lý nhưng kích thước ước tính là >4Ha, đối với bộ dữ liệu cụ thể này.
Thiếu các trường dữ liệu trong các tệp đã tải lên.
Các thuộc tính không được ánh xạ hoặc được ánh xạ không chính xác ở bước 4.
Kết luận
Tóm lại, hướng dẫn này hướng dẫn bạn các bước cần thiết để tải lên bộ dữ liệu một cách hiệu quả, từ tạo và tải lên dữ liệu đến lập bản đồ các trường, áp dụng bộ lọc, v.v. Bằng cách làm theo các bước này, bạn có thể đảm bảo tính chính xác của dữ liệu, hợp lý hóa phân tích và xác định các rủi ro hoặc thông tin chi tiết chính một cách dễ dàng.
