Trong tài liệu này, chúng tôi sẽ đề cập đến các nội dung sau:
1. Các lưu ý chính (Key Considerations)
Mục đích của việc gán Farmer ID duy nhất là gì?
Farmer ID hoặc Producer ID là một mã định danh thường được tạo bởi đơn vị vận hành (operator - ví dụ: thương nhân/nhà thu mua - trader) hoặc đơn vị thu gom (aggregator - ví dụ: hợp tác xã). Đây không phải là số định danh quốc gia (national ID) hoặc National Traceability ID (có thể được cấp bởi nền tảng truy xuất nguồn gốc quốc gia).
Farmer ID cho phép:
Liên kết nhất quán và đáng tin cậy giữa khối lượng vật lý (physical volumes) với từng nông dân và từng farm plot riêng biệt.
Kết nối giữa Farmer Name, Farm Plot và Aggregator.
Hỗ trợ phát hiện sai lệch phân bổ farm (misallocation) và các vấn đề dữ liệu truy xuất nguồn gốc khác.
Farmer aggregator là gì và cần được cấu trúc như thế nào?
Farmer aggregator là thuật ngữ chung chỉ một trong những điểm đầu tiên nơi sản phẩm từ nhiều nông dân được thu gom và ghi nhận.
Khái niệm aggregator sẽ khác nhau tùy theo ngành hàng và quốc gia (vùng lãnh thổ).
Ví dụ về aggregator:
Hợp tác xã (cooperative)
Công ty thu mua được cấp phép (licensed buying company)
Trạm thu mua cấp huyện (district purchase station)
Trạm rửa (washing station)
(Các ví dụ khác được trình bày ở cuối tài liệu)
Lý do nên tổ chức dataset theo aggregator:
Dữ liệu aggregator được sử dụng để chạy các bài test chuyên biệt nhằm cung cấp insight bổ sung.
Cho phép phân tách (disaggregate) điểm số theo từng aggregator để phân tích sâu hơn.
Dataset cấp farm cần bao gồm: tham chiếu đến tên/ID aggregator, Vị trí aggregator cho từng record farm plot.
Giá trị của việc bao gồm Farmer Name là gì?
Farmer Name không bắt buộc theo EUDR, do đó không phải trường dữ liệu bắt buộc.
Tuy nhiên, khuyến nghị nên đưa vào, vì:
Giúp phát hiện các vấn đề về chất lượng dữ liệu
Đảm bảo dữ liệu là thực (real data): nông dân thật gắn với plot thật
Trường Farmer Name đặc biệt hữu ích trong các bài test cross-dataset:
So sánh dữ liệu của khách hàng với farm plots trong data lake
So sánh với cơ sở dữ liệu địa chính quốc gia (cadastral databases)
Việc có Farmer Name giúp: Phân biệt overlap là conflict thật hay có thể giải thích hợp lý.
2. Yêu cầu đối với bộ dữ liệu cấp nông hộ (Requirements for Farm-Level Datasets)
File dữ liệu cần được cấu trúc theo bảng bên dưới, với các trường attribute được tích hợp trực tiếp trong file dữ liệu không gian địa lý (geospatial data file) dưới dạng các cột.
Tổ chức file (File Organisation)
Cung cấp dữ liệu dưới dạng file riêng cho từng quốc gia nguồn gốc (origin country) và từng loại hàng hóa (commodity)
Cấu trúc file phải nhất quán và đặt tên rõ ràng
Dữ liệu không gian (geospatial) và dữ liệu thuộc tính (attribute) phải được gộp trong một file duy nhất
Dataset có thể gồm nhiều file (ví dụ: theo huyện, loại hình geometry, aggregator), với điều kiện: Geospatial data (polygon, geopoint), Attribute data (plot ID, farmer ID, farmer name, …) phải nằm cùng trong một file
Tip: Tránh gửi file riêng lẻ cho từng farmer hoặc từng farm plot
Yêu cầu dữ liệu không gian (Geospatial Data Requirements)
Không bắt buộc áp dụng projection (CRS). Mặc định WGS84 là đủ
Định dạng file chấp nhận: GEOJSON (ưu tiên), Shapefile (SHP), KML, XLSX (không khuyến nghị cho polygon).
Tip: Chấp nhận dataset có nhiều loại geometry (geopoint + polygon). Tuy nhiên, tránh cung cấp cả geopoint và polygon cho cùng một farm plot
Yêu cầu dữ liệu thuộc tính (Attribute Data Requirements)
Đảm bảo tất cả record farm plot (geopoint và/hoặc polygon) có đầy đủ các trường bắt buộc theo bảng specification
Sử dụng nhãn (label) rõ ràng theo bảng Requirements for Dataset Contents
Tip: Tránh gộp nhiều thông tin vào một cột. Mỗi trường dữ liệu phải: Tách riêng, đúng kiểu dữ liệu, đặt dưới đúng header.
Chất lượng dữ liệu và nộp dữ liệu (Data Quality and Submission)
Trước khi gửi, cần đảm bảo file geospatial: Không lỗi, không bị corrupt, có thể mở bằng phần mềm GIS.
Chỉ gửi version mới nhất chứa toàn bộ farm records để chạy test
Tip: Tránh gửi nhiều version gây trùng lặp dữ liệu
Yêu cầu về nội dung dữ liệu (Dataset Content Requirements)
Diện tích farm plot (ước tính), là diện tích canh tác cây trồng. Không nhất thiết là toàn bộ diện tích đất mà nông dân sở hữu.
3. Quy cách Aggregator (Aggregator specification)
Đối với cacao, các aggregator phổ biến:
cooperative (coop) – phổ biến tại Côte d’Ivoire, Cameroon, Ecuador
traitant – phổ biến tại Côte d’Ivoire
licensed buying company district – phổ biến tại Ghana
licensed buying agent – phổ biến tại Nigeria
town collector – phổ biến tại Indonesia
Đối với cà phê, các aggregator phổ biến:
Thương lái /Trung gian thu mua)
Trạm thu mua cà phê
Trạm xát vỏ (pulping/de-pulping station)
Trạm lên men, rửa, phơi, làm sạch và/hoặc phân loại
Ví dụ chuỗi cung ứng cacao tại Côte d’Ivoire:
Trong trường hợp này, aggregator không được định nghĩa là điểm tập kết đầu tiên (các section của hợp tác xã),
mà được định nghĩa tại bước thứ hai (kho của hợp tác xã).
4. Ví dụ template dataset Excel (Excel dataset template example)
