Tìm hiểu chuẩn CSGM - Metadata trong GIS



Metadata là dữ liệu của dữ liệu (thông tin mô tả về dữ liệu)

1. Chuẩn metadata

Hiện tại có rất nhiều chuẩn của các nước như Mỹ, Canada, Quata, Úc,… Dưới đây là một ví dụ về chuẩn của CSDGM.

CSDGM (Content Standard for Digital Geospatial Metadata) là chuẩn metadata của Ủy Ban Dữ Liệu Địa Lý Liên Bang Hoa Kỳ (United States Federal Geographic Data Committee - FGDC). CSDGM cung cấp khái niệm và định dạng để mô tả các đặc điểm của dữ liệu không gian địa lý. FGDC đưa ra phiên bản đầu tiên cho chuẩn này vào ngày 8 tháng 6 năm 1994 với mục đích là cung cấp một tập các thuật ngữ và định nghĩa thông dụng cho các khái niệm liên quan đến metadata.

Tháng 7 năm 1997, phiên bản CSDGM 2.0 ra đời chính thức hóa phương pháp dùng để tạo ra các yếu tố metadata, thiết lập các phương pháp để phác họa tiêu chuẩn metadata và cải tiến các nguyên tắc tiêu chuẩn sản phẩm để tạo ra CSDGM dễ dàng sử dụng hơn.

Chuẩn CSDGM bao gồm hơn 200 yếu tố để mô tả dữ liệu không gian địa lý, được tập hợp thành 10 loại thông tin, như:

- Thông tin nhận dạng dữ liệu (Data Identification Information).
- Thông tin chất lượng dữ liệu (Data Quality Information).
- Thông tin tổ chức dữ liệu không gian (Spatial Data Organization Information).
- Thông tin tham chiếu không gian (Spatial Reference Information).
- Thông tin thực thể và thuộc tính (Entity and Attribute Information).
- Thông tin phân phối (Distribution Information).
- Thông tin tham chiếu metadata (Metadata Reference Information).
- Thông tin trích dẫn (Citation Information).
- Thông tin thời gian (Time Period Information).
- Thông tin liên lạc (Contact Information).

2. Metadata trong ArcCatalog

Trong ArcCatalog có chứa các công cụ cho phép tạo lập, cập nhật và hiển thị thông tin metadata của dữ liệu.
2.1. Đặc điểm chung

Metadata trong ArcCatalog gồm hai phần: thông tin thuộc tính và thông tin mô tả. Thông tin thuộc tính được dẫn xuất từ chính đối tượng. Thông tin mô tả được cung cấp bởi người sử dụng.
Khi người sử dụng muốn xem metadata của một đối tượng (item) nào đó, ArcCatalog sẽ kiểm tra xem metadata của đối tượng đó đã tồn tại chưa. Nếu metadata chưa tồn tại, ArcCatalog sẽ tự động tạo metadata cho đối tượng và lấy những thông tin thuộc tính của đối tượng bỏ vào metadata, đồng thời tạo những hướng dẫn để người sử dụng nhập thông tin mô tả. Nếu metadata đã tồn tại thì ArcCalalog sẽ hiển thị những thông tin của metadata.

ArcCatalog hỗ trợ sẵn một ứng dụng để nhập phần thông tin mô tả. Ứng dụng đó là FGDC metadata editor. Để sử dụng công cụ này người sử dụng kích chọn nút Edit metadata trên thanh công cụ metadata (metadata toolbar). FGDC metadata editor cho phép người sử dụng tạo metadata theo đúng chuẩn CSDGM, đây chính là ứng dụng mặc định nhập metadata trong ArcCatalog.

Người sử dụng có thể tạo một ứng dụng riêng để nhập thông tin cho metadata. Do đó có thể tồn tại nhiều ứng dụng nhập cùng một lúc. Tuy nhiên chỉ có thể sử dụng một ứng dụng tại một thời điểm.
Sau khi metadata được tạo ra, nó trở thành một thành phần của đối tượng. Metadata tự động được di chuyển, sao chép hoặc xoá khi đối tượng di chuyển, sao chép hay bị xoá.

ArcCatalog cho phép người sử dụng lựa chọn metadata để tự động cập nhật hoặc cập nhật bằng tay khi dữ liệu thay đổi. Nếu chọn chế độ tự động cập nhật thì bất cứ khi nào xem metadata, ArcCatalog tự động cập nhật thông tin thuộc tính theo đúng giá trị hiện hành. Điều này bảo đảm thông tin thuộc tính trong metadata và thông tin thuộc tính của đối tượng luôn thống nhất với nhau. Nếu chọn chế độ cập nhật dữ liệu bằng tay thì medata chỉ được cập nhật khi nào người sử dụng kích chọn nút cập nhật metadata.

2.2. Hiển thị nội dung metadata

Cùng một nội dung metadata, ArcCatalog cho phép người sử dụng xem dưới các định dạng (stylesheet) như: ESRI, FGDC, FGDC FAQ, Geography Network, XML. Mỗi định dạng lấy dữ liệu trong metadata đưa vào trang HTML theo một dạng khác nhau (different-looking). ArcCalalog chọn định dạng ERSI là định dạng mặc định khi hiển thị nội dung metadata. Tuy nhiên, người sử dụng có thể lựa chọn một dạng hiển thị mặc định tuỳ ý.

Người sử dụng cũng có thể tạo ra định dạng theo ý muốn và gắn vào danh sách các định dạng để hiển thị thông tin theo ý muốn.

2.3. Phương pháp lưu trữ metadata

Metadata tạo bởi ArcCatalog được lưu trữ theo dữ liệu XML, Tuỳ theo dạng dữ liệu mà dữ liệu XML được lưu trữ cùng với thư mực chứa dữ liệu hoặc trong geodatabase.

XML (Extension Markup Language) là ngôn ngữ định dạng mở rộng dùng để thể hiện dữ liệu. XML cho phép người sử dụng định nghĩa dữ liệu bằng cách sử dụng các thẻ (tags). XML là một chuẩn dùng để truyền dữ liệu trên mạng Internet.

Stylesheet định nghĩa dữ liệu XML theo một dạng nhất định. Stylesheet được tạo bằng cách sử dụng XSL. XSL truy vấn dữ liệu XML. Stylesheet nhận dữ liệu từ tài liệu XML, định dạng lại và định nghĩa cách hiển thị. Trong ArcCatalog các stylesheet tạo trang XML từ dữ liệu XML, do đó người sử dụng có thể xem metadata với bất kỳ trình duyệt web nào.

Do dữ liệu được lưu trữ riêng biệt trong các file XML nên người sử dụng dễ dàng thay đổi định dạng hiển thị metadata bằng cách chọn các stylesheet từ thanh công cụ metadata.

Mỗi phần tử (element) của metadata định nghĩa theo chuẩn CSDGM đều có tên ngắn và tên dài. Tên ngắn được sử dụng để kết hợp với phần tử XML.

Những phần tử XML phải được chỉ ra, ArcCatalog tham chiếu tới thuộc tính đồng bộ trước khi cập nhật dữ liệu.

Post a Comment

Mới hơn Cũ hơn