本標準規定了環境數據集說明文檔的內容要求、格式要求和環境數據集說明文檔模板。
本標準適用于環境數據集加工、使用及匯交過程中對環境數據集的說明。
本標準內容引用了下列文件中的條款。凡是不注日期的引用文件,其有效版本適用于本標準。
GB/T 2260-2007 中華人民共和國行政區劃代碼
GB/T 7408-2005 數據元和交換格式 信息交換 日期和時間表示法
GB/T 17295-2008 國際貿易計量單位代碼
HJ/T 417-2007 環境信息分類與代碼
HJ 720-2014 環境信息元數據規范
環辦[2012]92 號 附件 3 污染源監督性監測數據元技術規定
環辦[2012]92 號 附件 4 污染源自動監控數據元技術規定
環辦[2012]92 號 附件 5 環境統計數據元技術規定
下列術語和定義適用于本標準。
3.1 數據集 dataset
可識別的數據集合。
3.2 環境數據集 environmental dataset
由環境保護業務相關的數據實例組成、遵循統一的數據模型、具有相對獨立的業務語義的數據集合。
3.3 數據元 data element
用一組屬性描述定義、標識、表示和允許值的數據單元。
4.1 內容要求
環境數據集的創建單位應編寫環境數據集說明文檔,以準確描述環境數據集。環境數據集說明文檔應包含以下基本章節:
a) 概述;
b) 數據集標識;
c) 數據內容和結構;
d) 覆蓋范圍;
e) 數據質量;
f) 元數據。
可包括以下章節:
g) 數據分發;
h) 限制信息;
i) 數據維護;
j) 附加說明。
4.2 概述
概述應包括環境數據集說明文檔的創建信息:
a) 數據集說明文檔的名稱;
b) 數據集說明文檔的版本;
c) 數據集說明文檔的發布日期;
d) 數據集說明文檔的創建單位,包括單位名稱、地址、電話、傳真、電子郵件地址、網址。
可包括以下可選項:
e) 術語和定義;
f) 縮略語。
4.3 數據集標識
數據集標識應包括以下項:
a) 數據集名稱:縮略描述環境數據集內容的標題,應包含該數據集的空間覆蓋范圍、時間覆蓋范圍、數據內容等;
b) 數據集摘要:對數據集內容概要說明的文字,應包含該數據集的主要內容、空間覆蓋范圍、時間覆蓋范圍、形成過程、遵循的主要標準等信息;
c) 數據集分類:數據集所屬的分類,遵循 HJ/T 417-2007 各種分類的取值規定;
d) 數據集提供方:包括數據集提供單位、提供單位電話、提供方電子郵件地址。可包括以下可選項:
e) 目的:生成數據集的目的;
f) 補充信息:對該數據集的其他描述信息,如說明該數據集與歷史版本間的關系。
4.4 數據內容和結構
4.4.1 數據結構
采用 UML 描述環境數據集的數據結構,即環境數據集數據模型,描述數據實體-屬性關系。用 UML 中類的概念表示數據實體,用 UML 類的屬性概念表示實體的屬性。
本標準采用 UML 定義的下列四種模型關系,并采用 UML 靜態結構圖表示數據實體間的關系:
a) 關聯
關聯用于描述兩個或更多類之間的一般關系。如圖 1 所示。
關聯的方向必須說明。如果不指明方向,則假定為雙向關聯。如果是單向關聯,關聯方向在線段終點用箭頭來標記。
?
圖 1 關聯示例圖
b) 聚合
聚合用于創建兩個類之間的部分與整體的關系。在該關系中,一個類擔當容器角色,另一個類擔當容器的構件角色。如圖 2 所示。
??
圖 2 聚合示例圖
c) 泛化
泛化表示一般化描述和具體化描述之間的關系,即超類與替代它的子類之間的關系。如圖 3 所示。
?
圖 3 泛化示例圖
d) 角色
模型中使用“角色名稱”描述源對象與目標對象之間的關系。在雙向關聯中,提供兩個角色名稱。如圖 4 所示。
?
圖 4 UML 角色示例圖
4.4.2 數據內容
說明環境數據集所包含的數據元。若所包含的數據元在環辦[2012]92 號文附件 3、環辦[2012]92 號文附件 4、環辦[2012]92 號文附件 5 中已有定義,可直接引用;若為第一次定義, 則應對數據元的屬性進行詳細描述,數據元屬性見表 1。
更多標準內容點擊以下鏈接獲取標準全文:
下載地址:《HJ 722-2014 環境數據集說明文檔格式》