盐度数据集
# 全球盐度数据集(基于1980-2019 年地表水和地下水测量)
# 1.数据概况
淡水资源的盐渍化是一个日益严重的水质挑战,可能对生活用水和粮食安全以及生物多样性和生态系统服务产生负面影响。尽管与许多其他水质参数相比,盐度监测相对普遍,但尚未在全球范围内对地表水和地下水成分的可用数据集进行汇编和协调。该数据库展示了一个新的全球盐度数据库,数据库由1980-2019年期间地表水(河流、湖泊/水库)和地下水位置的电导率 (EC) 监测数据编制而成。
这些数据是从各行各界收集的,包括把已有研究基础、全球盐度数据库、政府组织、流域管理委员会和水开发委员会等等。生成的数据库包含来自全球45,103 个地表水位置和208,550个地下水位置的超过1630万个测量值。
该数据库可以为水资源盐度水平的元分析提供新的机会,以及解决与历史和未来盐化模式和影响相关的数据和模型驱动的问题。
# 2.研究现状
改善水质是联合国可持续发展目标(SDG)的核心部分,数据收集和共享已被视为实现相关水质目标的重要步骤。尽管共享盐度数据集的研究数量正在增加,但很少有评估扩展到全球范围,甚至更少的评估同时针对地表和地下水系统。此外,盐度数据在报告参数、单位和时空分辨率方面往往是分散的和不统一的。这使得跨尺度的信息比较变得复杂。
为了支持科学家和其他从事淡水盐度相关工作的人,该研究在此提供一个全球统一的盐度数据库,包括地表水和地下水成分的盐度监测数据。收集并合并了观测数据,主要侧重于电导率(EC),这是全球最常监测的盐度参数。对于地下水,还包括一些额外的总溶解固体(TDS)的数据集,这些数据被转换为电导率,以便在不同地点进行比较。这些数据是由一系列来源收集的,包括地方、区域和全球水质数据库、政府组织、流域管理委员会、水发展委员会和个别研究项目。包括了1980-2019年选定时间段内所有至少有30个测量值的地表水监测站,以及所有有测量值和深度信息的地下水站。
由此产生的数据库包含了超过1630万个电导率测量值,来自世界各地约25万个地点,分为34494个河流地点,10609个湖泊或水库地点和208550个地下水地点(图1)。尽管在各大洲都发现了测量数据,但站点密度和采样频率在空间和时间上都有很大差异。例如,北美和澳大利亚的站点密度一般最高(图1a,b的绿色),亚洲和非洲的总体密度最低(图1a,b的白色),但南非的站点频率较高(图1a,b的青绿色)。站位密度普遍随时间推移而增加,特别是欧洲和南美部分地区。采样水体类型的分布在各大洲和不同时期也有差异(图1c)。例如,在亚洲,20世纪80年代和90年代没有发现测量数据(条纹颜色),在21世纪,只有地下水数据被报告(浅灰色条形颜色)。另一方面,在欧洲,1980年代获得的地下水测量数据多于后来的地表水。然而,对于该数据库中的大多数取样水类型,其分布并没有随着时间的推移而发生很大的变化(图1c)。关于每种水类型的测量次数(图1d),在整个时间段内也是相当稳定的,地下水的采样频率总体上比地表水低得多。地下水平均取样4次,而河流和湖泊/水库平均每站分别有321和417个样本。
(a)的全球地图显示了在整个数据期间(1980-2019 年),数据库中包含电导率(EC)观测值的每个国家的站点总数。放大突出显示每个大陆的高密度站点区域,每种水类型给出的数字是相关大陆的站点总数。
(b)显示了数据库中包含的不同十年(1980-1989、1990-1999、2000-2019)每个国家的台站数量。
(c)显示了每个大陆在三个十年中采样水类型(占总样本的百分比)的分布。没有数据表示为条带列。
(d)显示了同一时间段内每种水类型的测量次数分布的小提琴图。
# 3.生产方法
盐度是衡量所有来源的水中溶解(可溶)盐类的浓度,它可以由一系列参数(包括溶解固体分数、总溶解固体、氯化物、电导率、盐度)和单位(包括ppm、mg/L、μS/cm、dS/m)来测量。
对每个监测点和取样的水类型采用了多种选择标准。地表水被划分为以下类别。(a)河流;(b)湖泊/水库。如果在选定的时间段内(1980-2019年)至少有30次测量结果,则包括一个采样地点。对于地下水,如果有报告的采样深度信息,就包括每个地点的所有测量值。
对每个地下水地点采用这种不太严格的采样频率标准的原因是,与地表水监测相比,高频率的地下水监测普遍存在局限性。此外,低时间分辨率的地下水数据可以为一阶盐度评估、模型校准和/或假设测试提供宝贵的输入。然而,解释地下水电导率的一个重要变量是采样深度,因为这对不同取水深度以及淡水/盐水透镜的估计有很大影响。因此,这就促使地下水的深度可用性标准高于采样频率。除了这些标准外,所有样品还必须有日期和坐标(经纬度)信息,以便合格地纳入数据库(数据选择和处理步骤的示意性流程图见图)。
# 4.数据基础
使用数据源组合从地表水和地下水监测地点收集数据,包括:(i) 全球数据集,(ii) 区域数据集,以及 (iii) 个别河流流域和地下水含水层数据集。区域数据包括跨越多个河流流域和/或地下水含水层的数据集,既在同一区域内,也跨区域。这些数据大多由政府组织或环保部门或国家水质监测计划下的跨区域数据门户平台提供。地方/单个流域数据集由单个流域的监测数据组成,通常通过政府机构、流域管理委员会、研究机构以及个人研究人员提供。
(i)全球盐度数据集
全球河流化学数据集(GLORICH) 包括世界各地河流位置的多个水质参数,由汉堡大学的研究人员收集。
(ii)区域盐度数据集:
欧洲的数据来自欧洲环境署的水质数据库;Waterbase包含整个欧洲的河流、湖泊和地下水体的多个水质参数;
美国地表水和地下水水质门户(WQP)包含美国地表水和地下水的一系列水质数据。该数据门户由美国地质调查局(USGS)、环境保护署(EPA)和国家水质监测委员会(NWQMC)建立;
美国的地下水数据也是从溶解固体数据集(Qi& Harris 2017)中收集的,该数据由USGS提供的ScienceBase 目录发布,其中包含为评估美国各地的微咸地下水而收集的EC(和其他地球化学)数据;
科罗拉多州的地下水数据是从农业部和农业化学品与地下水保护部门(Co Gov)收集的。使用全州无机质量监测数据的搜索查询直接从该站点下载数据,并选择所有可用年份的参数比电导(Lab);
加利福尼亚州的地下水数据是从加利福尼亚州开放数据门户网站提供的GeoTracker地下水环境监测和评估计划(GAMA)下载的;
俄亥俄州环境保护署(Ohio EPA)的地下水监测数据是从他们的环境地下水监测计划中下载的......
(iii)各个流域和地下水含水层的盐度数据集:
多瑙河流域内河流位置的数据来自多瑙河流域水质数据库。该数据库由国际保护多瑙河委员会(ICPDR)信息系统Danubis (ICPDR)提供;
墨累达令下游流域的数据通过 Water Connect 数据门户(Waterconnect)访问;
尼罗河三角洲含水层的地下水TDS数据由Joeri van Engelen提供。
# 5.质量验证
盐度数据库包含以下 3 个类别和相关列出的文件:
第1类:河流数据
此文件夹包含完整的河流数据库,其中包含一个csv文件,其中包含每个河流位置的所有电导率和站点相关数据。该文件夹还包含一个数据摘要文件,该文件提供基本的电导率统计数据(中位数、平均值、最大值、最小值、标准差)、采样摘要信息(测量的开始和结束周期、测量次数)以及其他站点和数据信息(坐标、每个采样位置(Station_ID)的国家、大陆、数据源)。
Rivers_database.csv
Rivers_summary.csv
第2类:湖泊/水库数据。
此文件夹包含湖泊和/或水库电导率数据的完整数据库,以及根据上述描述的摘要文件。
Lakes_Reservoirs_database.csv
Lakes_Reservoirs_summary.csv
第3类:地下水数据。
此文件夹包含所有地下水数据及其相关的摘要文件。对于地下水文件,测量的电导率、总溶解固体和转换后的电导率作为单独的列包含在数据库文件和相关的摘要文件中。
Groundwaters_database.csv
Groundwaters_summary.csv
对于所有文件,每个站点的数据源都包括在内,其相关数据链接在仅在附属文件中给出,用于每列变量名称的定义和单位在表中给出。示例R代码,包括读取数据库文件和复制本文图形的说明,也可作为该数据记录的一部分。
# 6.论文及数据获取
引用格式:
Thorslund,J.,van Vliet, M.T.H. A global dataset of surface water and groundwater salinity measurements from 1980–2019. Sci Data 7, 231 (2020).
原文链接:
https://doi.org/10.1038/s41597-020-0562-z
访问链接:
https://doi.pangaea.de/10.1594/PANGAEA.913939?format=html#download
出版单位:Springer Nature
出版时间:13.July.2020