深层地下水含水层被开发用于各种目的。一般来说,不透水的岩层保护这些含水层不受人为影响。因此,在工业化前的国家,它们是获取地下水的最后手段,在洪水污染浅层地下水等紧急情况下,它们是至关重要的资源。欧盟水框架指令(WFD)为保护水的质量和数量提供了监管框架。最近对巴伐利亚和奥地利上侏罗统油井水化学状态的监测显示,波动与新的开采活动有关,可能表明含水层的发展不可持续。我们根据WFD提出了一种新的工作流,该工作流使用聚类算法来评估这些波动。我们的数据包括每口井5到42次水化学分析,每年采样间隔长达30年。通过聚类分析,我们得出了两条走廊的阈值:自然范围走廊(NC)和行动走廊(AC)。虽然NC代表了一个非常具体的自然变化范围,但AC暗示了不可持续的发展,应该触发详细的(重新)评估。为了展示新方法的潜力,将该工作流程应用于两口具有不同地质特征的井。该系统能够清楚地识别出不同的波动事件,并将其应用于早期预警系统中,从而在有害的水化学变化对井作业人员造成法律问题之前就能发现它们。因此,我们的工作流程提供了一种新颖、稳健、可重复的方法来评估一口井的可持续性等级,并确保独特而重要的资源处于良好状态。
数百米的岩石基质具有有限的渗透性和高阻滞电位,保护深层地下水免受人为影响。在这个前提下,深层地下水水库是一种非凡的清洁水源,特别是在更多浅层和地表水被污染或枯竭的时候。这种资源的重要性和广泛的应用导致了同时开发的冲突,例如用于技术目的的大量净排放,地热能和饮用水生产(Wycisk等人,2003;Goldscheider 2005;Panagos et al. 2013;Baiocchi et al. 2013)。
如果累积取水速率超过年补给速率的20%,则认为含水层处于压力状态(Arle et al. 2017)。这个值主要保证了数量的可持续性。然而,深层含水层的地下水流速通常非常慢。因此,任何提取都会改变水体的年龄结构,因为更近期的水会取代被提取的水。Baumann(2013)分析了瓶装水的年龄结构和这些水中存在农药的证据,表明深层地下水的开采可以将采出水的年龄从1000多年改变为不到30年。因此,在人类的时间尺度上,深层地下水应被视为不可再生资源(Ungemach et al. 2005)。然而,对于许多深层含水层,目前还没有针对含水层的可持续管理计划。
使用地下水年龄作为直接输入参数来评估当地开采方案的影响似乎是直观的。然而,目前的年龄测定方法表现出一系列的不确定性,因此在评估年龄结构的微小变化时缺乏敏感性,使地下水年龄成为地下水可持续性的可疑指标(Ferguson et al. 2020)。相反,我们建议使用单井的水化学特征及其变化作为(非)可持续井开发的敏感指标。这一前提假设含水层的过度开采会导致水化学变化(Li et al. 2013)。
欧洲水框架指令(WFD);欧洲议会和理事会(2000年)为评估地下水水体设定了法律背景。它规定,到2027年,所有指定的地下水必须达到“良好的数量和质量状态”(Foster and Custodio 2019)。它还使用电导率(EC)定义了良好的化学状态,以检查盐水或其他侵入物的影响,并强调人为影响和污染物(欧洲议会和理事会,2000年)。这些准则对易受人为活动影响的浅层地下水体产生了积极影响(Foster and Custodio 2019)。然而,由于深层含水层位于地下150米至7000米,因此其压力源差异很大,受人为影响较小(Kang et al. 2019)。深层地下水含水层,如北阿尔卑斯前陆盆地(NAFB)的上侏罗统,面临着直接从人为来源接收污染物的小风险。然而,它们可能呈现“坏”的化学状态(根据世界水处理标准),例如,通过从较高或较低地层侵入石油、天然气或盐水(欧洲议会和理事会2000;Kang et al. 2019)。
实施WFD核心理念的国家行业标准的例子是欧盟矿泉水指令(欧洲议会和理事会2000年)或德国水疗协会(GSA)的“健康度假村,度假小镇和治疗来源提名的定义和质量标准”(Deutscher Heilb?derverband和Deutscher Tourismusverband 2016)。其他国家的WFD实施也有类似的缺点。因此,这里讨论的特点不仅限于这个德国法律框架,而且可以在国际上推断出来。GSA框架表示具有平衡治疗用途的成分的阈值,并允许
特征成分和浓度< 20mg /L的成分的浓度分别有±20%和±50%的变化。然而,这些阈值与井的自然变异性无关。因此,如果波动特征位于允许的走廊内,那么它们显然不是井的自然波动的一部分,可能会在强制性的年度水化学分析中被忽视。因此,±20%的一般值无法检测到不可持续的油井开发。
水化学参数的时间变化表明了异质流入机制对不同回采速率的响应。除其他因素外,这可能是由于供暖需求或接受浴疗的客人数量的季节性波动、COVID-19大流行期间的封锁等不可预测事件或泵故障造成的。此外,必须考虑重新注入冷却水或缺乏冷却水。大多数年度采样活动安排在日历年的±2 - 3周时间窗口内,因此采样在井的类似运行状态下进行。
与缺乏适当的监测和管理办法形成鲜明对比的是,维持深层地下水含水层的数量和质量完整性至关重要。这种矛盾的结果是需要可靠且可重复的方法来评估井的水化学特征的恶性变化,同时确定其自然波动范围。这些方法还必须健壮地适用于不相等时间间隔的基本数据集。
确定自然范围必须通过聚集代表井的自然波动的数据点来实现。聚类算法遵循模式识别的前提,将具有相似特征的数据点分组,并以无偏的方式将大数据集细分为较小的聚类(Fu et al. 1976;考夫曼和卢梭1990)。在稀疏训练数据上应用聚类方法会遇到困难。换句话说,人们的目标是将数据分组为同质簇,而不使用任何与样本组有关的信息(Lee 1981)。因此,对数据结构和聚类的目的有很好的了解是必要的。两种聚类算法分别是分裂分析(DIANA)和k-means。DIANA是一种分层(自顶向下)聚类方法。它将初始数据集分成两个簇,由它们到最不同数据点的欧几里德距离定义。得到的聚类被拆分,直到每个剩余的聚类只包含一个数据点(Patnaik et al. 2016)。
k -均值分析是一种自下而上的聚类算法,它以相反的顺序处理聚类过程(Kaufman and Rousseeuw 1990;Patnaik et al. 2016)。作为最简单的无监督学习算法之一(Kodinariya and Makwana 2016),它将数据集划分为k组,k组由用户设置(Wagstaff et al. 2001)。这就要求研究者对数据的结构特征有良好的先验知识。然后使用实例到各自聚类中心的欧几里德距离迭代地改进这k个聚类中心的位置(Wagstaff et al. 2001)。
聚类分析与水文地球化学分析相结合,用于研究地下水化学的时空格局(Yang et al. 2020;Heine et al. 2021;Kim et al. 2003;Wang et al. 2015)。利用这种方法的大多数研究,包括最近的调查,都侧重于空间水文地球化学分带,并使用代表整个采样周期的时间平均值(Yang et al. 2020),而忽略了时间动态(Sayemuzzaman et al. 2018;Heine et al. 2021)。侧重于时间分析的研究倾向于将聚类分析应用于不同采样周期的数据,以便在更大的地理区域内跟踪这些时间段之间的变化,而不是单个井场(Pacheco Castro等人,2018;Yang et al. 2020;Thyne et al. 2004;Hussain et al. 2008)。聚类分析也被用于地下水监测项目。Ribeiro和Macedo(1995)在对数据集应用主成分分析以定义变量之间的相互关联结构之后,采用层次聚类分析(HCA)来建立具有相似时间模式特征的站点组,然后通过Mann-Kendall检验分析所得指标的时间变化。Daughney和Reeves(2006)将HCA应用于地下水化学的时间趋势,这是他们之前通过Mann-Kendall测试确定的。他们强调了在全国范围内确定地下水质量变化基线率的重要性,因为一个给定的井“不能被定义为‘受影响’或‘异常’,除非之前已经定义了正常(基线)的阈值限制”(Daughney和Reeves, 2006)。考虑到地下水在自然系统中可能遇到的条件范围,例如含水层岩性、限制、补给来源和年龄,重要的是将基线定义为数值范围,而不是单个数字。在他们的研究中,他们使用百分位数(第5、25、75和95)来定义这些范围(Daughney and Reeves 2006)。在撰写本文时(2022年4月),我们不知道有任何尝试利用聚类分析方法来定义单个井的水质动态自然时间范围,而不是在含水层水平或通过任意值范围。
因此,基于在NAFB的下巴伐利亚州和上奥地利州收集的数据,本研究的主要研究问题是使用可重复的统计分析方法和基本数据集来定义井的自然状态(考虑其主要离子和微量物质的总浓度)。此外,我们测试了开发的框架作为井水化学变化预警系统的功能。
该研究提供了一种新的方法来确定NAFB中每口井的典型固有波动范围,而不是采用任意值。了解这种特征波动是我们理解地热地下水可持续开发的核心,也是了解使用同一含水层的竞争井运营商如何可持续共存的核心。
我们从德国和奥地利北部阿尔卑斯前陆盆地(NAFB)的22口地热井(图1)中选择了8口进行分析(图1)。之前的研究(Mayrhofer et al. 2014;Heine et al. 2021;Birner et al. 2012)研究表明,这些碳酸盐岩相互连接,构成一个深部地下水体。
图1

研究区域:下巴伐利亚州的DEGK1110和上奥地利州的GK100158。饼状图的大小代表了测试井的水化学特征,表明了TDS
选定的水井生产热水,用于温泉、区域供热和发电目的。可用分析的数量从5到42不等。虽然最早的分析是在1939年在BF1进行的,但只有少数历史分析可用。每年的抽样始于20世纪90年代。数据包括物理参数(如流速、电导率(EC)、温度和pH)和水化学参数(与浴疗相关的主要离子和微量离子)。虽然德国水井的大多数分析是由慕尼黑工业大学的水化学研究所进行的,但也有其他实验室参与。所有数据存储在PostgreSQL数据库中,并通过PostGIS连接到QGIS进行空间表示(PostgreSQL Global Development Group (2021);PostGIS项目指导委员会(PSC) (2021);QGIS开发团队(2021))。
描述性统计使用R (R Core Team 2020)计算总溶解固体(TDS)、主要离子、与浴疗相关的离子和物理参数。对于以下所有分析,我们将TDS定义为8种主要离子和表征微量离子(Na+, K+, Ca2+, Mg2+, F-, CI-, SO42-和HCO3-)的总和。汇总的Schoeller图和两个Piper图(在线资源1)描述了井的一般水化学特征。为了更详细地描述水化学特征,我们必须考虑影响岩石基质中水化学过程的流入途径,从而考虑TDS和单个参数浓度。
本研究采用了DIANA和k-means两种聚类算法。通过采用两种不同的聚类方法(自底向上vs自顶向下,无条件vs预条件),我们涵盖了一系列广泛的方法。这两种方法都使用R软件包“stats”,“factoextra”(Kassambara和Mundt 2020),“cluster”实现方法由Kaufman和Rousseeuw(1990)和Maechler等人(2021)开发,以及“gridExtra”(Auguie和Antonov 2017)执行。
为了识别具有低TDS、TDS值高于正常值以及介于这两个极端之间的数据点,我们将数据集分为三个聚类(k=3)进行k-means分析。DIANA以树状图的形式展示了它的结果,树状图显示了两个簇之间的相似性。两个集群之间的垂直距离越大,它们彼此之间的差异就越大(Kaufman and Rousseeuw 1990)。因此,集群的数量取决于定义为截止点的垂直高度值。因此,我们为每口井确定了合适的高度值。
我们在没有事先归一化的数据上运行了两种聚类算法,因为绝对浓度是当地水监管标准实施的重要特征(L?nderarbeitsgemeinschaft f
r Wasser (LAWA) 1998)。此外,我们旨在检测水化学的变化,包括稀释过程。如果阳离子和阴离子的相对浓度没有变化,但总浓度发生了变化,那么使用标准化数据就不会注意到这些变化。
我们比较了两种聚类方法的结果,并通过比较两种聚类方法在同一聚类中分组的数据点数量来评估它们之间的一致性。在对剩余数据运行聚类算法之前,通过每次去除八个离子中的一个来测试这两种方法的灵敏度。
由此产生的工作流程将年度数据点分组为自然状态,然后根据代表自然状态的聚类的平均值和标准差(SD)定义代表“自然波动范围内”和“自然波动范围外”的走廊。一旦检查了建议的工作流以检测不同波动事件的异常值,我们就测试了它作为早期预警系统的适用性。为此,我们在三次迭代中将工作流应用于可识别的波动事件,在每次迭代中增加可用于聚类算法的数据点。然后,我们评估了拟议的走廊是否允许在波动事件发生之前和发生期间进行区分。
摘要
1 介绍
2 方法
3.结果
4 讨论
5 结论
数据可用性
代码的可用性
参考文献
致谢
作者信息
道德声明
补充信息
搜索
导航
#####
图2以汇总的Schoeller图展示了所有8口井的水化学成分。具有相同特征但浓度不同的水以平行线表示。单个离子的浓度相差一个数量级。虽然一般特征似乎相当相似,但在线交叉和/或线的斜率与一般趋势强烈偏离的地方存在显著差异。BS1的水TDS较低,钠含量高于氯化物,表明离子交换过程沿着流动路径进行,与咸水接触较少。相比之下,STR显示出较高的浓度值,钠浓度几乎与氯浓度相匹配。这表明盐水的贡献和很少的离子交换。
图2

所有8口评估井的舍勒图。连接点是该井所有分析的算术平均值,误差显示为一个标准差
一般来说,除了硫酸盐外,SD都很低,这表明分析错误,而不是储层的变化。大多数热水含有大量的还原硫(HS-, H2S)。这些物质在取样和样品转移过程中会氧化,除非进行特殊处理(Mayrhofer et al. 2014)。
STM, HAA和ALT产生碳酸氢钠-氯化物热水。氯离子的相对当量浓度自西向东递减。BS1在相对氯化物浓度低于20%和TDS非常低的情况下脱颖而出。
水化学特征表明,DEGK1110与GK100158水体差异显著。这表明不同的岩石地层环境和井的局部流动路径,可能包括与主要流动路径上方和下方的含水层接触。与碳酸盐基质中的反应动力学相比,区域停留时间较长。因此,局部效应对水化学稳定性的影响比区域流态更强。
基于钻井测井(Baumann and Nie?ner 2012;研究所
r Wasserchemie TUM 1999, Elster et al. 2016)和水化学特征,我们提出了三种流入路径类型(图3)。这些简化类型以不同的方式经历停留时间、萃取量和压力状态的影响。A型含水层封闭在不透水层之间。不管采出速率和水力潜力如何,水只在含水层的主岩中流动。在B型含水层中,与相邻层的水力接触是可能的。这种流入的大小是主要含水层及其邻近地层的渗透率以及每一层的水力势的函数。C型代表地层中不同含水层的技术联系,否则这些含水层是分开的。在这里,来自不同含水层的混合量是不同层的透射率、水力势和产量的函数。虽然这种勘探策略已被弃用,但这种类型的井仍然存在。这三种流入类型为首次评估油井开发的稳健性提供了一种快速方法。本研究井中2口(SB2、STR)为A型井,4口(BF1、ALT、BS1、SB2)为B型井,2口(BB3、HAA)为C型井。大多数B型井位于NAFB的中部。
图3

研究区域的流入路径类型
图4

特征离子在BF1和SB2的时间序列。根据法律框架,方框显示允许的±20%变化区间(相对浓度低于20%的参数为±50%)(灰框:与水化学表征无关的参数)。线条显示参考值(最新官方分析;蓝色),NC(绿色)和AC(红色)
在本研究的剩余部分,我们将重点关注两口井:BF1 (B型)和SB2 (A型),涵盖流入类型的可变性和水化学条件的稳健性。BF1用于加热和消毒。它属于一组净排无注井。SB2专门为当地区域供热产生热量,并连接到注入井以保持水平衡。
在图4的左侧,显示了所有可用采样日期BF1的选定离子和参数。温度是恒定的,没有任何明显的趋势。少数低温数据点可能不是在井口测量的,而是在地面生产线的其他地方测量的。
随着时间的推移,钠和碳酸氢盐的发展相似。1998年至2011年间,钠和碳酸氢盐表现出高度动态的行为,浓度开始增加,分别达到最大值296.5 mg/L和646.8 mg/L。在接下来的几年中,浓度值逐渐下降,直到2006年分别达到最小值260 mg/L和515 mg/L。在这种发展之后,钠和碳酸氢盐的值在稳定的平均值附近趋于平稳,没有明显的短期趋势。
总体而言,BF1的特点是其化学成分波动较大。这与流入路径类型(B型)相对应。这里的主要流入来自上侏罗统的碳酸盐岩,上覆的Coniac/Cenoman碳酸盐岩也有贡献。图4显示这两个含水层具有相似的水化学特征,但矿化度略低。
由于BF1离子浓度大多在允许的范围内,因此可以证明含水层的状态良好。然而,2006年前后的动态行为是惊人的(图4)。1 g/L TDS的阈值几乎被削弱,硫化物浓度一度削弱了允许的波动范围。这说明,当前法律框架设定的标准不够敏感,无法发现可能表明不可持续油井开发的变化。
在右侧,图4描述了与上述相同的SB2所有可用采样日期的参数选择。大多数参数是不变的,没有任何趋势。虽然TDS偶尔会低于1000毫克/升,但这是可以忽略不计的,因为水不是用于浴疗目的。
总体而言,SB2的发展较为稳定。TDS仅在记录数据开始时波动,并在约1000 mg/L时趋于平稳。钙和氯表现出最强的变异性,其最大的波动发生在时间轴的前十年。其初始值分别为16.3 mg/L和215 mg/L。在十年内,它们分别在2005年和2003年降至最小值9.3毫克/升和138毫克/升,然后分别稳定在13毫克/升和160毫克/升左右。除氯化物外,所有参数均不超过或低于允许波动范围。
SB2一般为稳定井,代表其指定的流入路径类型(a型)。主要流入来自上侏罗统,不透水层屏蔽了邻近地层水的影响。因此,即使提高生产速率也不太可能导致TDS或单个离子浓度的重大变化。
建立一个对含水层整体状态变化具有高灵敏度的预警系统符合作业者和相关部门的利益,如图4所示。确定这些变化是否由额外的勘探活动、过度使用或水力制度的长期变化引起,不在本研究的范围之内。这里的重点在于在波动变得具有法律意义之前发现波动(例如,通过降低最低TDS阈值1000毫克/升),这就是为什么我们提议的框架必须发挥预警系统的作用。我们建议一个工作流程,其中产生两条走廊,分别称为自然走廊(NC),代表可持续利用的自然变化,以及行动走廊(AC),代表不可持续的利用。后者应引起进一步的调查和/或采取措施以保持含水层的良好状态。
两条走廊都是基于特定井的水化学特征,包括与水疗相关的微量成分。我们假设每口井都有一个自然的水化学方差,它反映了其岩石地层环境和流入类型。这种自然变化包括井的产量,因为通常没有含水层本身的先验数据。
走廊被定义为空白周围SD的3倍(NC)和6倍(AC)(代表自然状态的分析平均值;图5 c)。这种对走廊的描绘采用了检测极限()和量化极限()的定义(Armbruster and Pry 2008)。这里是代表自然波动范围的所有样本的均值及其SD。对于正态分布值的随机方差,按照概率论中的三西格玛规则(或68-95-99.7规则)(Hao et al. 2015), 3覆盖99.73%,而6覆盖99.999998%。
在已知井的自然状态的前提下,这个定义似乎很简单。如果给定水的水化学特征如图4所示是恒定的,则自然状态是明显的。然而,BF1显示的一些特征显然不是自然变化的结果(图4)。因此,走廊的定义需要首先勾画自然状态的额外步骤。
采用聚类算法(DIANA和k-means;图5a),我们将数据集分成几组分析。研究区域所有井的历史数据都支持这样的假设,即最大的结果簇代表自然状态(图5b)。
关于产量对水化学特性是否有任何直接影响的初步测试是强制性的,可以在泵送测试期间获得。在流入类型B和c中,泵送速率和/或水力势的变化可能对水化学成分产生影响。在这里,如果以不同的泵送速率采集年度样本,确定自然变化的概念将会失败。表1和图4显示了所有8口井的拟议工作流程的结果。
图5

聚类工作流识别给定井的自然波动范围和作用走廊
NC的平均值和所有可用数据点的平均值通常很接近。标准差值的差异对于NC通常比整个数据集的差异要小得多。这就强调了选择构成井的自然范围的数据点来定义井的基线波动的重要性。
表1公司DIANA与k-means之间的聚类分配对每个数据点的影响以及DIANA的聚类结果
表1进一步显示了DIANA与k-means的同余性。K-means是按类别运行的。通常观察到高同余值。ALT的同余值最低(64%)。对于这个数据集,k-means聚类分析得出两个同样大的聚类。将两种算法的聚类数量从3类增加到4类,可以将ALT的同余值提高到100%。不包括ALT,所有其他井的最小同余值为77%,不包括ALT的平均同余值为94.57%。
聚类的结果对于从数据中去除大多数单个离子是稳健的(在线资源3和4)。当排除和时,NC没有改变。排除Na+或HCO3-确实改变了结果,因为这些离子是这些井中水的主要成分。K-means对BF1上Cl-的去除敏感,这归因于K-means (SI)中预定义的簇数。两种聚类算法在NC的定义上是一致的,Na+的缺失对两种聚类算法的影响是相同的。在SB2中,当使用DIANA时,最大集群中的数据点数量没有改变。用k-means计算,排除Cl-时从16变为11,排除HCO3-时变为10。在BF1上使用k-means,当排除Cl-时,最大簇的数据点数从14个增加到16个,当排除Na+时,数据点数增加到19个。当DIANA作用于BF1时,这些数值在排除Na+时从14变为19,在排除HCO3-时变为21。
图4显示了基于DIANA聚类的BF1和SB2两口井的走廊图。自1939年以来,BF1的TDS在NC外,有10个分析,2个数据点甚至在AC外。对于SB2,只有1个TDS数据点在NC外,没有数据点切断AC。TDS为1112.8±40.6 mg/L,与SB2相比,BF1的差异通常更大(TDS=1029.17±30.2 mg/L)。然而,它们各自的最大星团显示出不同的统计特征:BF1最大星团的TDS为1106.1±12.2 mg/L,而SB2最大星团的TDS为1024.8±21.9 mg/L。在BF1中,归属于NC集群的值靠得更近。在SB2中,只有两个值与其他数据点的差异足以形成它们自己的簇。因此,数据集的整个剩余部分被分组到一个簇中,导致SB2的NC更大。我们基于聚类分析的廊道比上次测量时最先进的廊道窄了±20%。另一方面,对于单一参数的走廊,如BF1中的镁,可能比±50%的走廊更宽松。这是因为我们的走廊考虑了整个时间序列,而不是依赖于单个值,从而提供了更可靠的评估。
为了解决这个工作流程是否适合作为预警系统,我们用BF1 (SI)的可用数据点数量的增加来评估走廊的发展,从1987年到1995年的五个数据点开始(在线资源4)。选择DIANA聚类算法是为了这个目的,因为它可以通过树形图的可视化来洞察聚类结构的发展。最大的集群包含这5个初始数据点中的4个。通过在波动事件(21世纪初总矿化值明显突然下降)之前增加5个数据点,基于现在10个数据点的新阈值描绘出略窄的走廊,这是由于新形成的最大集群中的SD较低(在线资源4)。经过10次测量,我们观察到1994年和2000年有两个数据点超过NC。在整个迭代过程中,不同的数据点聚在自然范围内,这解释了SD和nc的变化。当在14个测量值上运行聚类工作流时,数据集涵盖了前面提到的2005年至2007年间观察到的TDS值的突然下降。走廊的宽度再次略有变化,基于一组新的分析数据,现在构成了最大的集群。虽然最大簇的SD变化明显,但代表井的TDS范围的各自平均值在三种情况下保持相对恒定。基于第一种和最后一种情景的两个走廊都能够以各自的阈值检测到这一波动事件,证明拟议的工作流程适用于预警目的。
南北缘上侏罗统深层地热含水层是地热水的重要来源。多家作业者将其用于水力和地热目的。尽管这些地下水是不可再生的资源,但WFD并不是保护上侏罗纪含水层的充分工具,因为该指令是针对浅层含水层设计的。监测含水层水质的地方实施(Deutscher Heilb?derverband和Deutscher Tourismusverband 2016;Daughney和Reeves 2006)面临的主要问题是,他们的应用是基于任意和通用的阈值,以表明有问题的开发程序。Daughney和Reeves(2006)强调了确定基线波动范围以确定非自然发展的重要性。尽管Begriffsbestimmungen (Deutscher Heilb?derverband and Deutscher Tourismusverband 2016)的方法简单直接,但它无法描述给定井的特定固有和自然水化学波动范围。此外,只要这些(有时甚至是明显的)事件没有超过上述一般阈值,它就无法对水化学特征的突然变化进行定量分析。因此,可能表明油井不可持续使用的显著但不够大的波动仍未被注意到。
该研究提供了一种新的统计方法来定义井的自然状态。我们提出了一个框架,虽然比将通用百分比应用于单个数据点稍微耗时和复杂,但它提供了各种优势。通过聚类分析,可以较好地识别出井水化学特征的特定自然波动范围,并能检测出不在自然波动范围内的井水化学成分变化。我们将这些识别为离开先前定义的NC的数据点。通过应用特定于井的通道,这些非自然事件不再需要超过与井固有自然波动范围断开的阈值。
我们使用了两种聚类方法(DIANA和k-means)。k-means算法实现起来相对简单,产生的结果也很容易解释。然而,一个人必须对数据有很好的了解,以便为k选择正确的值,整个聚类机制都依赖于这个参数。此外,k-means在定义不同密度的聚类时往往会出现问题(Likas et al. 2003),结果聚类可能会被异常值拖拽(Wagstaff et al. 2001)。DIANA虽然比聚集聚类更复杂,但不需要用户定义任何初始参数。分裂算法在聚类过程开始时考虑到全局数据分布,使其比聚类算法更准确。定义集群的值,即派生集群的高度值,必须由用户定义。我们发现DIANA和k-means在聚类结构中具有很高的一致性,这表明这两种算法都是定义代表油井自然状态的分析集的足够工具。8口检测井中有4口显示出100%的一致性,最低的一致性为64%。一旦在k-means聚类步骤中调整聚类数量(k),即使这个数字也可以得到改善。当评估关于个别参数缺失的方法的稳健性时,观察到走廊宽度的微小变化。最大的差异发生在遗漏HCO3-时。在这里,k-means包括大量的NC分析值,这些值似乎是波动事件的一部分。虽然两种算法都能很好地处理数据集,但DIANA似乎比k-means更健壮。这是由于k-means中集群的数量是固定的。尽管聚类在排除单一离子的情况下是稳健的,但这只表明所评估的井对压力的反应是随着多个水化学参数的变化而变化的。微量金属、多环芳烃和同位素可以构成检测整体流型变化的额外参数,然而,包括这些参数的分析太少(扩展分析的常规间隔为10年,现在为5年)。由于离子的总浓度是水化学组成的一个特征,所以对非归一化数据的聚类是首选的。
在BF1井上测试了新开发的框架检测井流态变化的灵敏度。这口井显示出一个明显的波动事件,而以前使用GSA描述的通用方法(Deutscher Heilb?derverband和Deutscher Tourismusverband 2016)没有被注意到。相比之下,新的工作流程能够建立NC和AC,仅根据先前的5个年度数据点就可以检测到波动事件。这是很重要的,因为它表明事件不仅是可追溯的,而且提议的工作流在事件发生时已经检测到它。重要的是要考虑到,每个新的数据点都会提高聚类工作流程的精度,从而可能略微改变井的自然波动范围。当在同一口井中使用不同数量的数据点测试工作流时,可以观察到这一点。尽管如此,该测试得出了关于将用于该框架的数据集的最小样本量的重要结论。根据我们的研究结果,至少5年的数据点可以为建立油井的自然波动范围提供一个很好的基础。关于数据质量,由于更新的采样和分析方案以及改进的分析方法,当使用旧的测量和/或来自不同实验室时,必须预期一定的方差和偏移。在聚类结构的质量中必须考虑到这一点。
本文旨在设计一个强大的统计工作流程,通过该流程可以定义单井的水化学特征的自然状态,并确定和避免不可持续的操作策略。其主要目标是识别非自然波动事件,这些事件可能暗示着不可持续的油井开发,以免对运营商造成法律问题。我们提出了一种基于聚类分析的工作流程,使用聚集和分裂算法来替代最先进的通用方法,即任意设置某些水化学参数允许的最小和最大浓度的阈值。我们的框架是一种实用的方法,以解决密集的地热水开采和深层地下水作为有限资源的冲突,并提供以下主要特点:
1.
所提出的基于聚类分析的工作流程可以很好地识别自然水化学波动范围,重点是总矿化(8个主要离子和其他特征微量离子的总和)。除了自然波动范围外,它还确定了两条走廊,由自然阈值和行动阈值划定。测量人员可以利用这些阈值来评估油井作业程序的可持续性。
2.
所提议的框架被证明在检测非自然波动事件方面是成功的,这些事件可能被设定通用最小和最大浓度值的最先进方法所忽视。因此,它对井的水化学特征的变化非常敏感,同时考虑到其自然波动状态。每一个新增加的数据点都提高了确定的自然波动的准确性。这一点尤其重要,因为深层地热数据是出了名的稀缺,很难在高空间和时间分辨率下采样。
3.
提出的框架适合作为预警系统的应用。基于对一口井的案例研究,该井的水表现出强烈的波动事件,我们的工作流程生成的通道能够在波动发生之前和发生时检测到波动。该评估还表明,该工作流的最小数据集大小为5个年数据点。
最后,该工作流程的结果表明,开发深层地下水含水层DEGK1110和GK100158的井是稳健的,以前的勘探活动没有导致含水层的总体状态发生变化。
下载原文档:https://link.springer.com/content/pdf/10.1007/s11269-023-03529-6.pdf




