数据挖掘技术在水文预报与水库调度中的应用研究
  • 【DOI】

    10.7666/d.y866054

  • 【摘要】

    数据挖掘作为知识发现过程中的重要步骤,是从大型数据库及数据仓库中提取未知的、有价值的和可操作性的关系、模式和趋势用于决策支持的过程。我国目前在防洪领域存在着大量水文数据、水库调度数据和预报成果数据,如何充分有效地利用各种智能算法对这些数据进行分析与挖掘,以形成相应的水文预报、水库调度模型进行准确的预报、合理的调度,是一项具有重要的意义的工作。本文结合数据挖掘中的聚类、分类、关联分析等方法特点,着重... 展开>>数据挖掘作为知识发现过程中的重要步骤,是从大型数据库及数据仓库中提取未知的、有价值的和可操作性的关系、模式和趋势用于决策支持的过程。我国目前在防洪领域存在着大量水文数据、水库调度数据和预报成果数据,如何充分有效地利用各种智能算法对这些数据进行分析与挖掘,以形成相应的水文预报、水库调度模型进行准确的预报、合理的调度,是一项具有重要的意义的工作。本文结合数据挖掘中的聚类、分类、关联分析等方法特点,着重探讨了在水文预报、水库调度、组合预报中的应用。同时为了使数据更高效地进行挖掘分析,对水文数据仓库的结构与应用进行探讨与设计,将其与各种数据挖掘应用形成一个水文数据挖掘体系。研究内容和成果概述如下: (1)针对以数据挖掘为基础的预报与调度的特点,结合我国的防洪减灾实际,建立面向预报、调度等不同主题的水文数据仓库的结构模型,并对其结构、功能、数据存储模型和实现技术进行研究,从而对海量水文信息进行管理与分析,为以数据挖掘为基础的预报、调度体系提供数据支持和提高挖掘效率。随后建立包括数据层、组织层、挖掘层和决策层的水文数据挖掘体系,各层承担着水文数据挖掘不同阶段的任务,从数据预处理、数据挖掘到知识表达,形成了一个完整的系统体系。 (2)以水文预报中实践性很强的河道洪水传播为例探讨基于数据挖掘的水文预报模型。利用水文数据仓库对流域河道洪水数据进行数据预处理,同时利用T-S模糊推理模型提出一种根据上游各支流条件模糊推理下游流量的方法,针对模糊推理中随着推理条件增多而形成的“维数灾”问题,利用数据挖掘的关联规则分析方法确定历史数据中频繁出现的上游条件组合(即推理规则),将洪水传播中的低流量组合和极少出现的组合规则进行合并或删减,然后利用优化模型分析历史数据确定的规则集在模糊推理中的参数,最终形成基于模糊推理与关联规则分析的洪水传播模型,提高了高流量条件下的预报精度。 (3)不同的水文预报模型有着不同的特点,很难有适用各种情况的“全能预报模型”。针对这一问题,提出了基于多目标模糊优选的组合预报模型,将多种模型预报结果的洪峰、峰现时间、流量过程的相对误差作为模糊优选的指标,通过对历史预报数据的模式识别分析,得到各种预报模型在不同情况下的适用度,然后在实时预报中根据条件及各种模型的适用度进行组合预报,得到比单个预报模型更合理的预报结果。 (4)针对目前水库调度技术中的分类调度、扩大调度信息源等研究热点,提出一种利用数据挖掘技术分析历史水文数据与历史调度数据,从而生成调度规则的方法:决策树水库调度模型,该模型将生成的调度结果以调度树的形式表达。作为数据挖掘的结果,它集中反映了大量历史水文数据、调度数据的规律性。同时,如果历史资料与专家经验允许,水文预报结果,气象预报结果,生态因素等条件可以被考虑进调度规则,使决策更加切合实际。与目前实践中广泛使用的调度图相比,调度树从考虑因素的广泛性和规则表达的直观性上都更趋合理,是合理使用调度经验的有效途径。 (5)与第四章所述的组合预报方法比较,基于贝叶斯分析的组合预报方法无需更多的历史预报数据来训练组合模型,而是首先利用专家经验确定模型的分布类型,然后通过贝叶斯分析将已知各模型预报结果的后验分布转化成预报值的分布函数,利用马尔科夫蒙特卡洛模拟(MCMC)方法抽样模拟得到组合预报的结果,在抽样模拟中,将基于时间序列的实时校正方法结合到MCMC中的Gibbs抽样中,得到了比单个模型预报结果更好的组合预报结果。 最后,对全文进行了总结,并对有待进一步研究的问题进行了展望。 收起<<

  • 【作者】

    张弛 

  • 【学科专业】

    水文学及水资源

  • 【授予学位】

    博士

  • 【授予单位】

    大连理工大学

  • 【导师姓名】

    王本德

  • 【学位年度】

    2005

  • 【语种】

    chi

  • 【关键词】

    数据挖掘  水文预报  水库调度  水文数据仓库  模糊推理  决策树  多目标模糊优选  贝叶斯分析  关联规则分析