基于改进支持向量回归机的污水处理厂出水总氮预测模型

刘杰, 李佟, 李军. 基于改进支持向量回归机的污水处理厂出水总氮预测模型[J]. 环境工程学报, 2018, 12(1): 119-126. doi: 10.12030/j.cjee.201706050
引用本文: 刘杰, 李佟, 李军. 基于改进支持向量回归机的污水处理厂出水总氮预测模型[J]. 环境工程学报, 2018, 12(1): 119-126. doi: 10.12030/j.cjee.201706050
LIU Jie, LI Tong, LI Jun. Prediction of effluent total nitrogen concentration in a wastewater treatment plant using a particle swarm optimization-support vector regression model[J]. Chinese Journal of Environmental Engineering, 2018, 12(1): 119-126. doi: 10.12030/j.cjee.201706050
Citation: LIU Jie, LI Tong, LI Jun. Prediction of effluent total nitrogen concentration in a wastewater treatment plant using a particle swarm optimization-support vector regression model[J]. Chinese Journal of Environmental Engineering, 2018, 12(1): 119-126. doi: 10.12030/j.cjee.201706050

基于改进支持向量回归机的污水处理厂出水总氮预测模型

  • 基金项目:

    国家水体污染控制与治理科技重大专项(2014ZX07201-001)

Prediction of effluent total nitrogen concentration in a wastewater treatment plant using a particle swarm optimization-support vector regression model

  • Fund Project:
  • 摘要: 在小样本数据的情况下,采用粒子群优化算法(PSO)对传统支持向量回归机(SVR)进行改进,将其应用于北京某大型污水处理厂出水总氮浓度预测上。 预测结果精度对比分析表明,PSO-SVR模型预测结果平均相对误差为1.836%,决定系数为67.76%,均方根误差为0.693 9,各评价指标均优于多元线性回归模型、BP神经网络模型。因此在小样本情况下,利用PSO-SVR模型对污水处理厂出水总氮浓度进行预测是可行有效的,为应用数据驱动模型对污水处理过程进行建模模拟提供了一种新方法尝试。
  • 污水处理过程非常复杂, 通常涉及物理、生物、化学过程,如何有效地对污水处理过程进行优化控制一直是国内外研究热点[1-4]。为了解决这个问题,可以通过建立模型来描述污水处理过程和预测出水水质。用来模拟污水处理过程的模型一般可以分为2类:数学模型和数据驱动模型。国际水协(IWA)于20世纪80年代推出的活性污泥1号模型(activated sludge model No.1,ASM1)是最为广泛的污水处理数学模型之一,已经被成功地应用在污水处理中[5-7]。与数据驱动模型相比,污水处理数学模型需要对大量的水质组分和动力学参数进行精确测定[3],取得这方面的基础有效数据需要耗费大量的人力与物力,而且污水处理过程具有非线性、时变性、强时滞等特点,最终的处理效果受大量不确定因素的影响[8-10]。因此,建立一个令人满意的污水处理数学模型非常困难。
    最近十几年来数据驱动模型得到了越来越多的关注,其中人工神经网络模型是被运用最多的数据驱动模型[3, 8-13],人工神经网络模型可以很好地解决复杂的非线性问题,而且不需要先验知识。然而人工神经网络模型在实际应用中仍然具有一定局限性[14-16]:1)人工神经网络需要大量的历史数据,对于缺乏大量历史数据的新建污水处理厂在使用人工神经网络模型时无法取得较好的效果;2)人工神经网络的原理是基于经验风险最小原则,容易出现局部最优解,结果不稳定,模型普适性差,而且易受人为因素干扰。
    支持向量回归机(support vector regression,SVR)是一种利用有限的样本数据在复杂性和学习能力之间寻求最佳平衡,从而在统计样本数量较小的情况下以求获得最好的泛化能力[17]。SVR已应用在很多领域,例如PM2.5质量浓度预测[18]、湖水叶绿素a预测[19]、光伏发电量预测[20]以及耕地面积预测[21]等。在SVR的应用中,SVR参数的选取是影响模型学习能力和泛化能力的关键因素,因此针对不同的研究对象,应该选择合适的方法对SVR进行优化。
    鉴于此,本文拟采用参数较少、且收敛速度快的粒子群算法对传统支持向量回归机模型进行优化,建立粒子群-支持向量回归机模型(PSO-SVR);并利用PSO-SVR模型对北京某大型污水处理厂实际运行数据和工艺参数进行拟合,并且与传统的多元线性回归模型以及BP神经网络模型进行了模型精度分析对比。

    1 支持向量回归机与粒子群优化算法

    1.1 支持向量回归机

    支持向量回归机(SVR)是一种新颖的小样本数据学习方法,它以统计学习理论为基础,通过结构风险最小化原则可以避免对样本数据量的高度依赖[22]。SVR将实际问题通过非线性映射到高维空间,并在高维空间中用线性回归来实现原空间中非线性回归[23]
    对于给定的一个非线性训练样本数据集{(xi, yi),i=1, 2…},首先通过非线性映射函数φ(x)将样本集的x变换到高维空间中,非线性问题就可以转化成高维空间的线性问题,在高维空间中求解线性问题的回归函数。回归函数定义如下:
    y(x)=wTφ(x)+b (1)
    式中:φ(x)为非线性映射函数;y为经过输入变量x所得的计算结果;w为系数向量;T为转置;b为偏差项。通过正则化风险最小原则,则最优化问题转化为:
    min12wTw+γli=1(ξi+ξi)s.t.{wTφ(xi)+byiε+ξi(i=1,2,,l)yi(wTφ(xi)+b)ε+ξi(i=1,2,,l)ξi,ξi0(i=1,2,,l) (2)
    将拉格朗日乘子(αi, αi*)引入到上式,则该优化问题可以转化为:
    maxα,αL=12li=1lj=1(αiαi)(αjαi)K(xi,xj)εli=1(αi+αi)+li=1yi(αiαi)s.t.{li=1(αiαi)=00αiC0αiC (3)
    式中:K(xi, xj)=φ(xi)φ(xj)为核函数;C为惩罚参数。求解后可得回归估计函数:
    f(x)=(αiαi)K(xi,x)+b (4)
    核函数的引入解决了维数问题,可在不知映射函数的情况下实现回归估计。常用的核函数有:多项式函数、线性函数、RBF高斯径向基函数和Sigmoid函数等。本文采用RBF高斯径向基函数作为模型的核函数:
    K(xi,x)=exp(|xxi|22σ2) (5)

    1.2 粒子群优化算法

    粒子群优化(particle swarm optimization, PSO)算法是一种进化算法,由KENNEDY[24]提出,其基本原理是模拟鸟类觅食行为来进行优化问题的求解。该算法具有算法简单、容易实现、精度高、收敛快的特征,在优化实际问题时可展现其优越性。PSO算法已被广泛地应用于各种统计学模型参数优化中,其中最为典型的就是对ANN模型和SVR模型进行优化[25-27]
    PSO初始化为一组随机解。在迭代过程中,每一个粒子依据2个值来更新自己的位置:第一个就是粒子本身找到的最优解,称为个体历史最好位置,记pi;另一个是整个种群目前找到的最优解,称为全局粒子最好位置,记为pg,则该粒子在最优解搜索过程中更新自己位置的公式为:
    {νk+1ij=wνkij+r1c1(pijxkij)+r2c2(pgjxkij)xk+iij=xkij+νk+1ij (6)
    式中:i=1,2,…,nj=1, 2, …,dk为当前迭代次数;w为惯性权重;c1c2为加速常数,它们取值范围均在[0, 4]之间,本文选取参数c1=1.5,c2=1.7;r1r2则为[0, 1]之间的随机数。

    2 基于PSO-SVR的污水处理厂出水总氮浓度预测模型建模

    2.1 模型输入输出变量的选取

    污水处理厂出水总氮应该受到严格的控制,它是评价一个污水处理厂工艺水平和运行情况的重要指标之一,对污水处理厂脱氮效果进行模拟预测对污水处理厂的优化运行管理和提高脱氮效率有重要意义,因此本文选取污水处理厂出水总氮为模型的输出变量。
    污水处理厂出水总氮浓度与多项水质指标和运行参数有关。为了精确地建立污水处理厂出水总氮预测模型,应对影响污水处理厂出水总氮浓度的因素进行合理的选取。国内外研究[28-31]表明,影响污水处理厂出水总氮浓度的因素主要有:进水流量(Qin)、温度、pH、固体悬浮物浓度(SS)、进水生化需氧量(BODin)、进水化学需氧量(CODin)、进水氨氮浓度(NH3-Nin)、进水总氮浓度(TNin)、生物反应池混合液悬浮固体浓度(MLSS)、生物反应池混合液挥发性悬浮固体浓度(MLVSS)。本文利用灰色关联度分析法,选取关联度大的影响因素,最终确定了8个输入变量:进水流量(Qin)、生物反应池温度(T)、进水生化需氧量(BODin)、进水化学需氧量(CODin)、进水总氮浓度(TNin)、进水氨氮浓度(NH3-Nin)、生物反应池混合液悬浮固体浓度(MLSS)、生物反应池混合液挥发性悬浮固体浓度(MLVSS),其关联度分别为0.809、0.632 1、0.845 9、0.834 8、0.908 3、0.917 9、0.693 7、0.794 4。

    2.2 数据的获取与处理

    本文实验数据来源于北京市某大型污水处理厂的实际运行数据,该厂的设计日处理能力为100万m3·d-1,采用A/O法去除有机污染物(COD)和总氮(TN),总磷(TP)通过投加化学药剂来去除,经处理后的出水主要指标达到了《城镇污水处理厂污染物排放标准》 (GB 18918-2002)中的一级B标准。
    本文以该厂2013、2014年各月的月均数据(表 1)来测试PSO-SVR模型的回归效果。为了检验PSO-SVR模型的泛化能力,通常将样本集分为训练样本和测试样2个部分。因此,我们将2013年1—12月、2014年1—6月的月均运行数据作为训练数据集,2014年7—12月的月均运行数据作为测试数据集。为消除量纲对模型精度的影响,采用式(7)进行归一化处理,得到[0, 1]之间的量纲一的数据。
    xi=ximin(xi)max(xi)min(xi) (7)
    表1 北京某大型污水处理厂2013—2014年主要运行数据
    Table 1 Operational data from a WWTP in Beijing from 2013 to 2014
    表1 北京某大型污水处理厂2013—2014年主要运行数据
    Table 1 Operational data from a WWTP in Beijing from 2013 to 2014

    日期 Qin/
    (104m3)
    T/℃ BODin/
    (mg·L-1)
    CODin/
    (mg·L-1)
    TNin/
    (mg·L-1)
    NH3-Nin/
    (mg·L-1)
    MLSS/
    (mg·L-1)
    MLVSS/
    (mg·L-1)
    TNout/
    (mg·L-1)
    2013-01 1 303.2 14.8 182 408 49.8 39.4 4 996.2 2 757.1 27.10
    2013-02 1 124.5 14.9 178 421 49.6 39.1 4 965.9 2 427.7 28.00
    2013-03 1 279.5 15.7 172 421 49.6 39.1 5 365.8 2 776.2 29.00
    2013-04 1 268.5 17.1 176 419 52.0 41.0 5 134.6 2 785.8 27.10
    2013-05 1 267.9 21.0 212 468 52.7 41.3 4 814.4 2 383.7 26.70
    2013-06 1 343.1 23.0 220 486 49.3 37.5 4 578.3 2 070.1 26.16
    2013-07 1 615.0 24.9 170 410 42.0 32.6 4 046.4 2 109.0 25.10
    2013-08 1 587.1 25.2 158 385 45.8 34.8 3 293.2 2 041.0 23.50
    2013-09 1 495.4 24.7 172 385 45.7 35.3 3 179.4 2 041.2 25.20
    2013-10 1 498.0 24.2 193 430 51.7 39.9 3 312.8 2 219.8 27.87
    2013-11 1 395.6 20.4 170 369 55.1 43.4 3 556.9 2 503.1 29.50
    2013-12 1 452.3 17.2 191 417 54.0 43.2 4 132.7 3 236.7 29.80
    2014-01 1 337.2 16.2 200 440 54.4 43.4 4 114.8 3 111.0 28.81
    2014-02 1 226.7 15.9 192 381 51.7 41.7 3 894.5 2 838.6 30.20
    2014-03 1 278.4 17.1 212 444 57.1 45.9 3 981.9 2 885.2 28.51
    2014-04 1 293.1 19.1 234 479 55.8 44.3 3 546.0 2 483.7 28.79
    2014-05 1 441.4 20.4 204 452 51.7 40.5 4 126.9 2 676.2 25.90
    2014-06 1 397.9 21.6 176 420 47.3 36.1 3 857.7 2 398.1 26.12
    2014-07 1 480.4 25.6 178 405 47.4 36.5 3 562.6 2 132.6 25.52
    2014-08 1 519.3 25.7 138 284 46.3 35.3 2 850.4 1 865.2 25.49
    2014-09 1 412.0 23.4 135 285 47.0 36.1 2 805.8 2 037.8 24.50
    2014-10 1 394.7 22.2 166 336 50.9 39.1 2 941.1 2 095.6 26.30
    2014-11 1 392.1 20.8 170 358 49.5 38.2 3 415.5 2 492.7 27.08
    2014-12 1 351.0 16.9 183 393 50.3 39.0 3 758.6 2 654.9 27.30

    2.3 模型的构建过程

    基于粒子群优化支持向量回归机的污水处理厂出水总氮浓度预测模型建模具体步骤如下。
    1) 选取核函数。本文选取最常用的RBF高斯径向基函数作为核函数,在实际应用中也可以分别选取不同的核函数进行实验,然后根据实验结果选取最佳的核函数。
    2) 确定PSO-SVR模型参数。初始化粒子群算法参数,在本文中选取c1=1.5,c2=1.7,r1r2取[0, 1]之间的随机数,利用粒子群算法对支持向量回归机中惩罚系数C,和核函数参数g进行寻优,寻优的流程如图 1所示。
    图1 基于粒子群优化算法的SVR参数寻优流程图
    Fig. 1 Flow chart of SVR parameters optimization based on PSO
    图1 基于粒子群优化算法的SVR参数寻优流程图
    Fig. 1 Flow chart of SVR parameters optimization based on PSO
    Figure1
    3) 建立PSO-SVR模型。确定了支持向量回归机中的惩罚系数C和核函数参数g后,将最佳参数输入到模型中,在训练集上训练PSO-SVR模型。
    4) 污水处理厂出水总氮浓度预测。利用训练后的模型在测试集上测试模型回归效果,预测污水处理厂出水总氮浓度。

    2.4 模型回归效果评价

    为了比较模型的优劣性,本文通过计算预测值与真实值的平均相对误差(MRE)、均方根误差(RMSE)和决定系数(R2)对模型精度进行评价,各评价指标的计算公式如下:
    MRE=1nni=1|yiˆyi| (8)
    RMSE=(1n)ni=1(yiˆyi)2 (9)
    R2=(nni=1yiˆyini=1yini=1ˆyi)2(nni=1y2i(ni=1yi)2)(nni=1ˆy2i(ni=1ˆyi)2) (10)
    式中:yi为实际值;ˆyi为预测值;n为总样本数。

    3 结果与讨论

    3.1 模型参数确定

    在PSO-SVR模型核函数确定后,模型参数的选择对于模型的回归效果影响很大,本文采用粒子群优化算法结合手动调整法对PSO-SVR模型的最优参数进行寻优,采用K-折交叉验证的思想对模型进行检验。粒子群规模取n=20,c1=1.5,c2=1.7,r1r2选取[0, 1]之间的随机数,最大迭代次数取为100。通过粒子群算法对SVR参数组合寻优,其适应度曲线如图 2所示。本文确定的PSO-SVR模型参数为最优惩罚系数C=6.039 4,最优核函数参数g=0.01。
    图2 粒子群优化算法参数寻优适应度变化曲线
    Fig. 2 Fitness change curve of parameters optimizing based on PSO
    图2 粒子群优化算法参数寻优适应度变化曲线
    Fig. 2 Fitness change curve of parameters optimizing based on PSO
    Figure2

    3.2 污水处理厂出水总氮浓度预测

    利用训练后的PSO-SVR模型对表 1中的训练数据集(2013年1月—2014年6月)进行回归计算,真实值与回归值对比结果如图 3所示。
    图3 训练集真实值与回归值拟合结果
    Fig. 3 Curve fitting results of real and predicted value among training set
    图3 训练集真实值与回归值拟合结果
    Fig. 3 Curve fitting results of real and predicted value among training set
    Figure3
    利用训练后的模型对该厂2014年6—12月的出水总氮浓度进行预测,最终预测值与实际值对比情况如表 2所示,从表 2可以看出,6个月的数据预测误差范围为[0.157%, 6.408%],除去2014年9月的数据外,其余5个月数据预测误差低于2%,预测结果比较稳定,2014年9月的数据出现较大误差可能是由于数据监测(水质化验)仪器出现故障或者人工记录数据出现失误造成的。模型预测结果说明应用PSO-SVR模型进行污水处理厂污水处理过程模拟和出水总氮浓度预测是可行的。
    表2 污水处理厂总氮实际出水水质及PSO-SVR预测结果
    Table 2 Real and PSO-SVR prediction values of effluent TN of WWTP
    表2 污水处理厂总氮实际出水水质及PSO-SVR预测结果
    Table 2 Real and PSO-SVR prediction values of effluent TN of WWTP

    日期 实际值/(mg·L-1) 预测值/(mg·L-1) 绝对误差/(mg·L-1) 相对误差/%
    2014-07 25.52 25.76 0.24 0.94
    2014-08 25.49 25.45 0.04 0.157
    2014-09 24.50 26.07 1.57 6.408
    2014-10 26.30 26.75 0.45 1.711
    2014-11 27.08 26.98 0.10 0.369
    2014-12 27.30 27.69 0.39 1.429

    3.3 模型比较

    为了验证PSO-SVR模型的预测精度和优越性,本文选取BP神经网络(BP-ANN)和传统的多元线性回归模型(MLR),在相同的测试样本上比较模型的精度。BP神经网络隐藏层数取1,迭代次数为100,采用不同的隐含层节点数分别对网络进行训练,当隐含层节点数取5时,BP人工神经网络训练误差最低。3个模型的回归结果可见图 4,可以看出来,PSO-SVR模型的回归效果最好,优于MLR模型和BP-ANN模型。
    图4 PSO-SVR模型、MLR模型、BP-ANN模型预测结果
    Fig. 4 Forecasting results of PSO-SVR, MLR and BP-ANN
    图4 PSO-SVR模型、MLR模型、BP-ANN模型预测结果
    Fig. 4 Forecasting results of PSO-SVR, MLR and BP-ANN
    Figure4
    表 3为模型精度对比分析结果,PSO-SVR模型预测值与实际值平均相对误差(MRE)为1.836%,BP-ANN模型和MLR模型则分别为5.973%和2.815%;PSO-SVR模型预测值与实际值的决定系数R2为67.76%,BP-ANN模型和MLR模型则分别为2.66%和28.31%;PSO-SVR模型预测值与实际值的均方根误差为0.693 9,BP-ANN模型和MLR模型则分别为2.023 1和1.093 5。通过各项指标比较可知,PSO-SVR模型精度最高,MLR模型精度低于PSO-SVR模型但高于BP-ANN模型,BP-ANN模型精度最低。这主要是因为,MLR模型将输出量与输入量认为是线性关系,因此不能很好地反映出污水处理过程中各项变量之间的真实关系;而BP-ANN在小样本数据下不能很好地对样本进行学习,导致其出现“欠学习”的现象。
    表3 3种模型预测结果精度对比
    Table 3 Precision comparison of forecast results for three models
    表3 3种模型预测结果精度对比
    Table 3 Precision comparison of forecast results for three models

    模型 平均相对误差/% 决定系数
    R2
    均方根误差
    RMSE
    多元线性回归 2.815 28.31 1.093 5
    BP神经网络 5.973 2.66 2.023 1
    PSO-SVR 1.836 67.76 0.693 9

    4 结论

    1) 本文针对北京某大型污水处理厂2013年、2014年月均运行数据建立了小样本情况下的基于粒子群算法优化支持向量回归机的污水处理厂出水总氮浓度预测模型,PSO-SVR模型最终回归结果为,测试集的平均相对误差仅为MRE=1.836%,测试集的决定系数达到了R2=67.76%,测试集的均方根误差RMSE=0.693 9。与多元线性回归模型、BP神经网络模型相比,PSO-SVR模型可以更好地预测污水处理厂出水总氮浓度,适于推广。
    2) 本文将粒子群优化算法用于支持向量回归机的关键参数选取中,很好地避免了人为主观因素在支持向量回归机关键参数选取中的影响,提高了预测精度,具有实用价值。
    3) 本文构建的污水处理厂出水总氮浓度预测模型,尤其适合于缺乏大量历史数据的新建污水处理厂,为新建污水处理厂的脱氮工艺优化运行管理提供辅助信息,同时为污水处理厂污水处理过程进行建模模拟提供了新的尝试方法。另外需要指出的是,不同的污水处理厂运行情况、工艺水平各不相同,因此将PSO-SVR模型运用于不同的污水处理厂时,应该重新选取合适的模型参数和核函数。
    4) 在日后的研究中可以加深对数据的分析和预处理,如运用主成分分析法(PAC)、运用聚类分析(HCA)将数据进行预处理与分组处理等,以提高模型预测精度和预测结果的稳定性。

    参考文献

    1. NAZARI L, YUAN Z S, SANTORO D, et al. Low-temperature thermal pre-treatment of municipal wastewater sludge:Process optimization and effects on solubilization and anaerobic degradation[J]. Water Research,2017,113:111-123. [CrossRef]
    2. HVALA N, VREČKO D, LEVSTEK M, et al. The use of dynamic mathematical models for improving the designs of upgraded wastewater treatment plants[J]. Journal of Sustainable Development of Energy, Water and Environment Systems,2017,5(1):15-31. [CrossRef]
    3. 李佟,李军.基于BP神经网络与马尔可夫链的污水处理厂脱氮效果模拟预测[J].环境科学学报,2016,36(2):576-581. [CrossRef]
    4. 张晓军,应启峰,王洪臣,等.质量平衡模型及其在污水处理厂节能降耗中的应用[J].环境工程学报,2016,10(3):1030-1034. [CrossRef]
    5. BUSCH J, ELIXMANN D, KÜHL P, et al. State estimation for large-scale wastewater treatment plants[J]. Water Research,2013,47(13):4774-4787. [CrossRef]
    6. SANTA C J A, MUSSATI S F, SCENNA N J, et al. Reaction invariant-based reduction of the activated sludge model ASM1 for batch applications[J]. Journal of Environmental Chemical Engineering,2016,4(3):3654-3664. [CrossRef]
    7. ALIKHANI J, TAKACS I, AL-OMARI A, et al. Evaluation of the information content of long-term wastewater characteristics data in relation to activated sludge model parameters[J]. Water Science and Technology,2017,75(6):1370-1389. [CrossRef]
    8. HAMED M M, KHALAFALLAH M G, HASSANIEN E A. Prediction of wastewater treatment plant performance using artificial neural networks[J]. Environmental Modelling & Software,2004,19(10):919-928. [CrossRef]
    9. HONG Y S T, ROSEN M R, BHAMIDIMARRI R. Analysis of a municipal wastewater treatment plant using a neural network-based pattern analysis[J]. Water Research,2003,37(7):1608-1618. [CrossRef]
    10. MJALLI F S, AL-ASHEH S, ALFADALA H E. Use of artificial neural network black-box modeling for the prediction of wastewater treatment plants performance[J]. Journal of Environmental Management,2007,83(3):329-338. [CrossRef]
    11. ALVANI V, NABIZADEH R, ANSARIZADEH M, et al. Predicting TOC removal efficiency in hybrid biological aerated filter using artificial neural network[J]. Desalination and Water Treatment,2016,57(43):20283-20291. [CrossRef]
    12. ZHAO Y, GUO L, LIANG J B, et al. Seasonal artificial neural network model for water quality prediction via a clustering analysis method in a wastewater treatment plant of China[J]. Desalination and Water Treatment,2016,57(8):3452-3465. [CrossRef]
    13. 韩改堂,乔俊飞,韩红桂.基于递归模糊神经网络的污水处理控制方法[J].化工学报,2016,67(3):954-959. [CrossRef]
    14. 何芳,徐友宁,袁汉春.矿山环境地质问题综合评价客观权值确定方法探讨[J].中国地质,2008,35(2):337-343. [CrossRef]
    15. MIN J H, LEE Y C. Bankruptcy prediction using support vector machine with optimal choice of kernel function parameters[J]. Expert Systems with Applications,2005,28(4):603-614. [CrossRef]
    16. 赖红松.基于支持向量回归机的耕地保有量组合预测[J].地理与地理信息科学,2011,27(2):56-60. [CrossRef]
    17. 李佳,张一敏,刘振宇,等.基于改进支持向量机的石煤提钒行业清洁生产评价研究[J].环境科学学报,2016,36(3):1113-1120. [CrossRef]
    18. 秦喜文,刘媛媛,王新民,等.基于整体经验模态分解和支持向量回归的北京市PM2.5预测[J].吉林大学学报(地球科学版),2016,46(2):563-568. [CrossRef]
    19. 张成成,陈求稳,徐强,等.基于支持向量机的太湖梅梁湾叶绿素a浓度预测模型[J].环境科学学报,2013,33(10):2856-2861. [CrossRef]
    20. 张玉,莫寒,张烈平.基于模糊支持向量机的光伏发电量预测[J].热力发电,2017,46(1):116-120. [CrossRef]
    21. 王霞,王占岐,金贵,等.基于核函数支持向量回归机的耕地面积预测[J].农业工程学报,2014,30(4):204-211. [CrossRef]
    22. VAPNIK V. The Nature of Statistical Learning Theory[M]. New York:Springer Science & Business Media,2013.
    23. 韦佳,何世钧,周汝雁,等.基于支持向量回归机的南黄海浒苔分布面积预测模型[J].环境工程学报,2015,9(6):3046-3050. [CrossRef]
    24. KENNEDY J. Particle swarm optimization[M]//SAMMUT C, WEBB G I. Encyclopedia of Machine Learning. New York: Springer,2011:760-766.
    25. ARMAGHANI D J, SHOIB R S, FAIZI K, et al. Developing a hybrid PSO-ANN model for estimating the ultimate bearing capacity of rock-socketed piles[J]. Neural Computing and Applications,2017,28(2):391-405. [CrossRef]
    26. 安爱民,祁丽春,丑永新,等.基于粒子群优化的溶解氧质量浓度支持向量回归机[J].北京工业大学学报,2016,42(9):1318-1323. [CrossRef]
    27. BENVIDI A, ABBASI S, GHARAGHANI S, et al. Spectrophotometric determination of synthetic colorants using PSO-GA-ANN[J]. Food Chemistry,2017,220:377-384. [CrossRef]
    28. 姜体胜,杨琦,尚海涛,等.温度和pH值对活性污泥法脱氮除磷的影响[J].环境工程学报,2007,1(9):10-14. [CrossRef]
    29. 吴代顺,桂丽娟,侯红勋,等.COD,MLSS,pH值及污泥驯化对脱氮除磷的影响[J].中国给水排水,2012,28(13):117-120. [CrossRef]
    30. GAJEWSKA M, JÓŹWIAKOWSKI K, GHRABI A, et al. Impact of influent wastewater quality on nitrogen removal rates in multistage treatment wetlands[J]. Environmental Science and Pollution Research,2015,22(17):12840-12848. [CrossRef]
    31. 付昆明,王会芳,苏雪莹,等.初始pH值对序批式CANON工艺脱氮效果和N2O释放的影响[J].环境科学,2016,37(11):4261-4267. [CrossRef]
  • [1] NAZARI L, YUAN Z S, SANTORO D, et al.Low-temperature thermal pre-treatment of municipal wastewater sludge:Process optimization and effects on solubilization and anaerobic degradation[J].Water Research,2017,3:111-123
    [2] HVALA N, VREˇKO D, LEVSTEK M, et al.The use of dynamic mathematical models for improving the designs of upgraded wastewater treatment plants[J].Journal of Sustainable Development of Energy, Water and Environment Systems,2017,5(1):15-31
    [3] 李佟, 李军.基于BP 神经网络与马尔可夫链的污水处理厂脱氮效果模拟预测[J].环境科学学报,2016,6(2):576-581
    [4] 张晓军, 应启峰, 王洪臣, 等.质量平衡模型及其在污水处理厂节能降耗中的应用[J].环境工程学报,2016,0(3):1030-1034
    [5] BUSCH J, ELIXMANN D, KHL P, et al.State estimation for large-scale wastewater treatment plants[J].Water Research,2013,7(13):4774-4787
    [6] SANTA C J A, MUSSATI S F, SCENNA N J, et al.Reaction invariant-based reduction of the activated sludge model ASM1 for batch applications[J].Journal of Environmental Chemical Engineering,2016,4(3):3654-3664
    [7] ALIKHANI J, TAKACS I, AL-OMARI A, et al.Evaluation of the information content of long-term wastewater characteristics data in relation to activated sludge model parameters[J].Water Science and Technology,2017,5(6):1370-1389
    [8] HAMED M M, KHALAFALLAH M G, HASSANIEN E A.Prediction of wastewater treatment plant performance using artificial neural networks[J].Environmental Modelling & Software,2004,9(10):919-928
    [9] HONG Y S T, ROSEN M R, BHAMIDIMARRI R.Analysis of a municipal wastewater treatment plant using a neural network-based pattern analysis[J].Water Research,2003,7(7):1608-1618
    [10] MJALLI F S, AL-ASHEH S, ALFADALA H E.Use of artificial neural network black-box modeling for the prediction of wastewater treatment plants performance[J].Journal of Environmental Management,2007,3(3):329-338
    [11] ALVANI V, NABIZADEH R, ANSARIZADEH M, et al.Predicting TOC removal efficiency in hybrid biological aerated filter using artificial neural network[J].Desalination and Water Treatment,2016,7(43):20283-20291
    [12] ZHAO Y, GUO L, LIANG J B, et al.Seasonal artificial neural network model for water quality prediction via a clustering analysis method in a wastewater treatment plant of China[J].Desalination and Water Treatment,2016,7(8):3452-3465
    [13] 韩改堂, 乔俊飞, 韩红桂.基于递归模糊神经网络的污水处理控制方法[J].化工学报,2016,7(3):954-959
    [14] 何芳, 徐友宁, 袁汉春.矿山环境地质问题综合评价客观权值确定方法探讨[J].中国地质,2008,5(2):337-343
    [15] MIN J H, LEE Y C.Bankruptcy prediction using support vector machine with optimal choice of kernel function parameters[J].Expert Systems with Applications,2005,8(4):603-614
    [16] 赖红松.基于支持向量回归机的耕地保有量组合预测[J].地理与地理信息科学,2011,7(2):56-60
    [17] 李佳, 张一敏, 刘振宇, 等.基于改进支持向量机的石煤提钒行业清洁生产评价研究[J].环境科学学报,2016,6(3):1113-1120
    [18] 秦喜文, 刘媛媛, 王新民, 等.基于整体经验模态分解和支持向量回归的北京市 PM2.5预测[J].吉林大学学报 (地球科学版),2016,6(2):563-568
    [19] 张成成, 陈求稳, 徐强, 等.基于支持向量机的太湖梅梁湾叶绿素 a 浓度预测模型[J].环境科学学报,2013,3(10):2856-2861
    [20] 张玉, 莫寒, 张烈平.基于模糊支持向量机的光伏发电量预测[J].热力发电,2017,6(1):116-120
    [21] 王霞, 王占岐, 金贵, 等.基于核函数支持向量回归机的耕地面积预测[J].农业工程学报,2014,0(4):204-211
    [22] VAPNIK V.The Nature of Statistical Learning Theory[M].New York:Springer Science & Business Media,2013
    [23] 韦佳, 何世钧, 周汝雁, 等.基于支持向量回归机的南黄海浒苔分布面积预测模型[J].环境工程学报,2015,9(6):3046-3050
    [24] KENNEDY J.Particle swarm optimization[M]//SAMMUT C, WEBB G I.Encyclopedia of Machine Learning.New York:Springer,2011:760-766
    [25] ARMAGHANI D J, SHOIB R S, FAIZI K, et al.Developing a hybrid PSO-ANN model for estimating the ultimate bearing capacity of rock-socketed piles[J].Neural Computing and Applications,2017,8(2):391-405
    [26] 安爱民, 祁丽春, 丑永新, 等.基于粒子群优化的溶解氧质量浓度支持向量回归机[J].北京工业大学学报,2016,2(9):1318-1323
    [27] BENVIDI A, ABBASI S, GHARAGHANI S, et al.Spectrophotometric determination of synthetic colorants using PSO-GA-ANN[J].Food Chemistry,2017,0:377-384
    [28] 姜体胜, 杨琦, 尚海涛, 等.温度和 pH 值对活性污泥法脱氮除磷的影响[J].环境工程学报,2007,1(9):10-14
    [29] 吴代顺, 桂丽娟, 侯红勋, 等.COD, MLSS, pH 值及污泥驯化对脱氮除磷的影响[J].中国给水排水,2012,8(13):117-120
    [30] GAJEWSKA M, J'WIAKOWSKI K, GHRABI A, et al.Impact of influent wastewater quality on nitrogen removal rates in multistage treatment wetlands[J].Environmental Science and Pollution Research,2015,2(17):12840-12848
    [31] 付昆明, 王会芳, 苏雪莹, 等.初始 pH 值对序批式 CANON 工艺脱氮效果和 N2O释放的影响[J].环境科学,2016,7(11):4261-4267
  • 期刊类型引用(8)

    1. 陈亚松,邱勇,柳蒙蒙,刘萌萌,刘雪洁,田宇心,黄霞. 污水处理软测量仪表研究进展与应用. 工业仪表与自动化装置. 2024(03): 60-67+88 . 百度学术
    2. 李海华,肖保增,靳凯丽,陈籽含,禹露. 黄河三门峡水库水质预测模型构建及对比分析. 环境工程. 2024(12): 1-7 . 百度学术
    3. 沈虎祥. 某污水处理厂提标工程的运行分析及出水水质预测模拟研究. 苏州科技大学学报(工程技术版). 2023(02): 46-54 . 百度学术
    4. 王永顺,崔东文. 数据分解技术与若干智能算法优化的高斯过程回归总氮预测. 人民珠江. 2023(11): 105-114 . 百度学术
    5. 李艳,杨雨霖,杨光. 基于机器学习的水质处理单元预警系统设计与实现. 信息记录材料. 2023(11): 188-191 . 百度学术
    6. 黄琦兰,范金祥. 基于改进粒子群优化LSSVM的污水COD软测量建模. 天津工业大学学报. 2021(01): 74-80 . 百度学术
    7. 邓锐,尉胜男. 基于LSTM神经网络和DBSCAN算法的污水水质预测. 电脑与电信. 2021(04): 66-73 . 百度学术
    8. 胡云霄,李占福,童昕. 基于PSO-SVR双层不平行振动筛分性能的数值仿真. 机械设计与研究. 2021(03): 198-202+207 . 百度学术

    其他类型引用(13)

  • 加载中
    Created with Highcharts 5.0.7访问量Chart context menu近一年内文章摘要浏览量、全文浏览量、PDF下载量统计信息摘要浏览量全文浏览量PDF下载量2024-052024-062024-072024-082024-092024-102024-112024-122025-012025-022025-032025-040Highcharts.com
    Created with Highcharts 5.0.7Chart context menu访问类别分布DOWNLOAD: 11.4 %DOWNLOAD: 11.4 %FULLTEXT: 41.2 %FULLTEXT: 41.2 %META: 47.4 %META: 47.4 %DOWNLOADFULLTEXTMETAHighcharts.com
    Created with Highcharts 5.0.7Chart context menu访问地区分布其他: 83.9 %其他: 83.9 %Ashburn: 1.9 %Ashburn: 1.9 %Beijing: 3.3 %Beijing: 3.3 %Hangzhou: 0.5 %Hangzhou: 0.5 %Kaifeng: 0.5 %Kaifeng: 0.5 %Shijiazhuang: 0.5 %Shijiazhuang: 0.5 %Suzhou: 0.5 %Suzhou: 0.5 %Xi'an: 0.5 %Xi'an: 0.5 %XX: 6.2 %XX: 6.2 %Yancheng: 0.5 %Yancheng: 0.5 %北京: 0.5 %北京: 0.5 %广州: 0.5 %广州: 0.5 %文山: 0.5 %文山: 0.5 %济南: 0.5 %济南: 0.5 %其他AshburnBeijingHangzhouKaifengShijiazhuangSuzhouXi'anXXYancheng北京广州文山济南Highcharts.com
计量
  • 文章访问数:  3896
  • HTML全文浏览数:  3620
  • PDF下载数:  438
  • 施引文献:  21
出版历程
  • 刊出日期:  2018-01-14
刘杰, 李佟, 李军. 基于改进支持向量回归机的污水处理厂出水总氮预测模型[J]. 环境工程学报, 2018, 12(1): 119-126. doi: 10.12030/j.cjee.201706050
引用本文: 刘杰, 李佟, 李军. 基于改进支持向量回归机的污水处理厂出水总氮预测模型[J]. 环境工程学报, 2018, 12(1): 119-126. doi: 10.12030/j.cjee.201706050
LIU Jie, LI Tong, LI Jun. Prediction of effluent total nitrogen concentration in a wastewater treatment plant using a particle swarm optimization-support vector regression model[J]. Chinese Journal of Environmental Engineering, 2018, 12(1): 119-126. doi: 10.12030/j.cjee.201706050
Citation: LIU Jie, LI Tong, LI Jun. Prediction of effluent total nitrogen concentration in a wastewater treatment plant using a particle swarm optimization-support vector regression model[J]. Chinese Journal of Environmental Engineering, 2018, 12(1): 119-126. doi: 10.12030/j.cjee.201706050

基于改进支持向量回归机的污水处理厂出水总氮预测模型

  • 1. 太原理工大学环境科学与工程学院,太原 030024
  • 2. 北京工业大学建筑工程学院,北京 100124
  • 3. 北京城市排水集团有限责任公司,北京 100044
基金项目:

国家水体污染控制与治理科技重大专项(2014ZX07201-001)

摘要: 在小样本数据的情况下,采用粒子群优化算法(PSO)对传统支持向量回归机(SVR)进行改进,将其应用于北京某大型污水处理厂出水总氮浓度预测上。 预测结果精度对比分析表明,PSO-SVR模型预测结果平均相对误差为1.836%,决定系数为67.76%,均方根误差为0.693 9,各评价指标均优于多元线性回归模型、BP神经网络模型。因此在小样本情况下,利用PSO-SVR模型对污水处理厂出水总氮浓度进行预测是可行有效的,为应用数据驱动模型对污水处理过程进行建模模拟提供了一种新方法尝试。

English Abstract

    污水处理过程非常复杂, 通常涉及物理、生物、化学过程,如何有效地对污水处理过程进行优化控制一直是国内外研究热点[1-4]。为了解决这个问题,可以通过建立模型来描述污水处理过程和预测出水水质。用来模拟污水处理过程的模型一般可以分为2类:数学模型和数据驱动模型。国际水协(IWA)于20世纪80年代推出的活性污泥1号模型(activated sludge model No.1,ASM1)是最为广泛的污水处理数学模型之一,已经被成功地应用在污水处理中[5-7]。与数据驱动模型相比,污水处理数学模型需要对大量的水质组分和动力学参数进行精确测定[3],取得这方面的基础有效数据需要耗费大量的人力与物力,而且污水处理过程具有非线性、时变性、强时滞等特点,最终的处理效果受大量不确定因素的影响[8-10]。因此,建立一个令人满意的污水处理数学模型非常困难。
    最近十几年来数据驱动模型得到了越来越多的关注,其中人工神经网络模型是被运用最多的数据驱动模型[3, 8-13],人工神经网络模型可以很好地解决复杂的非线性问题,而且不需要先验知识。然而人工神经网络模型在实际应用中仍然具有一定局限性[14-16]:1)人工神经网络需要大量的历史数据,对于缺乏大量历史数据的新建污水处理厂在使用人工神经网络模型时无法取得较好的效果;2)人工神经网络的原理是基于经验风险最小原则,容易出现局部最优解,结果不稳定,模型普适性差,而且易受人为因素干扰。
    支持向量回归机(support vector regression,SVR)是一种利用有限的样本数据在复杂性和学习能力之间寻求最佳平衡,从而在统计样本数量较小的情况下以求获得最好的泛化能力[17]。SVR已应用在很多领域,例如PM2.5质量浓度预测[18]、湖水叶绿素a预测[19]、光伏发电量预测[20]以及耕地面积预测[21]等。在SVR的应用中,SVR参数的选取是影响模型学习能力和泛化能力的关键因素,因此针对不同的研究对象,应该选择合适的方法对SVR进行优化。
    鉴于此,本文拟采用参数较少、且收敛速度快的粒子群算法对传统支持向量回归机模型进行优化,建立粒子群-支持向量回归机模型(PSO-SVR);并利用PSO-SVR模型对北京某大型污水处理厂实际运行数据和工艺参数进行拟合,并且与传统的多元线性回归模型以及BP神经网络模型进行了模型精度分析对比。

    1 支持向量回归机与粒子群优化算法

    1.1 支持向量回归机

    支持向量回归机(SVR)是一种新颖的小样本数据学习方法,它以统计学习理论为基础,通过结构风险最小化原则可以避免对样本数据量的高度依赖[22]。SVR将实际问题通过非线性映射到高维空间,并在高维空间中用线性回归来实现原空间中非线性回归[23]
    对于给定的一个非线性训练样本数据集{(xi, yi),i=1, 2…},首先通过非线性映射函数φ(x)将样本集的x变换到高维空间中,非线性问题就可以转化成高维空间的线性问题,在高维空间中求解线性问题的回归函数。回归函数定义如下:
    y(x)=wTφ(x)+b (1)
    式中:φ(x)为非线性映射函数;y为经过输入变量x所得的计算结果;w为系数向量;T为转置;b为偏差项。通过正则化风险最小原则,则最优化问题转化为:
    min12wTw+γli=1(ξi+ξi)s.t.{wTφ(xi)+byiε+ξi(i=1,2,,l)yi(wTφ(xi)+b)ε+ξi(i=1,2,,l)ξi,ξi0(i=1,2,,l) (2)
    将拉格朗日乘子(αi, αi*)引入到上式,则该优化问题可以转化为:
    maxα,αL=12li=1lj=1(αiαi)(αjαi)K(xi,xj)εli=1(αi+αi)+li=1yi(αiαi)s.t.{li=1(αiαi)=00αiC0αiC (3)
    式中:K(xi, xj)=φ(xi)φ(xj)为核函数;C为惩罚参数。求解后可得回归估计函数:
    f(x)=(αiαi)K(xi,x)+b (4)
    核函数的引入解决了维数问题,可在不知映射函数的情况下实现回归估计。常用的核函数有:多项式函数、线性函数、RBF高斯径向基函数和Sigmoid函数等。本文采用RBF高斯径向基函数作为模型的核函数:
    K(xi,x)=exp(|xxi|22σ2) (5)

    1.2 粒子群优化算法

    粒子群优化(particle swarm optimization, PSO)算法是一种进化算法,由KENNEDY[24]提出,其基本原理是模拟鸟类觅食行为来进行优化问题的求解。该算法具有算法简单、容易实现、精度高、收敛快的特征,在优化实际问题时可展现其优越性。PSO算法已被广泛地应用于各种统计学模型参数优化中,其中最为典型的就是对ANN模型和SVR模型进行优化[25-27]
    PSO初始化为一组随机解。在迭代过程中,每一个粒子依据2个值来更新自己的位置:第一个就是粒子本身找到的最优解,称为个体历史最好位置,记pi;另一个是整个种群目前找到的最优解,称为全局粒子最好位置,记为pg,则该粒子在最优解搜索过程中更新自己位置的公式为:
    {νk+1ij=wνkij+r1c1(pijxkij)+r2c2(pgjxkij)xk+iij=xkij+νk+1ij (6)
    式中:i=1,2,…,nj=1, 2, …,dk为当前迭代次数;w为惯性权重;c1c2为加速常数,它们取值范围均在[0, 4]之间,本文选取参数c1=1.5,c2=1.7;r1r2则为[0, 1]之间的随机数。

    2 基于PSO-SVR的污水处理厂出水总氮浓度预测模型建模

    2.1 模型输入输出变量的选取

    污水处理厂出水总氮应该受到严格的控制,它是评价一个污水处理厂工艺水平和运行情况的重要指标之一,对污水处理厂脱氮效果进行模拟预测对污水处理厂的优化运行管理和提高脱氮效率有重要意义,因此本文选取污水处理厂出水总氮为模型的输出变量。
    污水处理厂出水总氮浓度与多项水质指标和运行参数有关。为了精确地建立污水处理厂出水总氮预测模型,应对影响污水处理厂出水总氮浓度的因素进行合理的选取。国内外研究[28-31]表明,影响污水处理厂出水总氮浓度的因素主要有:进水流量(Qin)、温度、pH、固体悬浮物浓度(SS)、进水生化需氧量(BODin)、进水化学需氧量(CODin)、进水氨氮浓度(NH3-Nin)、进水总氮浓度(TNin)、生物反应池混合液悬浮固体浓度(MLSS)、生物反应池混合液挥发性悬浮固体浓度(MLVSS)。本文利用灰色关联度分析法,选取关联度大的影响因素,最终确定了8个输入变量:进水流量(Qin)、生物反应池温度(T)、进水生化需氧量(BODin)、进水化学需氧量(CODin)、进水总氮浓度(TNin)、进水氨氮浓度(NH3-Nin)、生物反应池混合液悬浮固体浓度(MLSS)、生物反应池混合液挥发性悬浮固体浓度(MLVSS),其关联度分别为0.809、0.632 1、0.845 9、0.834 8、0.908 3、0.917 9、0.693 7、0.794 4。

    2.2 数据的获取与处理

    本文实验数据来源于北京市某大型污水处理厂的实际运行数据,该厂的设计日处理能力为100万m3·d-1,采用A/O法去除有机污染物(COD)和总氮(TN),总磷(TP)通过投加化学药剂来去除,经处理后的出水主要指标达到了《城镇污水处理厂污染物排放标准》 (GB 18918-2002)中的一级B标准。
    本文以该厂2013、2014年各月的月均数据(表 1)来测试PSO-SVR模型的回归效果。为了检验PSO-SVR模型的泛化能力,通常将样本集分为训练样本和测试样2个部分。因此,我们将2013年1—12月、2014年1—6月的月均运行数据作为训练数据集,2014年7—12月的月均运行数据作为测试数据集。为消除量纲对模型精度的影响,采用式(7)进行归一化处理,得到[0, 1]之间的量纲一的数据。
    xi=ximin(xi)max(xi)min(xi) (7)
    表1 北京某大型污水处理厂2013—2014年主要运行数据
    Table 1 Operational data from a WWTP in Beijing from 2013 to 2014
    表1 北京某大型污水处理厂2013—2014年主要运行数据
    Table 1 Operational data from a WWTP in Beijing from 2013 to 2014

    日期 Qin/
    (104m3)
    T/℃ BODin/
    (mg·L-1)
    CODin/
    (mg·L-1)
    TNin/
    (mg·L-1)
    NH3-Nin/
    (mg·L-1)
    MLSS/
    (mg·L-1)
    MLVSS/
    (mg·L-1)
    TNout/
    (mg·L-1)
    2013-01 1 303.2 14.8 182 408 49.8 39.4 4 996.2 2 757.1 27.10
    2013-02 1 124.5 14.9 178 421 49.6 39.1 4 965.9 2 427.7 28.00
    2013-03 1 279.5 15.7 172 421 49.6 39.1 5 365.8 2 776.2 29.00
    2013-04 1 268.5 17.1 176 419 52.0 41.0 5 134.6 2 785.8 27.10
    2013-05 1 267.9 21.0 212 468 52.7 41.3 4 814.4 2 383.7 26.70
    2013-06 1 343.1 23.0 220 486 49.3 37.5 4 578.3 2 070.1 26.16
    2013-07 1 615.0 24.9 170 410 42.0 32.6 4 046.4 2 109.0 25.10
    2013-08 1 587.1 25.2 158 385 45.8 34.8 3 293.2 2 041.0 23.50
    2013-09 1 495.4 24.7 172 385 45.7 35.3 3 179.4 2 041.2 25.20
    2013-10 1 498.0 24.2 193 430 51.7 39.9 3 312.8 2 219.8 27.87
    2013-11 1 395.6 20.4 170 369 55.1 43.4 3 556.9 2 503.1 29.50
    2013-12 1 452.3 17.2 191 417 54.0 43.2 4 132.7 3 236.7 29.80
    2014-01 1 337.2 16.2 200 440 54.4 43.4 4 114.8 3 111.0 28.81
    2014-02 1 226.7 15.9 192 381 51.7 41.7 3 894.5 2 838.6 30.20
    2014-03 1 278.4 17.1 212 444 57.1 45.9 3 981.9 2 885.2 28.51
    2014-04 1 293.1 19.1 234 479 55.8 44.3 3 546.0 2 483.7 28.79
    2014-05 1 441.4 20.4 204 452 51.7 40.5 4 126.9 2 676.2 25.90
    2014-06 1 397.9 21.6 176 420 47.3 36.1 3 857.7 2 398.1 26.12
    2014-07 1 480.4 25.6 178 405 47.4 36.5 3 562.6 2 132.6 25.52
    2014-08 1 519.3 25.7 138 284 46.3 35.3 2 850.4 1 865.2 25.49
    2014-09 1 412.0 23.4 135 285 47.0 36.1 2 805.8 2 037.8 24.50
    2014-10 1 394.7 22.2 166 336 50.9 39.1 2 941.1 2 095.6 26.30
    2014-11 1 392.1 20.8 170 358 49.5 38.2 3 415.5 2 492.7 27.08
    2014-12 1 351.0 16.9 183 393 50.3 39.0 3 758.6 2 654.9 27.30

    2.3 模型的构建过程

    基于粒子群优化支持向量回归机的污水处理厂出水总氮浓度预测模型建模具体步骤如下。
    1) 选取核函数。本文选取最常用的RBF高斯径向基函数作为核函数,在实际应用中也可以分别选取不同的核函数进行实验,然后根据实验结果选取最佳的核函数。
    2) 确定PSO-SVR模型参数。初始化粒子群算法参数,在本文中选取c1=1.5,c2=1.7,r1r2取[0, 1]之间的随机数,利用粒子群算法对支持向量回归机中惩罚系数C,和核函数参数g进行寻优,寻优的流程如图 1所示。
    图1 基于粒子群优化算法的SVR参数寻优流程图
    Fig. 1 Flow chart of SVR parameters optimization based on PSO
    图1 基于粒子群优化算法的SVR参数寻优流程图
    Fig. 1 Flow chart of SVR parameters optimization based on PSO
    Figure1
    3) 建立PSO-SVR模型。确定了支持向量回归机中的惩罚系数C和核函数参数g后,将最佳参数输入到模型中,在训练集上训练PSO-SVR模型。
    4) 污水处理厂出水总氮浓度预测。利用训练后的模型在测试集上测试模型回归效果,预测污水处理厂出水总氮浓度。

    2.4 模型回归效果评价

    为了比较模型的优劣性,本文通过计算预测值与真实值的平均相对误差(MRE)、均方根误差(RMSE)和决定系数(R2)对模型精度进行评价,各评价指标的计算公式如下:
    MRE=1nni=1|yiˆyi| (8)
    RMSE=(1n)ni=1(yiˆyi)2 (9)
    R2=(nni=1yiˆyini=1yini=1ˆyi)2(nni=1y2i(ni=1yi)2)(nni=1ˆy2i(ni=1ˆyi)2) (10)
    式中:yi为实际值;ˆyi为预测值;n为总样本数。

    3 结果与讨论

    3.1 模型参数确定

    在PSO-SVR模型核函数确定后,模型参数的选择对于模型的回归效果影响很大,本文采用粒子群优化算法结合手动调整法对PSO-SVR模型的最优参数进行寻优,采用K-折交叉验证的思想对模型进行检验。粒子群规模取n=20,c1=1.5,c2=1.7,r1r2选取[0, 1]之间的随机数,最大迭代次数取为100。通过粒子群算法对SVR参数组合寻优,其适应度曲线如图 2所示。本文确定的PSO-SVR模型参数为最优惩罚系数C=6.039 4,最优核函数参数g=0.01。
    图2 粒子群优化算法参数寻优适应度变化曲线
    Fig. 2 Fitness change curve of parameters optimizing based on PSO
    图2 粒子群优化算法参数寻优适应度变化曲线
    Fig. 2 Fitness change curve of parameters optimizing based on PSO
    Figure2

    3.2 污水处理厂出水总氮浓度预测

    利用训练后的PSO-SVR模型对表 1中的训练数据集(2013年1月—2014年6月)进行回归计算,真实值与回归值对比结果如图 3所示。
    图3 训练集真实值与回归值拟合结果
    Fig. 3 Curve fitting results of real and predicted value among training set
    图3 训练集真实值与回归值拟合结果
    Fig. 3 Curve fitting results of real and predicted value among training set
    Figure3
    利用训练后的模型对该厂2014年6—12月的出水总氮浓度进行预测,最终预测值与实际值对比情况如表 2所示,从表 2可以看出,6个月的数据预测误差范围为[0.157%, 6.408%],除去2014年9月的数据外,其余5个月数据预测误差低于2%,预测结果比较稳定,2014年9月的数据出现较大误差可能是由于数据监测(水质化验)仪器出现故障或者人工记录数据出现失误造成的。模型预测结果说明应用PSO-SVR模型进行污水处理厂污水处理过程模拟和出水总氮浓度预测是可行的。
    表2 污水处理厂总氮实际出水水质及PSO-SVR预测结果
    Table 2 Real and PSO-SVR prediction values of effluent TN of WWTP
    表2 污水处理厂总氮实际出水水质及PSO-SVR预测结果
    Table 2 Real and PSO-SVR prediction values of effluent TN of WWTP

    日期 实际值/(mg·L-1) 预测值/(mg·L-1) 绝对误差/(mg·L-1) 相对误差/%
    2014-07 25.52 25.76 0.24 0.94
    2014-08 25.49 25.45 0.04 0.157
    2014-09 24.50 26.07 1.57 6.408
    2014-10 26.30 26.75 0.45 1.711
    2014-11 27.08 26.98 0.10 0.369
    2014-12 27.30 27.69 0.39 1.429

    3.3 模型比较

    为了验证PSO-SVR模型的预测精度和优越性,本文选取BP神经网络(BP-ANN)和传统的多元线性回归模型(MLR),在相同的测试样本上比较模型的精度。BP神经网络隐藏层数取1,迭代次数为100,采用不同的隐含层节点数分别对网络进行训练,当隐含层节点数取5时,BP人工神经网络训练误差最低。3个模型的回归结果可见图 4,可以看出来,PSO-SVR模型的回归效果最好,优于MLR模型和BP-ANN模型。
    图4 PSO-SVR模型、MLR模型、BP-ANN模型预测结果
    Fig. 4 Forecasting results of PSO-SVR, MLR and BP-ANN
    图4 PSO-SVR模型、MLR模型、BP-ANN模型预测结果
    Fig. 4 Forecasting results of PSO-SVR, MLR and BP-ANN
    Figure4
    表 3为模型精度对比分析结果,PSO-SVR模型预测值与实际值平均相对误差(MRE)为1.836%,BP-ANN模型和MLR模型则分别为5.973%和2.815%;PSO-SVR模型预测值与实际值的决定系数R2为67.76%,BP-ANN模型和MLR模型则分别为2.66%和28.31%;PSO-SVR模型预测值与实际值的均方根误差为0.693 9,BP-ANN模型和MLR模型则分别为2.023 1和1.093 5。通过各项指标比较可知,PSO-SVR模型精度最高,MLR模型精度低于PSO-SVR模型但高于BP-ANN模型,BP-ANN模型精度最低。这主要是因为,MLR模型将输出量与输入量认为是线性关系,因此不能很好地反映出污水处理过程中各项变量之间的真实关系;而BP-ANN在小样本数据下不能很好地对样本进行学习,导致其出现“欠学习”的现象。
    表3 3种模型预测结果精度对比
    Table 3 Precision comparison of forecast results for three models
    表3 3种模型预测结果精度对比
    Table 3 Precision comparison of forecast results for three models

    模型 平均相对误差/% 决定系数
    R2
    均方根误差
    RMSE
    多元线性回归 2.815 28.31 1.093 5
    BP神经网络 5.973 2.66 2.023 1
    PSO-SVR 1.836 67.76 0.693 9

    4 结论

    1) 本文针对北京某大型污水处理厂2013年、2014年月均运行数据建立了小样本情况下的基于粒子群算法优化支持向量回归机的污水处理厂出水总氮浓度预测模型,PSO-SVR模型最终回归结果为,测试集的平均相对误差仅为MRE=1.836%,测试集的决定系数达到了R2=67.76%,测试集的均方根误差RMSE=0.693 9。与多元线性回归模型、BP神经网络模型相比,PSO-SVR模型可以更好地预测污水处理厂出水总氮浓度,适于推广。
    2) 本文将粒子群优化算法用于支持向量回归机的关键参数选取中,很好地避免了人为主观因素在支持向量回归机关键参数选取中的影响,提高了预测精度,具有实用价值。
    3) 本文构建的污水处理厂出水总氮浓度预测模型,尤其适合于缺乏大量历史数据的新建污水处理厂,为新建污水处理厂的脱氮工艺优化运行管理提供辅助信息,同时为污水处理厂污水处理过程进行建模模拟提供了新的尝试方法。另外需要指出的是,不同的污水处理厂运行情况、工艺水平各不相同,因此将PSO-SVR模型运用于不同的污水处理厂时,应该重新选取合适的模型参数和核函数。
    4) 在日后的研究中可以加深对数据的分析和预处理,如运用主成分分析法(PAC)、运用聚类分析(HCA)将数据进行预处理与分组处理等,以提高模型预测精度和预测结果的稳定性。
参考文献 (31)

返回顶部

目录

/

返回文章
返回