下一代计算毒理学在食品安全风险评估中的应用

赵雅萱, 杨道远, 黄美玲, 隋海霞, 庄树林. 下一代计算毒理学在食品安全风险评估中的应用[J]. 环境化学, 2025, 44(3): 756-763. doi: 10.7524/j.issn.0254-6108.2024071107
引用本文: 赵雅萱, 杨道远, 黄美玲, 隋海霞, 庄树林. 下一代计算毒理学在食品安全风险评估中的应用[J]. 环境化学, 2025, 44(3): 756-763. doi: 10.7524/j.issn.0254-6108.2024071107
ZHAO Yaxuan, YANG Daoyuan, HUANG Meiling, SUI Haixia, ZHUANG Shulin. The application of next-generation computational toxicology in food safety risk assessment[J]. Environmental Chemistry, 2025, 44(3): 756-763. doi: 10.7524/j.issn.0254-6108.2024071107
Citation: ZHAO Yaxuan, YANG Daoyuan, HUANG Meiling, SUI Haixia, ZHUANG Shulin. The application of next-generation computational toxicology in food safety risk assessment[J]. Environmental Chemistry, 2025, 44(3): 756-763. doi: 10.7524/j.issn.0254-6108.2024071107

下一代计算毒理学在食品安全风险评估中的应用

    通讯作者: Tel:010-52165562, 0571-88982344,E-mail:suihaixia@cfsa.net.cn shulin@zju.edu.cn
  • 基金项目:
    国家重点研发计划项目(2023YFF1103900)和国家自然科学基金(22136001,32372445)资助.
  • 中图分类号: X-1;O6

  • CSTR: 32061.14.hjhx.2024071107

The application of next-generation computational toxicology in food safety risk assessment

    Corresponding authors: SUI Haixia, suihaixia@cfsa.net.cn ;  ZHUANG Shulin, shulin@zju.edu.cn
  • Fund Project: the National Key R&D Program of China (2023YFF1103900) and National Natural Science Foundation of China (22136001,32372445).
  • 摘要: 随着人工智能的迅速发展,基于机器学习和深度学习的下一代计算毒理学(Next-Generation Computational Toxicology,NGCT)逐渐兴起. NGCT通过整合化学、毒理学和系统生物学等多模态大数据,实现对化学物属性和毒性的高通量预测,克服了传统风险评估方法的局限性,推动了化学物的高通量风险评估. 本文总结了NGCT在融合分子交互特征、预测化学物属性和暴露数据、以及食品安全风险评估领域的应用. 鉴于大语言模型对研究新范式的推动,进一步展望了大语言模型在食品安全领域自然语言处理、预测分析和决策制定方面的潜力,并简述了基于NGCT的食品安全风险评估新范式.
  • 铅锌矿在中国矿产资源体系中占据着至关重要的地位,是工业领域的“关键基石”. 我国已勘铅锌资源主要集中于7个省区,储量约占全国66%,其中就包含甘肃省[1]. 在矿业开采与工业加工进程中,废液未经妥善处理随意排放,废渣堆积成山,加上雨水冲刷,致使 Cd、Hg等有害成矿、伴矿元素不断迁移、扩散,对周边土壤造成污染. 同时,由于土壤重金属污染的累积性[2],使其在土壤中的浓度越来越高,最终对生态系统造成危害[3]. 统计数据显示,我国有超过2000万 hm2的农田土壤存在重金属污染情况,当中被工业废渣污染的农田约10万 hm2,因采矿而污染的土壤面积约20万 hm2[4]. 一旦土壤重金属富集至特定程度,便会对农作物质量产生直接影响,有研究表明,国内每年由于土壤重金属污染而导致的粮食安全损失高达1.2×108 t,直接造成的经济损失逾 200 亿元[5]. 其毒性效应可经食物链传递至人体,引发骨骼疼痛、肾脏疾病等健康问题,对人类健康构成了极大的威胁 [6].

    目前国内外学者对土壤重金属源解析的方法主要包括判别污染源类别和精准解析污染源两部分[79],前者包括相关性分析法、主成分分析法和聚类分析法等,后者包括绝对因子得分-多元线性回归法和正定矩阵因子分解法(positive matrix factorization,PMF)等. PMF是对污染源进行精确分析的首选方法,该方法操作简单,可同时满足不确定性和非负性约束[10],能够自动化地处理错误和缺失数据,不需要源组分图就能得到精确、可信的结果,因此被美国环保署优先推荐使用[11]. PMF 源解析虽能识别土壤重金属污染源,但难以精准量化其生态风险和健康风险,从而无法确定首要管控要素[11]. 为此,学者们将PMF模型与生态风险、健康风险评价模型进行整合,成功提出重金属污染特定源的风险评价方法[12]. 马杰等[13]将PMF模型和健康风险模型结合,探讨了不同污染源影响下重庆市农产品主产区的土壤健康风险,确定研究区工业源和As为首要管控要素,重金属源解析成为后期尾矿库及其周围土壤修复或复垦的重要依据.

    甘肃省陇南市矿产资源丰富,尾矿库数量多,以铅锌矿和金矿尾矿为主,占比分别为72.54%和15.5%[14]. 当前,铅锌尾矿库及周边农田是土壤重金属污染的重点关注区域. 本文以此为研究对象,测定其土壤重金属含量,分析其污染状况,并在源解析的基础上结合生态风险和健康风险评估模型来量化各污染源相应风险贡献率,从而确定首要控制因素. 研究结果将为尾矿库周边农田土壤污染现状的调查和评价提供科学有效的理论依据.

    研究区地处徽县江洛镇赵湾村,隶属于甘肃省陇南市. 县名源自城北徽山之下的徽山驿,在北纬33°32'—34°10'、东经105°34'—106°26'之间,东接两当县,南连陕西省略阳县,西接成县,北通天水市秦州区与麦积区,西北衔西和县,总面积2699 km2. 江洛镇处于徽县北部山地向中部河谷丘陵过渡区域,地势自北向南渐次降低,地形分为东南部河谷区,西北部山区;境内最高峰海拔2002 m. 江洛镇属暖温带大陆性气候;多年来气温的平均值为11 ℃,无霜期平均每年可达180 d,降水量的平均值为700 mm,降雨每年集中在7—9月. 2022年全县耕地总面积38.98万亩. 江洛镇境内已探明地下矿藏有铅、锌、硫、铁、金、煤等矿产资源,特别是铅、锌矿储量较大[15]. 该尾矿库为山谷型,采用湿式排放方式,尾矿库现状总坝高26 m,初期坝坝高为15 m,堆积坝坝高11 m,库内堆存尾砂量约为23万m3. 该尾矿库未填埋,在工矿生产和矿渣储存过程中,土壤中的粉尘会在大气中沉积,受降雨和径流的影响,对矿区周围环境造成了严重影响,从而可能会引发一系列的生态环境安全问题.

    本文于2023年8月在甘肃省陇南市某铅锌尾矿库及其周边农田(北纬33°53'27''—33°53'43''、东经105°48'27''—105°48'41'')进行样品采集. 采用了简单随机布点法并结合专业判断法来布点. 为确保采样点布局的科学性与均匀性,本研究充分借助了地理信息系统的空间分析能力,结合网格化精密的划分手段,对整个研究区域进行布局(采样面积约为3.22 km2[1]. 采样时用GPS定位采样点经纬度,并根据样点采集顺序对其编号,在现场共布置了41个采样点,其中尾矿库8个,周边农田33个,如图1所示. 在每个采样点采集表层土壤(0—20 cm),样品放在密封袋里保存. 采集的样品经自然风干、去除杂物、研磨和筛分后,一份用于测定土壤pH,一份用于测定土壤重金属含量. 采用电感耦合等离子体质谱仪(ICP-MS,NexION 2000)测定经盐酸-硝酸-氢氟酸-高氯酸微波消解(CEM MARS6)后样品中的镉(Cd)、铬(Cr)、铜(Cu)、镍(Ni)、铅(Pb) 和锌(Zn) 含量,其检出限分别为0.03、2.00、0.70、2.00、1.00 mg·kg−1和5.00 mg·kg−1;采用原子荧光光度计(AFS-930d)测定经硝酸-盐酸消解后样品中的砷(As)和汞( Hg)含量,其检出限分别为0.20 mg·kg−1和0.002 mg·kg−1. 样品测试环节均进行空白实验与平行样测定,结果精密度符合实验允许误差要求,同时用国家标准土样予以质量管控,所测元素的加标回收率为95%—106%,分析误差为±5%.

    图 1  研究区域布点图
    Figure 1.  Distribution plot of the study area

    由于农田研究区土壤pH值范围为6.00—8.18,平均值为7.85,中位数为7.75,其中pH > 7.5占比达93.94%,且变异系数小于0.1. 故选用《土壤环境质量农用地土壤污染风险管控标准》(GB15618-2018)中pH>7.5的风险筛选值(mg·kg−1)和风险管制值(mg·kg−1)分别作为农田土壤的一级和二级评价标准. 《土壤环境质量建设用地土壤污染风险管控标准》(GB36600-2018)中第二类用地的风险筛选值(mg·kg−1)和风险管制值(mg·kg−1)分别作为尾矿库土壤的一级和二级评价标准,如表1所示.

    表 1  土壤环境质量评价标准
    Table 1.  Soil environmental quality evaluation criteria
    指标Index风险筛选值Risk filter value风险管制值Risk control value
    尾矿库(第二类用地)农田(pH>7.5)尾矿库(第二类用地)农田(pH>7.5)
    Cu1800010036000
    Cr2501300
    Ni9001902000
    Zn300
    As6025140100
    Cd650.601724.0
    Pb80017025001000
    Hg383.40826.0
      注:“−”表示无此项,下同. Note: "−" means that there is no such item, the same below.
     | Show Table
    DownLoad: CSV

    污染负荷指数法在土壤重金属污染水平评估中应用广泛,既能考量单个样点污染状况,又可评定多重金属污染区域状况[16]. 污染负荷指数法的计算如下式(1–3):

    stringUtils.convertMath(!{formula.content}) (1)
    stringUtils.convertMath(!{formula.content}) (2)
    stringUtils.convertMath(!{formula.content}) (3)

    式中,CFi是某一重金属的污染因子;Ci是重金属的测定值,mg·kg−1Bi是甘肃省土壤重金属元素背景值[17],mg·kg−1n为重金属污染种类总数,m为采样点个数. PLI 和PLIzone分别是某个采样点和整个研究区的污染负荷指数,污染负荷分级标准[18]表2.

    表 2  污染负荷指数分级标准
    Table 2.  Classification standard of the pollution load index
    CF PLI 等级Level 污染程度Contamination degrees
    CF<1 PLI<1 0 无污染
    1≤CF<3 1≤PLI<3 1 轻度污染
    3≤CF<6 3≤PLI<6 2 中度污染
    6≤CF 6≤PLI 3 重度污染
     | Show Table
    DownLoad: CSV

    PMF模型是将重金属含量矩阵分解为因子得分矩阵、因子载荷矩阵和残差矩阵[19]. 见式(4–7):

    stringUtils.convertMath(!{formula.content}) (4)

    式中,Xij为第j个样品中第i个元素的含量(mg·kg−1);Gjkj个样品在源k中的含量(mg·kg−1);Fki为第k个源中第i个元素的含量(mg·kg−1);Eijp分别为残差矩阵和因子个数. 通过Multilinear Engine 模型迭代运算,因子数设定的多少均会显著影响解析结果. 因此,要进行多次调整和改进,以便得到最小的Q 值和最优解 [19],以此确定具有代表性的因子数及其相对贡献率.

    stringUtils.convertMath(!{formula.content}) (5)

    式中,Uij为第j个样品中第i个元素的不确定度,n为元素种类,m为采样点数. MDL为方法检出限. 当土壤重金属含量小于或等于MDL时,Uij可由公式计算得出:

    stringUtils.convertMath(!{formula.content}) (6)

    当土壤重金属含量高于MDL时,则由式(6)计算得出:

    stringUtils.convertMath(!{formula.content}) (7)

    式中,c为重金属元素含量实测值(mg·kg−1);δ为不确定度百分数.

    本研究将PMF模型与综合生态风险评价指数法(Nemerow integrated risk index,NIRI)有机结合,来量化各污染源对生态风险的贡献[20]. 具体计算公式如下(8–12):

    stringUtils.convertMath(!{formula.content}) (8)

    式中,Ckij为样品j中污染源k对元素i的贡献值(mg·kg−1),Ci为样品中重金属i元素的实测值(mg·kg−1).

    stringUtils.convertMath(!{formula.content}) (9)
    stringUtils.convertMath(!{formula.content}) (10)

    式中,ERkij为样品j中污染源k对元素i的生态风险;Bi为甘肃省土壤元素背景值;Eir为重金属i元素的潜在生态风险,重金属毒性响应系数直观展现了重金属的毒性强弱以及水体对其敏感程度,Tir一般取值Zn=1,Cr=2,Cu=Ni=Pb=5,Cd=30,Hg=40,As=10 [21].

    stringUtils.convertMath(!{formula.content}) (11)
    stringUtils.convertMath(!{formula.content}) (12)

    式中,EIRIkij为样品j中污染源k对多种元素的生态风险,NIRIij为样品j的综合生态风险评价,ERkijmaxEirmaxERkijaveEirave分别为同一样品中所有元素生态风险值的最大值和平均值. 基于EirNIRI值的生态风险等级划分标准[22]表3.

    表 3  生态风险指数分级标准
    Table 3.  Ecological risk index classification criteria
    Eir 生态风险等级Ecological risk level NIRI 生态风险等级Ecological risk level
    Eir<40 轻微 NIRI<40 轻微
    40≤Eir<80 中等 40≤NIRI<80 中等
    80≤Eir<160 80≤NIRI<160
    160≤Eir<320 很强 160≤NIRI<320 很强
    Eir≥320 极强 NIRI≥320 极强
     | Show Table
    DownLoad: CSV

    采用美国环保署(USEPA)推荐的健康风险评估模型,量化土壤重金属对人体健康造成的风险[23]. 土壤重金属健康风险评估模型中暴露参数和不同暴露途径的参考剂量(RfD)和致癌斜率因子(SF)值参照中国生态环境部发布的HJ 25.3-2019中的风险评估模型参数推荐值和美国环保署发布的相关参数[2426]. 对于致癌风险,致癌风险值低于10−6时,表示对人体健康风险不显著,视为风险可以忽略不计;致癌风险值为10−6—10−4时,表示对人体健康有风险;致癌风险值大于10−4时,表示有显著风险,认为风险是不可接受的[27]. 基于源导向的土壤重金属风险评估是先根据PMF模型得到不同源的贡献率,并结合研究区健康风险评估结果,计算不同源对人体健康风险的贡献率[28],具体计算公式如下(13–16):

    stringUtils.convertMath(!{formula.content}) (13)
    stringUtils.convertMath(!{formula.content}) (14)
    stringUtils.convertMath(!{formula.content}) (15)
    stringUtils.convertMath(!{formula.content}) (16)

    式中,HQj为第j类源的非致癌风险;Fij为第i种重金属在第j类源的贡献率;HQi为第i种重金属的非致癌风险;Dj,HQ为第j类源的非致癌风险贡献率;CRj为第j类源的致癌风险;CRi为第i种重金属的致癌风险;Dj,CR为第j类源的致癌风险贡献率.

    研究数据处理采用SPSS 27和EXCEL,进行描述性统计分析,利用EPA PMF 5.0软件进行溯源解析,使用Origin 2024和ArcGIS软件处理数据并绘制图形.

    土壤中As、Cd、Cr、Cu、Ni、Pb、Zn和Hg元素含量描述性统计结果如表4所示,研究区尾矿库土壤中As、Cd、Cr、Cu、Ni、Pb、Zn和Hg含量范围分别为21.64—43.69、0.25—1.04、11.23—16.95、26.07—51.85、7.13—14.61、653.99—925.67、412.96—603.57 mg·kg−1和7.65—9.45 mg·kg−1,其中只有Pb有50.00%的样点超出一级标准. 研究区农田土壤中As、Cd、Cr、Cu、Ni、Pb、Zn和Hg的含量范围分别为10.20—26.85、1.35—3.30、68.76—134.98、12.64—23.60、11.44—29.20、39.12—92.61、66.65—139.35 mg·kg−1和2.48—4.33 mg·kg−1. 根据评价标准(表1),农田土壤中Cd所有样点的含量均超过一级标准,As有3.03%的样点超过了一级标准,Hg有39.39%的样点超过了一级标准,Cr、Cu、Ni、Pb和Zn含量均未超过一级标准. 尾矿库和农田土壤中所有重金属含量均未超过二级标准. 污染负荷指数法结果(图2)表明,农田土壤中8种重金属的CFi平均值由大到小依次为:Hg(56.08)>Cd(19.40)>Pb(3.02)>Cr(1.41)>Zn(1.30)>As(1.27)>Cu(0.75)>Ni(0.57). Hg和Cd全部样点属于重度污染;Pb有66.67%的样点属于轻度污染,33.33%的样点属于中度污染;Cr、Zn和As大部分样点属于轻度污染;Cu和Ni的全部样点均属于无污染. 农田的PLI值介于2.453.09之间,均值为2.71,总体上属于轻度污染,占比为 93.94%. 尾矿库土壤中8种重金属的CFi平均值由大到小依次为:Hg(137.98)>Pb(42.32)>Zn(7.33)>Cd(5.80)>As(2.54)>Cu(1.81)>Ni(0.29)>Cr(0.21). Hg和Pb的全部样点为重度污染,Zn有87.50%的样点属于重度污染;Cd分别有62.5%和37.5%的样点属于中度污染和重度污染;Cu的全部样点属于轻度污染,As有75%的样点属于轻度污染;Ni和Cu的全部样点属于无污染. 尾矿库研究区域的PLI值介于3.34—4.46之间,均值为3.96 ,总体上属于中度污染,占比为100%. 总体来说,尾矿库土壤重金属污染程度要高于农田. 由于该尾矿库表层未客土,有毒有害的尾矿粉尘会随大气迁移,继而受降雨的影响,会对矿区周围环境造成一定影响. 铅锌尾矿的堆积使得尾矿库及其周边农田土壤中的Pb和Zn污染严重,但农田土壤中Cd和Cr元素含量均值高于尾矿库土壤. 据调查,陇南农业特色产业的种植规模约1000万亩[29],农业活动频繁,结合PMF的结果,说明这2种重金属污染与农业活动和成土母质有关. 这与李多杰等[30]对内蒙古兴安盟某铅锌矿的研究结果相似,矿区周围的土壤受到明显的Zn和Pb污染,而铅锌矿周边土壤中的Cd和Cr污染归因于成土母岩风化和人为活动的共同作用.

    表 4  土壤重金属含量描述性统计分析
    Table 4.  Descriptive statistical analysis of soil heavy metal content
    项目Item 采样地Sampling site 最小值/( mg·kg−1)Minimum 最大值/( mg·kg−1)Maximum 平均值/( mg·kg−1)Average value 标准差Standard deviation 变异系数Standard deviation 超标率Excess ratio
    以一级标准为评价标准 以二级标准为评价标准
    As 尾矿库 21.64 43.69 32.04 7.26 22.66% 0% 0%
    农田 10.20 26.85 16.04 2.86 17.83% 3.03% 0%
    Cd 尾矿库 0.25 1.04 0.67 0.25 37.31% 0% 0%
    农田 1.35 3.30 2.25 0.41 18.22% 100% 0%
    Cr 尾矿库 11.23 16.95 14.57 2.38 16.33%
    农田 68.76 134.98 98.66 18.37 18.62% 0% 0%
    Cu 尾矿库 26.07 51.85 43.70 10.23 23.41% 0% 0%
    农田 12.64 23.60 18.17 1.98 10.89% 0%
    Ni 尾矿库 7.13 14.61 10.19 2.48 24.34% 0% 0%
    农田 11.44 29.20 20.04 4.61 23.01% 0%
    Pb 尾矿库 653.99 925.67 795.70 101.05 12.70% 50% 0%
    农田 39.12 92.61 56.68 12.93 22.81% 0% 0%
    Zn 尾矿库 412.96 603.57 508.20 60.45 11.89%
    农田 66.65 139.35 90.25 17.36 19.23% 0%
    Hg 尾矿库 7.65 9.45 8.28 0.60 7.24% 0% 0%
    农田 2.48 4.33 3.37 0.50 14.84% 39.39% 0%
    pH 尾矿库 8.26 8.58 8.42 0.16 1.90%
    农田 6.00 8.18 7.85 0.75 9.59%
     | Show Table
    DownLoad: CSV
    图 2  研究区域土壤重金属污染因子和污染负荷指数箱型图
    Figure 2.  Box plot of soil heavy metal contamination factors and pollution load index in the study area
    (a)农田(b)尾矿库
    (a) agricultural land (b) tailing ponds

    变异系数(coefficient of variance,CV)是一种反映重金属元素含量空间分布离散程度的指标[31],根据CV值的大小,可分为低度变异(CV<0.1)、中度变异(0.1≤CV<0.36)、高度变异(0.36≤CV<1)和极度变异(CV>1)[32]. 由表4可知,尾矿库研究区域土壤中Cd属于高度变异;As、Cu、Ni、Cr、Pb和Zn属于中度变异;Hg属于低度变异. 农田研究区域表层土壤中重金属的变异系数均在0.1—0.36之间,均属于中度变异. 因此,研究区域土壤中重金属含量的空间分布差异显著,地理环境和人类活动对其影响较大.

    本研究设定4至7个因子数量,经多番运行调试,最终选定5个因子,获取了较低的Q值 42.43,此时实测值与预测值拟合效果最好,且多数残差处于−3—3区间. 8 种元素的R2系数为0.545—0.951,表明PMF的整体拟合效果较好,能够很好地满足研究需求,并解释了原始数据中包含的信息. PMF模型的解析结果如图3所示,5个污染源的占比分别为 21.26%、22.77%、17.91%、16.61%和 21.44%.

    图 3  基于 PMF 模型的农田土壤重金属溯源解析
    Figure 3.  Traceability analysis of heavy metals in farmland soil based on PMF model

    图3可知,因子1主要载荷元素包括Cr、Cu、Ni、Pb和Zn,其贡献率分别为28.05%、29.16%、28.88%、24.43%和30.65%. 据报道,Ni和Cr含量的变化与成土母质、成土过程和地质活动密切相关[33]. 农田土壤中Cr、Cu和Ni均未超过一级评价标准,且含量较低,这表明Cr、Cu和Ni主要是受成土母质的影响,属于自然源. 而农田土壤中Pb和Zn的含量较高,且有研究表明铅锌矿影响区土壤中Pb、 Zn和Cu主要来自于矿山开采活动[34],故污染主要来源于周边的铅锌尾矿库. 故因子1是由自然源和尾矿库源的混合源.

    因子2主要载荷元素包括Ni、Pb、Zn和Hg,其贡献率分别为35.66%、32.50%、33.35%和25.02%,变异系数分别为0.23、0.23、0.19和0.15,均属于中度变异,受人类活动影响较大. 有研究表明,铅锌矿区在开采和冶炼活动中所产生的三废中含有大量的Zn、Pb、Cd、As和Hg等元素[7],排放后通过大气降尘进入周围土壤,导致土壤污染. 经调查,农田研究区右侧是废弃工厂,工矿活动及矿渣堆存期间的扬尘会通过大气沉降在土壤中积累,受降雨等影响导致Ni、Pb、Zn和Hg的二次富集. 故因子2是工业降尘源.

    因子3 主要载荷元素包括Pb、Cd、Zn和Cr,其贡献率分别为29.04%、24.61%、21.43%和21.64%. 汽车发动机、镀锌构件及轮胎等因机械摩擦、化学侵蚀引发的磨损与腐蚀,以及燃油燃烧或泄露和尾气排放等交通活动,都会将Cd、Pb和Zn元素释放到周边环境中[35,36]. 由因子1可知,Cr含量变化与成土过程显著相关,但研究区Cr的超标率96.97%,表明受到了人类活动的影响. 研究发现Cr还与金属零件和镀铬配件磨损有关[37]. 考虑研究区农田周围有交通运输道路及汽修厂,故因子3是交通源.

    因子4主要载荷元素包括As、Cd 和Cu,其贡献率分别为29.60%、31.16%和25.43%,变异系数分别0.18、0.18和0.11,属于中度变异,受人类活动影响较大. 除草剂和杀虫剂的大量使用会造成As的大量积累,磷肥中含有的微量As也是土壤As的重要来源之一[38]. 农家肥中含有较多的Cu、Cd元素,农药、化肥长期投入到农用地中会导致重金属Cu、Cd元素的大量积累[39]. 故因子4是农业源.

    因子5主要载荷元素包括As、Cd、Cr、Cu、Ni和Hg,其贡献率分别为21.62%、21.24%、35.42%、22.18%、18.30%和38.93%. Cd污染的主要来源包括汽油燃烧、农药和化肥、垃圾堆积、铅锌矿开采和冶炼等[40]. Cr、Cu、Ni主要受成土母质的影响,同时也有研究表明,农业投入品 (化肥、农药、有机肥等)中含有的Hg、As、Cu、Zn、Cd、Cr等元素易残留在土壤中,如磷肥中Cr含量在几十到几百mg·kg−1[8],As含量在20到50 mg·kg−1,施用不合理时,土壤中Cr、As这类元素含量会升高[39, 41]. 长期的尾矿库堆存、物料转运及加工等人为活动也会向周围环境释放Cd、Hg、As等元素[42],故因子5是由多种类型的活动组成的综合源.

    研究区农田土壤中重金属的EirNIRI评价结果见表5Eir的平均值从大到小排序为:Hg(2243.04)>Cd(582.06)>Pb(15.08)>As(12.73)>Cu(3.77)>Ni(2.85)>Cr(2.82)>Zn(1.30). 除了属于极强生态风险的Hg和Cd元素之外,其余元素均属于轻微生态风险,说明造成研究区生态风险的首要污染元素为Hg和Cd. 这与陈希瑶等[43]人研究中国土壤重金属的生态风险结果一致,对土壤造成生态风险的主要元素是Hg和Cd. 此外,研究区农田土壤重金属的综合生态风险指数(NIRI)范围为1673.762921.86,平均值为2271.48,属于极强生态风险.

    表 5  农田土壤重金属潜在生态危害系数(Eir)和Nemerow综合生态风险指数(NIRI)评价结果
    Table 5.  Evaluation results of potential ecological hazard coefficients (Eir ) and Nemerow integrated ecological risk index (NIRI) of soil heavy metal in farmload
    As Cd Cr Cu Ni Pb Zn Hg
    Eir最小值 8.10 348.44 1.96 2.62 1.62 10.40 0.96 1651.74
    Eir最大值 21.31 853.45 3.86 4.90 4.15 24.63 2.01 2883.33
    Eir平均值 12.73 582.06 2.82 3.77 2.85 15.08 1.30 2243.04
    NIRI 1673.762921.86
     | Show Table
    DownLoad: CSV

    研究区特定源-综合生态风险的评价结果如图4所示,按其贡献率的高低对5 种污染源进行排序:因子5(综合源)(38.37%)> 因子2(工业降尘源)(24.67%)> 因子3(交通源)(17.62%)> 因子1(自然源和尾矿库源的混合源)(10.47%)> 因子4(农业源)(8.86%),表明综合源对农田研究区影响的贡献率最大. 由于Hg元素自身毒性很高,且在研究区土壤中,Hg为首要的生态危害元素,在因子5中贡献率达到了38.93%,导致因子5是对综合生态风险贡献最高的污染源. 本研究中对综合生态风险贡献最高的污染源与以工业降尘源为主要污染源的PMF源解析结果不一致. 这与李军等[21]对敦煌市主城区的土壤重金属的研究结果一致,Hg元素负荷高的工业降尘源虽然不是重金属的最高贡献源,但却是综合生态风险的最高贡献源. 这表明重金属贡献率高的污染源并不一定具有高生态风险.

    图 4  农田土壤重金属不同污染源对综合生态风险的贡献率
    Figure 4.  Contribution of different pollution sources of heavy metals in agricultural soils to the integrated ecological risk

    图5a 显示了针对特定来源的人体健康风险评估模型的结果. 对于非致癌风险,不同污染源对儿童总HI值为 1.49,大于阈值1,表明农田土壤中的重金属在不同污染源下会对儿童健康造成非致癌健康风险. 成人的总HI值为 2.13×10−1,小于阈值1,表明农田土壤中的重金属在不同污染源下不会对成人健康造成非致癌健康风险. 儿童的总HI值大于成人的总HI值一个数量级,这可能与儿童较低的体重、生活习惯和对污染物的敏感性比较高有关[26]. 这一结果与方嘉等[44]研究基于PMF模型的农田土壤重金属源暴露风险综合评价的结果一致,可能与儿童对污染物的敏感性比较高有关. 与石文静等[45]对矿区周边土壤重金属的健康风险结果也一致,儿童非致癌及致癌风险较成人相比明显偏高,可能与儿童较低的体质量和生活习惯有关. 各个污染源的重金属对当地成人和儿童的HI排序均为:1>As>Cr>Pb>Hg>Cd>Ni>Cu>Zn,表示在不同污染源下,每种重金属元素不会对当地居民造成非致癌健康风险. 不同污染源对成人和儿童的总TCR值分别为2.72×10−5和4.58×10−5,表明农田土壤重金属在不同污染源下对当地人群健康有致癌健康风险. 各个污染源的重金属对当地成人和儿童的TCR排序均为:10−4>As>Cd>Cr>10−6>Pb>Ni,其中As、Cd和Cr有致癌健康风险,因为其有较低的RfD和较高的SF,致癌和非致癌效应较强[46]. Pb和Ni元素对当地人群身体的风险可以忽略不计.

    图 5  农田土壤重金属特定源-人体健康风险评价
    Figure 5.  Source-specific human health risk assessment of heavy metals in agricultural soil
    (a)健康风险(b)贡献率;注:白色区域表示无相关数据.
    (a) health risk (b) contribution rate Note: The white area indicates no relevant data.

    对于研究区农田土壤重金属、污染源与健康风险关系如图5b所示,就致癌风险而言,因子4(农业源)是导致成人和儿童致癌风险的首要污染源,贡献率分别为25.87%和26.92%. 其次是因子5(综合源),对成人的贡献率是23.77%,对儿童的贡献率是23.12%,污染因子以As为主,对成人的贡献率是51.79%,对儿童的贡献率是54.70%;对于非致癌风险而言,污染源贡献率的排列顺序:因子5(综合源)> 因子3(交通源)> 因子1(自然源和尾矿库源的混合源)> 因子4(农业源)> 因子2(工业降尘源). 因子5(综合源)是导致儿童非致癌风险的首要污染源,贡献率为25.17%,最主要的污染因子也是As元素,贡献率为43.57%. 这可能与As元素本身毒性有关,其有较低的RfD和较高的SF [46]. 这一结果不仅与杨杰等[47]研究鄂西某铜铅锌尾矿库周边农田土壤重金属风险评估的结果一致,还与张丽瑞等[48]研究甘肃省农田土壤潜在有毒元素污染的典型区域白阴市东大沟的健康风险评价结果一致,As元素是造成当地人群致癌风险影响的主要因子. 考虑到农业源和多种类型活动共同作用的综合源是造成研究区人体健康风险的主要因子,因而工业和农业等人类活动排放的重金属对人体存在健康风险,未来可通过提升工业废物排放标准,建立合适的管控机制以及减少农药和化肥用量等途径减少污染物进入环境的量,从而减少重金属对人体的危害 [45].

    1)研究区尾矿库和农田土壤中重金属含量均低于国家风险管制值,但尾矿库土壤中Pb有50.00%的样点超出国家风险筛选值,农田土壤中Cd、As和Hg分别有100%、3.03%和39.39%的样点超出国家风险筛选值. 总体而言,尾矿库土壤中重金属的污染程度较农田土壤明显偏高,其中尾矿库土壤以Hg、Pb、Zn和Cd污染为主,整体上属于中度污染水平,占比为100%;农田土壤以Hg和Cd污染为主,整体上属于轻度污染水平,占比为93.94%.

    2)研究区农田土壤重金属分别受自然源及尾矿库源的混合源(贡献率为21.26%)、工业降尘源(贡献率为22.77%)、交通源(贡献率为17.91%)、农业源(贡献率为16.61%)和由多种类型活动组成的综合源(贡献率为 21.44%)的共同影响.

    3)综合源对研究区生态风险贡献率为38.37%,为优先控制污染源,Hg为生态风险优先控制污染元素;农田重金属对成人不构成非致癌健康风险,但综合源是引起当地儿童非致癌风险的优先控制污染源,贡献率为25.17%,农业源是引起当地成人和儿童致癌风险的优先控制污染源,贡献率分别为25.87%和26.92%,健康风险的优先控制污染元素均为As.

  • 图 1  下一代计算毒理学

    Figure 1.  Next-generation computational toxicology

    图 2  2015—023年基于机器学习的食品安全风险评估的相关文章

    Figure 2.  Related articles on machine learning-based food safety risk assessment, 2015—2023

    图 3  QSAR及Read-Across的在风险评估中的应用特点

    Figure 3.  Application characteristics of QSAR and Read-Across in risk assessment

    图 4  分子动力学模拟与机器学习联合应用

    Figure 4.  Joint application of molecular dynamics simulations and machine learning

    图 5  PBK模型特点及应用

    Figure 5.  Characteristics and applications of PBK models

  • [1] Toxicity testing in the 21st century: a vision and a strategy[M]. Washington, DC: National Academies Press, 2007.
    [2] YANG D Y, YANG H, SHI M Y, et al. Advancing food safety risk assessment in China: Development of new approach methodologies (NAMs)[J]. Frontiers in Toxicology, 2023, 5: 1292373. doi: 10.3389/ftox.2023.1292373
    [3] Supporting Individual Risk Assessment during COVID-19[M]. Washington D C : National Academies Press, 2022.
    [4] HAN P L, LI X H, YANG J Y, et al. Advancing toxicity predictions: A review on in vitro to in vivo extrapolation in next-generation risk assessment[J]. Environment & Health, 2024, 2(7): 499-513.
    [5] HSCHMEISSER S,MICCOLI A,von BERGEN M,et al. New approach methodologies in human regulatory toxicology–Not if,but how and when![J]. Environment International, 2023(178): 108082.
    [6] DENG X Y, CAO S H, HORN A L. Emerging applications of machine learning in food safety[J]. Annual Review of Food Science and Technology, 2021, 12: 513-538. doi: 10.1146/annurev-food-071720-024112
    [7] ALEXANDER-WHITE C, BURY D, CRONIN M, et al. A 10-step framework for use of read-across (RAX) in next generation risk assessment (NGRA) for cosmetics safety assessment[J]. Regulatory Toxicology and Pharmacology, 2022, 129: 105094. doi: 10.1016/j.yrtph.2021.105094
    [8] LIM K, PAN K, YU Z, et al. Pattern recognition based on machine learning identifies oil adulteration and edible oil mixtures[J]. Nature Communications, 2020, 11(1): 5353. doi: 10.1038/s41467-020-19137-6
    [9] BOUZEMBRAK Y, MARVIN H J P. Impact of drivers of change, including climatic factors, on the occurrence of chemical food safety hazards in fruits and vegetables: A Bayesian Network approach[J]. Food Control, 2019, 97: 67-76. doi: 10.1016/j.foodcont.2018.10.021
    [10] ZHENG C, SONG Y H, MA Y P. Public opinion prediction model of food safety events network based on BP neural network[J]. IOP Conference Series: Materials Science and Engineering, 2020, 719(1): 012078. doi: 10.1088/1757-899X/719/1/012078
    [11] ZHANG R F, ZHOU L, ZUO M, et al. Prediction of dairy product quality risk based on extreme learning machine[C]. 2018 2nd International Conference on Data Science and Business Analytics (ICDSBA), Changsha, China, 2018: 448-456.
    [12] MA Y, J HOU Y Y, LIU Y S, et al. Research of food safety risk assessment methods based on big data[C]. IEEE International Conference on Big Data Analysis (ICBDA), Hangzhou, China, 2016: 1-5.
    [13] CHANG W T, Yeh Y P, WU H Y, et al. An automated alarm system for food safety by using electronic invoices[J]. PLoS One, 2020, 15(1): e0228035. doi: 10.1371/journal.pone.0228035
    [14] SCHILTER B, BENIGNI R, BOOBIS A, et al. Establishing the level of safety concern for chemicals in food without the need for toxicity testing[J]. Regulatory Toxicology and Pharmacology, 2014, 68(2): 275-296. doi: 10.1016/j.yrtph.2013.08.018
    [15] LI X L, CHENG W, YANG S F, et al. Establishment of a 13 genes-based molecular prediction score model to discriminate the neurotoxic potential of food relevant-chemicals[J]. Toxicology Letters, 2022, 355: 1-18. doi: 10.1016/j.toxlet.2021.10.013
    [16] LI T, TONG W D, ROBERTS R, et al. DeepCarc: Deep learning-powered carcinogenicity prediction using model-level representation[J]. Frontiers in Artificial Intelligence, 2021, 4: 757780. doi: 10.3389/frai.2021.757780
    [17] RUIZ-SAAVEDRA S, GARCÍA-GONZÁLEZ H, ARBOLEYA S, et al. Intestinal microbiota alterations by dietary exposure to chemicals from food cooking and processing. Application of data science for risk prediction[J]. Computational and Structural Biotechnology Journal, 2021, 19: 1081-1091. doi: 10.1016/j.csbj.2021.01.037
    [18] WANG C C, LIANG Y C, WANG S S, et al. A machine learning-driven approach for prioritizing food contact chemicals of carcinogenic concern based on complementary in silico methods[J]. Food and Chemical Toxicology, 2022, 160: 112802. doi: 10.1016/j.fct.2021.112802
    [19] 佘僧, 李熠, 宋洪波, 等. 稳定同位素技术在蜂蜜真实性溯源中的研究进展[J]. 食品工业科技, 2018, 39(17): 300-304,308.

    SHE S, LI Y, SONG H B, et al. Research progress of stable isotope ratio mass spectrometry for authenticity and traceability in honey[J]. Science and Technology of Food Industry, 2018, 39(17): 300-304,308 (in Chinese).

    [20] 杜晓宁, 张鹏帅, 雷雯, 等. 稳定同位素技术在我国食品安全检测领域的应用进展[J]. 同位素, 2019, 32(3): 231-243. doi: 10.7538/tws.2019.32.03.0231

    DU X N, ZHANG P S, LEI W, et al. Application of stable isotope technique in food safety field[J]. Journal of Isotopes, 2019, 32(3): 231-243 (in Chinese). doi: 10.7538/tws.2019.32.03.0231

    [21] ERDÉLYI D, KERN Z, NYITRAI T, et al. Predicting the spatial distribution of stable isotopes in precipitation using a machine learning approach: A comparative assessment of random forest variants[J]. GEM - International Journal on Geomathematics, 2023, 14(1): 14. doi: 10.1007/s13137-023-00224-x
    [22] 王中钰, 陈景文, 傅志强, 等. QSAR模型应用域的表征方法[J]. 科学通报, 2022, 67(3): 255-266. doi: 10.1360/TB-2021-0406

    WANG Z Y, CHEN J W, FU Z Q, et al. Characterization of applicability domains for QSAR models[J]. Chinese Science Bulletin, 2022, 67(3): 255-266 (in Chinese). doi: 10.1360/TB-2021-0406

    [23] TROPSHA A, ISAYEV O, VARNEK A, et al. Integrating QSAR modelling and deep learning in drug discovery: The emergence of deep QSAR[J]. Nature Reviews. Drug Discovery, 2024, 23(2): 141-155. doi: 10.1038/s41573-023-00832-0
    [24] BHHATARAI B, WILSON D M, PRICE P S, et al. Evaluation of OASIS QSAR models using ToxCast™ in vitro estrogen and androgen receptor binding data and application in an integrated endocrine screening approach[J]. Environmental Health Perspectives, 2016, 124(9): 1453-1461. doi: 10.1289/EHP184
    [25] RYU J Y, KIM H U, LEE S Y. Deep learning improves prediction of drug-drug and drug-food interactions[J]. Proceedings of the National Academy of Sciences of the United States of America, 2018, 115(18): E4304-E4311.
    [26] RUSSO D P, ZORN K M, CLARK A M, et al. Comparing multiple machine learning algorithms and metrics for estrogen receptor binding prediction[J]. Molecular Pharmaceutics, 2018, 15(10): 4361-4370. doi: 10.1021/acs.molpharmaceut.8b00546
    [27] IDAKWO G, THANGAPANDIAN S, LUTTRELL J 4th, et al. Deep learning-based structure-activity relationship modeling for multi-category toxicity classification: A case study of 10K Tox21 chemicals with high-throughput cell-based androgen receptor bioassay data[J]. Frontiers in Physiology, 2019, 10: 1044. doi: 10.3389/fphys.2019.01044
    [28] WANG H, LIU R F, SCHYMAN P, et al. Deep neural network models for predicting chemically induced liver toxicity endpoints from transcriptomic responses[J]. Frontiers in Pharmacology, 2019, 10: 42. doi: 10.3389/fphar.2019.00042
    [29] FERNANDEZ M, BAN F Q, WOO G, et al. Toxic colors: The use of deep learning for predicting toxicity of compounds merely from their graphic images[J]. Journal of Chemical Information and Modeling, 2018, 58(8): 1533-1543. doi: 10.1021/acs.jcim.8b00338
    [30] GOH G B, SIEGEL C, VISHNU A, et al. Chemception: A deep neural network with minimal chemistry knowledge matches the performance of expert-developed QSAR/QSPR models[EB/OL]. 2017: 1706.06689.
    [31] van LEEUWEN K, SCHULTZ T W, HENRY T, et al. Using chemical categories to fill data gaps in hazard assessment[J]. SAR and QSAR in Environmental Research, 2009, 20(3/4): 207-220.
    [32] CHATTERJEE M, ROY K. Chemical similarity and machine learning-based approaches for the prediction of aquatic toxicity of binary and multicomponent pharmaceutical and pesticide mixtures against Aliivibrio fischeri[J]. Chemosphere, 2022, 308: 136463. doi: 10.1016/j.chemosphere.2022.136463
    [33] HARTUNG T. Making big sense from big data in toxicology by read-across[J]. ALTEX, 2016, 33(2): 83-93.
    [34] BANERJEE A, ROY K. Machine-learning-based similarity meets traditional QSAR: “q-RASAR” for the enhancement of the external predictivity and detection of prediction confidence outliers in an hERG toxicity dataset[J]. Chemometrics and Intelligent Laboratory Systems, 2023, 237: 104829. doi: 10.1016/j.chemolab.2023.104829
    [35] YANG C, RATHMAN J F, MOSTRAG A, et al. High throughput read-across for screening a large inventory of related structures by balancing artificial intelligence/machine learning and human knowledge[J]. Chemical Research in Toxicology, 2023, 36(7): 1081-1106. doi: 10.1021/acs.chemrestox.3c00062
    [36] 潘柳萌, 吕翾, 庄树林. 分子动力学模拟在有机污染物毒性作用机制中的应用[J]. 科学通报, 2015, 60(19): 1781-1788. doi: 10.1360/N972015-00118

    PAN L M, LÜ X, ZHUANG S L. The application of molecular dynamics simulations in mechanism of toxicity of organic contaminants[J]. Chinese Science Bulletin, 2015, 60(19): 1781-1788 (in Chinese). doi: 10.1360/N972015-00118

    [37] ZHANG Y J, LI S Y, MENG K, et al. Machine learning for sequence and structure-based protein-ligand interaction prediction[J]. Journal of Chemical Information and Modeling, 2024, 64(5): 1456-1472. doi: 10.1021/acs.jcim.3c01841
    [38] LI Y Q, HSIEH C Y, LU R Q, et al. An adaptive graph learning method for automated molecular interactions and properties predictions[J]. Nature Machine Intelligence, 2022, 4: 645-651. doi: 10.1038/s42256-022-00501-8
    [39] MASTROPIETRO A, PASCULLI G, BAJORATH J. Learning characteristics of graph neural networks predicting protein–ligand affinities[J]. Nature Machine Intelligence, 2023, 5: 1427-1436. doi: 10.1038/s42256-023-00756-9
    [40] 张家晨, 张良, 庄树林. 分子起始事件在计算毒理学中的研究展望[J]. 环境化学, 2021, 40(9): 2629-2632. doi: 10.7524/j.issn.0254-6108.2021032602

    ZHANG J C, ZHANG L, ZHUANG S L. Perspective of molecular initiating events in computational toxicology[J]. Environmental Chemistry, 2021, 40(9): 2629-2632 (in Chinese). doi: 10.7524/j.issn.0254-6108.2021032602

    [41] 谭皓月, 张荣, 陈钦畅, 等. 基于计算毒理的环境污染物-生物大分子的相互作用研究[J]. 科学通报, 2022, 67(35): 4180-4191. doi: 10.1360/TB-2022-0613

    TAN H Y, ZHANG R, CHEN Q C, et al. Computational toxicology studies on the interactions between environmental contaminants and biomacromolecules[J]. Chinese Science Bulletin, 2022, 67(35): 4180-4191 (in Chinese). doi: 10.1360/TB-2022-0613

    [42] PANEL ON CONTAMINANTS IN THE FOOD CHAIN (EFSA CONTAM PANEL) E F S A, SCHRENK D, BIGNAMI M, et al. Risk to human health related to the presence of perfluoroalkyl substances in food[J]. EFSA Journal. European Food Safety Authority, 2020, 18(9): e06223.
    [43] SHARMA R, KAMBLE S S, GUNASEKARAN A, et al. A systematic literature review on machine learning applications for sustainable agriculture supply chain performance[J]. Computers & Operations Research, 2020, 119: 104926.
    [44] PANSARI A, FAISAL M, JAMEI M, et al. Prediction of basic drug exposure in milk using a lactation model algorithm integrated within a physiologically based pharmacokinetic model[J]. Biopharmaceutics & Drug Disposition, 2022, 43(5): 201-212.
    [45] TAO T P, MASCHMEYER I, LeCLUYSE E L, et al. Development of a microphysiological skin-liver-thyroid Chip3 model and its application to evaluate the effects on thyroid hormones of topically applied cosmetic ingredients under consumer-relevant conditions[J]. Frontiers in Pharmacology, 2023, 14: 1076254. doi: 10.3389/fphar.2023.1076254
    [46] McNALLY K, LOIZOU G. Refinement and calibration of a human PBPK model for the plasticiser, Di-(2-propylheptyl) phthalate (DPHP) using in silico, in vitro and human biomonitoring data[J]. Frontiers in Pharmacology, 2023, 14: 1111433. doi: 10.3389/fphar.2023.1111433
    [47] NAJJAR A, PUNT A, WAMBAUGH J, et al. Towards best use and regulatory acceptance of generic physiologically based kinetic (PBK) models for in vitro-to-in vivo extrapolation (IVIVE) in chemical risk assessment[J]. Archives of Toxicology, 2022, 96(12): 3407-3419. doi: 10.1007/s00204-022-03356-5
    [48] MYUNG Y, de SÁ A G C, ASCHER D B. Deep-PK: Deep learning for small molecule pharmacokinetic and toxicity prediction[J]. Nucleic Acids Research, 2024, 52(W1): W469-W475. doi: 10.1093/nar/gkae254
    [49] ZHANG S Y, WANG Z Y, CHEN J W, et al. Multimodal model to predict tissue-to-blood partition coefficients of chemicals in mammals and fish[J]. Environmental Science & Technology, 2024, 58(4): 1944-1953.
    [50] ALGHARABLY E A, Di CONSIGLIO E, TESTAI E, et al. Prediction of in vivo prenatal chlorpyrifos exposure leading to developmental neurotoxicity in humans based on in vitro toxicity data by quantitative in vitro-in vivo extrapolation[J]. Frontiers in Pharmacology, 2023, 14: 1136174. doi: 10.3389/fphar.2023.1136174
  • 期刊类型引用(5)

    1. 邓威,翟健梁,赖淏,陆福洋,宗有杰,熊锐,关博文,常明丰. 微生物-碳化改性钢渣及其对水泥水化特性影响研究进展. 复合材料学报. 2025(01): 119-132 . 百度学术
    2. 王鹏伟,樊恒辉,任冠洲,谢非含,张星宇,霍江茹. 碳酸酐酶对仿岩溶碳酸氢钙生成速率的影响及其作用机理. 水利与建筑工程学报. 2025(01): 118-124+199 . 百度学术
    3. 王玉杰,张艳梅,栾金义,赵之平. 酶催化固碳过程及其强化技术研究进展. 化工进展. 2024(01): 232-245 . 百度学术
    4. 谢昕,王春辉,于荣珍,徐恒,周昊,孙志明,王建兵. CO_2干式生物甲烷化试验研究. 能源环境保护. 2024(03): 109-116 . 百度学术
    5. 刘鹏,曹源兴,程钰,白云波. 碳酸酐酶增强微生物矿化固土效果的试验研究. 岩土力学. 2024(09): 2554-2564 . 百度学术

    其他类型引用(0)

  • 加载中
    Created with Highcharts 5.0.7访问量Chart context menu近一年内文章摘要浏览量、全文浏览量、PDF下载量统计信息摘要浏览量全文浏览量PDF下载量2024-052024-062024-072024-082024-092024-102024-112024-122025-012025-022025-032025-04012345Highcharts.com
    Created with Highcharts 5.0.7Chart context menu访问类别分布DOWNLOAD: 3.7 %DOWNLOAD: 3.7 %HTML全文: 94.9 %HTML全文: 94.9 %摘要: 1.4 %摘要: 1.4 %DOWNLOADHTML全文摘要Highcharts.com
    Created with Highcharts 5.0.7Chart context menu访问地区分布其他: 99.5 %其他: 99.5 %北京: 0.2 %北京: 0.2 %吴忠: 0.1 %吴忠: 0.1 %漯河: 0.1 %漯河: 0.1 %长沙: 0.2 %长沙: 0.2 %其他北京吴忠漯河长沙Highcharts.com
图( 5)
计量
  • 文章访问数:  1180
  • HTML全文浏览数:  1180
  • PDF下载数:  47
  • 施引文献:  5
出版历程
  • 收稿日期:  2024-07-11
  • 录用日期:  2024-09-14
  • 刊出日期:  2025-03-27
赵雅萱, 杨道远, 黄美玲, 隋海霞, 庄树林. 下一代计算毒理学在食品安全风险评估中的应用[J]. 环境化学, 2025, 44(3): 756-763. doi: 10.7524/j.issn.0254-6108.2024071107
引用本文: 赵雅萱, 杨道远, 黄美玲, 隋海霞, 庄树林. 下一代计算毒理学在食品安全风险评估中的应用[J]. 环境化学, 2025, 44(3): 756-763. doi: 10.7524/j.issn.0254-6108.2024071107
ZHAO Yaxuan, YANG Daoyuan, HUANG Meiling, SUI Haixia, ZHUANG Shulin. The application of next-generation computational toxicology in food safety risk assessment[J]. Environmental Chemistry, 2025, 44(3): 756-763. doi: 10.7524/j.issn.0254-6108.2024071107
Citation: ZHAO Yaxuan, YANG Daoyuan, HUANG Meiling, SUI Haixia, ZHUANG Shulin. The application of next-generation computational toxicology in food safety risk assessment[J]. Environmental Chemistry, 2025, 44(3): 756-763. doi: 10.7524/j.issn.0254-6108.2024071107

下一代计算毒理学在食品安全风险评估中的应用

    通讯作者: Tel:010-52165562, 0571-88982344,E-mail:suihaixia@cfsa.net.cnshulin@zju.edu.cn
  • 1. 士壤污染防治与安全全国重点实验室,浙江大学环境与资源学院,杭州,310058
  • 2. 卫生健康委食品安全风险评估重点实验室,国家食品安全风险评估中心,北京,100022
基金项目:
国家重点研发计划项目(2023YFF1103900)和国家自然科学基金(22136001,32372445)资助.

摘要: 随着人工智能的迅速发展,基于机器学习和深度学习的下一代计算毒理学(Next-Generation Computational Toxicology,NGCT)逐渐兴起. NGCT通过整合化学、毒理学和系统生物学等多模态大数据,实现对化学物属性和毒性的高通量预测,克服了传统风险评估方法的局限性,推动了化学物的高通量风险评估. 本文总结了NGCT在融合分子交互特征、预测化学物属性和暴露数据、以及食品安全风险评估领域的应用. 鉴于大语言模型对研究新范式的推动,进一步展望了大语言模型在食品安全领域自然语言处理、预测分析和决策制定方面的潜力,并简述了基于NGCT的食品安全风险评估新范式.

English Abstract

  • 当前人工合成化学物被大量生产使用,给食品安全风险评估带来严峻挑战. 传统的化学物风险评估数据主要依赖于动物试验及体外试验等各类测试方法,但测试成本、试验周期、动物伦理以及“3R”原则的限制,导致了无法开展高通量、快速的风险评估. 随着毒理学测试方法的发展和风险评价策略的调整,2007年美国国家研究委员会提出“21 世纪的毒性试验:愿景与策略”(Toxicity Testing in the 21st Century: A Vision and a Strategy),强调了未来化学物毒性测试应借助计算毒理学和基于人源细胞、细胞系或细胞组分体外测试的组合方法[1],即新策略方法(New Approach Methodologies,NAMs),包括我国在内的很多国家和国际组织正在开展下一代风险评估技术研发[25],而NAMs是下一代风险评估的技术支持.

    随着人工智能(Artificial Intelligence,AI)的快速发展,基于机器学习(Machine Learning,ML)和深度学习(Deep Learning,DL)的下一代计算毒理学(Next-Generation Computational Toxicology,NGCT)逐渐兴起(图1),为化学物的高通量测试提供技术支撑[6]. NGCT通过挖掘化学、毒理学、医学、多组学、系统生物学等在内的多模态大数据,对化学物的各类属性以及毒性等进行高通量预测. 目前NGCT被逐渐用于开发化学物风险评估的NAMs[7],美国食品和药品管理局关于建模和仿真的相关报告中重点强调了NAMs的应用,如基于生理的动力学模型(Physilogically Based Kinetics,PBK)建模、定量构效关系(Quantitative Structure-Activity Relationship,QSAR)分析、交叉参照分析(Read Across)用于风险评估的概率和统计建模等. 为进一步促进NGCT在化学物风险评估中的应用,本文介绍NGCT主要方法及其在食品安全风险评估中的应用,为化学物安全风险评估研究提供借鉴.

    • ML和DL在食品安全领域具有多种用途,常被用于预测食品安全风险. 随着AI的快速发展和大型数据库的建设,基于ML和DL的预测方法整合了多种NAMs,在化学物风险评估中发挥重要作用,近年关于机器学习的食品安全风险评估研究论文数量持续增加(图2).

      ML和DL模型被广泛用于食品及食品相关化学物的安全性评估[8],可用于构建针对外源性化学物暴露的毒性筛查模型,包括贝叶斯网络[9]、神经网络[10,11]、支持向量机[12]和决策树[13,14]等算法常被用于食品安全风险分析及预警. 针对食品添加剂的潜在神经毒性,基于神经网络的ML模型建立了通用的食品有害因素分类评估分数,为大规模进行食品中具有神经毒性物质的风险评估提供有效手段[15]. 基于DL开发的DeepCarc模型运用碱基分类选择策略,实现了高准确率的化合物致癌风险优先级的筛选[16]. 通过亚临床和癌症前期阶段获得的数据构建ML模型,将有助于建立与饮食和儿童患传染性单核细胞增多症的关联,确定食品加工过程中产生的具有不良作用的化合物摄入的风险阈值[17]. 针对食品及食品添加剂的危害水平预测,将基于膳食暴露评估和暴露限值建立的风险评估模型,以及熵权-层次分析法计算食品中化学成分的风险值,进一步利用反向传播神经网络建立安全风险预警模型,预测食品的生产和加工过程是否存在安全风险,从而从源头上进行管控.

      AI可结合电子鼻、电子舌、气相色谱-质谱、质谱代谢组学技术等检测方法,用于食品安全质量分析,特别是食品中特定成分或污染物的追踪[18]. 基于贝叶斯框架的稳定同位素混合模型通过建立同位素指纹、化学指纹等分析食品样品中的稳定同位素比例,实现食品中痕量污染物的溯源. 基于神经网络的稳定同位素混合模型,可以预测出不同品种、产地蜂蜜的地理来源,准确率达90%以上[19]. 针对食品中痕量或微量的化学残留分析,稳定同位素混合模型结合质谱分析技术可检测食物中的残留农药和未公开的添加剂[20],并对其空间分布进一步预测[21],这为食品添加剂的监管提供了技术支撑.

    • QSAR是基于化学物分子结构与生物活性/毒性建立的定量关系(图3). 数据集及分子特征描述的限制导致QSAR模型的应用域及泛化能力有限[22],而基于ML/DL的QSAR模型能够完全由数据驱动,数据量越大,模型的预测能力越强. 随着高通量试验的快速发展,大量的测试数据可用于训练深度QSAR模型[23].

      随着AI的快速发展,围绕受体相关的关键分子靶点,利用化学物与受体分子交互作用的数据信息,可构建基于ML的QSAR模型[24]. 目前,基于ML/DL的QSAR模型已经用于食品-药物相互作用[25]、受体的结合活性[26-27]、肝脏毒性[28]及其他多种毒性终点的预测[29-30],在食品安全风险评估中显示出巨大应用前景.

      ML/DL及QSAR模型常在数据量充足时表现出良好的预测性能,当化学物数据不足时,通常采用Read-Across作为数据缺口填补方法,用于预测目标物质的相同终点[31]. 基于ML的Read-Across工具能够估计所选结构特征的相关性[32],实现小型数据集上的高准确率预测效果. 将Read-Across集成到基于ML的QSAR模型中,通过数据融合为每种化学物质构建基于相似性的大型特征向量,结合QSAR和Read-Across的优点,使用多种相似性规则进行计算和加权,提高了模型的预测效率、可靠性和可解释性[33]. 如定量跨结构活性关系模型,使用最小二乘法消除了描述符之间的关联,且采用了ML方法对超参数进行优化,实现了高准确度的化学物心脏毒性预测[34]. 基于ML的Read-Across方法有助于解决相似性假说的不确定性,提高论据的充分性和可靠性、判断证据权衡结果是否明确已被广泛应用于化学物风险评估[35].

    • 分子动力学(Molecular Dynamics,MD)模拟用于识别化学物质和生物大分子间的动态分子交互作用,为化学物风险评估提供更为全面的相互作用信息[36]. 分子模拟技术由于受到计算资源和算法的限制,精度和效率通常难以兼得,而将ML模型引入到分子动力学模拟中,能够在满足第一性原理精度的同时,计算速度媲美经验式模型,满足快速、低成本且高通量的预测要求(图4).

      研究污染物与受体的交互作用有利于从蛋白质分子水平识别分子起始事件(Molecular initiation events,MIE),有利于深入了解MIE、关键事件(Key events,KE)和有害结局(Adverse outcome,AO)的关联,促进深入了解污染物毒性作用机制. 基于ML/DL的蛋白质-配体相互作用预测目前已显示出巨大的潜力[37]. 基于图学习的自适应机器能够适应多类数据集,比传统的分子动力学模拟展现出更好的预测性能[38];基于X射线结构中蛋白质-配体相互作用信息,利用六种图神经网络算法构建的模型准确预测了配体的亲和力[39]. 目前,AlphaFold 3模型在蛋白质-配体相互作用方面的预测性能皆优于其他传统分子模拟方法,能够预测包括蛋白质、核酸和小分子及多种复合物的结构,为化学物和受体相互作用研究提供更加准确全面的受体结构信息. 通过基于ML的原子间相互作用建模对食品成分及添加剂中的分子进行精确模拟,有利于预测由外源化合物暴露导致的内源性小分子的相互作用以及对人体健康的潜在影响[40].

      随着大规模计算资源的持续增加,针对大量化学物开展MD模拟逐渐普及[41]. 基于分子交互作用信息,加强多模态数据扩充,构建融合MD重要特征的ML/DL预测模型,成为当前研究的新方法. 强化ML和MD领域之间的联合应用,构建集成式分子模拟及结构预测的综合性平台,将是人工智能与分子物理交叉领域荟萃方法的全新变革.

    • PBK模型可根据器官或组织内化学物及其代谢物浓度的时间变化,评估其在人体内的分布,模拟肝脏等代谢转化功能,提供毒物在体内的生物转化数据(图5). 在评估食品安全时,通过化学-生物相互作用的机理获得相关剂量-反应数据,借助PBK模型来预测人体体内的暴露量,最后进行风险表征.

      PBK模型广泛用于预测特定人群通过食品摄入化学物质的暴露量,可预测化学物质在动物及人体内的分布和浓度,包括在血液、组织、乳汁等中的水平[4244]. 欧洲食品安全局对食品中全氟烷基化合物对人类健康的风险进行评估时使用了PBK模型[42],能准确预测人类器官浓度-时间曲线、药代动力学行为和化学物的每日摄入剂量. PBK模型还能用于经由膳食摄入的化学物质到人体内浓度的推导[43],如预测乳汁中的化学物暴露,预测目标化合物的母体血浆暴露量和婴儿日摄入量[44].

      传统的PBK模型受到动物试验伦理和低通量的限制,难以推广使用. 基于AI建模的下一代PBK模型克服了传统模型的技术瓶颈问题,可广泛应用于高通量化学物风险评估. 基于微生理系统的PBK模型用于皮肤-肝脏-甲状腺模型的开发,通过研究微流体循环连接的“器官”间的相互作用,预测几种典型的化学物在特定器官中的暴露[45],通过由皮肤和肝脏中的代谢及甲状腺激素表征化学物的生物效应. 与普通PBK模型相比,基于AI的PBK模型能够进一步预测器官水平的化学物质暴露,定性及定量描述化学物在体内的生物转化数据. 目前,通过使用计算机模拟、体外和人体生物监测数据对化学物的人体PBK模型进行细化和校准[46],极大促进从机制上理解食品安全风险,并提高预测结果的准确性.

      定量危害表征依赖于对体外试验读数的解释,这需基于体外基准浓度将体外浓度-效应数据外推至体内剂量-效应数据,即定量体外-体内外推(Quantitative in vitro to in vivo Extrapolation,QIVIVE),通过体外组学数据预测体内毒性,区别于传统的动物实验,更加符合下一代风险评估的要求. 基于AI的PBK模型整合了关于化学物在人体或生物体中的吸收、分布、代谢和排泄的知识,成为体外-体内外推的有效工具,能够实现跨物种、途径和各种暴露情景预测[47]. 基于深度学习的Deep-PK模型能够识别影响化合物属性的关键分子区域,其在分子层面上的识别和预测性能远超常规的生理动力学模型[48]. 基于人工神经网络并融合化学物质文本描述和结构信息的多模态模型,能够实现同时预测不同物种、组织、测量方法和血液基质的组织-血液分配系数,为化学物内暴露评估提供了有效手段[49]. 将QIVIVE用于化学物的暴露,能够帮助深入理解化学物毒性的分子机制[50].

    • 大量人工合成化学物被生产、投入使用并不断产生相关测试新数据,亟需为其开发通用的评估模型. 包括我国在内的很多国家和国际组织正在探索下一代风险评估方法,将整合有关分子系统生物学的信息纳入未来的风险评估范畴. NGCT将海量多模态数据有机整合,可实现对于化学物多种性质的高通量预测,揭示化学物质如何在生物体内引发不良健康效应,为食品安全风险评估提供深层次的机制性理解,能够推动化学物食品安全风险评估研究新范式的建立. 目前大语言模型(Large Language Model,LLM)在提取和整合高通量数据上表现突出,能够处理来自高通量筛选、组学、生物信息学和其他来源的大量复杂数据,其中垂直大模型能够专注于特定领域的数据处理和分析,通过自然语言处理技术更深层次地理解、整合并分析多模态数据,训练数据中的模式和关系,对新化学物的行为进行高精度预测,将促进化学物风险评估的变革性发展. 未来需要进一步结合LLM在自然语言处理、预测分析和决策制定方面的先进能力,提高风险评估的准确性和透明度.

    参考文献 (50)

返回顶部

目录

/

返回文章
返回