网刊加载中。。。

使用Chrome浏览器效果最佳,继续浏览,你可能不会看到最佳的展示效果,

确定继续浏览么?

复制成功,请在其他浏览器进行阅读

基于XGBoost方法的常见人体农兽药及化学污染物暴露与糖尿病的相关性研究  PDF

  • 卢宇红 1
  • 李孜孜 2
  • 刘芝霖 1
  • 苏畅 2
  • 王惠君 2
  • 张兵 2
  • 侯艳 3
1. 北京大学公共卫生学院生物统计系,北京 100041; 2. 中国疾病预防控制中心营养与健康所/国家卫生健康委微量元素与营养重点实验室,北京 100050; 3. 北京大学公共卫生学院生物统计系/北京大学临床 研究所,北京 100041

中图分类号: R155

最近更新:2023-08-14

DOI:10.13590/j.cjfh.2023.05.003

  • 全文
  • 图表
  • 参考文献
  • 作者
  • 出版信息
EN
目录contents

摘要

目的

基于Lasso变量筛选和XGBoost模型探讨人体农兽药及化学污染物暴露水平与糖尿病患病风险相关性。

方法

2018—2019年,在中国石家庄和杭州进行的“降低成年超重者营养相关慢性病风险的适宜身体活动量研究”调查,选取86例糖尿病患者与410例非糖尿病患者样本并提取问卷调查中个人基本情况数据、体格测量、血生化数据和血清农兽药及化学污染物暴露浓度数据。采用Lasso筛选变量,再分别引入逻辑回归模型与XGBoost模型进行拟合,比较AUC评估拟合效果,并进行变量重要性排序。

结果

Lasso筛选出2-乙基己基二苯基磷酸酯、全氟辛酸与全氟十一烷酸3种农兽药及化学污染物暴露与人群糖尿病患病有关,重要性排序为全氟辛酸>2-乙基己基二苯基磷酸酯>全氟十一烷酸,XGBoost模型(AUC=0.83)显著优于逻辑回归模型(AUC=0.64)(P<0.05)。

结论

Lasso适用于糖尿病患病影响因素的筛选,且XGBoost模型具有较好的复杂数据拟合能力。2-乙基己基二苯基磷酸酯、全氟辛酸与全氟十一烷酸是人群糖尿病患病的重要影响因素。

糖尿病是人群胰岛B细胞分泌功能失调引起的胰岛素分泌减少,进而导致血糖升高及一系列脂肪、蛋白质、碳水化合物的代谢紊乱症状,并最终造成慢性健康损

1。2017年国际糖尿病联盟的统计数据显示,我国糖尿病患病率逐年升高,目前患病人数达到1.14亿人,高居世界第一,由此也带来了沉重的社会经济负2。糖尿病的影响因素除了遗传、肥胖、高血压、生活方式、年龄等常见因素以外,人体中的农兽药及化学污染物暴露可能也会影响血糖的代3。我国作为农兽药生产与使用大国,虽然国家出台相关使用标准予以限制,但人体长期暴露于低毒混合农兽药污染环境下仍可能对身体健康造成损4。目前农兽药与人群健康的相关研究多聚焦于农兽药的急性毒性方面,其与糖尿病等慢性病的相关研究较为缺乏,同时在农兽药的生产使用中伴随产生的其他化学污染物暴露也值得关注。

近年来,在卫生健康领域使用机器学习方法开展数据挖掘等工作的应用已经越来越普及,相比于传统的统计方法,机器学习在如何更好地对非线性数据关系的变量进行拟合优化方面具有独特的优势,也已成为大数据时代的重要统计分析工具。本研究采用Lasso(Least Absolute Shrinkage Selection Operator)进行变量筛选,并使用逻辑回归模型与机器学习中XGBoost(eXtreme Gradient Boosting)模型进行建模与预测,分析农兽药及化学污染物暴露与糖尿病之间的关联,为流行病学中相关问题提供参考。

1 材料与方法

1.1 数据来源

本研究来自2018—2019年中国疾病预防控制中心营养与健康所、河北医科大学及浙江省疾病预防控制中心协作开展的“降低成年超重者营养相关慢性病风险的适宜身体活动量研究”的调查数据。该调查采取问卷调查与实验室检查结合的方式,在中国的南北方各选取了一个城市(石家庄与杭州),并在每个城市选择两个社区进行调查,共确定了496名40~66岁的成年居民作为研究对象。该项目已获得中国疾病预防控制中心营养与健康研究所的伦理批准(编号2019-023),研究前每位参与者都签署了知情同意书。

1.2 调查方式与内容

所有调查问卷都由工作人员现场进行询问、讲解并完成填写。问卷调查表包括受试者性别、年龄、文化程度等基本情况信息以及吸烟、饮酒等生活方式信息。体格测量由工作人员为所有受试者进行测量,其中身高测量采用SECA206量高卷尺,体质量测量采用SECA877体重秤。身体质量指数(Body mass index,BMI)=体质量/身2(kg/m2)。血糖采用己糖激酶法测定、血清甘油三酯采用酶测定,血清总胆固醇采用胆固醇氧化酶法测定,胰岛素采用电化学方法测定。血清中各种农兽药及化学污染物暴露浓度使用高效液相色谱-质谱联用方法测定。

1.3 判定标准

BMI在18.5~24 kg/m2为正常,24 kg/m2以上为超重或肥胖。糖尿病通过问卷结果和空腹血糖值综合评定,根据《中国2型糖尿病防治指南(2020年版)》将血糖值≥6.1 mml/L或问卷回答为糖尿病的参与者纳入患者

5。按照《中国成人血脂异常防治指南(2016年修订版)》的标准,甘油三酯≥2.26 mmol/L为偏高,总胆固醇≥5.2 mmol/L为偏6。血清胰岛素>15 mU/L判断为偏7。对农兽药及化学污染物暴露按检出率进行了整理,将检出率大于30%的农兽药及化学污染物暴露纳入分8

1.4 质量控制

所有调查人员都必须参与培训,通过考核的调查员才能参与调查和数据收集工作。研究设备由国家项目组负责采购和配送,采用统一的调查问卷进行询问。调查过程中由专项负责人在现场进行抽查,核对数据并检查问卷的错误及遗漏,协同调查人员完成工作。农兽药浓度测定时加入标准化血清样本作质量控制。

1.5 统计学分析

用均值法插补缺失值,有序分类变量按顺序赋值。对于基线变量,其中性别、BMI、吸烟、饮酒、甘油三酯等二分类选项赋予0与1的值,受教育程度和生活质量自评,分别赋予0~2和0~3的值,对于年龄直接纳入数字进行分析。对于农兽药及化学污染物暴露变量,将低于检出限的样本分为低于检出限组,检出限以上再按中位数分为低浓度组和高浓度组。将浓度进行对数转化,以进一步排除异常值的影响,并直接使用数值进行下一步分析。在Lasso变量筛选后,使用传统的逻辑回归模型分别对基线变量与所有变量进行拟合,强调农兽药及化学污染物暴露在预测中的作用,再使用XGBoost模型对所有变量进行拟合。为避免对数据的过拟合,将所有样本按7∶3划分为训练集和测试集,在训练数据上做五折交叉验证。测试集上的ROC曲线下面积(Area under curve,AUC)用于评定效果。对XGBoost模型中变量(机器学习中称为特征)按重要性进行排序,分析农兽药及化学污染物暴露与基线变量对糖尿病预测准确性的影响程度。本研究采用python 3.9作为分析软件,使用pandas模块进行预处理,使用sklearn模块进行模型的构建与拟合,使用GridSearchCV模块对模型参数自动进行调整,提高模型性能。检验水平α=0.05,双侧P<0.05表示差异具有统计学意义。

2 结果

2.1 基本情况

调查总共获得496份样本,其中86人患有糖尿病,定义为糖尿病组,余410人为非糖尿病组。调查对象基本情况见表1。糖尿病组中男性占比为60.5%(52/86),非糖尿病组中男性占比为43.2%(177/410)。样本平均年龄为50.6±5.7岁,糖尿病组平均年龄为51.6±5.6岁,略高于非糖尿病组的50.4±5.8岁。本研究共对106种农兽药及化学污染物暴露进行了检测,其中有11种农兽药及化学污染物暴露检出率大于30%,并纳入后续分析,其包括:咪鲜胺(Prochloraz)、多西环素(Doxycycline)、呋喃它酮(Furaltadone)、4-氯苯氧乙酸(4-Chlorophenoxyacetate,4-CPA)、2-乙基己基二苯基磷酸酯(2-Ethylhexyl diphenyl phosphate,EHDPP)、全氟辛酸(Perfluorooctanoic acid,PFOA)、全氟壬酸(Perfluorononanoic acid,PFNA)、全氟癸酸(Perfluorodecanoic acid,PFDA)、全氟己烷磺酸(Perfluorohexane sulfonate,PFHxS)、全氟辛烷磺酸(Perfluorooctane sulfonate,PFOS)、全氟十一烷酸(Perfluoroundecanoic acid,PFUdA),农兽药及化学污染物暴露的分布情况见表2,其中PFHxS和PFOS在所有参与者体内均被检测到。

表 1  调查对象基本情况
Table 1  Basic information of participants
变量糖尿病组(n=86)非糖尿病组(n=410)合计(n=496)
性别
34(39.5) 233(56.8) 267(53.8)
52(60.5) 177(43.2) 229(46.2)
年龄/岁 51.6±5.6 50.4±5.8 50.6±5.7
BMI/(kg/m2
正常 10(11.6) 46(11.2) 56(11.3)
超重/肥胖 76(88.4) 364(88.8) 440(88.7)
吸烟
36(41.9) 108(26.3) 144(29.0)
50(58.1) 302(73.7) 352(71.0)
饮酒
62(72.1) 253(61.7) 315(63.5)
24(27.9) 157(38.3) 181(36.5)
甘油三酯/(mmol/L)
正常 47(54.7) 302(73.7) 349(70.4)
偏高 39(45.3) 108(26.3) 147(29.6)
胰岛素/(mU/L)
正常 56(65.1) 323(78.8) 379(76.4)
偏高 30(34.9) 87(21.2) 117(23.6)
总胆固醇/(mmol/L)
正常 48(55.8) 263(64.1) 311(62.7)
偏高 38(44.2) 147(35.9) 185(37.3)
受教育程度
初中及以下 20(23.3) 79(19.3) 99(20.0)
高中及中专 39(45.3) 127(31.0) 166(33.5)
大学及以上 27(31.4) 204(49.8) 231(46.6)
生活质量自评
较差 17(19.8) 109(26.6) 126(25.4)
一般 48(55.8) 187(45.6) 235(47.4)
良好 19(22.1) 112(27.3) 131(26.4)
优越 2(2.3) 2(0.5) 4(0.8)

注:  年龄使用平均数±标准差表示,其余变量使用频数(频率)表示

表 2  11种检出率高于30%的农兽药及化学污染物暴露分布情况[n(%)]
Table 2  Exposure distribution of 11 agricultural and veterinary drugs and chemical pollutants with detection rates higher than 30% [n(%)]
变量糖尿病组(n=86)非糖尿病组(n=410)合计(n=496)
咪鲜胺
<LOD 50(58.1) 275(67.1) 325(65.5)
低浓度 17(19.8) 68(16.6) 85(17.1)
高浓度 19(22.1) 67(16.3) 86(17.3)
多西环素
<LOD 42(48.8) 176(42.9) 218(44.0)
低浓度 22(25.6) 117(28.5) 139(28.0)
高浓度 22(25.6) 117(28.5) 139(28.0)
呋喃它酮
<LOD 56(65.1) 209(51.0) 265(53.4)
低浓度 7(8.1) 108(26.3) 115(23.2)
高浓度 23(26.7) 93(22.7) 116(23.4)
4-氯苯氧乙酸
<LOD 66(76.7) 231(56.3) 297(59.9)
低浓度 11(12.8) 88(21.5) 99(20.0)
高浓度 9(10.5) 91(22.2) 100(20.2
2-乙基己基二苯基磷酸酯
<LOD 43(50.0) 296(72.2) 339(68.3)
低浓度 18(20.9) 60(14.6) 78(15.7)
高浓度 25(29.1) 54(13.2) 79(15.9)
全氟辛酸
<LOD 0(0.0) 2(0.5) 2(0.4)
低浓度 77(89.5) 170(41.5) 247(49.8)
高浓度 9(10.5) 238(58.0) 247(49.8)
全氟壬酸
<LOD 41(47.7) 109(26.6) 150(30.2)
低浓度 38(44.2) 135(32.9) 173(34.9)
高浓度 7(8.1) 166(40.5) 173(34.9)
全氟癸酸
<LOD 42(48.8) 103(25.1) 145(29.2)
低浓度 39(45.3) 136(33.2) 175(35.3)
高浓度 5(5.8) 171(41.7) 176(35.5)
全氟己烷磺酸
<LOD 0(0.0) 0(0.0) 0(0.0)
低浓度 51(59.3) 197(48.0) 248(50.0)
高浓度 35(40.7) 213(52.0) 248(50.0)
全氟辛烷磺酸
<LOD 0(0.0) 0(0.0) 0(0.0)
低浓度 52(60.5) 196(47.8) 248(50.0)
高浓度 34(39.5) 214(52.2) 248(50.0)
全氟十一烷酸
<LOD 79(91.9) 217(52.9) 296(59.7)
低浓度 7(8.1) 93(22.7) 100(20.2)
高浓度 0(0.0) 100(24.4) 100(20.2)

注:  <LOD表示低于检测限;检出限以上按中位数分为低浓度组和高浓度组

2.2 Lasso变量筛选

Lasso通过在模型损失函数中添加惩罚项将不够重要的变量系数收缩为零达到筛选变量的目

9,增大惩罚项系数(以下简称惩罚值)可以减少选择的变量个数(图1),筛选后的变量能提供更高的分类准确10。GridSearchCV模块可以根据交叉验证的平均AUC自动挑选最优惩罚值,结果显示惩罚值为0.07时AUC最高。Lasso筛选出的非农兽药及化学污染物暴露变量为受教育程度、甘油三酯、胰岛素和生活质量自评;农兽药残留变量分别为PFOA、PFUdA和EHDPP。

图 1  模型保留变量数随惩罚值变化

Figure 1  The change of number of variables retained in model as the penalty

2.3 拟合结果

将Lasso筛选后的7个变量分类为基线变量与农兽药及化学污染物暴露变量,首先使用基线变量建立逻辑回归模型,测试集上的AUC为0.64。接着使用所有变量建立逻辑回归模型,测试集上AUC为0.78,预测效果上升,提示3种农兽药及化学污染物暴露在糖尿病的预测中起到明显作用。最后将所有变量导入XGBoost建模,在测试集上得到了0.83的AUC,进一步提高了预测效果,表明XGBoost更加适合拟合农兽药及化学污染物暴露与糖尿病的关系。3个模型ROC曲线的比较见图2。XGBoost的特征重要性排序见图3,结果显示农兽药及化学污染物暴露中,全氟辛酸、2-乙基己基二苯基磷酸酯在糖尿病预测模型中有重要影响,对预测准确性的贡献甚至超过了某些基线变量。

图 2  基于基线变量逻辑回归模型与基于所有变量的逻辑回归模型及XGBoost模型ROC曲线比较

Figure 2  Comparison of ROC curve among logistic regression based on baseline variables, XGBoost and logistic regression based on all variables

图 3  XGBoost特征重要性排序

Figure 3  Ranking of feature importance in XGBoost model

3 讨论

Lasso结果显示,PFOA、PFUdA和EHDPP三种农兽药及化学污染物暴露与糖尿病相关性较高。PFOA、PFUdA同属全氟烷基酸化合物(Per- and polyfluoroalkyl substances,PFAS),常用于烹饪设备、食品包装、防水防污织物处理以及农药加工过程中的添加

11。PFAS自二战后就在全球大量使用,不易降解的特性使其在环境中大量蓄积,在饮用12及大部分普通人群的血清13都能检测到PFAS。PFAS也是本研究检出率和检出种类最多的一类物质,反映了人类处于PFAS广泛暴露下的现状。流行病学研究显示PFOA等PFAS与糖尿病及相关代谢物存在关联,如美国全国健康和营养检查调查的结果发现PFOA与糖尿病患病率之间存在很强的正相14。动物研究表明,PFAS通过影响肝脏中的PI3K-AKT信号通路减少肝糖原合成,抑制糖异生并诱导胰岛素超敏反应,破坏葡萄糖稳15。此外,由于PFAS影响人体多种代谢调控机制,其与高血16、高尿17、高脂血18等慢性病同样存在相关性。用作阻燃剂和包装材料的EHDPP,虽然没有其与糖尿病相关的直接证据,但在鸡胚胎肝细胞的研究中发现,EHDPP会影响细胞葡萄糖代谢相关基因与通路,使肝细胞的糖异生和糖原分解出现异常,导致葡萄糖代谢失19。农兽药本身及其生产使用中伴随产生的其他化学污染物暴露与糖尿病的关联及作用机制还需要更多的研究。

除了农兽药及化学污染物暴露的影响,甘油三酯、胰岛素水平、受教育程度和生活质量自评也与糖尿病正相关。研究表明,糖异生与脂质代谢相关联,糖尿病会引起肝的糖脂代谢改变,使血脂异常成为糖尿病的常见并发

20。脂肪组织中甘油三酯异常积累,而异位脂肪存储也会促进糖尿病的发展,两者相互影21。胰岛素分泌减少是2型糖尿病的直接原因,因此变量重要性排序显示胰岛素水平是最重要的变量。但胰岛素及其类似物也是糖尿病的治疗药22,所以糖尿病患者体内可能存在外源胰岛素,使得胰岛素水平并不能完全预测糖尿病的发生。

受教育程度越高,了解糖尿病相关知识越多,有助于人们有意识地采取各种措施,预防糖尿病的发生。社会经济的发展提高了人们的生活质量,同时也使不少人养成了不健康的生活习惯,如过多的营养素摄入、较少的体力活动、更多的视屏时间,这些行为都是糖尿病的危险因素。此外,一些常见的影响因素如年龄、性别等可能是研究的潜在混杂因素,在纳入Lasso进行变量筛选后,发现其对于预测的重要性不如现存变量,去除这些混杂因素能够更清晰地分析农兽药及化学污染物暴露等变量与糖尿病的关联。

逻辑回归模型是解决二分类问题的经典广义线性模型,但农兽药及化学污染物暴露与糖尿病的关系并不是简单的线性关系,在变量数较多的情况下,要正确找出所有交互项加入模型也十分困难,导致逻辑回归模型难以达到较好的拟合效果。因此本研究使用了拟合能力更强的XGBoost模型,XGBoost作为梯度提升决策树(Gradient boosting decision tree,GBDT)的一种,通过优化可学习的弱分类器来提高模型的准确性,代价函数中加入的正则项一定程度上解决了GBDT的过拟合问题,使模型具有较好的泛化能

23,同时拥有更快的运行速度与更高的灵活性。对于拟合能力更好的神经网络,其往往需要大量的样本进行训练,而在中小型数据中XGBoost具有更好的效果,基于决策树的算法也比神经网络拥有更好的解释性,可以在拟合非线性复杂关系的同时对变量的重要性进行排序,这对于实施有效的干预与决策非常重要。此外,在对线性回归影响较大的异常值和噪声方面,XGBoost也具有较好的鲁棒性。本研究保留了传统的逻辑回归模型进行对比,AUC从0.64增加到0.78,证明农兽药及化学污染物暴露变量可以有效提升预测效果,而在拟合所有变量时AUC从0.78增加到0.83展现了XGBoost模型具有更强的区分能力,更适合应用于非线性复杂数据的建模问题。

本研究存在一定的局限性,研究样本仅来自于两个城市,而农兽药及化学污染物暴露受地域影响较大,仅采用两个城市的样本数据并不能很好地展示农兽药及化学污染物暴露的真实分布,增加取样地点有利于提高结果的准确度和泛化性。由于没有足够证据表明EHDPP与糖尿病直接相关,我们应谨慎对待该结论,最终筛选出的农兽药及化学污染物暴露依然需要相关的研究进一步验证。鉴于PFAS的广泛暴露与健康危害,相关部门应考虑给予其足够的重视。本研究获得的模型AUC值较高,具备较好的区分能力,因此本研究能够为糖尿病的预防工作提供重要科学依据,为机器学习方法在流行病学研究中的应用提供参考,同时也为探索农兽药及化学污染物暴露对身体健康的影响提供了有效的科研方法与思路。

参考文献

1

MAYFIELD J. Diagnosis and classification of diabetes mellitus: New criteria[J]. American Family Physician1998586): 1355-1362, 1369-1370. [百度学术] 

2

LUO ZFABRE GRODWIN V G. Meeting the challenge of diabetes in China[J]. International Journal of Health Policy and Management202092): 47-52. [百度学术] 

3

MA R C W. Epidemiology of diabetes and diabetic complications in China[J]. Diabetologia2018616): 1249-1260. [百度学术] 

4

KIM K HKABIR EJAHAN S A. Exposure to pesticides and the associated human health effects[J]. Science of the Total Environment2017575525-535. [百度学术] 

5

中华医学会糖尿病学分会. 中国2型糖尿病防治指南(2020年版)[J]. 国际内分泌代谢杂志20215): 482-548. [百度学术] 

Chinese Diabetes Society. Guideline for the prevention and treatment of type 2 diabetes mellitus in China (2020 edition)[J]. International Journal of Endocrinology and Metabolism20215): 482-548. [百度学术] 

6

诸骏仁高润霖赵水平. 中国成人血脂异常防治指南(2016年修订版)[J]. 中国循环杂志20163110): 937-953. [百度学术] 

ZHU J RGAO R LZHAO S Pet al. 2016 Chinese guideline for the management of dyslipidemia in adults[J]. Chinese Circulation Journal20163110): 937-953. [百度学术] 

7

康怡张宝和徐洪涛. 北京市部分中老年男性高胰岛素血症患者代谢紊乱及胰岛功能评估[J]. 首都医科大学学报2016373): 385-390. [百度学术] 

KANG YZHANG B HXU H Tet al. Evaluation of metabolic disorders and pancreatic islet function in aged male patients with hyperinsulinemia in Beijing[J]. Journal of Capital Medical University2016373): 385-390. [百度学术] 

8

YOU LZHENG F JSU Cet al. Metabolome-wide association study of serum exogenous chemical residues in a cohort with 5 major chronic diseases[J]. Environment International2022158106919. [百度学术] 

9

KANG C ZHUO Y HXIN L Het al. Feature selection and tumor classification for microarray data using relaxed Lasso and generalized multi-class support vector machine[J]. Journal of Theoretical Biology201946377-91. [百度学术] 

10

KHAIRE U MDHANALAKSHMI R. Stability of feature selection algorithm: A review[J]. Journal of King Saud University- Computer and Information Sciences2022344): 1060-1073. [百度学术] 

11

MITRO S DLIU J XJAACKS L Met al. Per- and polyfluoroalkyl substance plasma concentrations and metabolomic markers of type 2 diabetes in the Diabetes Prevention Program trial[J]. International Journal of Hygiene and Environmental Health2021232113680. [百度学术] 

12

DOMINGO J LNADAL M. Human exposure to per- and polyfluoroalkyl substances (PFAS) through drinking water: A review of the recent scientific literature[J]. Environmental Research2019177108648. [百度学术] 

13

CRINNION W J. The CDC fourth national report on human exposure to environmental chemicals: what it tells us about our toxic burden and how it assist environmental medicine physicians[J]. Alternative Medicine Review: a Journal of Clinical Therapeutic2010152): 101-109. [百度学术] 

14

HE X WLIU Y XXU Bet al. PFOA is associated with diabetes and metabolic alteration in US men: National health and nutrition examination survey 2003-2012[J]. Science of the Total Environment2018625566-574. [百度学术] 

15

YAN S MZHANG H XZHENG Fet al. Perfluorooctanoic acid exposure for 28 days affects glucose homeostasis and induces insulin hypersensitivity in mice[J]. Scientific Reports2015511029. [百度学术] 

16

MIN J YLEE K JPARK J Bet al. Perfluorooctanoic acid exposure is associated with elevated homocysteine and hypertension in US adults[J]. Occupational and Environmental Medicine2012699): 658-662. [百度学术] 

17

KATARIA ATRACHTMAN HMALAGA-DIEGUEZ Let al. Association between perfluoroalkyl acids and kidney function in a cross-sectional study of adolescents[J]. Environmental Health: A Global Access Science Source20151489. [百度学术] 

18

SPRATLEN M JPERERA F PLEDERMAN S Aet al. The association between perfluoroalkyl substances and lipids in cord blood[J]. The Journal of Clinical Endocrinology & Metabolism20191051): 43-54. [百度学术] 

19

SHEN J YZHANG Y YYU N Yet al. Organophosphate ester, 2-ethylhexyl diphenyl phosphate (EHDPP), elicits cytotoxic and transcriptomic effects in chicken embryonic hepatocytes and its biotransformation profile compared to humans[J]. Environmental Science & Technology2019534): 2151-2160. [百度学术] 

20

JIANG S ZYOUNG J LWANG Ket al. Diabetic‑induced alterations in hepatic glucose and lipid metabolism: The role of type 1 and type 2 diabetes mellitus (Review)[J]. Molecular Medicine Reports2020222): 603-611. [百度学术] 

21

SØNDERGAARD ENIELSEN S. VLDL triglyceride accumulation in skeletal muscle and adipose tissue in type 2 diabetes[J]. Current Opinion in Lipidology2018291): 42-47. [百度学术] 

22

GRECO D SBROUSSARD J DPETERSON M E. Insulin therapy[J]. Veterinary Clinics of North America: Small Animal Practice1995253): 677-689. [百度学术] 

23

CHEN T QGUESTRIN C. XGBoost: A scalable tree boosting system[C]. Proceedings of the 22nd ACM SIGKDD International Conference on Knowledge Discovery and Data Mining. New York, NY, USAACM2016785-794. [百度学术]