人工神经网络在医疗风险预测中的应用研究
分享到:
发布人:administrator 发布时间:2017/8/25 16:39:09  浏览次数:176次
【字体: 字体颜色

人工神经网络在医疗风险预测中的应用研究*

——绳慧峰1刘晴2许苹3陈春林1*



【摘要】目的建立基于人工神经网络的医疗风险预测模型,为有效预防医疗风险提供参考。方法运用SPSS 21.0统计软件,以入院方式、住院天数等变量为输入神经元,以医疗纠纷分组为输出神经元,用RBF(径向基函数)建立神经网络模型,预测医疗风险的发生,评估各因素对医疗风险的作用。结果训练样本和测试样本的预测准确率分别为83.7%和84.2%,医疗风险影响因素重要性排序前6位分别是住院费用(100.0%)、住院天数(78.2%)、四周内手术次数(61.4%)、感染(60.5%)、伤口愈合不良(54.0%)和手术并发症(47.8%)等。结论运用RBF(径向基函数)神经网络对医疗风险进行预测,不受样本分布特点及数据类型的影响,适用性较好。
【关键词】人工神经网络;径向基函数;医疗风险;预测;应用
IApplication of Artificial Neural Network in Medical Risk Prediction/SHENG Huifeng,LIU Qing,XU Ping,et al.//Chinese Health Quality Management,2017,24(4):15-17
AbstractObjective To establish prediction model of medical risks based on artificial neural network, provide reference for effective prevention of medical risks. MethodsWith the admission form, length of stay and other variables as the input neurons, medical disputes group as the output neuron, using radial basis function (RBF) to establish neural network model, the occurrence of medical risk was predicted, and the factors on the role of health risk was evaluated. ResultsThe prediction accuracies of the training sample and test sample were 83.7% and 84.2%, respectively. The top six importance of medical risk factors were hospitalization expenses (100.0%), length of stay (78.2%), four weeks’ operation times (61.4%), infection (60.5%), poor wound healing (54.0%) and complications (47.8%). ConclusionIt is not affected by sample distribution features and data types to use RBF neural network to forecast the medical risks and has a good applicability.
Key wordsArtificial Neural Network;Radial Basis Function;Medical Risk;Prediction; Application
Firstauthor's addressMinistry of Medical Affairs, 105th Hospital of People 's Liberation Army, Hefei, Anhui, 230031, China




人工神经网络(Artificial Neural Network,ANN)简称神经网络(Neural Network,NN),是模拟生物神经系统结构,由大量处理单元组成的非线性自适应动态系统[1]。神经网络因其强大性、灵活性和易用性,成为预测数据应用程序的首选工具。径向基函数 (Radial Basis Function,RBF)是人工神经网络诸多形式中应用较广泛的一种,由于其具有能够逼近任意的非线性函数、学习收敛速度快等优点,目前已经成功应用于非线性函数逼近、模式识别、信息处理等方面[2]。本研究在前期研究基础上,初步尝试采用RBF神经网络建立医疗风险预测模型,筛选医疗风险影响因素,以期为进一步加强风险控制,制定管理决策提供参考。

1资料来源与方法

1.1资料来源
本研究所使用的数据资料均来源于合肥市某军队三甲医院信息系统。针对该院2010年-2015年发生的60例手术纠纷案例和120例非纠纷案例,通过医院信息系统调取各案例的16项医疗风险指标。其中,60例纠纷案例为该院6年间发生的全部手术纠纷案例,反映该院实际纠纷情况;120例非纠纷案例则按照常用病例和对照1:2的标准选取。16项指标均由前期通过单因素分析筛选并确定,分别是入院方式、住院天数、住院费用、四周内手术次数、非计划再次手术等[3]。具体指标及赋值情况见表1。 表1医疗风险指标变量及其赋值 变量* 代码 赋值入院方式 X1 0=门诊;1=急诊住院天数 X2 0=<20天;1=≥20天住院费用 X3 0=<5万;1=≥5万四周内手术次数 X4 0=<2次;1=≥2次非计划再次手术 X5 0=无;1=有输血总量 X6 0=<1 600ml;1=≥1 600ml非正常进入ICU天数 X7 0=<3天;1=≥3天病情危重 X8 0=无;1=有病情突变 X9 0=无;1=有抢救次数 X10 1=0次;2=1次;3=≥2次手术并发症 X11 0=无;1=有伤口愈合不良 X12 0=无;1=有感染 X13 0=无;1=有休克 X14 0=无;1=有出院病情 X15 0=治愈或好转;1=死亡出院方式 X16 0=医嘱出院;1=家属要求分组 Y 0=非纠纷组;1=纠纷组注:*16项风险指标是从22个变量中筛选出来的。这些变量是前期经过专家咨询筛选的相对重要的指标,但不包括所有可能与纠纷事件相关的变量。

1.2研究方法
所有数据采用Excel 2007整理和汇总,采用SPSS 21.0统计软件中的径向基函数神经网络进行分析。神经网络模型包含输入层、隐藏层和输出层3层结构,将16项医疗风险指标作为输入神经元,医疗纠纷分组作为输出神经元。

1.3操作步骤
神经网络建模按照以下步骤进行:(1)打开SPSS软件,导入Excel数据。(2)生成随机数。选择菜单栏里的“转换-随机数字生成器”,勾选设置起点中的固定值,并输入数字“9191972”。(3)建立神经网络模型。选择菜单栏里的“分析-神经网络-径向基函数”,将医疗纠纷分组作为因变量,入院方式、住院天数等16项指标变量作为因子。在输出选项中勾选“描述→图表→模型汇总→分类结果→ROC曲线→累积增益图→增益图→观察预测图→个案处理摘要→自变量重要性分析”。其他选项均采用系统默认,点击确定进行分析。

2结果


2.1模型预测结果
共有180个有效样本,按照神经网络常用7:3比例,123个案例(68.3%)被分配到训练样本,57个案例(31.7%)被分配到测试样本,没有个案被排除。表2为模型分类结果。训练样本中,83个非医疗纠纷样本有80个(96.4%)被正确分到了非医疗纠纷组,40个医疗纠纷样本有23个(57.5%)被正确分到了医疗纠纷组,预测正确总百分比为83.7%;测试样本中,37个非医疗纠纷样本有35个(94.6%)被正确地分到了非医疗纠纷组,20个医疗纠纷样本有13个(65.0%)被正确地分到了医疗纠纷组,预测正确总百分比为84.2%。表3模型汇总中,训练样本百分比错误预测16.3%和测试样本百分比错误预测15.8%相对应。图1为观察预测图,显示组合的培训和测试样本的预测拟概率。最左侧箱图显示,对于观察类别no(非医疗纠纷组)的个案,类别no的预测拟概率。在y轴0.5标记之上的箱图部分代表分类表中显示的正确预测值,0.5标记以下部分代表不正确的预测值;最右侧箱图显示,对于观察类别yes(医疗纠纷组)的个案,类别yes的预测拟概率。在y轴0.5标记之上的部分代表分类表中显示的正确预测值,0.5标记以下部分代表不正确的预测值。 表3神经网络预测模型结果汇总 训练 平方和错误 16.031 百分比错误预测(%) 16.3 培训时间 0:00:00.31测试 平方和错误 8.316a 百分比错误预测(%) 15.8 注:a隐藏单位的数量由检验数据标准确定,隐藏单位的“最佳”数量为检验数据中产生最小错误的单位。图1神经网络预测模型的预测拟概率注:0表示非医疗纠纷组,1表示医疗纠纷组。


2.2ROC曲线拟合结果
图2为ROC曲线拟合结果,显示了单个图中所有界限的敏感度和图2神经网络预测模型的ROC曲线 表2神经网络预测模型分类结果 样本 已观测已预测0 1 正确百分比(%)训练 0 80 3 96.4 1 17 23 57.5 总计百分比(%) 78.9 21.1 83.7测试 0 35 2 94.6 1 7 13 65.0 总计百分比(%) 73.7 26.3 84.2特异性。ROC曲线下面积为0.821,表明了诊断试验准确度的大小[4],说明对于每一个类别,该类别中一个随机选择的个案高于非该类别中一个随机选择的个案的概率。例如,对于随机选择的医疗纠纷者与随机选择的非医疗纠纷者,就缺省模型预测拟概率而言,前者高于后者的概率为0.821。


2.3重要性分析结果
表4为自变量的重要性及标准化的重要性。结果显示,医疗风险影响因素重要性排序前6位的自变量及其标准化重要性分别为:住院费用(100.0%)、住院天数(78.2%)、四周内手术次数(61.4%)、感染(60.5%)、伤口愈合不良(54.0%)和手术并发症(47.8%)。对医疗风险的影响作用最小的自变量是入院方式(17.8%)。 表4医疗风险指标的重要性 指标 重要性 标准化的重要性(%)入院方式 0.023 17.8住院天数 0.099 78.2住院费用 0.127 100.0四周内手术次数 0.07861.4非计划再次手术 0.055 43.7输血总量 0.048 38.0非正常进入ICU天数 0.045 35.5病情危重 0.047 36.8病情突变 0.058 46.0抢救次数 0.059 46.3手术并发症 0.061 47.8伤口愈合不良 0.068 54.0感染 0.077 60.5休克 0.048 37.6出院病情 0.051 40.6出院方式 0.05845.4


3讨论


3.1神经网络模型效果分析
医疗风险成因复杂,受患者因素、疾病因素、医院管理因素、医务人员因素、社会因素等的影响[5]。本研究仅纳入了医疗风险的部分影响因素,所选16项指标均是从医院HIS系统调取的定量指标,不包含医务人员技术水平、医患沟通、患者期望值等定性指标。所建立的神经网络模型对医疗风险总的预测正确率达80%以上,具有较强的预测效能,可以为医疗风险识别提供客观依据。同时,与多元线性回归等模型相比,神经网络模型给出了所有自变量的敏感度,有利于综合判断各自变量对医疗风险的重要性。

3.2建立医疗风险神经网络预测模型的意义
医疗风险管理是医疗质量管理的重要组成部分,医疗风险将直接影响医疗质量。如何控制医疗风险,降低风险发生率,是医院管理者持续探索和关注的话题[6-7]。本研究所建立的医疗风险神经网络预测模型,风险识别率高,对实时监测、筛选医疗风险,从而及时预防医疗风险发生有一定参考价值。同时,为医院风险管理提供了新的方法和思路,有利于进一步深入挖掘风险成因,建立预警机制,总结归纳经验,改进管理办法,从源头上遏止医疗风险的发生。

3.3本研究的创新性和局限性
人工神经网络对资料的分布特征无特殊要求,能够较好地解决非线性问题等优点,在其他领域得到了广泛应用[8-9],并取得了良好效果,但在医疗风险预测方面的应用较少。本研究尝试将神经网络用于医疗风险预测,并运用SPSS软件建立神经网络模型,与MATLAB等软件相比,省去了复杂的编程麻烦,简单易操作。同时,建立的神经网络预测模型效果较好,对医院管理部门进行医疗风险管理提供了参考。但是,本研究仅是基于RBF神经网络对医疗风险进行预测的初步尝试,结果仍然存在一定局限性。由于仅以合肥市某三甲医院为例进行分析,所用的数据资料均来自该院实际发生的案例,针对性较强,研究结果是否具有良好推广性还有待进一步验证。

参考文献
[1]方鹏骞,谢金亮.人工神经网络在公立医院监管指标体系中的应用[J].中国医院,2012,16(9):23-25.
[2]邹慧琴,李硕,陶欧,等. RBF神经网络在中医药领域中的应用及其在SPSS 17.0 软件中的实现[J].中华中医药学刊,2015,33(2):336-338.
[3]刘晴,许苹,绳慧峰,等.医院医疗风险预警预控指标研究[J].中国医院管理,2016,36(7):43-45.
[4]贺佳,尹平.医学统计学[M].北京:高等教育出版社,2015.
[5]刘晴,许苹,绳慧峰,等.军队某三甲医院医疗纠纷发生特点及对策[J].解放军医院管理杂志,2016,23(5):415-417.
[6]连斌,秦婷,吴琼,等.医疗风险防范调控体系研究[J].中国卫生质量管理,2006,13(1):1-4.
[7]杜淑英,曹红英,顾跃静,等.医疗风险管理的实践及体会[J].中国卫生质量管理,2013,20(2):43-44.
[8]江弋,林永鹏.RBF神经网络在股价预测中的应用[J].心智与计算,2007,1(4):413-419.
[9]王敏,张开金,姜丽,等. BP神经网络技术在慢性病患者住院费用研究中的应用[J].中国卫生经济,2010,29(11):86-88. 通信作者:
陈春林:解放军105医院院长
E-mail: shenghuifeng8@163.com
收稿日期:2016-10-12
修回日期:2016-12-16
责任编辑:吴小红