智能预诊系统质量评价指标体系的构建研究
分享到:
发布人:yaot 发布时间:2019/4/9 10:08:49  浏览次数:2909次
【字体: 字体颜色

 

——李前慧 钟源 姜英玉 曾光



【摘要】目的为有效规范和评估智能预诊系统,需建立一套指标体系对其服务质量进行评价。方法基于“结构-过程-结果”和“技术接受模型”理论构建评价模型,采用德尔菲法构建指标体系,运用层次分析法对各个指标进行赋权。结果通过三轮咨询,最终确立了由3个一级指标、11个二级指标组成的智能预诊系统质量评价指标体系,指标体系的信度和结构效度良好。结论智能预诊系统的核心服务质量在于预诊结果,因此应提高预诊结果的准确性。
【关键词】智能预诊;质量评价;德尔菲法;层次分析法
中图分类号:R197.324文献标识码:B
Construction of Quality Evaluation Index System of Intelligent Pre-Diagnosis System/LI Qianhui,ZHONG Yuan,JIANG Yingyu,et al.//Chinese Health Quality Management,2019,26(2):79-81,109
Abstract Objective To effectively standardize and evaluate the intelligent pre-diagnosis system, a set of index system was established to evaluate its service quality.MethodsThe evaluation model was constructed based on the theories of "Structure-Process-Outcome" and "Technology Acceptance Model (TAM)". The dimensions of the index system was established by Delphi method and weights of the indicators was analyzed by analytic hierarchy process.ResultsAfter three rounds of consultations, a set of intelligent pre-diagnosis system quality evaluation index system consisting of 3 first-level indicators and 11 second-level indicators was established with good reliability and structural validity.Conclusion The core quality of service of the intelligent pre-diagnosis system lied in the system's pre-diagnosis results, so the accuracy of the pre-diagnosis results should be improved.
Key words Intelligent Pre-Diagnosis; Quality Evaluation; Delphi Method; Analytic Hierarchy Process (AHP)
Firstauthor's address School of Management,Beijing University of Chinese Medicine, Beijing, 100029, China



      高速发展的互联网技术以及快速涌现出的各类移动医疗产品正改变着人们的就医行为。我国医疗资源虽然短缺,但医疗浪费现象却比较普遍。据估计,我国医疗资源浪费占到医疗总费用的30%以上,严重地区可达40%~50%[1]。而造成医疗资源浪费的根源之一就是医患信息不对称[2]。智能预诊系统的应用使患者在就诊前进行基本的自我判断成为可能。智能预诊系统是利用互联网技术将传统的预诊分诊过程开发成可供用户直接使用的移动应用程序,以智能化的人机界面帮助用户完成对自身病症的初步判断,从而引导患者合理就医。目前国内外智能预诊系统已达50多种。

1理论基础

      智能预诊系统是传统医疗服务与互联网技术的结合,它既属于移动应用,又属于医疗服务,因此对智能预诊系统的质量评价,应兼顾医疗服务和移动互联网技术两方面。
      在传统的医疗服务质量评价中,具有代表性的理论模型有服务质量差距模型、SERVQUAL质量评价模型、“结构—过程—结果”质量三环节理论等。考虑到智能预诊系统的服务特点,本研究选择“结构-过程-结果”质量评价理论作为指标构建的理论基础。该理论是1968年由美国学者Avedis Donabedian提出的,它将医疗卫生服务看成是一个由结构、过程和结果组成的系统[3]。三者的关系是: 结构要素使过程要素成为可能,过程要素促使产生短期结果(即中间结果),最终促使产生健康结果。智能预诊系统主要是对用户病情进行初步诊断,引导患者合理就医,其预诊结果的准确性是质量的重要影响因素。
      智能预诊系统的质量直接影响用户的接受和使用。因此智能预诊系统的质量评价必须考虑到技术接受。技术接受模型(Technology Acceptance Model,TAM)是1989年美国Davis 提出的[4],该理论认为用户对技术的接受主要取决于用户感知的有用性和易用性。
      结合医疗服务和技术接受这两个理论基础,本研究构建了智能预诊系统的质量评价模型(如图1),在该模型的指导下,从智能预诊系统的准确性、有用性和易用性进行相关指标设置。

图1智能预诊系统质量评价理论模型

2资料与方法

2.1指标的初步拟定
      查阅医疗服务质量评价文献,结合智能预诊系统的交互过程,提出了“使用价值”“交互性能”“预诊结果”3个一级指标,并对每个一级指标进行具体细分,初步建立了质量评价指标体系。

2.2德尔菲专家的选择
      本研究使用德尔菲法构建指标体系,共进行3轮咨询。德尔菲法的核心在于专家的选择,多数学者认为专家人数应在10~50人[5],本研究邀请21名专家参与指标体系的咨询。专家的入选标准:(1)从事卫生管理、卫生评价或互联网医疗工作,对医疗质量评价有所了解。(2)卫生管理等相关领域人员至少工作5年以上,互联网医疗领域人员至少工作3年以上。(3)愿意积极配合指标的构建工作。
      21名专家中,从事卫生管理与互联网医疗领域工作人数比为2:1,高级职称13人(61%),中级职称2人(10%),初级职称6人(29%)。学历为博士7人(33%),硕士10人(48%),本科4人(19%)。工作年限3~9年的有7人(33%),10~19年的有5人(24%),20~29年的有4人(19%),30年及以上的5人(24%),工作年限低于10年的主要是从事互联网医疗或初级职称的专家。
      对专家的判断系数和熟悉程度根据赋值表标准进行赋值,本研究专家的判断系数(Ca)、熟悉程度(Cs)、权威系数(Cr)三值的综合统计结果如表1所示。
      三项的均值均高于0.7,标准差分别为0.11、0.11、0.1,为可接受范围。可见,本研究专家的权威性较高。

2.3问卷的发放和回收
      专家咨询以E-mail方式发放到专家指定的邮箱,专家填写完毕后通过E-mail返回项目组,填写时限为2周。
      第一轮指标咨询发放问卷21份,回收21份,回收率为100%,专家积极系数为1。第二轮指标咨询发放21份,回收问卷20份,回收率为95%,专家积极系数为0.95。第三轮权重咨询发放20份权重咨询问卷,回收问卷18份,回收率为90%。一般情况下,专家积极系数大于0.7则认为专家积极性较高[6]。本研究三轮咨询中,专家积极性分别为1、0.95、0.90,均高于0.7,专家积极性较高。

2.4指标的筛选标准
      研究指标的修改与增加尊重专家意见,当专家超过3人提出对某一指标进行修改或增加时,即考虑修改或增加指标。删除指标则采用界值法[7]与专家意见相结合,筛选值主要为均数、满分率和变异系数。其中,均数和满分率的界值=均数-标准差,低于界值则需要删除;变异系数界值=均数+标准差,高于界值则需要删除。为了不过分删减指标,删除标准规定当某项指标3个筛选值均超出界值时,删除指标;当指标不符合删减标准,但专家意见超过3人要求删减时,同样考虑删除该指标。
      专家意见协调程度用Kendall w协调系数来表示,W取值范围为0~1,W值越大,表示专家对指标设定的认同程度越高,结果就越可靠[8]。两轮指标咨询专家意见的总体协调系数分别为0.249和0.398,且P<0.05,说明第二轮较第一轮意见更协调,两轮咨询后指标的整体协调性良好。

2.5指标权重的确定
      本研究利用层次分析法确定各级指标的权重。由各位专家对确立的指标进行两两对比,然后按9分位比率排定各评价指标的相对优劣顺序,并依次构建评价指标的判断矩阵。最终由项目组计算得出各指标权重。
      指标体系的权重咨询表回收率为90%。对收回的专家咨询表的判断矩阵进行一致性检验,一致性比率CR<0.1,均通过一致性检验。结合各专家的加权权威系数和判断矩阵,最终确立的指标体系包含3个一级指标和11个二级指标,各级指标权重如表2所示。由指标权重可知,作为预诊系统,其核心质量在于预诊结果(权重为0.59),其次是交互性能(权重为0.23),最后是预诊价值(权重为0.18)。

表1 判断系数(Ca)、熟悉程度(Cs)、权威系数(Cr)三值统计表
均值 最大值 最小值 中位数 众数 标准差
专家判断系数 0.87±0.05 1 0.7 0.9 0.9 0.11
专家熟悉程度 0.83±0.05 1 0.6 0.8 0.8 0.11
专家权威程度 0.85±0.04 1 0.65 0.85 0.85 0.10
注:置信度α取0.05。

表2智能预诊系统质量评价指标体系及权重
一级指标 归一化权重 二级指标 归一化权重 组合权重 重要性排序
交互性能 0.23 症状列表 0.29 0.07 5
界面设计 0.09 0.02 11
语言表述 0.29 0.07 6
问诊时间 0.18 0.04 8
反应能力 0.15 0.03 9
预诊结果 0.59 通俗性 0.29 0.17 2
全面性 0.17 0.10 3
准确性 0.54 0.32 1
预诊价值 0.18 疾病知识 0.28 0.05 7
就诊指导 0.56 0.10 4
附加服务 0.16 0.03 10

2.6数据处理
      专家咨询问卷数据采用Excel 2010表格进行录入和整理,并运用SPSS 17.0软件进行统计分析,指标权重利用层次分析法软件Yaahp 0.5.3进行分析。本研究选取的检验水准为α=0.05,检验结果P<0.05时为有显著性差异,P≥0.05 则为无差异。
      信度系数越大,表明测量的可信程度越大[9]。本研究中总指标、交互性能、预诊结果、预诊价值的Cronbach's α系数分别为0.92,0.76,0.82,0.79,信度较高。运用spearman相关系数对指标体系进行结构效度检验,一级指标与总指标的相关系数依次为0.90,0.61,0.57,二级指标与其对应的一级指标相关系数也具有明显的相关性,说明指标体系具有良好的结构效度。

3讨论

3.1指标体系的科学性及适用范围
      科学性是建立和使用评价指标体系的前提。本研究遴选的专家知识背景和经验结构良好,专家判断系数、熟悉程度、权威程度均值均高于0.8,专家积极系数高达0.9,专家意见一致性的Kendall系数较好,均具有统计学意义。指标系统具有较好的科学性。
      各智能预诊系统的开发者不同,导致系统的结构和质量可能会存在差异。本研究对国内外智能预诊系统的分析发现,不同预诊系统的结构-过程设计略有不同,主要分为两类:一类是交互过程基于医疗数据库,对用户输入的病症设有判断结点,即系统对用户有问诊过程。另一类是系统对用户没有问诊过程,直接对用户选择的病症给出建议。对于第一类系统而言,可以直接应用于本研究的指标体系中进行评价。而对于第二类系统,其系统结构相对简单,预诊结果则是系统核心,所占的权重会更大,因此本指标体系可能需重新对权重进行完善后才能使用。

3.2指标体系对预诊系统质量的导向
      智能预诊系统是为用户提供就医指导建议,引导用户合理就医的应用系统。因此,其服务质量的效果是评价的核心内容,也是系统持续改进的关键。科学建立指标评价体系,规范系统的服务模式,不仅可以帮助开发者发现系统设计中薄弱环节和存在问题,提高核心竞争力,也可以帮助用户甄别不同预诊系统质量的优劣,便于用户做出选择。
      在评价体系中,结果质量尤其是预诊结果的准确性,是系统的关键性核心指标。因此,智能预诊系统应注重提高预诊结果准确性。与传统医疗服务相比,用户看中的仍是移动医疗服务的最终结果。只有真正提高医疗服务的结果质量,智能预诊系统才能做到用户满意。

3.3发展建议
      由于智能预诊系统大多数属于免费应用,目前国内外市场上的预诊系统质量令人堪忧[10]。不少开发者仅仅为了实现服务的多样化,却不注重预诊系统的质量,使预诊系统失去了其对用户病情进行初步诊断的意义。甚至有开发者为了盈利,企图利用预诊结果诱导用户,使用户失去对移动医疗的信任。
      智能预诊的初衷是为用户提供就医指导建议,引导用户合理就医。

      优秀的智能预诊系统更应注重提高预诊结果,尤其是预诊结果的准确性,体现移动医疗的价值和意义。而预诊结果的准确性需要庞大的医疗知识库作为支撑。因此,系统开发者应从用户角度出发,不断完善医学数据库,科学规范设计预诊系统的判断节点,实现真正意义上的“在线医疗”,将预诊服务做好。

参考文献
[1]田雅婷.医疗资源浪费触目惊心[N].光明日报,2013-2-23(1).
[2]兰利莹,秦迎新,王琪,等.信息不对称下公立医院过度医疗的治理[J].中国医院管理, 2014, 34(5):17-18.
[3]Donabedian A. Quality of care: problems of measurement. II. Some issues in evaluating the quality of nursing care[J].American Journal of Public Health & the Nations Health, 1969, 59(10):1833-1834.
[4]Davis F D. Perceived usefulness, perceived ease of use, and user acceptance of information technology[M].Society for Information Management and The Management Information Systems Research Center, 1989:65.
[5]曾照云,程安广.德尔菲法在应用过程中的严谨性评估——基于信息管理视角[J].情报理论与实践, 2016, 39(2):64-68.
[6]李沛良.社会研究的统计应用[M].北京:社会科学文献出版社,2002:113.
[7]应桂英,李恒,段占祺,等. 卫生统计指标筛选方法评价[J].中国卫生事业管理, 2012, 29(6):465-467.
[8]卫萍,任建萍,张琪峰,等. 德尔菲法在医学科技计划绩效评价指标体系构建中的应用[J].卫生经济研究, 2013(4):52-54.
[9]陈平雁,黄浙明.SPSS 19统计软件应用教程[M].北京:人民卫生出版社,2012:89.
[10]Semigran H L, Linder J A, Gidengil C, et al. Evaluation of symptom checkers for self diagnosis and triage: audit study[J].BMJ,2015, 35(1):3480.

通信作者:
曾光:北京中医药大学管理学院卫生管理系教授
E-mail:
hui2566fly@163.com
收稿日期:2018-04-08
修回日期:2018-05-10
责任编辑:姚涛