• info@hwemgroup.com
  • (021) 65650412

“国考”医院必看!命题者是如何设计考题的?

2021 04 12

近日,2019年度全国三级公立医院绩效考核国家监测指标考核结果出炉,全国共2413家三级公立医院同时参加“国考”。

目前,各家医院都在认真研究考核结果,希望从结果分析中找对策,但对考核体系和方法却并不是十分了解,这无疑会影响下一步的工作方向和重点的判断。

三级公立医院绩效考核的考核体系,也可称为评价体系。评价体系的构成和运作方式直接决定了医院考核结果如何。那么它是如何构成的,又是如何运作的?具体是怎样影响“国考”结果的?

一般来说,评价体系按照过程,或按照对评价主体的影响程度,可分为三个部分,即指标体系、权重和打分规则。

指标体系是如何建构的?

指标体系,是评价体系的基础,其目的是挑选出评价客体中能够反应评价目的的指标集合。通常情况下,评价主体是复杂和系统化的,需要通过多个方面和维度进行评价。方法上一般可以通过多层次指标来体现。

比如“国考”要呈现公立医院高质量发展的导向,就要从医疗质量、运营效率、可持续发展和满意度方面有所体现。同时,可以在这几个方面里再列不同维度体现高质量。例如医疗质量下的功能定位、质量安全等维度。

在指标搜集和筛选过程的设计上,又会有几种方法。一般文献和专家共识是比较常用和有效的方法。其中专家共识是更为重要的评价指标,在学术上,也叫“倾听客户的声音”。

三级公立医院绩效考核指标体系分为三级,一级指标4个,二级指标15个,三级指标55个,2019年新增指标“重点监控高值医用耗材收入占比”,共计56个,其中只有26个用作国家监测指标。这26个指标是指标权重和打分规则的载体,需要重点研究。一级指标包括医疗质量、运营效率、可持续发展、满意度评价4个方面。具体展开来,医疗质量方面,包括功能定位、质量安全、合理用药、服务流程4个维度;运营效率方面,包括资源效率、收支结构、费用控制、经济管理4个维度;持续发展方面,包括人员结构、人才培养、学科建设、信用建设4个维度;满意度评价方面,包括门诊患者满意度、住院患者满意度和医务人员满意度3个维度。

从来源看,26个指标中,有9个指标来源于全国卫生健康财务年报系统,1个指标来源于国家卫健委临床检验中心,2个指标来自于国家医疗机构、医师、护士电子化注册系统,1个指标来自于国家卫健委医考中心,1个指标来自于国家卫健委医院管理研究所,3个指标来自于国家卫建委医管中心公立医院满意度调查平台,2个指标由医院自己填报,需要强调的是,有7个指标来自于医院的病案首页。

由于医院绩效评价最终呈现形式是排名,要通过分数表现结果,所以在指标体系建设后还会有权重设计和打分规则两个步骤。

权重比例是怎样设计的?

权重设计,是考核赋予每个指标一定的“分量”,要体现某个指标在指标体系中的重要性。普遍情况下,指标体系所反映的主体所有特征中,有一些是比另外一些重要的。例如“国考”中,专家普遍认为医疗质量是最为重要的,这与高质量发展的思想相吻合,是整个指标体系中的核心,所以给予了较高的权重。

权重设计的方法比较多,从权重赋值的客观性看,有主观赋值和客观赋值两种方法。我们俗称的“拍脑袋”决定就是主观的,而通过数据本身来反应其指标的重要性,就是客观的。

权重的大小可以直接决定评价的结果。但是权重设计也是“主观性”非常强的一个活动。目前应用比较多的是通过德尔菲法收集建议,利用层次分析方法测算,对指标赋予一定的权重。此次考核就是使用的这个方法。

层次分析法(Analytic Hierarchy Process简称AHP),是将与决策总是有关的元素分解成目标、准则、方案等层次,并在此基础之上进行定性和定量分析的决策方法。该方法是美国运筹学家匹茨堡大学教授萨蒂于20世纪70年代初,在为美国国防部研究“根据各个工业部门对国家福利的贡献大小而进行电力分配”课题时,应用网络系统理论和多目标综合评价方法,提出的一种层次权重决策分析方法。

其优点在于层次分析法是一种系统性的分析方法、过程也简洁实用,决策过程成本低,所需定量数据信息较少,但不足之处在于不能为决策提供新方案。定量数据较少,定性成分过多,不易令人信服,指标过多时数据统计量大,且权重量值难以确定。

为了弥补这个不足,三级公立医院考核在指标确定过程中才采用了熵权法。熵权法是信息论中的一个概念,应用到评价体系中,可以从定量角度帮助确定权重。

按照信息论基本原理的解释,信息是系统有序程度的一个度量,熵是系统无序程度的一个度量;根据信息熵的定义,对于某项指标,可以用熵值来判断某个指标的离散程度,其信息熵值越小,指标的离散程度越大, 该指标对综合评价的影响(即权重)就越大,如果某项指标的值全部相等,则该指标在综合评价中不起作用。

因此,可利用信息熵这个工具,计算出各个指标的权重,为多指标综合评价提供依据。比如I类手术切口感染率指标,各医院数据普遍都比较高,那么极差就会比较小,一般来说方差也会比较小,那么这个指标所能包含的信息就比较小,其价值也相对较小。

反之,每百名员工科研经费指标,极差就非常大,满分值是900万,而一般三甲医院在200万左右,部分三级乙等医院可能人均只有2万元。因此这个指标所包含的信息量就特别大,一般来说,提供的管理信息也会比较多。

又比如,出院患者四级手术占比,最高的医院有65%,不少三级医院则不到5%,差距很大,对评价的意义而言也就更大。

经过测算,此次考核一级指标权重大致为4:3:2:1,即医疗质量430分,运营效率270分,持续发展180分,满意度评价120分。根据上述层次分析法和熵权法,指标权重最大的是100分,包括出院患者手术占比、出院患者四级手术占比、每百名卫生技术人员科研项目经费三个指标,权重最低的是20分,包括出院患者微创手术占比、单病种质量控制等7个指标。

打分规则是怎么定的?

打分,是构建评价体系的最后一关。总体来看,打分规则和权重作用差不多,但影响程度相对较小,方法也相对简单,关键在于如何确定满分值和打分的区间。

但有一个尤为重要的环节不可忽略,那就是让数据具有可比性。即对结果进行校正,以使得在同样指标上各评价主体之间的数据能更具可比性。

比如,在常见的跌倒率计算上,很多医院采用跌倒人数/病人数的计算公式。即分母是期间住院人次,如果换位住院日,那么不同科室,不同医院之间就具有可比性了。

为了让主体之间数据更具可比性,还有一个办法是事后调整。DRG就是典型的事后调整,通过年龄、并发症等情况,对费用进行调整,保证同一组中的每个病例的费用具有可比性。

在如何确定满分值上,此次考核分为三类,一类是结果的取向明确,100%或者0均可。比如运营效率方面,收支结余指标,公立医院的要求是收支平衡,略有结余,所以这里就取0值为满分。这类指标满分值不会随年度变化。

一类指标是取极端值,或靠近极端值,比如可持续发展中的医务人员人均科研经费指标。此次的满分值是900万元。在四级手术占出院人次中,则根据聚类分析,取到“极端值”45%作为满分值。

还有一类是合理值,即评价者并不清楚什么标准合适,就取一个平均值作为满分值。比如门诊均次费用增幅,很难评价出费用增幅的合理范围,全国中位数是5.5%,满分值是增幅小于等于6.18%。而2018年的全国中位数是5.03%,满分值是增幅小于等于5.33%。

其中,后两类会随着年度有所调整。

再看区间的两种分法,一种是在满分值下,按照降序或升序将数据分区间给分,大部分指标是采用这种方法。第二种是满分值下,根据标准差区间赋值,如手术患者并发症发生率和I类切口手术部位感染率。

评价方也会根据数据反映的评价主体的特征和评价目的进行调整。“国考”是通过病种复杂程度对指标进行调整,此次就是通过DRG中的病例组合指数(CMI)指标作为系数,对抗生素使用强度、医疗服务型收入占比、住院均次费用增幅等指标进行了调整。用四级手术量对出院患者手术占比、出院患者微创手术占比、出院患者四级手术占比、手术患者并发症发生率4个指标进行了校正。

作为一种“游戏”规则,不同评价体系可能产生不同结果,但更重要的是,不同规则也将会产生不同的激励机制。为此,推进考核更能客观反映“考生”真实能力和医疗服务水平,一方面要求广大三级医院管理者认真研究评价体系,便于给指标设定目标值,以及对成绩做出合理预测;另一方面,指标体系仍需不断完善,在精度上更加精益求精,更准确反应医院高质量发展情况和管理者的水平与努力程度。

作者:惠宏医疗管理集团资深战略/人力资源管理专家 董事长 余庆松