公共卫生大数据应用

(整期优先)网络出版时间:2019-08-18
/ 2

公共卫生大数据应用

王振国李立岩

青州市谭坊中心卫生院262516

摘要:本文从公共卫生的数据需求出发,分析了公共卫生大数据特征,并通过对传染病预警预报大数据应用和基于互联网大数据舆情监测预警应用的案例分析,阐述了大数据对公共卫生的应用愿景与应用模式,提出了我国公共卫生大数据应用存在的问题,并以政府主导和社会参与为技术路径,提出了应用策略与关键技术。

关键词:公共卫生;大数据;

近年来公共卫生信息化快速推进,逐步建立和完善了多个信息平台和业务信息系统,积累了丰富的公共卫生数据资源。在业务领域上,这些数据资源包括传染病、慢性病、健康危害因素数据等;在数据类型上,有以人群为基础的个案信息、以实验室为基础的生物与环境信息,以组织机构为基础的管理信息,以人群社会活动为基础的结构化、半结构化和非结构化信息;在数据来源上,有调查问卷、访谈记录等手工录入信息,以及电子病历、互联网舆情信息、卫星遥感信息等机器自动产生的信息。这些信息汇集起来,不仅数量庞大(Volume)、产生速度快(Velocity)、数据结构复杂多样(Variety),而且对数据真实性要求高(Veracity)、价值密度低(Value),符合典型的大数据特征。作为一种新的研究模式和应用生态系统,大数据研究更多地使用大规模的数据作为研究驱动[1],无疑会对公共卫生领域的统计调查和信息化建设产生巨大的影响和推动,传统卫生统计分析方法已不能完全适应日新月异的数据环境,无法满足海量数据分析的需求。当前,公共卫生大数据资源的价值还远远没有得到挖掘和利用,如何从大数据中发现有用的知识以及提高信息的利用率是迫在眉睫的任务。

一、公共卫生大数据特征

公共卫生大数据特征主要体现在体量巨大、数据繁杂、敏感信息少、时效性高四个方面。首先,公共卫生业务活动主要包括监测干预、应急处置、调查评价、科学研究、教育培训和管理服务等。内容包括传染病,慢病,健康危险危害因素等。类别包括以人群为基础的个案信息;以实验室为基础的生物与环境信息;以组织机构为基础的管理信息;以人群社会化活动为基础的结构化、半结构化和非结构化信息。其次,监测信息来源多样化,包括手工录入,电子病历(EMR),微博/论坛等网络信息。最后,数据时效要求高,疫情探测和应对要求近乎实时的应对速度,需要满足实时统计分析,快速获得结果,同时大量监测数据中需要的敏感信息少,需要连续监测捕获异常信号,或发现流行规律。

二、公共卫生大数据发展存在问题

2.1数据质量不高,数据治理力度不强

由于各医疗机构信息系统和标准的不一致,不同来源的数字资源格式不同,存储标准不一,同一来源渠道的资源在不同时期也会由于人员、软硬件环境等不同而存在差异。因此,在公共卫生大数据实际使用中存在着数据可用性低、数据质量差等问题。

2.2数据处理技术薄弱,分析方法欠缺

数据处理方面,当前的标准和技术难以满足公共卫生大数据整合应用的要求,缺乏统一的标准、固定的描述格式和表示方法等,不同层次结构化、半结构化与非结构化数据的集成融合较为困难。分析方法方面,目前还缺乏专门面向公共卫生领域的分析方法库、挖掘算法库和模型库。对于数据内容的语义处理,还缺少知识库的支撑。

2.3数据应用权限不明,隐私与安全保护较差

目前医疗隐私数据主要涉及两类,一类是个人医疗信息,一类是群体共同信息。国家并没有针对数据设立明确的隐私保护相关政策,缺乏对不同职业的卫生计生人员、不同类型的数据制定相应的获取使用权限,这对于大数据分析应用增加了较大的难度。因此需要制定相关政策法规,分辨出哪些数据属于隐私数据,哪些数据可以共享和利用,明确隐私保护对象。同时应加大力度完善技术规范,如利用数据脱敏、去标签化等手段对数据进行处理,尽可能保护数据隐私。

2.4数据标准不够统一

大数据标准体系缺乏标准方面主要存在两个问题,首先对数据进行标准化是一项巨大的工程,而且标准的推行也困难重重。其次尽管制订开发了能够满足数据管理基本要求的大量基本数据集、健康档案与电子病历数据交换共享文档标准及代码标准,为大数据应用奠定了基础,但未形成完整的大数据标准体系,如产品和平台标准、应用和服务标准等。

2.5大数据应用配套政策缺乏相关法规

大数据越开放越有价值,但缺乏大数据相关的政策法规,导致数据开放和隐私保护之间难以平衡,也难以更好地进行开放。数据是重要的生产要素和资源,共享才能发挥最大效益,但正因为其价值就不可能无条件的共享,数据生产链条以及相应的价值链条需要创新和完善各种制度,建立适宜促进数据开发和应用的制度体系和运行机制。

三、大数据对公共卫生应用的愿景与建议

面向公众提供传染病监测预警预报信息服务。在服务内容上,提供本地区传染病长期流行趋势分析,短期爆发和流行风险预测预警信息,重点传染病预防建议,旅行卫生提示等公众服务信息;在服务形式上,以城市为单位,依托区域疾病预防控制数据中心建立接入公用互联网的信息服务门户,利用商业智能和可视化技术,提供界面友好的互动查询。并以政府主导,开放相关数据资源,引入社会力量搭建信息服务平台,实现政府业务部门与企业应用服务相结合,面向公众提供公共卫生信息资源及信息技术服务。

为了更好地推动公共卫生大数据应用,提出以下发展建议:加强公共卫生信息化基础建设,完善业务信息系统和公共卫生数据共享平台,逐步整合各领域的数据,同时要加强信息质量控制,优化大数据基础环境;加快推动大数据相关技术的研发和应用,在公共卫生各领域引入云计算、数据仓库、数据挖掘等技术,搭建基于云计算的大数据研究技术平台,研究合适的方法体系,逐步形成系统、成熟的大数据分析方法和模型;推动多学科合作,实现公共卫生数据收集、整理、共享、挖掘、分析、决策一体化,更好地促进疾病预防、健康促进、卫生决策;公共卫生领域需要全面实现信息的标准化,增强数据互用性,促进信息共享,建立有效的数据管理方式,改进分析技术和方法,培养拥有公共卫生背景的数据分析专业人才。同时,建议政府尽快设立大数据使用法规,推动大数据在健康领域的落地,合理运用大数据服务大众健康。

大数据在公共卫生中应用,突出体现在以传染病实时监测的信息为依据,以历史疫情大数据为基础,建立敏感特异、科学实用、适用基层的传染病爆发、流行的预警体系,提高了中国传染病疫情监测的预警能力,并在传染病爆发、流行的早期能够及时发现并采取快速的应对措施,从而减少传染病对人民健康和社会经济发展造成的影响。大数据是云计算的具体化,且正在成为一个国家最重要的国家社会资源,对大数据的获取和利用能力正在成为软硬兼备的真实力。公共卫生大数据的核心组成部分是由政府公共卫生机构所拥有的社会管理和公共卫生活动数据,以及由政府卫生行政部门直接拥有或间接支持下获得的物理世界和生物世界的数据。与政府数据资源相比,无论个人,企业或社会组织如何努力,获取和可利用的数据资源都是简单、片面和利用价值极其有限的。如何使政府从垄断和保密数据的历史惯性思维方式中解脱出来,在确保隐私、机密和国家安全的前提下,由政府主导开放数据,降低公众获取和利用政府数据资源的难度及成本,至少是公共卫生大数据时代开启阶段需解决的瓶颈。

参考文献

[1]国务院办公厅.关于促进和规范健康医疗大数据应用发展的指导意见(国办发﹝2016﹞47号)[Z].2016-06-21.

[2]马家奇.公共卫生大数据应用[J].中国卫生信息管理杂志,2014(2):174-177.

[3]孟润堂,罗艺,宇传华,等.健康大数据在公共卫生领域中的应用与挑战[J].中国全科医学,2015(35):4388-4392.