新闻中心

News Center

为了公共健康,大数据必不可少

发布时间:2016-07-05 16:20:37点击:

  

 

  如何让公共健康管理更简单

 

  Intetix Foundation(英明泰思基金会)由从事数据科学、非营利组织和公共政策研究的中国学者发起成立,致力于通过数据科学改善人类社会和自然环境。通过联络、动员中美最顶尖的数据科学家和社会科学家,以及分布在全球的志愿者,我们创造性地践行着我们的使命:为美好生活洞见数据价值。

 

  原文:

 

  How Semantic Data Analytics Benefits Population Health Management http://healthitanalytics.com/news/how-semantic-data-analytics-benefits-population-health-management

 

  虽然关系数据库的研究应用于基本的病人护理,但是语义学数据的分析是可靠的公共健康管理系统不可或缺的。

 

  在复杂的病人护理领域,存在的问题总是比答案多。临床医生和学者正在通过常规检查、复诊和治疗发现新的疾病,并且他们对人类的身体健康的认知也是指数级的拓展。

 

  对大多数内科医生而言,他们需要学习最新临床指导方针细节、最新的药物治疗方式并了解精准医药最前沿的发展。但是在照顾病人、满足常规要求和科技更新的沉重压力下,他们又不可能一直保持阅读大量的文章和研究。这时大数据分析就大有用武之地。分析工具可以通过同步电子健康记录、保险需求、病人自己记录的健康数据、甚至基因检测结果等,为可行的临床决定提供支撑,从而增进内科医生对病人护理的了解,填补医学院毕业后多年内知识更新的鸿沟。然而哪怕是最新最好的传统分析方法也难以满足现代医疗健康飞速发展的需求,即使小规模的HER数据挖掘也是非常困难和昂贵的,这其中面临很多数据完整性的障碍,这些障碍将降低结果的可信度。获得干净、完整和标准化的数据源已经足够困难。但是更加困难的是如何将分析结果转换成对患者更好的治疗。即使一个机构成功克服了一些基本障碍,开始进行公共健康管理,它也会受限于它所使用的原始科技。

 

  在最新的先进大数据分析技术系列中,我们探索了当前分析工具的极限和语义数据库改变医疗健康机构从事公共健康管理方式的可能性。

 

  语义分析深植于与最当前版本的大数据分析相同的概念:关系数据库。

 

  关系数据库最基本的的特性是电子表格程序。行和列表示着不同的按逻辑顺序排列的数据元素。用户可以创建公式、算法、比较询问和通过比较信息的差异从而提取相对更窄的可能的结果集。例如,一个医疗健康组织可能会建立一个包含患者姓名、住址、保险等信息的熟悉库,如图所示:  

 


  通过这个数据库,用户可以回答“Mary Fletcher 加入的是哪一个保险?”,“James Wong 居住在哪里?”,“有多少位患者居住在主大街?”等问题。

  


  关系数据库的困境

 

  即使在表格上增加更多的竖列试图提高解答病人疑问的可能性, 简单的关系数据库仍会变得难以控制以致于不能提供复杂问题的答案。

 

  Linda Sanchez 以新病人的身份来到诊所。 她在挂号时提供了她的地址和保险公司信息。她没有糖尿病,但是她的BMI指数已经到了高危范围,而且她在服用抗抑郁类药物。

 

  为了能够积极地管理Linda Sanchez,她的诊所需要知道什么?第一, 她换上心脑血管的临床风险。第二,可以阻止发生这类疾病的措施。 Linda的健康管理人员需要知道监视这些指标,而且她也得明白为什么Linda不能很好的控制她的体重,并且帮助她调节饮食和督促她锻炼。

 

  她的健康管理人员可能会问如下的问题:

 

  · Linda可以在商店里买到新鲜食材或者其他健康饮食的材料吗?

 

  · Linda有一个可以方便安全的地方锻炼吗?她有经济能力去参加一个健身房吗?或者健康管理人员要为她制定一个低成本健身方法?

 

  · Linda可以便捷的在当地的药房开出她抗抑郁的药物吗?她按时开药吗?

 

  一下子这个健康管理人员可能要处理大量的信息,这些数据可能大相径庭。

 

  她可能需要接触人口调查数据,需要通过保险纪录查看Linda的病史,了解Linda社区中药店的开药率,她也需要问关于Linda的各式各样的问题, 而不是Mary,James或者John的,没有任何一家健康组织会为每一位病人量身定做一个数据银行。没有任何一个数据科学家可以预测健康管理人员会提出怎样的问题,或者他们需要怎样的数据组合。 这种程度的公共健康管理,关系数据库已经无法满足了,太多数据有着不一样的结构,仅仅用电子数据表已经不能解答复杂的问题。

 

  语义数据库的出场

 

  语义数据库不是简单的陈列数据元素,而是将概念都链接在一起,数据可以在语义上的连接起来,就像人类大脑一样。

 

  当语义数据库运用到管理Linda的健康状况的时益处就更加明显了。比如, 从最近的美国人口普查里提取的家庭收入数据中, 数据策展人员可以讲在中心城市的东大道列为低收入社区。

 


  Linda Sanchez的地址在东大道上,所以她很有可能是低收入人群

 

  Linda Sanchez [病人编号106]

 

  [病人106地址]=[东大道]

 

  [东大道]=[低收入]

 

  [病人编号106]=[低收入]

 

  结论:Linda Sanchez可能是低收入

 

  假设Linda的健康管理人取得了所有在东大道上的商店信息,每个都整理归类,快餐店,事务所,卖衣服的,卖菜的和药房。 这样她就可以回答更加复杂的公共健康管理的问题了,比如说:“有多少我的病人住在低收入社区而且没有买菜的店?”“在中心城市哪些药房的处方药开药率最低?” 

 


  管理病人健康变得容易起来,因为健康管理人员不需要通过一系列调查梳理出Linda很难买到饮食中所需要的新鲜蔬菜,她也不用等到Mary Fletcher因为哮喘发作来急诊才知道因为她在低收入地区的药房,从而无法即使开药。 取而代之的是,只要从这很小的语义数据库中她就可以知道:

 

  · 在这个区域里有X名病人有糖尿病

 

  · 在这个区域里有X名病人使用Medicare为他们的保险,可能需要在老年的时候在家看护

 

  · 有X名有糖尿病的病人使用这两个药房,其中一个药房并不能满足他们的需求

 

  · 这部分的病人住在低收入社区可能需要交通工具才能来诊所

 

  · 这部分病人无法获得持续供给用药因为他们的药房不接受电子处方

 

  · 我们可以在这群病人邻近的食品商店设立免费流感疫苗注射点

 

  · 这部分病人可能负担不起多种药物的处方因为他们是低收入人群

 

  · 这个地区的人心脏病发病率很高, 可以在这个地方建设公共小路,提供给他们锻炼。

 

  健康管理者可能不能通过关系数据库预见到这么有深度的问题,也不能在这种原始数据形态下提问题,来满足她想要知道关于每个病人的问题。语义数据库填补了关系数据库这个缺点,通过每套添加到语义结构里的数据,健康机构就可以更了解他们的病人以及他们所处的环境,从而给出最好的治疗方案。