更多栏目
搜索
姚晨:如何获得高质量的临床真实世界数据?| 遇见
施樱子·2019-11-25
遇见
真实世界研究如何真正落地?如何采集高质量的真实世界数据?


采访|施樱子 毛冬蕾

整理|马志爽

要得到符合监管要求的真实世界证据,一要有相关可靠的真实世界数据,二要有科学合理的研究设计,三要合规的开展研究,三者缺一不可。临床研究方法学专家虽然不直接减轻患者的病痛,但能帮助医生解决在数据收集和统计分析的困难,提高临床研究效率和科学性,最终获益的还是患者。


国家药品监督管理局发布的《真实世界证据支持药物研发的基本考虑》(简称《基本考虑》)从概念到实操层面都为我国相应的研究人员指明了方向,厘清了思路,对提升我国创新药研发的效率与能力具有深远影响。然而,正如许多业内专家指出,真实世界证据指导原则,如果没有真实世界数据作为基础,是不具备可行性的。


姚晨教授在2019真实世界数据研究交流会上发言


真实世界研究如何真正落地?如何采集高质量的真实世界数据?近日,《研发客》围绕上述数据话题,请教了北京大学第一医院医学统计室主任、北京大学临床研究所副所长姚晨教授。


多年来,姚晨教授作为生物统计学与临床研究方法学教授,在临床研究方案设计、数据管理和统计分析方法应用研究颇有建树。他认为,临床研究的数据采集、加工、整理是统计工作的一部分,是做好数据统计分析的基础。他回忆起自己20年前刚参与药物临床试验做统计分析经历,自己亲自录入数据,分析后从SAS软件输出结果中手工摘取统计量完成统计分析报告,数据有时会录错。在检查统计分析报告的最小值和最大值时,会发现有数据异常值,这时再修改数据就相当于重头再来。


延伸阅读:临床是红花,统计是绿叶


现在,姚晨不忘初心回归统计分析基础,即如何做好临床研究数据采集、整理的数据管理工作,目前正在推广医院临床研究源数据通用管理流程,完善多中心临床研究数据共享机制,进一步提高我国临床研究数据质量。以下是他的解读。


来自EMR的临床真实世界数据


真实世界数据(Real-World Data,RWD)是指与患者健康状况和/或医疗服务相关的、常规采集的来自于多来源的数据。临床研究中的真实世界数据大部分来自于电子医疗记录(Electronic Medical Record,EMR),EMR由医院诊疗系统采集。此外,还有为了这项研究专门收集的数据(评价疗效、影像资料重新读片等)。这些真实世界数据大部分都是非结构化的原始数据,数据形式多样。


利用真实世界数据开展的临床研究亦称为真实世界研究,其研究方法包括:实效性随机对照试验、队列研究、病例对照研究、患者登记研究、健康医疗大数据分析等。这些都是在真实医疗环境下开展的,没有特殊干预(如安慰剂对照组),潜在的对照组也已经存在,无论是否进行研究,数据都已经客观存在了。


EMR是以医疗为目的生产出的医疗过程数据,这一本质使得利用EMR数据进行临床研究具有特殊性,如部分医疗数据的敏感难以授权外部访问,数据分散于各独立系统中,大量非结构化数据难以利用,数据质量差等。


目前,健康医疗大数据分析的数据全部来自EMR,有什么数据就分析得出相应的研究结论,存在一定局限性。而临床研究常常会根据研究目的不同需补充收集其他来源的数据,如疗效随访数据等。各种来源的数据在不同研究中发挥不同作用,有时会作为对照组,这就是临床真实世界数据的特征。


姚晨教授在第二届真实数据与研究全国大会上发言


那么,真实世界研究最核心的问题——如何获得高质量的真实世界数据?美国FDA在真实世界证据框架中强调,要得到符合监管要求的真实世界证据,一要有相关可靠的真实世界数据,二要有科学合理的研究设计,三要合规的开展研究,三方面缺一不可。


首先强调研究设计,以问题为导向。这项临床研究要解决什么问题?设计中要考量是否进行随机和合适的对照?诊疗指标是否与审评关注的终点相关?用什么统计方法?偏倚如何控制?强调观察性研究实施前,研究设计及分析方法的透明化也是很重要的。


与RCT最大的不同就是,真实世界研究不是事先分组,而是事后分组,这就可能存在偏倚和混杂因素,所以要有统计方法控制。另外,真实世界数据由于不是事先设计好的格式化数据需要研究者重要整理填写更多与研究目的相关的信息,例如:病理切片中细胞类型,CT片重新测量肿瘤大小等,这些数据的特点都要在研究设计中事先考虑。


顶层设计与数据质量并重


为达到临床研究的合规性,首先要符合伦理,保护受试者的利益。在真实世界研究中,最重要的伦理问题是隐私保护,源数据不能随意被拿到,需要去隐私,例如:X光片包含性别、年龄等信息。其次,数据要可溯源,需要有一套规则和编码。编码不能用身份证号,需要用另外的数字进行编码。


姚晨教授讲解源数据的概念


那么,怎样生产合规、可及、可溯源、高质量的真实世界数据?EMR是医疗过程中积累的数据,大部分使用EMR研究的人在理念上或许存在误解,以为有了数据就能写文章,但是大数据不能解决临床问题,不能替代药物临床试验,只能看到一种临床现象,不能评价药物疗效,因为里面没有病人的随访数据,病人出院后的结局更无从得知。


医疗数据是敏感的,不能随便访问,这些数据分散在各个系统里,也是非结构化的,医生没有办法直接使用。目前也不能很好的处理EMR数据,医生一般靠人工从医院信息系统将数据转到另外一个临床试验数据管理系统,效率很低,低质量的EMR数据也无法产生高质量的真实世界数据。


2018年,姚晨团队在《BMJ》发表了《保障中国临床试验数据准确性》(Protecting the accruacy of clincal trial data in China)一文,文章首先纠正了《BMJ》在2017年发表的新闻“80%的中国临床试验数据存在虚假”夸大事实的新闻报道,同时提出了中国加强临床试验源数据管理的理念。


姚晨教授介绍基于医院的临床研究源数据通用管理流程草案


2019年他的团队联合科研管理人员共同发表了《深化临床研究透明化理念加强对研究全过程的监督及管理》和《加强医院临床研究源数据管理,提高我国临床研究数据质量》。其核心思想是在医院建立一个临床研究源数据管理平台。临床医生、医院管理者及其他管理部门都可以利用这一平台,包括医院信息科、伦理委员会,科研服务和管理人员等,该平台上的每个研究项目都有两种源数据,一是研究内容源数据,另一种是研究过程源数据,通过信息化处理技术进行数据传输、脱敏、加密、结构化、标准化、存储,最后随访、管理、稽查、统计分析等都可以在这个平台上进行。


未来,不论是随机对照临床试验,还是利用真实世界数据开展研究,数据来源都是基于某个研究问题提出的具体临床研究过程。首先要立项,经过伦理审查,确定哪些数据来源于EMR,哪些数据需要补充收集,再同步和结构化,去隐私后标准化,最后输出就可以共享了。

对话:每个医生都是数据拥有者


问:您原来做统计方法应用研究,现在回归到数据采集方法,您做这件事最初的想法是什么?如果概括来说,其目的是否为了突破国内真实世界数据的获取障碍,将EHR/EMR和EDC等数据联通起来?


姚晨:这是基于两大原因:

(1)数据质量问题。我们在医院给临床医生做统计咨询服务时发现,医生提供的数据质量存在不少问题,有些数据存在真实性疑问。比如:某个指标的数据变异系数很小,在某些临床指标的评价中不太可能。实际上,真实环境中各种情况都可能发生,也会出现科研诚信问题。


出现这种问题的原因有很多,第一,临床医生者或患者在感知或报告测量结果时有意或无意的失真。如依靠回忆主观报告治疗结果时容易出现报告偏倚,要把数据真实还原出来常常需要及时记录,另外,由于临床研究由于存在病人失访导致数据缺失这些也是临床研究中最为核心的问题。


第二,医生没有时间和精力整理数据。药物临床试验过程中,有的医生可能让其他人帮忙填写数据,未授权的人存在数据溯源困难情况。


如何让虚假的数据更少?要使用各种手段控制它。即使数据存在缺陷,也要真实反映出来。如临床试验过程中违背方案现象能否完整反映出来,另外,真实世界的数据采集也不能影响临床医疗过程,如有医生想做一个临床研究,设计了非常理想的数据采集表,有70多个格式数据空格,让病理科医生每次给病人看病理片子的时候填写,就没时间看病了。这也是不现实的情景。但如果为了做研究,仅选择符合入选标准的病人挑出来,再让病理医生来填就比较可行。


(2)医院不愿意公开数据。

医院信息科的主要工作是保障医疗信息系统安全可靠的正常营运,不可能满足所有医生对临床研究数据的需求,如果数据全部能够由医院信息系统以外的临床研究的EDC统自动获取,数据库的安全就不能保证了。


目前,各医院在进行药物/器械临床试验采用EDC收集数据时,通常需要临床医生人工填写纸质或电子的CRF,这时医生可能要重复输入数据,在医院信息系统中输入一次,在某项临床试验的EDC系统中再输入一次,两者也有可能出现不一致情况。


我们要帮助在临床医生利用数据产生证据过程中,如何高效高质量采集临床研究数据,将真实世界数据转化成真实世界证据,循证医学专家评估这些证据产生指南之后,让医生按照指南去利用证据,当然也要结合医生自己的经验以及病人的价值观和偏好,这才是我们提倡的循证医学的概念。


问:您现在工作中最重要的是要保证源数据的质量吗?

姚晨:数据质量我并不能保证,只能让医生重视源数据的收集和整理。现在医生缺少完整源数据,有了源数据不管什么时间做研究,不管谁做研究,都会得出科学的结果,价值远远大于只收集某项研究的CRF数据。有了源数据可以从多种角度去做研究。临床医生填写EMR 的数据是源数据,经过整理和加工后变成的可以统计分析用的研究数据。


问:您觉得在推进过程中最大的困难是什么?

姚晨:最大的困难不是技术问题,而是理念问题。对于医院管理者来说数据安全是第一位的,首先要保障医疗的正常运作,信息科会花费很多金钱和精力保证医院信息系统的正常运转。临床研究虽然也很重要,但是对信息科人员是额外的负担,医院的信息科由医疗副院长主管,而主管科研的副院长没有办法掌握医疗信息。这两个管理部门处在不同的角度,临床研究源数据管理平台由分管科研的副院长主管,还是由信息科安排人员来管理,只有经过处理和脱敏后的某项目临床研究数据库才能批准出医院,这样医院数据安全问题就能迎刃而解。


首先,所有源数据不能出医院,这就保证了数据安全。第二,数据依然在医院的信息科,只不过临床研究病例是所有医疗病例的子集。参与临床研究的信息科工作人员要知道这些研究病历将来做研究用的数据来自于哪个系统,使用了哪些数据,数据采集方案是否经过医院伦理委员会审批合格了。


此外,医疗数据一般不能完全满足临床研究。不同研究者、不同科室、不同专业对于数据的需求不一样,这时就要讲清楚研究的目的,额外的数据是否需要征求病人的知情同意。要有一套措施来保证,要透明化,让病人和医院知道获取数据的目的。


问:数据结构化是自动的过程吗,具体是怎么完成的?

姚晨:举个例子,应用自然语言处理(NLP)技术,将医学文本结构化处理,就可以自动获取数据了,实验室检查的数据更容易处理,通过导入就自动获取了这些数据。医院的数据变成科研数据库的时候,在获得伦理委员会和患者知情同意之后,研究者提交需求,由计算机系统产生一个研究数据库。那么,医生做什么呢?假如导出数据的时候有缺失值,是病人没有测量这一项?还是导出数据的时候有问题?需要医生去确认。这个系统可以帮助医生管理自己的项目,做数据核查、统计分析、绩效管理等。


问:您将来一直做这件事情的话,最希望达成的愿景是什么?

姚晨:我建议大家不忘初心,做研究的目的是解决医疗问题,做药物临床试验是评价药物有效性和安全性。做统计分析要回归到数据质量,通过收集数据、整理数据、分析数据得出规律,这是统计学科的特点。回归初心就是要回到临床真实数据基础,夯实基础后面的研究才可行。总要有人去做基础工作,计算机公司一直想拥有所有的数据,这种想法是不对的,数据是医院的。循证医学不是方法,是理念,指导医生在决策的时候要依据现有的、最佳的科学证据,结合自己的经验,以及病人的价值观和意愿,我们就是要帮助医生建立循证医学的理念。


问:怎样解决我国在医疗数据建设中各自为战、重复建设的局面?

姚晨:核心问题是临床研究的数据能否共享,关键是要解决利益冲突。过去谁都想做老大,宁做鸡头不做凤尾。如果每个人都在医院掌握大量源数据,同时在临床实践中不断针对临床问题产生新的想法去收集数据,产生研究假设,就有资格跟别人谈合作。在我国,如果各方都愿意分享不同病例数据时,临床多中心研究才能做到真实数据的共享和合作共赢。


未来医生的合作靠拥有的数据和想法,合作以前可以谈好文章的作者顺序、各自的工作量,这样的合作才有价值。如果所有的数据都集中在某一主要研究者,合作不会长久。我们应该提倡让广大年青医生对临床研究有兴趣和动力,年青医生常常是医疗一线的主力军。遇到的临床问题也多,在上级医生的指导下,常常可收集很多临床真实世界数据,在具体实践中会有灵感,还会根据源数据产生另外的研究数据。如果掌握了临床研究方法,可以总结出基于真实世界数据产生的真实世界证据,写出好的临床研究论文。这是一个良性循环,每个医生都是数据的拥有者,有数据才有资格与他人合作。


另外,要改变临床医生的科研绩效考核指标,以第一作者或责任作者发表文章的数量来考核是不符合临床研究的多中心大样本的特点,改变现在的考核机制很重要。


问:政府层面和产业界要如何携手合作?

姚晨:政府要鼓励临床研究,改变医生的考核机制,既要考核文章,也要重视临床研究中的实际贡献者,做好分工与合作。临床研究是为了解决临床问题,帮助病人解决对疾病的诊断和治疗。临床研究方法学专家虽然没有直接减轻患者的病痛,但能帮助医生解决在数据收集和统计分析方面的困难,提高他们的临床研究效率和科学性,最终获益的还是病人。


姚晨教授发表的研究论文

Protecting the accuracy of clinical trial data in China

https://blogs.bmj.com/bmj/2018/06/07/protecting-the-accuracy-of-clinical-trial-data-in-china/

深化临床研究透明化理念,加强对研究全过程的监督及管理

http://rs.yiigle.com/m/CN113565201902/1148689.htm

加强医院临床研究源数据管理,提高我国临床研究数据质量

http://www.cjebm.com/article/10.7507/1672-2531.201908047


责编|毛冬蕾


文章关键字:真实世界证据,姚晨
343
谁阅读了此文章?
回复评论0
登录后回复评论,不超过1024个字(当前剩余字数:1024)
施樱子 个人用户

研发客记者。爱好写作,对数字敏感,乐于追踪行业趋势变化

联系方式

联系电话

电子邮箱

shi.yingzi@pharmadj.com

公司名称

研发客

公司网站

公司地址

进入主页
Copyright © 2016-2020 研发客.All Rights Reserved.
建议反馈: Support@PharmaDJ.com
备案/许可证编号: 沪ICP备17054709号
联系电话:021 - 88194359