南京引光医药科技有限公司

临床试验逻辑核查的分类及应用

发稿时间：2019-07-04 来源：中国临床药理学与治疗学

作者：周蓓，于浩（南京医科大学公共卫生学院，南京 211166,江苏）

来源：中国临床药理学与治疗学 2019-06-27

摘要：临床试验数据的清理是临床试验过程中非常重要的环节，完整、清洁的数据才能用于统计分析。本文旨在讨论临床试验数据清理过程中数据核查计划的撰写及逻辑核查的分类等，并进一步讨论近年来临床试验数字化趋势对数据的采集及清理可能带来的影响。

关键词：临床试验；数据清理；病例报告表设计；数据核查计划

临床试验数据是药物研发过程中最重要、最有价值的产出之一，是整个临床试验过程中的核心，最终作为统计分析的基础用以论证药物的安全性及有效性。保证数据的完整及清洁有助于得到可靠、可信的结论。而临床试验数据的采集、报告与处理的每一步骤都可能伴随错误。国内外法规均明确要求，在数据收集录入完毕后对数据进行审查、核对、清理，及时发现并解决问题以获取完整、清洁、真实可信的临床数据。本文对临床试验数据管理中数据清理的各类核查类型及数据核查计划的制定进行了总结，以期对后续临床试验的数据清理提供一定的参考。

1 数据核查计划的建立

《药物临床试验数据管理和统计分析的计划和报告指导原则》中提到，规范的数据管理计划有助于获得真实完整、准确可靠的高质量数据。为保证临床试验数据的质量和科学评价药物的有效性与安全性，须事先对数据管理工作和统计学分析原则制定详细的计划书。在进行数据核查前，应制定详细的数据核查计划(data validation plan,DVP),以明确数据核查内容、方式与核查要求。相关人员根据数据核查计划进行编程或人工核查，之后发出质疑(query)确认数据。

数据核查计划的制定非常关键，应至少包括如下内容，如Tab.1所示。

无论是纸质或者电子数据采集系统，均应在试验开始初期撰写完备、清晰的数据核查计划，以便能高效、准确地对数据进行清理。获得高质量的临床研究数据是临床数据管理的最终目的。同时数据核查计划还应由临床试验其他参与人员，如申办方、统计分析人员进行审核，以防止漏查、错查、重复查的情况出现。

2 临床试验中收集的数据模块概述

一个临床试验数据中通常包括受试者人口学基本信息、病史、实验室检查、体格检查、生命体征、不良事件、合并用药、研究完成情况等信息。

研究目的、适应症及分期的不同会导致临床数据的收集有一定的差异。不同数据模块的核查与清理有一定的共同性，同时不同模块之间也有一定的交叉性，整个临床试验收集的数据即是各个单独的模块构成的一个整体，模板之间独立又互相关联。除了单个数据点的核查外，通常还涉及模块与模块之间的交叉核查、数据库中收集的数据与外部数据的核查等。

3 逻辑核查的分类总结

临床试验数据核查中的逻辑核查涉及缺失值、极端值、异常值等。根据质疑产生方式的不同分为系统核查、人工核查等，系统内核查撰写方式的不同又分为系统内置核查、人工撰写的逻辑核查等。为阐述方便，我们将其大致归为几类：

窗口/范围的核查：临床试验中涉及的日期通常具有一定的前后逻辑关系并且大部分日期需要在一定的访视窗范围内，如访视日期。

交叉逻辑关系的核查：临床试验中各个数据点并不是独立存在的，其通常与其他数据点具有一定的逻辑关系，需在某一数据点的条件下考虑另一数据点的数据情况，如受试者性别与妊娠试验的关系。

缺失/不完整：临床试验中一些数据点的缺失及日期数据不完整的情况。如人口学资料、知情同意日期等。

其他核查：不同的临床试验项目可能具有一些不同的数据核查要点，大部分不具有共通性。

同时临床试验中还有一部分外源性数据，如中心实验室检查、第三方PK/PD数据、严重不良事件等，需要临床数据库中的数据进行人工的一致性核对。大致情况如Fig.1所示。

3.1 范围及窗口的逻辑核查

临床试验方案通常对试验期间的各个时间点有若严格的规定，各日期之间有一定的前后关系且有固定的窗口期。病例报告表(CRF)中对这些日期进行收集，而数据管理员需要对这些日期、时间点进行一定的核查，以确认各访视、检查等确实按照方案进行执行，而违反方案的日期确实是操作中的实际情况而非填写错误等。通常情况下，各个访视内的各检查日期均应在本次访视及下次访视之间。

另外知情同意书的填写需要为临床试验中最早的一个日期（既往史除外），所有临床操作都应该在受试者签署知情同意书之后进行。

而在肿瘤项目中，由于无进展生存期(progression free survival)、总生存期(overall survival)等作为主要或次要指标，对进展日期、死亡日期等尤为敏感，需要对其进行细致的确认及核对，如进展日期与死亡日期的一致性核对。

3.2 模块间的交叉逻辑核查

模块间最常见的交叉核查主要为病史、不良事件、合并用药及实验室检查之间的关系核查。

病史通常记录的是受试者在进入试验前存在过或仍存在的疾病，通常与试验目的、适应症及药物特点有关。当病史中存在一些慢性病时，如高血压、糖尿病时，这类疾病通常是难以治愈且需要持续用药控制的，这时注意核查合并用药中是否记录了相应的药物。不良事件作为药物安全性的重要佐证，是临床试验数据极为重要的一部分，不良事件的出现意味着可能出现的实验室检查异常及相应的合并用药及治疗。

合并用药中记录包括针对既往病史及不良事件的药物情况，可能还会存在一些预防用药。需要与病史及不良事件进行核查，以防漏记或错记等情况发生。同时合并用药对后续方案中违禁用药的判断、分析集的划分而言是非常重要的。

实验室检查（生命体征、体格检查）通常与不良事件相对应，两者之间互为因果关系，需要对其进行一致性的核对。

这几块数据的清理通常需要耗费大星时间来进行人工核查。基于目前业内临床试验数据管理的趋势，可考虑通过CDISC标准标准化、模块化CRF及前期数据管理的准备工作以减轻核查工作量，进而提高工作效率及数据质量。

3.3 缺失或不完整的核查

数据缺失及不完整的核查在数据清理过程中占很大一部分。在临床试验数据收集中，有些数据点是必须收集的，如知情同意书签署日期、性别、年龄等。在数据采集过程中，需要注意区别数据确实未采集与数据漏填的情况，较好的方法是规定单个独立的数据点都需要填写数据，如数据未知或不适用，则相应的填写UK(unknown)或NA(not available),以便于清晰明确的进行区分。

除单个数据点外，临床试验中收集的数据通常具有一定的前后关联，病例报告表中一般会收集一些提示性变量，这些变量并非均为关键性数据点，其主要作用在于：(1)提示研究者注意此处是否进行了检查以及是否检查了但未誉写至CRF;(2)用于数据管理核查，如无此变量，数据核查无法确认此数据点是否确实未做或是漏填写。此类逻辑核查在临床试验项目中非常常见，并且也涵盖了临床试验逻辑核查的大部分内容。此类逻辑核查通常较为简单，但需要注意在撰写数据核查计划时需要考虑周到全面，防止遗漏。

3.4 人工核查

人工核查是指数据管理员通过CRF所收集的数据获取核查所需的受试者相关数据信息，整理成数据清单或列表(data lists)的形式，根据医学相关的专业知识对数据之间的逻辑关系通过人工的方式进行核查，找出有逻辑错误之处，而后通过质疑进行确认。

需要人工核查的数据，通常其数据形式为开放填写内容(free text),数据杂乱无序，无法通过程序来进行统一的判断。如同一个不良事件-谷丙转氨酶升高，在不同中心、不同研究者，甚至同一个受试者的不同访视阶段名称各不相同，如描述为“谷丙转氨酶升高”、"AST升高”、"肝功能异常”、"丙氨酸氨基转移酶升高”等等。

3.5 外部数据的一致性核对

临床试验过程中，有时会出现一部分外部数据需要与临床数据库中的数据进行比对，如中心实验室、第三方PK/PD、严重不良事件等外部数据基本信息的一致性核对。其中严重不良事件(SAE)是药物安全性的重要组成部分，在临床试验过程中，目前国内SAE需要在获知后24h内上报，通常临床运营团队会进行采集整理，而另一方面SAE作为不良事件的一部分，在CRF中也进行了收集。这两部分数据的一致性核对是非常重要的。SAE的数据点较多，人工核查费时费力，可以通过SAS DDE语言来实现不一致数据点的定位标记，使一致性核对更加的精准直观。也可以通过EXCEL的VB语言，在数据导出到EXCEL之后，进行数据的处理及核对标记。两者虽然途径不同，但主要目的还是通过计算机语言对不一致处进行标记以提高一致性核对的效率。

在数据最终锁定之前，数据管理人员、统计师、监查员等各方需要进行一次数据核查会，对数据进行评估和检查，以确定分析集的划分，并对仍然存在的难以解决的数据疑问进行讨论确定。

4 讨论

数据即事实，各个阶段的临床数据的收集组成了整个临床研究,我们可从临床数据中窥见各阶段操作、执行、记录的过程。数据的质量直接影响到最终数据递交，数据清理的过程是递交高质量数据以供统计分析及报告的必经的一步。而近年来，临床试验行业的快速发展及新兴技术的出现，也为临床试验数据管理与数据清理带来了新气象。

从早期的纸质系统到目前盛行的EDC(electronic data capture system)系统，临床试验逐渐向电子化转换。数字化趋势下，除了国际广泛认可的RAVE、RDC、InForm等系统，目前国内也出现了各类EDC系统。各类系统的出现给临床试验数据的清理提供了一些新的方法和思路。传统纸质系统的数据清理有一定的滞后性，而EDC系统自动通过内嵌的程序自动产生质疑，使临床试验的数据清理呈动态进行，前期的数据核查计划撰写及系统的配置、测试是非常重要的，动态清理在一定程度上减轻了后期数据清理的工作量，保证了质疑的时效性。目前部分EDC系统除有CRF构建、逻辑核查、实验室管理等基本功能外，还可通过OCR(optical character recognition)技术识别化验单进行自动读人，通过系统内嵌程序智能提醒AE与CM的关联度，通过语音进行质疑答复等，使传统的数据采集、清理变得更加的高效简捷，临床研究数据库与药物安全瞥戒等数据库的宜接对接，也一定程度地减轻了数据库间的不一致性。减轻工作量的同时更能一定程度上提高临床试验的质量。

另一方面，FDA于2013年8月颁布了一项临床试验新的监查指导原则《基于风险的检查方法(A Risk-Based Approach to Monitoring)》，其中强调了中心监查(centralized monitoring)的概念。同时在ICH E6(R2)中也对中心化监查进行了定义：中心化监查是由合格的、接受过培训的人员（例如数据经理、统计师）对收集的数据进行远程的评估，对数据进行集中的审阅，包括中心内与中心间的数据趋势、异常值、方案违背等。对于数据管理人员而言，数据的清理与评估不再是基于单个受试者或单本CRF,而需要站在各个中心的高度俯瞰中心间的异同及趋势。

在未来临床试验的发展进程中，数据管理人员不仅在数据的管理方面，同时还可能越来越多地参与临床试验的监查过程中。行业的革新与新技术的发展为数据清理带来了新的发展和方向，也给数据管理人员带来了更多的挑战和机遇。

参考文献（略）

首页>

新闻资讯