部门    审评二部
作者    唐健元
发布日期    20090415


      基线协变量是指受试者在服用试验用药物之前,预计会对主要变量分析产生重要影响的一个定性因素或一个定量变量。这类变量可以是人口统计学变量如■年龄和体重;也可以是疾病情况如病程或病情『严重程度;还可以是一些疾病预后因素如通常认可的病】理生理基础;当然还有一些其它因素▓如中心或研究者等。基线协变量在Ψ 临床试验期间有两个阶段需要考虑,一是在随机化过程中作为分层因素,其次是在分析过程中便于调整。目前有许多不同的技术用于调整基线协变量,可以根据协变量和结局变量(outcome variable)的性质进行选择,例如当主要结局是定量时通常采用方差】分析或协方差分析,如果主↘要结局是一个二元或分类变量时则采↓用Logistic回归,如果是时间-事件数据则可采用Cox回归。
一、 设计考虑
1分层
      事实上,随机化处理是为了使各个协变量水平在不同治↘疗组间得以均衡,它通常不被用来观察在此之后的不平衡。如果某些不平衡趋于支持试验组则需特别关注。分层随机通常用来减少治疗组间指定协变量水平内的不平衡可能,如“一般定性协变量”(generally qualitative covariates)或“分类定量协︾变量”(categorised quantitative covariates)。以下其他原因也可▼采用分层设计:
①平衡各治疗组间某个√或多个相关特定预后协变量,以加强㊣试验结果的可信性;
②分层后可能会改善治疗效应的有〓效性评估,特别是对于小样本或中等规模的试验。在随机化阶段分层和分析中调整协变量被视为是说明协变量的补充手段;
③如果认为治疗效应在之前规定的亚组(如人种或年龄组)中确实存在明显差异,那么对这些亚组分层可以有助于ξ解释这个治疗效应以及这些亚组的一致性。这也有助于加强推理认为可能有较大获益的某些亚组分析的可△信性。如果认为存在某々种交互作用,那么这个试验应该支持特定亚组内的治疗效应;
④有时可以基于管理方便而采用分←层。
如果临床试验中存在多个可能影响结果的协变量时,分层处理往往就有必要。但需注意的是分层后会导致样本量减小,因此,在大样本临床试验中,即使从理@论上讲可能存在很多分层因素,但也仅仅考虑将临『床上最重要的或与治疗◥预后密切相关的协变量纳入分层分析。
2多中々心试验ξ 
      大多数多中心临床试验按中心或研究者进行分层要么是因为实际↑原因要么是因为中心或研◇究者被认为会与其它已知或未知的预后因素混淆。如果一个多中心试验未按中心进行分层,那么需在方案中解释其它协变量为什么比中心因素更重要并证明其合理性。如果每个中心的样本量很小,则可以不按中心进行分层随机,但即便如此也应考虑是否按ぷ国家或地区进行分层随机。
3动态分配(Dynamic Allocation)
      如上所述,对多个预后因素进行分层不太可能,特别︽是小样本临床。在这□种情况下,像最小化这种动态分配技术有◇时便用于同☉时实现多因素间的平衡。即使不用于确定性方案,这种方法也存在∞很大的争议。因此,强烈建议申请人尽量避免使用这类方法,如果要用,应从临床和统计学角度去证明其合理性。
二、 主要分析中协变量的纳入、排除标准
1联系主要结ぷ局
      分析中考虑协变量因素主要是基于协变量和主要结局指标之间有「着密切的联系(strong or moderate association)。调整协变量通常会∩改善有效性分析,并因此产生一个更有说服力◥且更精确的╳效应证据(更小的P值和更窄的可信区间)。但是仅※仅通过一个更小的P值并不足以支持一个令人信服□ 的、临床认可的获益效应,治疗效应的大小和协变量不同水平间的一致性才是考虑的重点。已知或预期同主要结局变量的联系应基于前期证据(源自前期试验或◤其它当前试验的可能数据)和(或)临床原因去证明其合理性。为什么在主要分析中纳入某个√协变量须在临床方案或破盲前的▅统计分析计划书中予以明确→说明。
2分层
      主要分析应通过分★层来反映随机化的局限性。出于这个原因,无论预后值怎样,分层变量通常会在主要分析中作为协变量。在主要分析中,任何错误匹配分层和调整之间的协变量必须予以解释并证明其合理性。
3多中心临床
      当多中心试验》是按中心分层时,无论预测╲值怎样,中心因◣素应纳入主要分析中进行调整。如果每个中心的受试者数量很少,那么按这种方式进行分层随机可能就不合适。如果分析时忽略随机化的中★心因素或对大量小样本中心进行调整则会导致评估治疗效应的不可靠,P值要么过大要么太小。如果中心被纳入随机化方案,但申请人又未按中心进行分析,那么就需要解释为什么,并应通过敏感性卐分析(Sensitivity Analyses)去充分解释和证明其合理性,以表明试验结论不会因此受到明显影响。
4动态分配
      动态分配有▽相当的难度,但是▃如果要用,分析中就必须将→所有用于分配方案的因∑素纳作协变量。即使有这样要求,分析是否充分反映了这个随机化方案仍存在很多争议。申请人将要求描述敏感性分析,并通过敏感性分析去支持主要分析结论。如果没有充分、恰当的支持或敏感性分析,则该项申请不会成功。
5此后』发现的基线不平衡
      基线⌒ 不平衡不应作为一个冠冕堂皇的理由将该基线指标视为协变量。随机化试验中一个明显的基线不平衡并能㊣就此认为是由因及果的,如果整个随※机化过程正确,那么所▓观察到的任何基线不平衡肯定只是个随机现象。
6受治疗分配影响的协变量
      在确证性试验中通常是不会将受到治疗分配影响的协变量纳入主要分析中,例如疗程、依从性或急救药物的使用等随机化后的协●变量指标。当某个协变量』要么是因为直接原因要么是因为合并有其它因素受到治疗ξ分配影响时,这种︾调整分析可能隐藏或夸大其治疗效应,因此很难解释这种治疗效应。
7基线变化○值分析
      如果分析是基于一个连续变量,通常会考虑是选择结局观测值还是基线∑变化值作为主要终点指标。无论选择哪个终点指标,基线值都应作为协变量纳入主要分析中。如果没有调整基线而采用基线变化值进行分析,通常是不会构成一个恰当∏的协变量调整。值得注意的是在统计模ㄨ型中当把基线︽纳作协变量时,无论是选择基线变化值还是结局观测值对于评估治疗效应都是⊙一样的。因此,如果采用了恰当的¤调整,那么终点指标的选择就仅仅成为一个解释性问题而已。
三、 对主要分析的说明
1一般性考虑
      纳入主要分析的协变量必须在方案或统计分析计划中预先指定。当◥确证性试验(Ⅲ期试验)开始时,重要的协变量应经过前期试验和其它有用的证据证明∩其合理。但是,如果在起草方案和完成研究期间出现认识情况的◤变化,于揭盲前在修ξ 订方案或统计分析计划中重新认识和更新分析描述是恰当的。此时纳入新的协变量或排除先前已经确定的其他协变量的理由应明确地说明,且应从临床和统计学角度予以考虑。当缺乏前期信息支撑时,不用或仅用少数协变量的简单统计模型更为可靠。在实际案例◥中纳入有多个协变量的分析并不比更少且优选过的协变量分ぷ析具有说服力。
      需注意的是纳入分析中的◣协变量的性质和数目可能会影响对分析的解释,尤其是在☆非线形模型中。应避免选择那ω些与主要结局最为相关的变量来选择协变量,即“变量选择法则”(variable selection methods)。评估协变量的临床和统计相关性,除看当前数据集外还应从其它数据来源去证明其←合理性。
      在一些案例中,并不是所有用于特定研≡究的相关敏感性分析都能预计在方案中。但◣是一些敏感性分析应提前计划以确定主要「分析结论是否稳健▅。特别是敏感性分析应被设计用于检验相关协变量的特异▓性假设。
2分析中的协变量数目
      虽然大样本试验较小样本试验可以纳入更多的协变量,但目前并没有一个正式规定指出分析中最多能纳入多少协变量。理论上讲协变量分析可以调整很多协变量,但预先指定的简单模型更为安全。事实上在统计模型中应考虑协变≡量和参数数目╲的限制。多水平的分类协变量可以造成有效性损失。对于这类协》变量,合并分类或开展其它敏感性分析策略需在方案中预先说明。
3协变量和▅主要结局之间的关系
      临床试验随机化的目的在于尽量不偏不倚地去评估不同治疗间的真实差异,而不是决定协变量和主要结局变量之间的真正联系。在标准线形模型假设下,毫无偏倚地评估治疗效应的决定因素并不取决于用恰当的函数形式(如线形或二次方程)去解释协变量和主要结局之间的联系。但是需注意的是协变量→或结局变量的离群值(outlying values)可能会对结果有不↑当的影响。如果预测到离群值▽的可能性,那么应通过一个合适稳妥的方法来最小化这种影响。
      如果分析是一个广义线形模型(generalised linear model)或非线形模型(如Logistic回归或生存期分析),更为关键的问题是协变量和结局之间的正确关系,错误的说明会使得评●估治疗效应出现偏倚。但是如果卐先前缺乏经充分证实的协变量和结局变量〖的关联信息,宜选用简单形式的统计模型。例如,当协变量是连续↑的,那么统计模型可能就建立在协变量和结局的线形关系基础→上;或者一个协变量被划『分为几个水平时,这个分层数就决定了样本量。在这种情※况下,决定如何描述分类的原则应被预先说明,采用的敏感性分析将确保主要结论不会高度依赖于所选择的分类。
      如果前期研究中充分建立有关于协变量如何与结局变量联系的♂信息,那么主要统计模型中应合并这些信息。联系协变↙量和结局变量的函数形式也应在方∑ 案或统计分析计划中预先说明并证明其合理ζ 。非参数回归方法(nonparametric regression methods)可以用于避免关于因变量(dependent variables)和独立变量(independent variables)关系的假设。但是在这些案例中,重要的是正确地评估能达到的治疗效应大小,而不是计算差异水平。
4受协变①量交互影响的治○疗
      如果没理由怀疑治疗和协变量之间存在⊙交互作用,那么主要分析仅需要包括治疗主效应和协变量即可。正好相反,如果设计时认为实际治疗与协变量可能存在交互作●用,那么□分层随机和(或)亚组分析就必须相应地提前计划,在相关的亚组分析中试验要有足够的检验效能去发现治疗效应。
四、 结果报告
1一般考虑
      如果方案或统计分Ψ 析计划中明确地指定有关键协变量并正确分析和解释,那么可以顺利地得出恰当结论。但是,如果协变⊙量和其调整方法没有明确说明,那么很多其他分析可能一样有效。这将会对申请人此后◤论证一个最为相关的特殊分析造成困ㄨ难。
2基线比较
      试验中由于基线不平衡使得统计检验不能有效处理随机和盲法。无论统计检验是否意味着治疗组间有明显的统计学差异,相关主要协变量的基线概况应被呈现,并从临床角度予以讨论。
      如果事实上不同治疗组间的病例分配过程并非随机,那么出现的任何偏倚是不能通过统计校正来↓予以纠正。应根据基线不平衡原因的调查情况采取∏恰当的措施,例如剔①除一些病例或中心。在这种情况下还需对结果进行慎重解释。
      当由于纯粹偶然性的因素导致◤基线协变量在不同治疗组间不平衡时,调整过的治疗效应可以说明这个被观察到的不平衡,当未调整分析时则不可以。如果两组不平衡反映了试验组较对照组∞有更好的预后,那么调整这种不平衡就很重要。敏感←性分析应用来证明所观察到的任何阳性治疗效应,而不仅仅是解释基线协变量的不平衡。
3受协变量交互影响的治♀疗
      主要分析仅包括方案中预先规定的协变量,而没有交互作用范围。但是正如ICH E9指南中的建议,应对受协变量交互影响的治疗效应进行探索。检验交互作用通常缺乏统计效能,缺失交互作用的统计学证据并不能作为没有相关临床交互影响的证据。相反,交互作用不能认为仅仅建立在统计学意←义基础上。因此【基于有统计学意义的检验去评估交〗互作用范围没有太大价值。
      如果≡从临床观点看一些交互作用很大,或者从统计学观点看存在有∴统计学意义的交互作用,那么就需要证实不同亚组的治疗效应。这些结果应被∩仔细地审核,没有交互作用的主要分析所得到的结论应被谨慎解释和评论。如果所观察到的交互作用范围很大或者本质上是定性,那么就不可能对整个试验◇结果进行解释。
4模型假设的有效性
      在简单的〓方差分析(variance analysis)和协方〖差分析(covariance analysis)中,通常╱是在并不充分的条件下进行模型假设。如果【观察到一些离群值(outlying values),那么应关注这些不是协变量》就是主要变量的极端离群值,然后用其它方法来评估结论↓的稳健性。
      如果分析是一个广义线形模型或非线形模型,那么误用统计模型会导致错误地评估治疗效应。因而,在形成最终的研究报告时必须仔细地检查统计假设。如果不采用模型假设,应采取其它分析〖方法去证明清楚统计和临床的合■理性。
5敏感性分析
      一直以⌒ 来都会采用其它方法来确认研究结论不会因为纳入协变量或协变量与结局间的假设关系的选择而敏感。基于敏感性分析的结果通常被视为探索性的,但是需要在主要分析得到支持性依据后才有必要进行。
      对于普通的线形模型,治疗效应的调整估计应同未调整估计进∩行比较。估计的治疗效应大小虽然没必要完全相等但应近似。由于通常用调整分析会得到一个预期的有效性∏结果,因此对于未调整∑ 分析的没有统计学意义的结果没必︻要担心。相反,如果调整分析↑和未调整分析所得结论存在很大差异,应尽可能进行讨论和解释。如果主要分析结论和敏感性分析结论在临床和统计学意义方面存在很大差异,那么这个试验结果就不确定。
      对于广义线形模型或非ω线形模型,调整和未调整的治疗效应不可能会有☆一样的解释,而且有时调整□ 分析和未调整分析会得到完全不同的结果。因此,选择合适的协变量和预先规定好主要统计模型就至关重要。
五、 全面总结和建议
      采用简单随机方法的试验其有效性分析通常是不会要求调整协变量。但是,纳入有影响的协变量可以更有效地评估治疗效应,如果排除这些存在的、有影响的协变量则会造成无法发现①其真实的治疗效应。
      当未调整分析是技术上简单且又易于解释时,调整分析则会更♂为复杂。因此∏采用调整分析应证明其合理性,并ㄨ通过某种方式呈现出来让读者或审评人员能准确无误地理解。采用相对复杂的技术不应成为一个解释不清的借口。
最后建议如下:
⑴分层可以用于确保治疗间协变量的平衡,同时它也基于管理的需要。分层因素通常被作为协变量纳入主要分※析模型中。
⑵因为有充分的临床理论基础推导出已知变量会与主要♀结局和(或)主要变量密切联系▲,那么这个变量应视为主要分析中的协变量。基于此,所选择的变量应在方案和统计分析计划中预先说明。
⑶此后观察到基ㄨ线不平衡是不能据此认为应将其视为主要分析中的协变量。
⑷随机化后发现变量受到治疗的潜在影响通常是不会将其视为主要分析的协变量。
⑸如果一个连续性的结局指标基线值有用,那么通常将其作▃为协变量。但引申出主要结局变量用“结局值”还是“基线变化值”定义的问题。
⑹只能有少数协变量被纳入主要分析】中。虽然更大数据集较更小数据集可支持更多的协ぷ变量,但纳入的每个协变量应◥证明其合理性。
⑺在缺乏先前信息的情况下,应采用简单函数形式(通常要么是线形函数要么是将一个连续性评分划为两个等级)去假设某个连续性协变量和结局变量之间的联系。
⑻当评估结果时必须检查模型假设」的有效性。这对于广义线形模型和非线形模型非常重要,一旦误用会造成错误〓地评估治疗效应。即使在普通线形模型下,也需关注有←可能造成影响的极端离群值。
⑼无论何时】提出调整分析◤,按协变量分层形成的亚组疗效结果应被提出以便于评估模型假设的有效性。
⑽敏感性分析应预先计划◥并用于调查主要结果的稳健性。其中的差异性应被讨论和解释。当重要差异出现逻辑上无法解释时,例如调整ξ 分析和未调整分析的结果不一致,就会严重影响到对试验的说¤明。
⑾主要统计模型不应纳入受到协变量交互影响的治疗。如果推理估计有潜在█的交互作用,那么试验应【被设计成允许单独评估特定亚组的治疗效应。
⑿开展探索性分析有助于改善对未纳入主要分╲析的协变量的理解↓,并有助于申请人后续研发。
⒀主要分析必须明确地在临床方案和统计分析计划书中预先规定,并正确实施和解释,主要分析应能支持试验结论。由于可能存在有许多其它的有效分析,基于预先规定好的分析方法其结果最为可信。


参考文献:
[1]EMEA.Points To Consider On Adjustment For Baseline Covariates[EB/oL]. (date of operation on Nov.2003)