数据完整性的重要性 - 限制对可能被用来操纵数据的工具的访问 (第三部分)

2019年1月14日

阅读时间：7分钟

整合和重返社会的工具

有用的工具可以应用于实现准确和一致的结果，但同时，在错误的手中或如果有人有这样的意图，它们也可能被用来伪造数据。你如何分辨呢？

能够优化峰值整合（使用方法参数或手动整合）和纠正峰值识别（无论是通过重设方法保留时间（RT）设置还是手动识别峰值），这些工具可能会被无良的工作人员用来欺骗性地将不合格的结果操纵成合格的规范。换句话说，在错误的人手中，在错误的意图下，在没有强大的培训和审查程序的情况下，改变色谱峰处理参数已经被分析人员滥用来伪造结果。

有经验的科学家还知道，色谱分析会受到温度、湿度、色谱柱历史以及流动相制备的影响，因此，一天的分析往往与前一天的运行略有不同。为了实现一致的输出和测量，调整和/或优化诸如峰值检测阈值或RT预期等因素以确保一致、正确和准确的峰值测量和识别是至关重要的。但是，审查者、批准者、质量或外部审计人员如何识别这些工具的合法与恶劣使用？

在我的上一篇博客（第二部分）中，我介绍了四个值得关注的场景。

系统准备、试验或平衡注射，只有当这些被用于非官方的 "预测试 "实际样品时，才应该被关注。
多次尝试优化整合参数以实现精确的整合
利用人工整合来实现准确的整合
抑制峰值积分，以消除某些峰值被纳入分析的可能性

在这里，我把情景二和情景三放在一起讨论，因为它们是密切相关的。如何编写关于其中一种情况的标准作业程序将影响分析员对另一种情况的使用。

实现准确的整合

让我们首先思考一下现实世界的情况。色谱峰的形状和分离在不同的注射液中、在不同的日子里、在不同的仪器上都可能发生变化。在方法验证过程中，一定程度的方法重现性和稳健性总是受到挑战，但在色谱方法发展的历史上，几乎从来没有用一套不变的处理参数进行方法验证。色谱师努力验证一套单一的采集参数，但现在，当努力采用QbD方法时，甚至这也会成为相关参数的设计空间。然而，没有一个实验室会考虑对整合方法施加这样的限制。这将意味着每天使用相同的参数比使用适当的参数来获得最一致和最准确的整合更科学。

样品和标准品之间的峰面积的比较对结果的计算非常关键，因此峰积分必须是一致的。在不同的峰形和保留时间下（除了最简单的方法外，都会出现这种情况），分析人员必须优化积分方法的参数，以适应稍有变化的峰起点和终点位置。一套参数应该用于一个序列中的所有进样--标准品和样品。然而，对 "一个研究中的所有序列 "或 "所有批次分析永远 "强行使用同一规则，势必会导致每天的整合不准确和不一致。

大多数色谱数据系统（CDS）可以提供适用于低浓度和高浓度样品的整合参数，因为优化基线位置（峰宽和阈值）的主要参数评估原始数据曲线或原始数据曲线的导数的斜率变化。但是整合方法也有定时的事件，某些参数可以针对色谱图的不同部分进行优化。优化或调整这些的动作必须记录在审计跟踪中，最好还能保存在该迭代过程中创建的临时结果中，以及明确保存在可追踪的处理方法中。一旦创建了一套合适的参数，它们就可以应用于整个数据集，以计算出值得信赖和一致的峰面积。

虽然从技术上讲这不叫 "人工整合"，但事实上，这是一个需要人工技能来发现和评估最佳参数的过程。通常情况下，根据用于系统准备注射或系统适用性注射的组件，分析人员可能会使用这些注射来优化整合参数；但是，他们仍然可能需要根据实际的样品色谱图来进一步调整。

确保真正和一致的整合

长期以来，这种整合方法的优化过程被认为是值得信赖的可重复的峰值整合的关键。重要的是，在这个时代，峰积分和峰面积不是存储记录的一部分，这是同一分析员或不同分析员可以重新生成结果的唯一方法。手动放置峰的起点和终点被认为是危险的，因为第二个人不可能将峰的起点和终点放在完全相同的地方，但重新应用一种方法总是会产生完全相同的结果。

这种危险在大多数CDS解决方案中不再存在，实际的结果，无论是自动还是手动整合的结果，都储存在一个不可编辑的文件中。这意味着，当所有处理过的结果都被存储并可供审查时，永远不需要从早期的 "处理 "中重现整合。

也可以说，针对一种方法可能 "不正确地 "整合的少数峰，手动调整自动整合的峰，比强迫分析员反复尝试整个序列的整合参数，以解决几个整合不好的峰，更透明，更值得信赖。它允许评审员将评审重点放在人工整合的色谱峰上，以确保真实和一致的整合。

然而，峰值整合过程中的意图和动机可能会受到质疑。这些参数的选择是为了根据SOP准确地进行整合，还是故意选择过高或过低的峰面积，以迫使不合格的注射液通过？

一个不经意的评审员不太可能做出这种区分，但是一个熟练的评审员，从SOP中知道结果的整合应该是什么样子的，会发现故意低估或高估峰面积的情况。这需要对样品和标准注射进行审查，因为两者都需要一致的整合。理想情况下，SOP会包括一幅图，说明应该如何整合峰，特别是未解决的或分组的峰。

什么是正确的整合？

图1.根据方法的验证方式，SOP中正确和不正确整合的例子。当骑手峰较小或与API峰相当时，它可能有替代说明。

必须保持一致的是实际产生的峰值积分，而不是使用一致的参数或设置来实现该峰值积分。

还应该指出，不易察觉的 "削峰 "或在噪声下拖动基线以达到更大的面积的不良做法，只能在训练有素的审查员发现之前对结果的计算产生微小的影响。因此，只有那些 "边缘失败 "的样本才有可能通过调整积分的方式进入虚假的合格状态，而这种操作并不明显。出于这个原因，把审查重点放在 "边缘合格 "上，可以使受过训练的审查员很容易发现利用积分制造虚假结果的恶劣行为。

禁止人工整合的三种潜在结果

禁止使用人工整合是一种常见的反应，以避免有关数据完整性的问题。然而，这种粗暴的行动有三个结果。

实验室将不得不接受不良和不一致的整合
分析师会找到一种变通方法，允许他们用一组不同的整合参数来整合每一次的运行（通常涉及在LIMS中进行定量，或者更糟糕的是在电子表格中进行定量，而不能追溯到整合方法）。
分析师们将被迫花费数小时的时间来开发复杂的操作方法，以解决单一处理方法的色谱之间的差异。通常情况下，这需要许多 "整合事件"，甚至可能包括在特定的时间点上放置峰的起点和终点；实际上，在自动方法的幌子下进行人工整合，以欺骗审查者。

综上所述，在决定如何在实验室中进行色谱峰整合和再整合之前，要考虑正在运行的方法。这些方法或样品基质有多复杂？方法的稳定性和可重复性如何？实际的峰值分辨率有多大？并从这些评估中继续确定是否可以改进分离方法以实现正确的第一时间自动整合？

在此基础上，制定适当的整合和再整合的SOP，明确指导分析员如何使用规定的整合方法来处理不良的峰值整合，如何优化整合，以及何时允许手动整合。这也应该指导评审员如何评估最终结果和被取代的结果中的峰值整合。最后，如果分离不好的峰不能通过方法的改进来解决，每种分析方法都应明确指导分析员和评审员对峰群的预期 "整合模式"。

准确的整合应始终在结果生成之前进行，以确保无偏见的计算和报告结果。

在我的下一篇博客中，我将讨论使用积分参数来故意抑制某些色谱峰的积分，从而使其包括在色谱计算中。

阅读Heather Longden的博客系列中的更多文章，数据完整性的重要性。