自动化完整的质量解构。是时候了


自从约翰-芬恩博士为描述他早期的大分子电喷雾质谱工作插上 "大象的翅膀 "以来,我们一直面临着确定简化这些大分子产生的多电荷光谱的最有效手段的挑战。从他和他的学生Matthias Mann在1989年蛋白质电喷雾质谱(ESI-MS)的开创性论文中首次展示的简单代数算法,到使用更复杂的最大熵和贝叶斯处理算法,一直在不断尝试从生物大分子的电喷雾LC-MS分析中产生最准确和全面的去核零电荷质谱。

抗体和DNA螺旋
在开发新的waters_connect INTACT Mass应用程序期间,我们与生物制药行业的去卷积算法用户进行了交谈,并遇到了每周要处理数百至数千种不同大分子的科学家。

生物制药LCMS分析的自动化之旅

沃特世公司在完整的质量分析方面取得进展的时间同样很长。在约翰-芬恩2002年的诺贝尔奖演讲中(约翰-芬恩-诺贝尔演讲-NobelPrize.org),他承认VG分析公司(沃特世质谱的前身)的布莱恩-格林(*)激发了研究大分子的努力,并安排 "VG公司借给我们一台二手四极杆分析仪,可以称量质量/电荷比高达1500的离子",以便他们可以研究这一可能性。布莱恩是VG内部ESI发展的推动者,随后他与剑桥大学卡文迪什研究所的约翰-斯基林博士和MaxEnt Solutions有限公司的创始人形成了关键的合作。 1992年发表的一篇题为 "用最大熵分解ESI光谱"的文章,为第一个基于最大熵的商业化大分子光谱解旋奠定了基础。

随着Micromass从VG/Fisons脱颖而出,这种推进光谱解旋的努力继续进行,并最终发展成为Waters公司的一个完全整合的部分,首席研究科学家Keith Richardson博士继续与Skilling博士合作,为现代计算系统更新MaxEnt1和MaxEnt3算法,并优化它们以支持更高分辨率的飞行时间(TofF)MS光谱数据。 这些改进不仅适用于MassLynx,也适用于BiopharmaLynx,这是第一个旨在简化和自动处理完整蛋白质和肽图数据的软件工具。

第一个通用去卷积算法

Skilling博士和Richardson博士之间的合作,以及计算能力的不断提高,也促成了BayesSpray去卷积算法的发展--第一个 "通用去卷积算法"。这为真正的贝叶斯解卷过程的出现创造了条件,能够解卷较低和较高分子量物种的质谱--用于较低和较高分辨率的MS数据。该算法首次出现在美国质谱协会(ASMS)2010年的海报上,随后被纳入UNIFI信息学平台,用于处理自上而下和完整的质量数据。

这一领域的进步不仅仅是一个与计算能力的熟练程度相联系的故事。在认识到这些日益强大的算法需要自给自足和自我优化时,我们消除了依靠使用用户输入的参数来实现准确和有意义的结果的需要。

下面几节详细介绍了我们采取的方法,不仅加快了大分子电喷雾质谱数据的处理,而且建立了更智能的去卷积工作流程,即。

  • 实现自动识别色谱峰的这一目标
  • 确定在这些峰下处理光谱的最佳参数
  • 返回的结果可以被那些不是蛋白质质谱分析专家的人有意义地解释
在实验室中完整的质量工作流程
为了确保科学家们能够为解旋质量工作流程提供一个快速的周转时间,我们在整个开发过程中对集成的INTACT质量工作流程在一个实时系统上进行了广泛的测试,在分析过程中检查解旋的速度。

开发新的waters_connect INTACT大众应用程序。以用户为中心的过程

在开始开发新的waters_connect INTACT Mass应用程序之前,我们与生物制药行业的去卷积算法用户进行了交流,并与每周处理数百至数千种不同大分子的科学家会面。 我们为自己设定的目标是支持那些需要为质量确认和纯度测定提供高容量、高通量服务的用户。我们面临的挑战是提供一种方法来分析384孔板的样品,每个样品都是一个独特的大分子;在LC-MS数据采集完成后一两分钟内提供整个板的结果;即使板中其他样品的数据仍在采集中,也能立即提供紧急样品的结果。为了实现这一目标,我们对如何实现我们的去卷积算法进行了一些重大的结构调整。

  • 利用多线程进行解卷,这样就可以同时对多个质谱进行解卷。我们认为这是确保在采集的时间范围内对多个峰进行解旋的关键。
  • 使得数据处理能够与数据采集同步进行。这意味着384孔板的结果可以在数据采集完成后不久准备好。这也意味着,当同一平板中的其他样品仍在分析时,科学家可以提供急需的样品的结果。

如果周转时间要快,重要的是在大运行期间保持解卷的速度。当分析384孔板时,大量的数据被写入数据库并从数据库中读取,同时质谱正在被解聚。更为复杂的是,在整个运行过程中,随着获得的数据越来越多,分析的规模也越来越大,这会进一步影响读写时间。为了确保科学家能够为解质工作流程提供一个快速的周转时间,我们在整个开发过程中,在一个实时系统上广泛测试了综合INTACT Mass工作流程,在分析过程中检查解质的速度。

我们解决的用户挑战

  • 常规的完整质量工作流程中需要新能力的挑战:支持杂质分析,样品中的意外成分,人为错误,解像光谱中的伪影,以及使用解像算法所需的高水平的专业知识。
    • 新的实施:我们为自己设定了另一个目标,即自动生成正确的解聚光谱,而不需要用户提供预期质量、预期质量范围或输入m/z范围。当我们自动设置参数解质谱时,我们考虑到了杂质分析、降解研究、使用通用方法的能力以及执行非目标分析的能力。
  • 新一代疗法带来的挑战解释:实验室的科学家们在处理新的模式,如新型定制化学寡核苷酸、新型定制化学肽和共轭物时,解释了使用现有去卷积算法的挑战,因为同位素模型的选择有限:通常只是天然大分子的类型。
    • 新的实施:我们决定允许用户创建自己的同位素模型。这提高了质量的准确性,而且当使用包括氯等元素的自定义化学成分时,科学家有一个更简单的光谱来审查。
  • 生物治疗分子类别的多样性带来的挑战科学家们还向我们介绍了不同解卷积算法的利弊,以及他们对单质和平均质谱的偏好。很明显,需要对算法进行选择。
    • 新的实施:我们决定为用户提供自动创建的MaxEnt1和BayesSpray光谱的选择。广泛使用的MaxEnt1算法,基于最大熵,对较大的大分子产生很好的光谱,对与传统结果的比较很重要。
  • 数据质量的挑战该算法的缺点是产生伪影,用户报告说这是该算法的一个缺点。一种较新的嵌套采样算法BayesSpray对同位素分辨的数据具有重要的优势,同时对来自大分子的非同位素分辨的数据仍然表现良好。
    • 新的实现方式:我们现在为用户提供了BayesSpray的单体质谱和平均质谱的选择,并考虑了这个新实现方式的处理速度。

是时候了

实现在waters_connect INTACT Mass应用程序中自动处理大分子电喷雾质谱数据集的目标已经有很长一段时间了,从公布蛋白质光谱数据到现在已经有30年了,这让我们看到了这种可能性。个人电脑处理能力的提高,去卷积算法从简单的代数处理到最先进的贝叶斯分析的进步,以及电喷雾质谱系统能力的不断提高,使我们达到了从多电荷光谱数据创建零电荷谱的目的,而且不再需要专家用户干预。

归根结底,这是关于时间的问题。这是关于在进行分析和交流结果方面节省的时间。这是关于把一个不熟悉大分子质谱技术的人变成能够产生高质量结果的人所需要的时间。这是关于在你第一次分析样品时得到正确结果所节省的时间。这当然是关于时间。

其他资源。

博客。帮助实验室迎接效率的新时代

博客。将科学家与下一代信息学联系起来

博客。新的SELECT系列MRT重新定义了下一代高分辨质谱仪的性能

*我们悲痛地注意到布莱恩-格林,OBE在2021年12月去世,并请读者参考1996年《快速通信》上的文章,其中记录了他早期职业生涯的细节--在他所谓的退休后,他的科学生涯仍在继续进步。