• 应用纪要

使用离子对液相色谱和质谱法进行合成mRNA寡核苷酸图谱分析

使用离子对液相色谱和质谱法进行合成mRNA寡核苷酸图谱分析

  • Maissa M. Gaye
  • Jonathan Fox
  • Johannes P.C. Vissers
  • Ian Reah
  • Chris Knowles
  • Matthew A. Lauber
  • Waters Corporation

摘要

信使RNA已迅速成为人类医学的重要方式,目前应用于癌症治疗评估和FDA批准的COVID-19 mRNA疫苗。随着分析方法的进步,mRNA疫苗和其他类别的mRNA疗法也得到了快速发展。这类方法的重点之一在于,它是通过液质联用法(LC-MS)进行序列图谱分析,来鉴定治疗性mRNA并确认纯度和修饰。与模板化RNA测序相比,使用质谱法进行RNA测序的优势在于,这种方法能够直接检测片段分子,可用于定位核苷杂质并鉴定重要的结构属性(5’端帽和polyA尾)。因此,我们提出了一种全面的LC-UV-MS方法,通过自下而上的工作流程来表征mRNA,该工作流程可产生源自精确质量数匹配的mRNA组分注释色谱图。

优势

  • 将离子对反相色谱与ACQUITY™ Premier BEH™ C18 300 Å寡核苷酸分析专用柱结合使用,可实现高色谱分离度和MS灵敏度
  • 在计算机模拟mRNA酶解计算和waters_connect/UNIFI™科学数据库应用程序的支持下,实现基于精确质量数匹配的自动化mRNA酶解注释

简介

新冠疫情(SARS-CoV-2)促进了核酸药物的快速发展,特别是合成mRNA1。 如今,距离1961年Brenner等人发现这种药物已经过去了40年2。 [i],mRNA已经发展成为一种具有巨大潜力的重要方式,分别在2021年8月和2022年1月用于癌症治疗的人体临床试验1–3以及获得美国食品药品监督管理局全面批准的两种COVID-19 mRNA疫苗。随着分析方法的进步,mRNA疫苗和其他类别的mRNA疗法也得到了快速发展。这类方法的重点之一在于,它是通过液相色谱串联质谱(LC-MS)进行寡核苷酸图谱分析并测序,来鉴定治疗性mRNA并确认纯度和修饰。Sanger和下一代测序(NGS)等核酸测序技术为药物开发人员提供了有价值的信息。不过,也可以通过将LC与基于串联质谱(LC-MS/MS)4或MSE(高低碰撞能量交替扫描)5的碎裂结合使用来提高分析水平。与自下而上的蛋白质组学方法类似,基于LC-MS/MS或MSE的测序方法具有直接检测RNA片段分子的优势,包括核苷杂质和重要结构属性的检测和定位,如脂质化核酸碱基6、封端残基和polyA尾部修饰4,7。与存在大量数据处理解决方案的自下而上蛋白质组学工作流程不同,RNA图谱分析的选择有限。我们提出了一种基于自下而上方法的寡核苷酸图谱分析工作流程,用于在包括LC、UV检测和MS测量的单一平台内表征给定的合成mRNA。使用内部开发的、可免费获得的计算机模拟酶解物库计算器“mRNAcalcondemand”与waters_connect™结合处理酶解组分,以产生带注释的色谱图。此处展示了使用RNase T1酶解的荧光素酶mRNA进行mRNA序列图谱分析的方法。

实验

样品信息

本研究采用大约90 µg合成Cypridina荧光素酶mRNA(未加盖且未用polyA尾修饰);由Bijoyita Roy(纽英伦生物技术公司,美国马萨诸塞州伊普斯维奇)赠送。使用3'-鸟苷特异性核糖核酸酶RNaseT1(Worthington Biochemical Corporation,美国新泽西州莱克伍德)进行酶解。请注意,使用10 µg萤火虫荧光素酶mRNA(CleanCap® FLuc mRNA,TriLink Biotechnologies,美国加州圣地亚哥)(非翻译序列为专有序列)重复此工作流程获得了相当的结果。酶解前,使用在无核酸酶缓冲液(10 mM Tris,0.1 mM EDTA,水溶液,pH 7.5,Integrated DNA Technologies, Inc,美国艾奥瓦州克拉尔维尔)中制备的20 µL尿素(8 M),在80 °C下将荧光素酶mRNA处理5分钟使其变性。接下来,将重悬于无核酸酶缓冲液中的24 µg (~10kU) RNase T1(Worthington Biochemical Corporation,美国新泽西州莱克伍德)添加到室温下的变性mRNA中,然后将混合物在37 °C下孵育30分钟。在孵育期结束时加入无核酸酶缓冲液(40 µL),使总样品体积达到80 µL。将最后的等分试样转移到300 µL聚丙烯自动进样器样品瓶中(P/N: 186002639)。在使用BioAccord™ RDa™检测器在负离子模式下进行MS检测之前,无需任何进一步操作即可对所得酶解物进行离子对反相色谱分析(IP-RPLC)。

液相色谱条件

液相色谱系统:

ACQUITY UPLC™ Premier BSM系统(作为BioAccord系统的一部分)

检测器:

ACQUITY UPLC TUV检测器

波长:

260 nm

色谱柱:

ACQUITY Premier BEH C18寡核苷酸分析专用柱, 2.1 X 150 mm, 300 Å, 1.7 µm(P/N:186010541)

柱温:

70 ˚C

样品温度:

4 ˚C

进样:

5 μL

流速:

0.4 mL/min

流动相A

含0.1% N,N-二异丙基乙胺(DIPEA)(作为IP试剂)和1% 1,1,1,3,3,3-六氟异丙醇(HFIP)的去离子水

流动相B

含0.0375% DIPEA和0.075% HFIP的65:35乙腈/水

梯度表

MS条件

质谱系统:

BioAccord LC-MS系统

检测器:

ACQUITY RDa检测器

模式:

碎裂模式下的全扫描

极性:

锥孔电压:

40 V

碎裂锥孔电压:

80-200 V

质量范围:

高(400~5000 m/z)

扫描速率:

2 Hz

毛细管电压:

0.80 kV

脱溶剂气温度:

400 °C

结果与讨论

使用C18固定相的离子对反相色谱法(IP-RPLC)已成为一种经过验证的寡核苷酸分析方法4,7。 流动相含有一种离子对试剂,通常是烷基胺,它吸附在C18固定相上8,9,10,从而引入了一种类似混合模式的保留机制8-10。本应用中所用的N,N-二异丙基乙胺(DIPEA)/1,1,1,3,3,3-六氟异丙醇(HFIP)的流动相系统与光学UV检测和负离子模式质谱均兼容4,7-10。HFIP用于增强电喷雾电离作用8

将RNase T1酶解的荧光素酶mRNA进样至ACQUITY Premier BEH C18 (2.1 x 150 mm, 300 Å, 1.7 µm)寡核苷酸分析专用柱上,并使用配备ACQUITY UPLC TUV检测器的ACQUITY Premier二元LC开发梯度。本研究所用的ACQUITY Premier BEH C18寡核苷酸专用柱与ACQUITY Premier BEH C18 130 Å寡核苷酸分析专用柱相似,但孔径更大,有助于提高长链寡核苷酸的分离度。使用BioAccord台式LC-MS系统的ACQUITY RDa检测器,通过负离子模式质谱重复采集三份数据。此外,将ACQUITY RDa检测器设置为采集MSE数据,这样每隔一次扫描就会产生一个高能量碎片离子谱图,随后可用于证实LC峰的鉴定结果。图1描绘了RNase T1对照样品(上方迹线)、mRNA对照样品(下方迹线)和酶解mRNA(中间迹线)的总离子流色谱图(TIC)。根据4-sigma峰容量为613的分离,很容易分离由RNase T1酶解荧光素酶mRNA产生的寡核苷酸片段。总体而言,色谱峰尖锐且对称,三次重复进样之间的保留时间(RT)差异约为0.01分钟。使用60分钟梯度时间法时,酶解物组分在2~23分钟之间洗脱;一些未完全酶解的mRNA在29分钟左右洗脱,而完整的RNaseT1在54分钟左右洗脱。如图1中的上方迹线所示,RNase T1对照样品在50分钟保留时间后才开始显示信号,这证实RNase T1不会在mRNA酶解物组分的保留窗口内引入干扰。(图1,中间迹线)。同样,图1中的下方迹线显示完整的荧光素酶mRNA在大约38分钟时洗脱,证实29分钟时在酶解样品中观察到的峰(图1,中间迹线)对应于未完全酶解的mRNA。我们注意到,对于包含5’端帽和polyA尾结构的合成mRNA,在酶解后约29分钟和37分钟观察到峰。约38分钟至约37分钟之间的微小变化可能指示未酶解的polyA结构(未来会有一篇应用纪要详细描述对此色谱行为的研究)。 

图1:离子对反相色谱法(IP-RPLC)分析RNase T1对照样品(上方迹线)、mRNA对照样品(下方迹线)和使用Rnase T1酶解的荧光素酶mRNA酶解物(中间迹线)的TIC;使用ACQUITY UPLC I-Class系统(ACQUITY Premier BEH C18寡核苷酸分析专用柱, 2.1 x 150 mm, 300 Å, 1.7 µm)和BioAccord ACQUITY RDa检测器在负离子模式下进行分析。

计算机模拟酶解mRNA计算器“mRNAcalcondemand”的图形用户界面(GUI)如示意图1所示。可以在碱基序列旁边指定许多酶解参数,例如修饰、酶和漏切位点。基于此处输入的内容,计算器将默认一些MS特定设置,包括电荷态和m/z范围,以及基于单同位素或平均质量数进行计算的能力。生成的输出内容为纯文本csv文件形式,可用于UNIFI或waters_connect软件,或用于补充下游分析。

示意图1:用于计算机模拟mRNA酶解质量数计算的mRNA计算器GUI。

接下来,创建一个库,将计算器的输出内容以电子表格的形式导入UNIFI科学库,在库中将酶解物组分视为单个分析物。创建的库可用于HRMS筛查分析方法,即使用用户指定的容差靶向查询采集后的酶解化合物。使用质量数容差进行库匹配的方法如下所示。库搜索的结果是自动生成带注释的色谱图(图2)。图2特别显示了17~20分钟保留时间窗口的放大图。 

图2:基于精确质量数与目标组分库匹配后生成的荧光素酶mRNA酶解物的带注释TIC。使用Rnase T1酶解荧光素酶mRNA,并使用ACQUITY Premier BSM LC(ACQUITY Premier BEH C18寡核苷酸分析专用柱, 2.1 x 150 mm, 300 Å, 1.7 µm)和BioAccord ACQUITY RDa检测器在负离子模式下进行分析。使用mRNA MASS计算器计算目标组分。

在以最多2个漏切位点为容差创建的计算机模拟库中进行数据筛查后,从每个技术重复样中产生了总共436、428和441个酶解物组分的潜在鉴定结果(ID)。在人工验证时考虑了几项标准。根据丰度和峰形(例如,低丰度色谱峰肩),在441个已鉴定组分中,有40个被拒绝。这些被拒绝的ID大多数(27/40)位于24~60分钟之间。总体而言,约60%的已鉴定和验证组分的质量数误差在10 ppm以内(261个酶解物组分)。对RNase T1对照样品(图1,上方迹线)进行了相同的查询,如预期一样没有产生任何鉴定结果。除了峰形和丰度之外,我们还基于对同位素分布的高置信度解析进一步验证了结果,以推断电荷分配,并因此得到了139个酶解物组分(65%在5 ppm质量数误差内)。最后,其中某些分配结果似乎是由于重复检测展宽和包含肩峰的色谱峰触发的冗余分配,因此未纳入分析中。因此,又排除了16个鉴定结果。然而,在几个例子中,分析物质量数出现在多个保留时间,导致产生了两个独立的ID,对应于两个不同的、明确定义的色谱峰。在这里,我们还注意到存在同分异构体ID(化学成分相同但序列不同的物质)以及同量异位异构体ID(化学成分不同[精确质量数不同],但标准质量相似的物质)。最终,基于精确质量数匹配可以鉴定90种独特的组分,如表1所示,包括同分异构核苷酸序列和同量异位离子(表1中以灰色突出显示的单元格)。 

表1:基于精确质量数匹配在10 ppm质量数误差内初步鉴定和验证的荧光素酶mRNA酶解物组分。对应于同分异构序列或同量异位离子的单元格以灰色突出显示。 

图3显示了产生酶解物组分UCCACUCUAUGp鉴定结果的示例数据。如左上色谱图所示,该组分在16.49分钟洗脱,基于m/z 576.5732 ([M-6H]6-)、692.0876 ([M-5H]5-)、865.3603 ([M-4H]4-)、1154.1438 ([M-3H]3-)和1731.7095 ([M-2H]2-)处5个携带2~6个负电荷的离子(图3,左下图)通过计算机模拟酶解物库鉴定得出。图中展示了[M-5H]5-和[M-2H]2-离子的同位素分布以显示支持电荷态分配的数据(图3,右)。

图3:在16.49分钟洗脱的酶解物组分UCCACUCUAUGp的鉴定结果(左上图)。基于m/z 576.5732 ([M-6H]6-)、692.0876 ([M-5H]5-)、865.3603 ([M-4H]4-)、1154.1438 ([M-3H]3-)和1731.7095 ([M-2H]2-)处5个携带2~6个负电荷的离子(左下图)通过生成的计算机模拟酶解物鉴定得出该化合物。实验中观察到的[M-5H]5-和[M-2H]2-离子的同位素分布分别见右上图和右下图。

如表2所示,使用waters_connect CONFIRM Sequence™应用程序解析MSE谱图,消除因存在由同分异构体或同量异位离子而造成的不确定性。第623-631位(ACAUCCUCGp)和第551-559位(UCACCAUCGp)的同分异构体序列均由RNAse T1计算机模拟酶解物预测得来,并且两者都分配至相同的保留时间13.87分钟。无法通过完整分子量分析进行正确分配。使用waters_connect™ CONFIRM Sequence应用程序,基于同一进样的MSE数据来阐明此分配的正确序列,预测其中每个序列的高能量碎片离子,并通过定制算法将这些离子与集成原始数据的同位素簇相匹配。利用点图表示已确认的碎片离子,从而快速评估序列覆盖率(图4,B):UCACCAUCGp的序列覆盖率达到100%,因此可以很容易地验证它是正确的分配(表2,第63行)。

手动验证的酶解物组分(表1)获得的中性母离子质量数从973.1406 Da(CCGp,RT 2.54分钟)到6366.7830 Da的20 mer核苷酸(UCAUUGAGUUCUUCAAACUGp,RT 19.39分钟)不等。最早洗脱的组分是UGUGp,经鉴定该组分的观测中性质量数为1320.1560,保留时间为1.64分钟。在手动验证的ID组(表1)中洗脱的最后一个荧光素酶mRNA酶解物组分是CAGGp (1342.1992Da),观察到它在22.38分钟洗脱。鉴于与CAGGp密切相关的序列UAAGp在约4分钟时洗脱,因此该洗脱时间明显晚于预期且相差较大。为了解决假阳性问题,我们使用waters_connect CONFIRM Sequence应用程序来进一步表征组分ID。基于MS数据和MSE数据进行验证。从表2中可以看出,包括CAGGp在内的34/90个组分没有生成足够数量的MSE片段来进一步验证序列分配,尽管精确质量数匹配支持该分配。另一个值得关注的例子是在同一数据集中观察到的指定序列AAAAACAUGUUGCCGp(4860.6678 Da,15-mer,9个嘌呤)和AUACAUUUGACAAAGp(4845.6568 Da,15-mer,9个嘌呤),二者具有相同的嘌呤含量但洗脱时间相隔10分钟。使用MSE数据,我们能够将AAAAACAUGUUGCCGp作为假阳性结果排除,并确认AUACAUUUGACAAAGp的鉴定结果。此例证明了战略性地使用精确质量数匹配和碎片离子质谱图来帮助明确鉴定mRNA序列酶解产生的组分的重要性。此外,我们通过观察结果认识到,mRNA酶解物组分的保留可能不如预期那样可预测,并且迫切需要进一步研究和建模来确认寡核苷酸与色谱固定相之间的相互作用。

最后,我们通过比较匹配的、手动验证的酶解物组分与mRNA序列来手动估计序列覆盖率。初步估计401个初始匹配的序列覆盖率得到的覆盖率值大约为76%。根据mRNA序列检查了经过严格验证的匹配后,得到的覆盖率值大约为22%。观察到的许多酶解物组分对应于荧光素酶mRNA序列的多个位置(表2),由于在修饰或完全修饰的核酸序列中只有四个单独的残基,因此预计会出现冗余。 

表2:基于精确质量数匹配的荧光素酶mRNA酶解物组分鉴定和验证结果,以及使用waters_connect CONFIRM Sequence应用程序和收集的MSE谱图获得的进一步验证。
图4:(A)第623–631位(ACAUCCUCGp)和第551–559位(UCACCAUCGp)的酶解片段组分基于RNAse T1酶解物预测得出,并分配至TIC中的相同RT峰。无法通过完整质量数信息确定正确分配。(B)同一进样的MSE数据可用于阐明此分配的正确序列。使用waters_connect CONFIRM Sequence应用程序,根据McLucky注释11预测每个序列的高能量碎片离子,并通过定制算法与集成原始数据的同位素簇相匹配。该软件在点图上显示了已确认的碎片离子,可用于快速评估序列覆盖率。

结论

在本研究中,我们建立了一个强大的分析工作流程,用于使用IP-RPLC和MS对合成mRNA进行寡核苷酸图谱分析。

  • 使用RNase T1可重现地酶解合成mRNA,包括低至10 µg的材料,并且无需额外的样品净化即可进样至ACQUITY Premier BEH C18 (2.1 x 150 mm, 300 Å, 1.7 µm)寡核苷酸分析专用柱上
  • 在ACQUITY Premier LC上使用离子对反相色谱法实现了高色谱分离度,因此酶解物组分可以很容易地与未完全酶解的mRNA和残留酶分离,从而使用BioAccord ACQUITY RDa检测器进行有效检测
  • 在计算机模拟mRNA酶解计算和waters_connect/UNIFI科学数据库应用程序的支持下,基于精确质量数匹配生成了带注释的mRNA酶解物色谱图
  • 我们使用waters_connect CONFIRM Sequence应用程序根据MSE谱图进一步验证了酶解组分的分配序列。此外,使用可视化点图快速检查了潜在分配的碎片离子覆盖率

本研究旨在建立促进mRNA分子自下而上表征所需的色谱、检测和数据解析方法。RNase T1酶解仅用作第一个示例,也是建立数据采集和分析工作流程的概念验证。也就是说,我们还有足够的机会通过以下方法更全面地探测给定的mRNA结构:(1)使用多种不同的核酸酶来生成正交和附加的序列图谱信息和(2)采用多重方法进行数据采集。这些方法都旨在实现全面的序列覆盖,并且将在未来的工作中得到进一步研究。 

参考资料

  1. Xu, S.; Yang, K.; Li, R.; Zhang, L., mRNA Vaccine Era—Mechanisms, Drug Platform and Clinical Prospection.International Journal of Molecular Sciences 2020, 21 (18), 6582.
  2. Brenner, S.; Jacob, F.; Meselson, M., An Unstable Intermediate Carrying Information From Genes to Ribosomes for Protein Synthesis. Nature 1961, 190 (4776), 576–581.
  3. Weide, B.; Pascolo, S.; Scheel, B. Derhovanessian, E.; Pflugfelder, A.; Eigentler, T. K. Pawelec, G.; Hoerr, I.; Rammensee, H. G.; Garbe, C., Direct Injection of Protamine-Protected Mrna: Results of a Phase 1/2 Vaccination Trial in Metastatic Melanoma Patients.J Immunother 2009, 32 (5), 498–507.
  4. Jiang, T.; Yu, N.; Kim, J.; Murgo, J.-R.; Kissai, M.; Ravichandran, K.; Miracco, E. J.; Presnyak, V.; Hua, S., Oligonucleotide Sequence Mapping of Large Therapeutic mRNAs via Parallel Ribonuclease Digestions and LC-MS/MS.Anal.Chem.2019, 91 (13), 8500–8506.
  5. Plumb, R. S.; Johnson, K. A.; Rainville, P.; Smith, B. W.; Wilson, I. D.; Castro-Perez, J. M.; Nicholson, J. K., UPLC/MSE; A New Approach for Generating Molecular Fragment Information for Biomarker Structure Elucidation.Rapid Communications in Mass Spectrometry 2006, 20 (13), 1989–1994.
  6. Packer, M.; Gyawali, D.; Yerabolu, R.; Schariter, J.; White, P., A Novel Mechanism for the Loss of mRNA Activity in Lipid Nanoparticle Delivery Systems.Nat.Commun.2021, 12 (1), 6777.
  7. Goyon, A.; Scott, B.; Kurita, K.; Maschinot, C.; Meyer, K.; Yehl, P.; Zhang, K., On-line Sequencing of CRISPR Guide RNAs and Their Impurities via the Use of Immobilized Ribonuclease Cartridges Attached to a 2D/3D-LC–MS System.Anal.Chem.2021.
  8. Guo, L.; Worth, A. J.; Mesaros, C.; Snyder, N. W.; Glickson, J. D.; Blair, I. A., Diisopropylethylamine/Hexafluoroisopropanol-Mediated Ion-Pairing Ultra-High-Performance Liquid Chromatography/Mass Spectrometry for Phosphate and Carboxylate Metabolite Analysis: Utility for Studying Cellular Metabolism.Rapid Commun Mass Spectrom 2016, 30 (16), 1835–1845.
  9. Birdsall, R. E.; Gilar, M.; Shion, H.; Yu, Y. Q.; Chen, W., Reduction of Metal Adducts in Oligonucleotide Mass Spectra in Ion-Pair Reversed-Phase Chromatography/Mass Spectrometry Analysis.Rapid Commun Mass Spectrom 2016, 30 (14), 1667-1679.
  10. Fountain, K.; Gilar, M.; Budman, Y.; Gebler, J., Purification of Dye-Labeled Oligonucleotides by Ion-Pair Reversed-Phase High-Performance Liquid Chromatography.Journal of chromatography.B, Analytical technologies in the biomedical and life sciences 2003, 783, 61–72.
  11. McLuckey, S. A.; Van Berkel, G. J.; Glish, G. L., Tandem Mass Spectrometry of Small, Multiply Charged Oligonucleotides.J. Am.Soc.Mass Spectrom.1992, 3 (1), 60-70.

致谢

我们在此感谢以下沃特世同事为本研究做出的宝贵贡献:Ana-Maria Rotaru、Emanuela Petreanu、Claudia Florea、Dave Jackson和Simon Jones。诚挚感谢以下的New England Biolabs合作者为我们提供荧光素酶mRNA并与我们进行许多深入讨论:Bijoyita Roy、Siuhong Chan、Ivan R. Corrêa Jr.、Erbay Yigit和G. Brett Robb。

720007669ZH,2022年6月

返回顶部 返回顶部