Automatisation de la déconvolution des masses intactes : Il était temps
Depuis que le Dr John Fenn a mis les "ailes aux éléphants" qui décrivaient ses premiers travaux sur la spectrométrie de masse par électronébulisation des macromolécules, nous avons été mis au défi d'identifier les moyens les plus efficaces de simplifier les spectres à charges multiples que ces grosses molécules génèrent. Depuis un simple algorithme algébrique que lui et son étudiant Matthias Mann ont démontré pour la première fois dans l'article fondateur de 1989 sur la spectrométrie de masse par électronébulisation des protéines (ESI-MS), jusqu'à l'utilisation d'algorithmes de traitement bayésiens et d'entropie maximale plus sophistiqués, il y a eu des tentatives continues pour produire les spectres de masse à charge zéro déconvolués les plus précis et les plus complets à partir de l'analyse LC-MS par électronébulisation des macromolécules biologiques.
Le voyage vers l'automatisation de l'analyse LCMS biopharmaceutique
Waters fait progresser l'analyse des masses intactes depuis tout aussi longtemps. Dans son discours de remise du prix Nobel 2002(John B. Fenn - Nobel Lecture - NobelPrize.org), John Fenn reconnaît à Brian Green (*) de VG Analytical (un précurseur de la spectrométrie de masse de Waters), d'avoir inspiré les efforts visant à étudier des molécules plus grandes, et d'avoir fait en sorte que "VG nous prête un analyseur quadripolaire d'occasion qui pouvait peser des ions avec des rapports masse/charge allant jusqu'à 1500" afin qu'ils puissent étudier cette possibilité. Brian a été la force motrice du développement de l'ESI au sein de VG et a ensuite formé une collaboration clé avec le Dr John Skilling de l'Institut Cavendish de l'Université de Cambridge et l'un des fondateurs de MaxEnt Solutions Ltd. Une publication en 1992 intitulée "Disentangling ESI Spectra with Maximum Entropy" a jeté les bases de la première déconvolution spectrale commerciale des macromolécules basée sur l'entropie maximale.
Cet effort pour faire progresser la déconvolution spectrale s'est poursuivi lorsque Micromass a émergé de VG/Fisons, pour finalement devenir une partie pleinement intégrée de Waters Corporation, où le Dr Keith Richardson, chercheur principal, a poursuivi le travail avec le Dr Skilling, en modernisant les algorithmes MaxEnt1 et MaxEnt3 pour les systèmes informatiques modernes et en les optimisant pour prendre en charge les données spectrales MS à temps de vol (TofF) à plus haute résolution. Ces améliorations sont devenues disponibles non seulement dans MassLynx, mais aussi dans BiopharmaLynx, le premier outil logiciel conçu pour rationaliser et automatiser le traitement des données de cartographie des protéines intactes et des peptides.
Le premier algorithme de déconvolution universel
La collaboration entre le Dr Skilling et le Dr Richardson, ainsi que les améliorations constantes de la puissance de calcul, ont également permis le développement de l'algorithme de déconvolution BayesSpray - le premier "algorithme de déconvolution universel". Cela a permis l'avènement d'un véritable processus de déconvolution bayésien, capable de déconvolutionner les spectres de masse d'espèces de poids moléculaire inférieur et supérieur - pour des données MS de résolution inférieure et supérieure. Apparu pour la première fois dans un poster de l'American Society for Mass Spectrometry (ASMS) 2010, cet algorithme a ensuite été intégré à la plateforme informatique UNIFI pour le traitement des données de masse descendantes et intactes.
Les progrès réalisés dans ce domaine ne sont pas uniquement liés à l'augmentation de la puissance de calcul. En reconnaissant la nécessité pour ces algorithmes de plus en plus puissants d'être autosuffisants et auto-optimisants, nous avons éliminé la nécessité de compter sur l'utilisation de paramètres entrés par l'utilisateur pour obtenir des résultats précis et significatifs.
Les sections suivantes détaillent l'approche que nous avons adoptée non seulement pour accélérer le traitement des données MS d'électrospray de macromolécules, mais aussi pour construire des flux de travail de déconvolution plus intelligents :
- atteindre cet objectif de reconnaissance automatique des pics chromatographiques
- déterminer les meilleurs paramètres pour traiter les spectres sous ces pics
- renvoyer un résultat qui peut être interprété de manière significative par des personnes non expertes en spectrométrie de masse des protéines.
Développement de la nouvelle application de masse waters_connect INTACT : Processus centré sur l'utilisateur
Avant de commencer le développement de la nouvelle application INTACT Mass de waters_connect, nous avons discuté avec des utilisateurs d'algorithmes de déconvolution dans le secteur biopharmaceutique et rencontré des scientifiques qui traitaient des centaines ou des milliers de macromolécules différentes chaque semaine. Nous nous sommes fixé comme objectif de soutenir les utilisateurs qui ont besoin de fournir un service à haute capacité et à haut débit pour la confirmation de la masse et la détermination de la pureté. Nous avons été mis au défi de fournir un moyen d'analyser une plaque de 384 puits d'échantillons où chaque échantillon est une macromolécule unique ; de rendre les résultats de la plaque entière disponibles une minute ou deux après la fin de l'acquisition des données LC-MS ; et de rendre les résultats immédiatement disponibles pour les échantillons urgents même si les données des autres échantillons de la plaque sont toujours en cours d'acquisition. Pour atteindre cet objectif, nous avons apporté quelques changements architecturaux majeurs à la manière dont nous mettons en œuvre nos algorithmes de déconvolution :
- L'utilisation du multithreading pour la déconvolution, afin que plusieurs spectres de masse puissent être déconvolués simultanément. Nous avons considéré qu'il s'agissait d'un élément clé pour garantir la déconvolution de plusieurs pics dans le temps d'une acquisition.
- Permettre le traitement des données en parallèle avec l'acquisition des données. Cela signifie que les résultats d'une plaque de 384 puits peuvent être prêts peu de temps après la fin de l'acquisition des données. Cela signifie également que les scientifiques peuvent fournir des résultats urgents pour des échantillons alors que d'autres échantillons dans la même plaque sont toujours en cours d'analyse.
Pour que les délais d'exécution soient rapides, il est important que la vitesse de déconvolution soit maintenue pendant les grandes séries. Lors de l'analyse d'une plaque de 384 puits, des quantités importantes de données sont écrites et lues dans une base de données, tandis que les spectres de masse sont déconvolués. Pour compliquer encore les choses, l'analyse devient de plus en plus volumineuse tout au long de l'exécution, car davantage de données sont acquises, ce qui peut avoir un impact sur les temps de lecture et d'écriture. Pour s'assurer que les scientifiques peuvent offrir un délai d'exécution rapide pour les flux de masse déconvoluée, nous avons testé de manière extensive le flux de masse intégré INTACT sur un système en direct tout au long du développement en vérifiant le taux de déconvolution au fur et à mesure de l'analyse.
Défis des utilisateurs que nous avons relevés
- Défis nécessitant de nouvelles capacités dans les flux de masse intacts de routineL'analyse des impuretés, les composants inattendus dans les échantillons, l'erreur humaine, les artefacts dans les spectres déconvolués et le haut niveau d'expertise requis pour utiliser les algorithmes de déconvolution.
- Nouvelle implémentation: nous nous sommes fixé un autre objectif, celui d'automatiser la production de spectres correctement déconvolués sans que l'utilisateur ait à fournir les masses attendues, les plages de masses attendues ou la plage m/z d'entrée. Nous avions à l'esprit l'analyse des impuretés, les études de dégradation, la possibilité d'utiliser des méthodes génériques et la possibilité d'effectuer une analyse non ciblée lorsque nous avons automatisé le réglage des paramètres pour déconvoluer les spectres de masse.
- Les défis posés par les thérapies de nouvelle générationLes scientifiques des laboratoires qui travaillent sur de nouvelles modalités, telles que les oligonucléotides, les peptides et les conjugués, ont expliqué les difficultés que pose l'utilisation des algorithmes de déconvolution existants en raison d'une sélection limitée de modèles isotopiques, généralement des types de macromolécules naturelles.
- Nouvelle implémentation : nous avons décidé de permettre aux utilisateurs de créer leurs propres modèles isotopiques. Cela améliore la précision des masses, et lorsque des chimies personnalisées incluant des éléments tels que le chlore sont utilisées, le scientifique dispose d'un spectre plus simple à examiner.
- Défis découlant de la diversité des classes de molécules biothérapeutiquesLes scientifiques nous ont également parlé des avantages et des inconvénients des différents algorithmes de déconvolution et de leurs préférences pour les spectres de masse monoisotopiques et moyens. Il était clair qu'un choix d'algorithmes était nécessaire.
- Nouvelle implémentation : nous avons décidé d'offrir aux utilisateurs un choix de spectres MaxEnt1 et BayesSpray créés automatiquement. L'algorithme MaxEnt1, largement utilisé, basé sur l'entropie maximale, produit d'excellents spectres pour les macromolécules de grande taille et est important pour les comparaisons avec les résultats antérieurs.
- Les défis de la qualité des donnéesL'algorithme BayesSpray permet de créer des artefacts, ce que les utilisateurs considèrent comme un inconvénient de cet algorithme. Un algorithme d'échantillonnage imbriqué plus récent, BayesSpray, présente des avantages importants pour les données à résolution isotopique tout en restant performant pour les données à résolution non isotopique provenant de grandes macromolécules.
- Nouvelle implémentation: nous offrons maintenant aux utilisateurs le choix entre des spectres de masse monoisotopiques et moyens pour BayesSpray et avons pris en compte la vitesse de traitement dans cette nouvelle implémentation.
Il est grand temps
La réalisation de l'objectif de traitement automatique des ensembles de données MS électrospray de macromolécules dans l'application waters_connect INTACT Mass a été longue à atteindre, 30 ans après la publication des données spectrales de protéines qui nous ont ouvert les yeux sur les possibilités. Les améliorations de la puissance de traitement des ordinateurs personnels, les progrès des algorithmes de déconvolution, du simple traitement algébrique à l'analyse bayésienne de pointe, et l'amélioration constante des capacités des systèmes de spectrométrie de masse par électronébulisation nous ont amenés à ce point où la création d'un spectre à charge nulle à partir de données spectrales à charge multiple peut être accomplie avec succès, et non plus avec l'intervention d'un utilisateur expert.
En fin de compte, c'est une question de temps. Il s'agit du temps gagné pour effectuer une analyse et communiquer le résultat. Il s'agit du temps nécessaire pour prendre une personne non initiée à l'art de la spectrométrie de masse des grosses molécules et la rendre capable de générer des résultats de qualité. Il s'agit du temps gagné en obtenant le bon résultat la première fois que vous analysez l'échantillon. Il s'agit très certainement de temps.
Ressources supplémentaires :
Blog : Aider les laboratoires à entrer dans une nouvelle ère d'efficacité
Blog : Connecter les scientifiques avec l'informatique de nouvelle génération
*Nous notons avec tristesse le décès de Brian Green, OBE, en décembre 2021, et renvoyons nos lecteurs à l'article paru en 1996 dans Rapid Communications, qui relate les détails de ses débuts de carrière - une carrière scientifique qui a continué à progresser longtemps après sa prétendue retraite.
Sujets populaires
ACQUITY QDa (16) bioanalyse (11) produits biologiques (14) biopharma (26) biopharmaceutique (36) biosimilaires (11) biothérapeutique (16) étude de cas (16) chromatographie (14) intégrité des données (21) analyse alimentaire (12) HPLC (15) LC-MS (21) chromatographie liquide (LC) (19) détection de masse (15) spectrométrie de masse (MS) (54) développement de méthodes (13) STEM (12)