L'épistasie compensatoire maintient l'affinité ACE2 dans le SRAS

Blog

MaisonMaison / Blog / L'épistasie compensatoire maintient l'affinité ACE2 dans le SRAS

Jan 04, 2024

L'épistasie compensatoire maintient l'affinité ACE2 dans le SRAS

Volume Communication Nature

Nature Communications volume 13, Numéro d'article : 7011 (2022) Citer cet article

3186 accès

13 Citations

29 Altmétrique

Détails des métriques

La variante Omicron BA.1 est apparue fin 2021 et s'est rapidement propagée à travers le monde. Comparé aux variantes antérieures du SRAS-CoV-2, BA.1 présente de nombreuses mutations, dont certaines sont connues pour permettre la fuite des anticorps. Beaucoup de ces mutations d'échappement d'anticorps diminuent individuellement l'affinité du domaine de liaison au récepteur de pointe (RBD) pour ACE2, mais BA.1 se lie toujours à ACE2 avec une affinité élevée. La forme physique et l'évolution de la lignée BA.1 sont donc déterminées par les effets combinés de nombreuses mutations. Ici, nous cartographions systématiquement les interactions épistatiques entre les 15 mutations du RBD de BA.1 par rapport à la souche Wuhan Hu-1. Plus précisément, nous mesurons l'affinité ACE2 de toutes les combinaisons possibles de ces 15 mutations (215 = 32 768 génotypes), couvrant tous les intermédiaires évolutifs possibles de la souche ancestrale Wuhan Hu-1 à BA.1. Nous constatons que les mutations d'échappement immunitaire dans BA.1 réduisent individuellement l'affinité ACE2 mais sont compensées par des interactions épistatiques avec d'autres mutations améliorant l'affinité, notamment Q498R et N501Y. Ainsi, la capacité de BA.1 à échapper à l'immunité tout en maintenant l'affinité ACE2 dépend de l'acquisition de plusieurs mutations interactives. Nos résultats impliquent l'épistasie compensatoire comme un facteur clé entraînant un changement évolutif substantiel pour le SRAS-CoV-2 et sont cohérents avec Omicron BA.1 résultant d'une infection chronique.

La variante Omicron BA.1 du SRAS-CoV-2 est apparue en novembre 2021 et s'est propagée rapidement dans le monde entier, en partie grâce à sa capacité à échapper à l'immunité existante chez les personnes vaccinées et précédemment infectées1,2. Étonnamment, Omicron n'est pas apparu comme un descendant de la lignée Delta alors répandue. Au lieu de cela, il est apparu comme une souche très divergente après avoir accumulé des dizaines de mutations au sein d'une lignée qui ne circulait pas largement à l'époque, dont 15 mutations dans le domaine de liaison au récepteur de la protéine de pointe (RBD)1.

Des travaux récents ont montré qu'un certain nombre de ces 15 mutations RBD (dont certaines sont observées dans d'autres variantes) perturbent la liaison d'anticorps monoclonaux spécifiques3,4,5,6,7, contribuant potentiellement à l'évasion immunitaire. Cependant, il a également été démontré que la plupart de ces mutations réduisent l'affinité de liaison à l'ACE2 humain lorsqu'elles surviennent dans les lignées Wuhan Hu-1, Delta ou plusieurs autres lignées SARS-CoV-28,9, altérant potentiellement l'entrée virale dans les cellules hôtes. En revanche, l'Omicron RBD tolère ces mutations d'échappement tout en conservant une forte affinité pour ACE210,11, ce qui suggère que d'autres mutations dans cette lignée peuvent aider à maintenir l'entrée virale.

Des travaux antérieurs ont systématiquement analysé les effets mutationnels sur la liaison des anticorps et l'affinité ACE2, par exemple en utilisant le balayage mutationnel profond (DMS)9,12. Cependant, ces approches se concentrent sur les effets de mutations uniques sur des fonds génétiques spécifiques. Ils sont donc utiles pour comprendre les premières étapes de l'évolution à partir de variants existants mais ne peuvent pas expliquer comment de multiples mutations interagissent sur des trajectoires évolutives plus longues. Ainsi, on ne sait toujours pas comment les combinaisons de mutations, telles que celles observées dans Omicron, interagissent pour à la fois échapper à l'immunité et conserver une forte affinité avec l'ACE2. Pour répondre à cette question, nous avons utilisé une approche d'assemblage combinatoire pour construire une bibliothèque de plasmides contenant toutes les combinaisons possibles des 15 mutations du Omicron BA.1 RBD (un total de 215 = 32 768 variantes). Cette bibliothèque, qui représente la plus grande bibliothèque combinatoire complète d'une protéine virale à ce jour, comprend tous les intermédiaires évolutifs possibles entre le Wuhan Hu-1 et l'Omicron BA.1 RBD. Nous avons transformé cette bibliothèque de plasmide en une souche d'affichage de levure standard, créant une bibliothèque de levure dans laquelle chaque cellule affiche une seule variante monomérique RBD correspondant au plasmide dans cette cellule. Nous avons ensuite utilisé Tite-Seq, une méthode basée sur la cytométrie en flux et le séquençage à haut débit13,14 (voir "Méthodes" ; Fig. 1A supplémentaire), pour mesurer les affinités de liaison, KD, app, des 32 768 variantes RBD à l'ACE2 humain en parallèle.

Conformément aux travaux antérieurs de nous-mêmes14 et d'autres9,13,15, nous constatons que les mesures Tite-Seq sont hautement reproductibles (SEM de 0,2 log KD, app entre les mesures en triple) et cohérentes avec des mesures indépendantes à faible débit (voir "Méthodes" ; Fig. 1b – f supplémentaire). Nous notons que nos mesures d'affinité de liaison présentent de petites différences systémiques par rapport à une étude antérieure9 en raison de différences dans les stratégies de déclenchement, mais les affinités relatives sont cohérentes entre les deux ensembles de données (Fig. 1f supplémentaire). De plus, nous constatons une variation minimale des niveaux d'expression de RBD et sommes ainsi en mesure de déduire KD, app pour l'ensemble de la bibliothèque combinatoire (voir "Méthodes"; Fig. 3 supplémentaire).

Nous constatons que les 32 768 intermédiaires RBD entre Wuhan Hu-1 et Omicron BA.1 ont une affinité détectable pour ACE2, avec KD, app compris entre 0,1 μM et 0,1 nM (Fig. 1a et Fig. 1 supplémentaire ; voir https://desai-lab.github.io/wuhan_to_omicron/ pour un navigateur de données interactif). Conformément aux études précédentes10, le BA.1 RBD présente une légère amélioration (trois fois par Tite-seq et par des mesures isogéniques) de l'affinité de liaison par rapport à Wuhan Hu-1 (Fig. 2 supplémentaire). Cependant, la plupart (~ 60 %) des séquences RBD intermédiaires montrent en fait une affinité de liaison plus faible pour ACE2 que le Wuhan Hu-1 RBD ancestral. En fait, il n'y a pas de chemins de Wuhan Hu-1 à Omicron BA.1 qui ne contiennent pas au moins une étape qui diminue l'affinité ACE2. Ceci est principalement dû au fait que la grande majorité des mutations BA.1 ont un effet neutre ou délétère sur l'affinité ACE2 sur la plupart des antécédents génétiques (Fig. 1b). Cela est particulièrement vrai pour K417N, G446S, Q493R, G496S et Y505H, dont quatre sont connus pour être impliqués dans la fuite de diverses classes d'anticorps monoclonaux16,17,18.

a Distribution des affinités de liaison à l'ACE2 sur tous les génotypes N = 32 768 RBD testés. Les affinités de liaison sont affichées sous la forme -logKD,app ; les lignes verticales bleues et rouges indiquent le -logKD,app pour Wuhan Hu-1 et Omicron BA.1, respectivement. b Distributions de l'effet de chaque mutation sur l'affinité ACE2 (définie comme le changement de -logKD,app résultant de la mutation) sur tous les antécédents génétiques possibles aux 14 autres loci. Les segments de ligne noire indiquent les 25e et 75e centiles des distributions d'effets et les points représentent les moyennes de distribution, n = 16384 arrière-plans. Les points bleus et rouges spécifient les effets sur Wuhan Hu-1 et les arrière-plans les plus mutés, respectivement. c Distribution des affinités de liaison regroupées par nombre de mutations Omicron BA.1. L'affinité de liaison du variant Wuhan Hu-1 est indiquée par une ligne pointillée horizontale. Les cases correspondent à la plage entre les 25e et 75e centiles, et les moustaches s'étendent jusqu'à la valeur la plus grande/la plus petite pas plus de 1,5 fois la plage interquartile.

Bien que de nombreuses mutations BA.1 réduisent l'affinité ACE2 en moyenne, les interactions entre ces mutations entraînent une amélioration de l'affinité ACE2 pour BA.1 par rapport à la souche ancestrale Wuhan Hu-1. Autrement dit, les mutations ont tendance à être plus délétères pour l'affinité ACE2 si peu d'autres mutations sont présentes, mais ont tendance à devenir neutres ou même bénéfiques en présence de plusieurs autres mutations (Fig. 1c ; Fig. 4 supplémentaire). Conformément à cela, nous constatons que bien que la plupart des 15 mutations RBD réduisent l'affinité ACE2 dans le contexte de Wuhan Hu-1 (et dans de nombreux cas dans la plupart des autres milieux également), elles deviennent toutes moins délétères ou même bénéfiques dans le contexte le plus muté (Fig. 1b). Ce schéma explique pourquoi le BA.1 RBD a une affinité plus forte pour ACE2 malgré le fait qu'il contient tant de mutations qui réduisent individuellement l'affinité ACE2 : leurs effets délétères sont atténués par des interactions épistatiques compensatoires avec d'autres mutations.

Pour analyser systématiquement les effets mutationnels et les interactions, nous adaptons un modèle biochimique standard d'épistasie19 à nos données. Cela décompose notre -log (KD, app) mesuré (qui devrait être proportionnel à l'énergie libre de liaison, ΔG) 20,21 en une somme d'effets de mutations uniques, d'épistasie par paires et d'interactions épistatiques d'ordre supérieur parmi de plus grands ensembles de mutations (tronquées au cinquième ordre ; Fig. 5 supplémentaire, voir "Méthodes"). Plus précisément, nous écrivons l'affinité de liaison d'une séquence s comme

où \({C}_{i}\) contient toutes les combinaisons \(\left(\begin{array}{c}L\\ i\end{array}\right)\) de mutations \(i\) et \({x}_{c,s}\) est égal à 1 si la séquence \(s\)contient toutes les mutations dans \(c\) et à 0 sinon (voir Méthodes ; tous les coefficients pour \(c\) avec \(i\) mutations sont référencés à comme coefficients d'ordre i). Ce modèle donne des coefficients comparables aux modèles alternatifs d'épistasie statistique (Fig. 6 supplémentaire) et globale22 (Fig. 7 supplémentaire). Généralement, nous constatons que l'ampleur des effets de premier ordre des mutations individuelles (Fig. 2a) est en corrélation avec la surface de contact ACE2 du résidu correspondant (Fig. 2b, c), et les résidus voisins sont plus susceptibles d'avoir de fortes interactions par paires (Fig. 2e), comme on pouvait s'y attendre des travaux antérieurs14,23.

a Effets de premier ordre dans le modèle d'interaction épistatique le mieux ajusté (jusqu'au cinquième ordre). Les barres d'erreur représentent les erreurs standard de l'ajustement du modèle et sont centrées sur la moyenne, n = 16 384. b Structure co-cristalline du récepteur Omicron BA.1 RBD et ACE2 (PDB ID 7WPB). Résidus mutés représentés par des sphères colorées comme en (a). c Effets de premier ordre pour chaque mutation tracés par rapport à la surface de contact entre le résidu BA.1 RBD correspondant et ACE2. Mutations colorées comme en (a). Le coefficient de corrélation de rang de Spearman (rs) entre l'effet de premier ordre et la surface de contact est indiqué en haut à gauche. d Coefficients d'interaction épistatique de second ordre et coefficients d'interaction d'ordre supérieur. Pour chaque mutation, le coefficient d'interaction d'ordre supérieur (indiqué au bas du tracé de la carte thermique) est calculé en additionnant tous les coefficients d'interaction de troisième et quatrième ordre impliquant la mutation. e Coefficients d'interaction par paires tracés en fonction des distances entre les carbones alpha respectifs. Les mutations sont colorées par un coefficient par paire comme dans (d). Le coefficient de corrélation du rang de Spearman (rs) est indiqué en haut à gauche.

Nos coefficients déduits par paires et d'ordre supérieur révèlent que de fortes interactions compensatoires compensent les effets des mutations réduisant l'affinité (Fig. 2d). L'ampleur de ces interactions est comparable à celle des effets de premier ordre, et cette épistasie est extrêmement positive, car l'exclusion des termes épistatiques conduit à une sous-estimation constante de l'affinité prédite (Fig. 8 supplémentaire). Cette forte épistasie positive signifie que les mutations qui réduisent l'affinité ACE2 deviennent moins délétères dans les milieux contenant d'autres mutations. Par exemple, l'effet négatif de premier ordre de Q498R est entièrement inversé par son interaction avec la mutation voisine N501Y ; cette interaction par paires a été mise en évidence dans des travaux antérieurs8,11,24 comme un exemple d'épistasie compensatoire. De plus, nous identifions de nombreuses autres mutations interactives, y compris des interactions positives encore plus fortes (ainsi que des effets de troisième et quatrième ordre) entre Q498R, G496S, N501Y et Y505H (Fig. 2d). En fait, l'affinité ACE2 est affectée par de nombreuses interactions plus significatives d'ordre supérieur, dont la plupart incluent ces quatre mutations (jusqu'au cinquième ordre ; données supplémentaires 1).

Nos analyses d'épistasie révèlent qu'une telle épistasie compensatoire d'ordre élevé élimine les effets fortement délétères des mutations impliquées dans l'échappement des anticorps sur l'affinité ACE2. Cette compensation entre mutations bénéfiques spécifiques (en particulier N501Y) et mutations d'échappement immunitaire a été observée dans des études antérieures8,25,26,27. Ici, nous quantifions l'étendue de cette épistasie et donc son impact sur la formation de l'ensemble du paysage d'affinité de séquence RBD. Plus précisément, des travaux antérieurs ont montré que cinq mutations BA.1 (K417N, G446S, E484A, Q493R et G496S) ont un effet particulièrement fort sur la promotion de l'échappement des anticorps4,17,18. Ces mutations réduisent toutes individuellement l'affinité pour ACE2 à la fois en moyenne et dans le fond de Wuhan Hu-1 (sauf E484A ; Figs. 1b, 2a, 3a), et la combinaison des cinq est fortement délétère (Fig. 3a, b). Cependant, une forte épistasie d'ordre élevé avec la paire de Q498R et N501Y atténue cela : N501Y ou Q498R seul réduit le coût des cinq mutations d'échappement, et la combinaison des deux compense presque entièrement ces effets délétères (Fig. 3b). Bien que ces mutations d'échappement bénéficient également d'interactions avec d'autres mutations (Fig. 9 supplémentaire), N501Y et Q498R représentent la majorité de l'effet compensatoire. Nous notons que de fortes interactions compensatoires atténuent également l'effet délétère de Y505H (Fig. 3c). Il n'a pas été démontré auparavant que cette mutation était fortement impliquée dans la fuite des anticorps, mais le schéma de compensation que nous observons suggère qu'elle peut être fonctionnellement pertinente d'une certaine manière.

a affinités de liaison ACE2 pour les variants contenant des mutations qui ont un fort effet sur la fuite des anticorps : K417N, G446S, E484A, Q493R et G496S regroupés par la présence de mutations compensatoires (Q498R et N501Y). La ligne bleue pointillée (resp. rouge) indique l'affinité de liaison ACE2 de Wuhan Hu-1 (resp. Omicron BA.1). Les cases représentent l'écart interquartile. b Les modifications des affinités de liaison à l'ACE2 pour les variants contenant l'une (ou toutes) des mutations d'échappement sélectionnées regroupées par la présence de mutations compensatoires (Q498R et N501Y). La ligne pointillée indique aucun changement d'affinité. Les cases représentent l'écart interquartile. c Affinités de liaison ACE2 pour les variants contenant Y505H et les mutations d'échappement d'anticorps présentées comme en (a).

L'épistasie étendue que nous observons signifie que les effets individuels de chacune de ces 15 mutations, ainsi que les interactions par paires entre elles, sont probablement différents dans d'autres lignées virales. Cependant, des travaux antérieurs ont montré que les mutations d'échappement d'anticorps décrites ci-dessus (K417N, G446S, E484A, Q493R et G496S) réduisent de manière similaire l'affinité ACE2 dans plusieurs autres variantes (y compris Alpha, Beta, Eta et Delta)8. Conformément à ce résultat, nous constatons que ces mutations, ainsi que d'autres qui ont un effet négatif de premier ordre sur l'affinité ACE2, se produisent rarement dans la phylogénie du SRAS-CoV-2 (Fig. 4a). Cela suggère que le maintien de l'affinité avec l'ACE2 humain est probablement un aspect important de l'aptitude virale, de sorte que ces mutations sont généralement sélectionnées contre. De même, nous constatons que les mutations ayant des effets négatifs sur l'affinité ACE2 qui sont compensées par des interactions épistatiques avec N501Y ont tendance à être enrichies à travers la phylogénie du SRAS-CoV-2 dans les souches qui ont également N501Y, par rapport aux souches qui n'en ont pas (Fig. 4b ; d'autres interactions par paires se produisent trop rarement pour être testées). Cela suggère en outre qu'au moins certaines des interactions épistatiques par paires que nous observons sont également présentes dans d'autres contextes, et que l'évolution virale a favorisé la compensation de la réduction de l'affinité ACE2.

a Fréquence d'occurrences pour chaque mutation dans les séquences SARS-CoV-2 disponibles sur GISAID (voir "Méthodes") en fonction de leur effet moyen sur l'affinité ACE2 dans nos données. Les barres d'erreur indiquent l'écart type des tailles d'effet et sont centrées sur la moyenne (n = 16384 arrière-plans). Le coefficient de corrélation du rang de Spearman (rs) est indiqué en haut à gauche. (b) Fréquence normalisée des mutations co-occurrentes avec N501Y à travers les séquences SARS-CoV-2 disponibles sur GISAID (calculée sur la base de la fréquence à laquelle chaque mutation se produit sur la même branche que N501Y, normalisée par leur fréquence globale ; voir "Méthodes") en fonction de la différence de leur effet sur l'affinité ACE2 en présence de N501Y. Les barres d'erreur indiquent l'écart type des effets et sont centrées sur la moyenne (n = 8096 arrière-plans). Le coefficient de corrélation du rang de Spearman (rs) est indiqué en haut à gauche. c Trajectoires d'affinité ACE2 pour 100 voies sélectionnées au hasard (impliquant les 15 mutations), présentées en fonction du nombre de mutations ayant un effet important sur l'échappement des anticorps (K417N, G446S, E484A, Q493R et G496S) et de la présence ou de l'absence de mutations compensatoires Q498R et N501Y (représentées par des couleurs). Chaque trajectoire représente un ordre de mutation possible, commençant au génotype Wuhan Hu-1 et se terminant à Omicron BA.1.

Ensemble, ces résultats suggèrent que l'évolution de l'échappement des anticorps dans BA.1 était possible sans perturber la liaison à ACE2 en raison des interactions compensatoires avec de nombreuses autres mutations uniques à cette lignée. Alors que les signatures de ces pressions de sélection et interactions épistatiques sont présentes à travers la phylogénie virale28, et que les variantes d'échappement des anticorps auraient pu être compensées par d'autres combinaisons de mutations, seule la lignée BA.1 a accumulé cette combinaison particulière de mutations compensatoires en interaction.

Nos résultats donnent également un aperçu de la raison pour laquelle le phénotype d'évasion immunitaire observé dans Omicron BA.1 n'est pas apparu à la suite de mutations accumulées dans la variante Delta alors largement diffusée. Plus précisément, il est peu probable que la combinaison de multiples mutations nécessaires à la fois à l'évasion immunitaire et au maintien de l'affinité avec l'ACE2 (Fig. 4c) se soit accumulée dans le contexte d'infections aiguës, qui impliquent peu de mutations entre les goulots d'étranglement de la transmission et vraisemblablement de fortes pressions de sélection sur les deux fonctions29. En revanche, dans les infections chroniques (par exemple chez un hôte immunodéprimé), de grandes tailles de population et des pressions de sélection détendues peuvent permettre l'accumulation des nombreuses mutations nécessaires à la fois pour maintenir l'affinité ACE2 et échapper aux anticorps neutralisants30,31. Alternativement, comme précédemment spéculé32,33, BA.1 peut avoir évolué au sein d'un réservoir animal où les pressions de sélection peuvent également avoir été relâchées. Dans l'un ou l'autre scénario, les mutations compensatoires peuvent avoir précédé les mutations d'échappement immunitaire, minimisant leurs effets autrement délétères sur l'affinité ACE2. Alternativement, une sélection détendue pour la liaison à ACE2 peut avoir créé un environnement permissif pour les mutations d'échappement immunitaire, suivie d'une compensation qui a ensuite permis à la variante de se propager à d'autres hôtes. L'analyse phylogénétique apporte un certain soutien à la première possibilité, car deux mutations d'échappement immunitaire (G446S et G496S) se produisent tard dans l'évolution de BA.1 (et ne sont pas partagées avec la lignée BA.2; Fig. 10 supplémentaire). De plus, un modèle de sélection forte basé sur l'affinité ACE2 préfère que les trois mutations spécifiques de BA.1 apparaissent tardivement dans l'évolution, comme observé dans la phylogénie (Fig. 11 supplémentaire). Indépendamment de l'ordre exact des mutations, la grande taille de la population virale et la pression de sélection relâchée d'une infection chronique peuvent avoir créé des conditions propices à la fixation de plusieurs mutations nécessaires à BA.1 pour échapper aux anticorps neutralisants tout en maintenant l'affinité ACE2.

Nous soulignons que notre travail se limite à 15 mutations dans une région spécifique d'une protéine, et néglige donc les interactions potentielles avec les nombreuses autres mutations en dehors du RBD qui sont présentes dans la lignée Omicron BA.1. Cependant, nous constatons que les interactions entre les mutations RBD seules sont suffisantes pour expliquer comment l'affinité ACE2 est maintenue, ce qui n'est pas évident uniquement à partir des données d'un seul mutant. De plus, nous notons également que les interactions positives sur l'affinité ACE2 pourraient se traduire négativement par d'autres phénotypes. Par exemple, ces interactions pourraient inhiber l'évasion immunitaire et, par conséquent, il est également nécessaire de cartographier les effets résultants de ces interactions sur l'évasion immunitaire. De plus, il est probable que l'expression et la stabilité des protéines de pointe jouent également un rôle clé dans l'évolution virale. Nous trouvons quelques indices de cette tendance dans nos données. Par exemple, nous identifions une interaction synergique significative entre S371L, S373P et S375F qui améliore l'expression de RBD dans la levure, conformément aux travaux antérieurs montrant que cet ensemble de mutations est associé à la stabilisation d'une conformation plus serrée du RBD34 (Fig. 4 supplémentaire). Au-delà de cela, de nombreux autres phénotypes sont également susceptibles d'être pertinents.

Malgré ces mises en garde, nos résultats démontrent que les événements clés de l'évolution virale peuvent dépendre de modèles d'épistasie d'ordre élevé. Nous constatons que ces interactions épistatiques sont presque entièrement synergiques ou compensatoires, un schéma qui pourrait être une caractéristique émergente générale des virus évoluant dans un paysage à contraintes immunitaires. Cela peut être particulièrement important pour les événements adaptatifs complexes impliquant de nombreuses mutations, telles que l'échappement immunitaire et le changement d'hôte. Ainsi, pour prédire l'avenir de l'évolution virale, nous devons aller au-delà des écrans à haut débit de mutations uniques et analyser plus en détail l'espace de séquence combinatoire. Un défi clé est l'immensité de cet espace de séquence, qui rend l'exploration exhaustive insoluble. Cependant, la génération de paysages combinatoires spécifiques comme ceux présentés ici peut aider à révéler des schémas généraux d'épistasie qui façonnent l'évolution virale dans des environnements complexes.

Pour générer des souches de levure clonales pour les variantes Wuhan Hu-1 et Omicron BA.1, nous avons cloné le gblock RBD correspondant (IDT, données supplémentaires 2) dans le vecteur d'affichage de surface de levure pETcon (plasmide 2649 ; Addgene, Watertown, MA, #166782) via Gibson Assembly. La séquence du gblock a été optimisée en codons pour la levure (à l'aide de l'algorithme Twist Bioscience); nous avons constaté que l'optimisation des codons avait un impact significatif sur l'efficacité de l'affichage. De plus, pour la construction de la bibliothèque (décrite ci-dessous), nous avons supprimé deux sites Bsa-I existants du plasmide par mutagenèse dirigée (Agilent, Santa Clara, CA, #200521). Dans la production de souches clonales, les produits Gibson Assembly ont été transformés en cellules E. coli électrocompétentes NEB 10-bêta (NEB, Ipswich, MA, #C3020K), en suivant le protocole du fabricant. Après une nuit d'incubation à 37 ° C, les cellules ont été récoltées et les plasmides résultants ont été purifiés et séquences Sanger. Nous avons transformé des plasmides contenant les séquences correctes dans la souche de levure AWY101 (aimable cadeau du Dr Eric Shusta)35 comme décrit par Gietz et Schiestl36. Les transformants ont été étalés sur SDCAA-agar (1,71 g/L de YNB sans acides aminés ni sulfate d'ammonium [Sigma-Aldrich #Y1251], 5 g/L de sulfate d'ammonium [Sigma-Aldrich #A4418], 2 % de dextrose [VWR #90000–904], 5 g/L d'acides bactocasaminés [VWR #223050], 100 g/L d'ampicilline [ VWR #V0339], 2% Difco Noble Agar [VWR #90000–774]) et incubé à 30 °C pendant 48 heures. Plusieurs colonies ont été réensemencées sur SDCAA-agar et à nouveau incubées à 30 ° C pendant 48 heures. Des souches de levures clonales ont été prélevées, inoculées, cultivées à saturation dans du SDCAA liquide (6,7 g/L YNB sans acide aminé VWR #90004-150), 5 g/L de sulfate d'ammonium (Sigma-Aldrich #A4418), 2 % de dextrose (VWR #90000–904), 5 g/L d'acides bactocasaminés (VWR #223050), 1,065 g/L de tampon MES ( Cayman Chemical, Ann Arbor, MI, #70310), 100 g/L d'ampicilline (VWR # V0339)) à 30 °C, et mélangé avec 5 % de glycérol pour stockage à -80 °C.

Nous avons généré la bibliothèque de variantes RBD avec une stratégie d'assemblage combinatoire Golden Gate. Premièrement, nous avons divisé la séquence RBD en cinq fragments de longueur à peu près égale, allant de 90 à 131 pb et contenant chacun entre 1 et 4 mutations. Nous avons introduit des sites BsaI et des surplombs aux deux extrémités de chaque séquence de fragment. Ces surplombs contenaient des sites de coupure BsaI qui permettraient aux cinq fragments de s'assembler de manière unique dans leur ordre approprié dans le squelette plasmidique. Pour chaque fragment avec n mutations, nous avons généré des versions de fragment 2n en produisant les fragments via PCR (Fragments 1-4) ou en achetant des duplex d'ADN individuels (Fragment 5) auprès d'IDT. Ces permutations ont assuré l'inclusion de toutes les combinaisons de mutations possibles dans la bibliothèque. Dans le fragment 2, nous avons également inclus une substitution synonyme sur le résidu K378 qui correspond à la mutation K417N. Cette substitution permet de séquencer la bibliothèque d'amplicons sur l'Illumina Novaseq SP (2x250bp). Pour la production d'ADNdb par PCR, nous avons conçu les fragments de manière à ce que les mutations qu'ils contiennent soient proches des extrémités 3' ou 5'. Cette conception a permis aux amorces d'inclure et d'introduire simultanément les mutations, les sites BsaI et les surplombs uniques choisis lors de la PCR. Nous avons produit chaque version de chaque fragment individuellement (28 réactions PCR au total ; données supplémentaires 3) et regroupé les produits de chaque fragment dans des rapports équimolaires. De plus, nous avons également regroupé les 16 duplex d'ADN achetés codant pour le cinquième fragment dans des rapports équimolaires. Nous avons ensuite créé un mélange final de fragments en regroupant les cinq pools de fragments. Dans la réaction du Golden Gate, les versions de chaque fragment seraient ligaturées ensemble dans des combinaisons aléatoires, produisant toutes les séquences présentes à des fréquences approximativement égales.

En plus du mélange de fragments, nous avons préparé quatre versions du squelette plasmidique pour la réaction du Golden Gate. Chaque version contient une combinaison des mutations N501Y et Y505H. Avant l'assemblage, nous avons introduit le marqueur de contre-sélection ccdB, à la place de la région d'insertion de fragment, avec des sites BsaI flanquants (Données supplémentaires 3). Nous avons effectué le clonage du Golden Gate à l'aide du Golden Gate Assembly Mix (NEB, Ipswich, MA, # E1601L), en suivant le protocole recommandé par le fabricant, avec un rapport molaire de 7: 1 du pool d'inserts de fragments au squelette plasmidique. Nous avons transformé les produits d'assemblage en cellules d'E. coli électrocompétentes NEB 10-bêta dans des aliquotes de cellules de 6 × 25 μL. Nous avons ensuite transféré chacune des cultures cellulaires récupérées dans 100 ml de LB fondu (1% de tryptone, 0,5% d'extrait de levure, 1% de NaCl) contenant 0,3% d'agarose SeaPrep (VWR, Radnor, PA # 12001-922) étalé en une couche mince dans un flacon à chicanes de 1 L (environ 1 cm de profondeur). Le mélange a été placé à 4°C pendant trois heures, après quoi il a été incubé pendant 18 heures à 37°C. Nous avons observé un total de 3 millions de transformants dans les aliquotes. Pour isoler la bibliothèque de plasmides, nous avons mélangé les flacons en secouant pendant 1 heure et granulés les cellules pour maxiprep de plasmide standard (Zymo Research, Irvine, CA, D4201), à partir de laquelle nous avons obtenu> 90 μg de plasmide purifié.

Nous avons ensuite transformé la banque de plasmides purifiés dans des cellules AWY101 comme décrit ci-dessus. Nous avons récupéré des transformants dans un gel d'agarose SDCAA fondu (1,71 g/L YNB sans acides aminés ni sulfate d'ammonium (Sigma-Aldrich #Y1251), 5 g/L sulfate d'ammonium (Sigma-Aldrich, St. Louis, MO, #A4418), 2 % de dextrose (VWR #90000–904), 5 g/L Bacto casamino acides (VWR #223050), 100 g/L d'ampicilline (VWR # V0339)) contenant 0,35 % d'agarose SeaPrep (VWR #12001–922) étalé en une fine couche (environ 1 cm de profondeur). Le mélange a été placé à 4 °C pendant trois heures, après quoi il a été incubé à 30 °C pendant 48 h. À partir de cinq aliquotes, nous avons obtenu environ 1,2 million de colonies. Après avoir mélangé les flacons en agitant pendant 1 heure, nous avons cultivé des cellules dans des tubes de 5 ml de SDCAA liquide pendant cinq générations et stocké la culture saturée dans des aliquotes de 1 ml additionnées de 5 % de glycérol à -80 °C.

Tite-Seq a été effectué comme décrit précédemment36. Nous avons effectué trois répétitions du test à des jours différents. Dans les deux premiers réplicats, une petite partie des variants de la bibliothèque contenait une mutation hors cible (E484W) au lieu de la mutation prévue (E484A). Ces variants ont été supprimés de l'analyse des données et, dans le troisième réplicat, la bibliothèque a été complétée par des variants contenant la mutation prévue (E484A).

Tout d'abord, nous avons décongelé les bibliothèques RBD de levure, ainsi que les souches clonales Wuhan Hu-1 et Omicron BA.1, en inoculant 150 μL de stock de glycérol correspondant (culture saturée avec 5 % de glycérol stocké à -80 oC) dans 5 ml de SDCAA à 30 oC pendant 20 heures. Le lendemain, les cultures de levure ont été diluées à DO600 = 0,67 dans 5 mL de SGDCAA (6,7 g/L YNB sans acide aminé VWR #90004-150), 5 g/L de sulfate d'ammonium (Sigma-Aldrich #A4418), 2 % de galactose (Sigma-Aldrich #G0625), 0,1 % de dextrose (VWR #90000–904), 5 g/L L Bacto casamino acides (VWR #223050), 1,065 g/L de tampon MES (Cayman Chemical, Ann Arbor, MI, #70310), 100 g/L d'ampicilline (VWR # V0339)), et rotation à température ambiante pendant 16 à 20 heures.

Après une nuit d'induction, les cultures de levure ont été culottées, lavées deux fois avec du PBSA à 0,01 % (VWR #45001–130 ; GoldBio, St. Louis, MO, #A-420–50) et remises en suspension à une DO600 de 1. Un total de 500 à 700 μL de cellules de levure OD1 ont été marquées avec de l'ACE2 humain biotinylé (Acrobiosystems #AC2-H2H82E6) à chacune des douze concentrations d'ACE2 (incréments d'un demi-log couvrant 10 à 12,5 à 10 à 7 M), avec des volumes ajustés pour limiter les effets de déplétion du ligand à moins de 10 % (en supposant 50 000 RBD de surface/cellule37). Les mélanges levure-ACE2 ont été incubés et mis en rotation à température ambiante pendant 20 heures. Après l'incubation, les complexes levure-ACE2 ont été granulés par rotation à 3000 × g pendant 10 min à 4 ° C, lavés deux fois avec 0, 5% PBSA + 2 mM EDTA, puis marqués avec Streptavidin-RPE (1: 100, Thermo Fisher # S866) et anti-cMyc-FITC (1: 50, Miltenyi Biotec, Somerville, MA, # 130-116-485) à 4 °C pendant 45 min. Après ce marquage secondaire, les levures ont été lavées deux fois avec du PBSA 0,5 % + EDTA 2 mM et laissées sur de la glace à l'obscurité jusqu'au tri.

Nous avons trié le complexe de la bibliothèque de levures sur un BD FACS Aria Illu, équipé de lasers 405 nm, 440 nm, 488 nm, 561 nm et 635 nm et d'une buse fixe de 85 microns. Pour minimiser les effets de chevauchement spectral, nous avons déterminé la compensation entre FITC et PE à l'aide de contrôles à un seul fluorophore. Les cellules individuelles ont d'abord été contrôlées par FSC vs SSC, puis triées par fluorescence d'expression (FITC) ou de liaison (PE). Au moins un million de cellules ont été triées pour chaque échantillon. Dans les tris d'expressions, les singulets (basés sur FSC vs SSC) ont été triés en huit bacs FITC équivalents à espacement logarithmique. Pour les tris de liaison, les cellules FITC+ ont été triées dans 4 bacs PE (la population PE- comprenait le bac 1, et la population PE+ a été divisée en trois bacs équivalents logarithmiques 2–414,37. Les cellules triées ont été collectées dans des tubes en polypropylène enduits et remplis avec 1 mL de YPD complété avec 1 % de BSA. d à 30°C jusqu'à la phase logarithmique tardive (OD600 = 0,9–1,4).

1,5 ml de cultures de levure tardives ont été culottés et stockés à -20 ° C pendant au moins six heures avant l'extraction. Les plasmides de présentation de levure ont été extraits à l'aide de Zymo Yeast Plasmid Miniprep II (Zymo Research # D2004), en suivant les instructions du fabricant, et élués dans un tampon d'élution de 17 μL. Les bibliothèques de séquençage d'amplicons RBD ont été préparées par une PCR en deux étapes comme décrit précédemment14,38. Dans la première PCR, des identifiants moléculaires uniques (UMI), des indices en ligne et des adaptateurs Illumina partiels ont été ajoutés à la bibliothèque de séquences pendant 7 cycles d'amplification pour minimiser le biais d'amplification par PCR. Nous avons utilisé 5 μL d'ADN plasmidique comme matrice dans un volume de réaction de 25 μL avec la polymérase Q5 selon le protocole du fabricant (NEB # M0491L). La réaction a été incubée dans un thermocycleur avec le programme suivant : 1. 60 s à 98 °C, 2. 10 s à 98 °C, 3. 30 s à 66 °C, 4. 30 s à 72 °C, 5. GOTO 2, 6x, 6. 60 s à 72 °C. Peu de temps après la fin de la réaction, nous avons ajouté 25 μL d'eau dans les réactions et effectué un nettoyage par billes magnétiques 1,2X (Aline Biosciences #C-1003–5). Les produits purifiés ont ensuite été élués dans 35 µL de tampon d'élution. Dans la deuxième PCR, le reste de l'adaptateur Illumina et les indices Illumina i5 et i7 spécifiques à l'échantillon ont été ajoutés à travers 35 cycles d'amplification (Données supplémentaires 4–5 pour les séquences d'amorces). Nous avons utilisé 33 μL du produit PCR1 purifié comme matrice, dans un volume total de 50 μL en utilisant la polymérase Kapa (Kapa Biosystems # KK2502) conformément aux instructions du fabricant. Nous avons incubé cette deuxième réaction dans un thermocycleur avec le programme suivant : 1. 30 s à 98 °C, 2. 20 s à 98 °C, 3. 30 s à 62 °C, 4. 30 s à 72 °C, 5. GOTO 2, 34x, 6. 300 s à 72 °C. Les bibliothèques de séquençage résultantes ont été purifiées à l'aide de billes Aline 0,85X, la taille de l'amplicon a été vérifiée comme étant d'environ 500 pb en exécutant sur un gel d'agarose à 1 %, et la concentration de l'amplicon a été quantifiée par un colorant de liaison à l'ADN fluorescent (Biotium, Fremont, CA, #31068, selon les instructions du fabricant) sur Spectramax i3. Nous avons ensuite regroupé les bibliothèques d'amplicons en fonction du nombre de cellules triées et avons ensuite sélectionné la taille de ce pool par une purification de billes Aline bilatérale (0, 5–0, 9X). La taille finale du pool a été vérifiée par Tapestation 5000 HS et 1000 HS. La bibliothèque de séquençage finale a été quantifiée par le fluorimètre Qubit et séquencée sur un Illumina NovaSeq SP avec 10 % de PhiX.

Nous avons traité nos lectures de séquençage démultiplexées brutes pour identifier et extraire les index et les sites mutationnels. Pour ce faire, nous avons développé un pipeline snakemake39 qui a d'abord analysé tous les fichiers fastq et séparé les lectures en fonction des index en ligne, des UMI et des lectures de séquence à l'aide de la bibliothèque Python regex40. Nous avons accepté les séquences qui correspondent à l'intégralité de la lecture (sans restriction sur les bases au niveau des sites de mutation) dans une tolérance de 10 % de mésappariement de bp. Ensuite, nous avons rejeté les indices en ligne incorrects (selon les indices i5/i7 correspondants) et analysé les séquences de lecture en génotypes binaires (« 0 » pour l'allèle Wuhan Hu-1 ou « 1 » pour l'allèle Omicron BA.1 à chaque position de mutation). Les lectures avec des erreurs au niveau des sites de mutation (c'est-à-dire ne correspondant ni à l'allèle Wuhan Hu-1 ni à l'allèle Omicron BA.1) ont été rejetées. Enfin, nous avons compté le nombre d'UMI distincts pour chaque génotype et rassemblé les décomptes de génotypes de tous les échantillons dans un seul tableau. La couverture moyenne pour tous les réplicats était d'environ 150x.

Pour ajuster les constantes de dissociation de liaison KD,app pour chaque génotype, nous avons suivi la même procédure que celle décrite précédemment39. En bref, nous avons utilisé les données de séquençage et de cytométrie en flux pour calculer le log-fluorescence moyen de chaque génotype \(s\) à chaque concentration \(c\), comme suit :

où \({F}_{b,c}\) est le log-fluorescence moyen de bin \(b\) à la concentration \(c\), et \({p}_{b,s\vee c}\) est la proportion déduite de cellules du génotype s qui sont triées dans bin \(b\) à la concentration \(c\). Le \({p}_{b,s\vee c}\) est à son tour estimé à partir du nombre de lectures comme

où \({R}_{b,s,c}\) est le nombre de lectures du génotype s qui se trouvent dans le bac \(b\) à la concentration \(c\), tandis que \({C}_{b,c}\) fait référence au nombre de cellules triées dans le bac \(b\) à la concentration \(c\).

Pour propager l'incertitude dans l'estimation de la classe moyenne, nous avons utilisé la formule

où \(\delta {F}_{b,c}\) est la propagation de la fluorescence logarithmique des cellules triées dans le bac \(b\) à la concentration \(c\). Comme étudié précédemment, nous avons constaté que l'estimation de \(\delta {F}_{b,c}\approx \sigma {F}_{b,c}\) est suffisante pour capturer la variation que nous avons observée dans la log-fluorescence dans chaque bac. En revanche, l'erreur dans \({p}_{b,s\vee c}\) provient de l'erreur d'échantillonnage, qui peut être approchée comme un processus de Poisson lorsque le nombre de lectures est suffisamment élevé.

Ainsi nous avons :

Enfin, nous avons déduit la constante de dissociation de liaison (KD,s) pour chaque variante en ajustant le logarithme de la fonction de Hill à la moyenne log-fluorescence\({\bar{F}}_{s,c}\), en fonction des concentrations d'ACE2 \(c\) :

où \({A}_{s}\) est l'augmentation de la fluorescence à la saturation ACE2, et \({B}_{s}\) est le niveau de fluorescence de fond. L'ajustement a été effectué à l'aide de la fonction curve_fit du package Python scipy.optimize. Pour tous les génotypes, nous avons donné des limites raisonnables sur les valeurs de \({A}_{s}\) à 102−106, \({B}_{s}\) à 1-105 et KD,s à 10−14−10−5. Nous avons ensuite fait la moyenne des valeurs KD,s déduites sur les trois répétitions après avoir supprimé les valeurs avec un mauvais ajustement (\({r}^{2}\, < \, 0,8\)).

Nous notons que notre approche ici diffère légèrement de certains travaux antérieurs9,41 qui ajustent souvent cette fonction de Hill directement en utilisant le bac moyen avec l'équation suivante :

plutôt que d'utiliser les valeurs moyennes de fluorescence déduites. Cette utilisation de valeurs de bac moyennes introduit un biais car les nombres de bacs sont proportionnels à la fluorescence moyenne logarithmique, plutôt qu'à la fluorescence moyenne. Par conséquent, les valeurs de KD,s déduites avec cette méthode antérieure ne sont pas exactes. Cependant, dans notre plage de mesure, ces valeurs sont toujours linéairement corrélées à nos mesures (voir Fig. 1e supplémentaire).

Nous avons validé notre méthode d'affinité de liaison à haut débit en sélectionnant 10 clones RBD spécifiques pour une validation à plus faible débit : Wuhan Hu-1, Omicron, 5 simples mutants (K417N, S477N, T478K, Q498R, N501), deux doubles mutants (Q498R/N501Y et E484A/Q498R) et un génotype avec quatre mutations (K417N/E 484A/Q498R/N501Y). Pour chaque courbe de titrage isogénique, nous avons suivi la même stratégie de marquage, titrant ACE2 à des concentrations allant de 10−12−10−7 M pour les souches de levure isogéniques qui ne présentent que la séquence d'intérêt. La fluorescence logarithmique moyenne a été mesurée à l'aide d'un analyseur de cellules BD LSR Fortessa. Nous avons directement calculé la moyenne et les variances de ces distributions pour chaque concentration et les avons utilisées pour déduire la valeur de –log10(KD) à l'aide de la formule (illustrée ci-dessus) (voir Fig. 1 supplémentaire).

Nous avons d'abord utilisé un modèle linéaire simple où les effets des combinaisons de mutations s'additionnent au phénotype d'une séquence. Le logarithme de l'affinité de liaison \({{\log }}_{10}\left({K}_{D,s}\right)\) est proportionnel aux changements d'énergie libre, donc dans un modèle sans interaction, ils se combineraient de manière additive41. Le modèle complet d'ordre K peut s'écrire :

où \({\beta }_{c}\) désigne le coefficient de la combinaison de mutation \(c\)(soit le coefficient de mutation unique pour \(i=1\) soit le coefficient d'interaction sinon), contient toutes les combinaisons de i mutations et est égal à 1 si la séquence contient toutes les mutations en et vers 0 sinon. Ce choix est appelé épistasie « biochimique » ou « locale »42 et c'est celui utilisé dans le texte principal. Une autre option, appelée épistasie « statistique » ou « d'ensemble », consiste à remplacer les coefficients par. Dans ce modèle « statistique », la ligne de base est l'affinité moyenne de la population et les effets de premier ordre des mutations correspondent à leur effet moyen sur l'affinité. Nous présentons le résultat de cette analyse et les différences avec le modèle biochimique dans la Fig. 6 supplémentaire.

Pour choisir la valeur optimale de K, nous suivons la méthode détaillée dans Phillips et Lawrence et al., 202142. En bref, nous utilisons une validation croisée de 10 fois pour tester toutes les valeurs de K ≤ 6. Pour chaque valeur de K, les données sont divisées en dix et chacun des dix sous-ensembles de données est utilisé comme ensemble de test pour un modèle formé sur le reste des données. Nous avons choisi la valeur de K qui maximise les performances de prédiction (R²) moyennées sur les dix ensembles de données de test. Pour cet ensemble de données, nous avons trouvé une valeur optimale de K = 5 (Fig. 5 supplémentaire). Enfin, nous avons formé un modèle K = 5 sur l'ensemble de données complet pour obtenir les coefficients finaux. Le nombre de paramètres du modèle final (~5000) est bien inférieur au nombre de points de données observés (215 = 32768).

Comme mentionné ci-dessus, le logarithme de l'affinité de liaison est proportionnel à un changement d'énergie libre, une quantité extensive. Ceci justifie théoriquement l'utilisation d'un modèle linéaire. Néanmoins, dans certains scénarios, les interactions entre les mutations peuvent être mieux expliquées par une fonction non linéaire avec peu de paramètres agissant sur le phénotype complet ("épistasie globale") plutôt qu'un grand nombre d'interactions à petits effets d'ordre élevé ("épistasie idiosyncratique"). Notre implémentation est similaire à celle décrite par Sailer et Harms, 201743 et suit de près Phillips et Lawrence et al., 202142. En bref, nous utilisons une fonction logistique Φ, avec quatre paramètres, pour ajuster l'expression :

Le choix d'une fonction logistique est justifié par la forme générale de distribution de KD,app, qui "platine" légèrement à fort KD,app. Cet effet n'est pas causé par des artefacts expérimentaux (Fig. 3 supplémentaire) mais plutôt par une forme d'épistasie à "rendements décroissants"43. Pratiquement, les paramètres sont déduits en ajustant successivement l'additif βi et les paramètres de la fonction non linéaire. Bien que la transformation globale de l'épistasie améliore l'ajustement, les coefficients additifs observés à un ordre inférieur ne changent pas de manière significative (Fig. 7 supplémentaire).

Nous avons utilisé la structure de référence d'une structure cryo-EM de 2,79 Å d'Omicron BA.1 complexé avec ACE2 (PDB ID : 7WPB). Sur la figure 2c, la surface de contact est déterminée en utilisant ChimeraX44 pour mesurer la surface enterrée entre ACE2 et chaque résidu muté dans le RBD (mesurer la fonction de zone enterrée, probeRadius par défaut de 1,4 Å). Sur la figure 2E, la distance entre les carbones α est mesurée à l'aide de PyMol45.

L'affinité de liaison ACE2 a un impact sur l'aptitude des variants du SRAS-CoV-2 et peut donc être exploitée pour déduire partiellement sa trajectoire passée. Cette information est particulièrement importante pour Omicron BA.1, où les informations phylogénétiques sont limitées. Étant donné que notre ensemble de données contient l'affinité ACE2 de tous les intermédiaires évolutifs possibles, nous pouvons déduire les probabilités de toutes les voies entre la séquence ancestrale Wuhan Hu-1 et Omicron BA.1. Pour ce faire, nous devons choisir un modèle de sélection. Les circonstances dans lesquelles la variante Omicron a évolué sont inconnues, et l'aptitude évolutive du virus est plus complexe que sa capacité à se lier à l'ACE2 - la pression immunitaire, la stabilité structurelle et le niveau d'expression jouent également un rôle, parmi de nombreux autres facteurs46. De plus, les rétromutations sont courantes dans l'évolution virale et la pression de sélection peut changer selon que la souche change rapidement d'hôte ou fait partie d'une infection à long terme. Ici, nous avons choisi d'adopter un régime extrêmement simple de mutation faible/forte sélection d'évolution virale.

Dans ce modèle, la sélection se déroule comme un processus de Markov, où la population est caractérisée par une seule séquence qui acquiert une seule mutation à chaque étape discrète31,47. Nous supposons que les rétromutations (c'est-à-dire un résidu passant de l'acide aminé Hu-1 de Wuhan à celui de BA.1) ne sont pas possibles. Une fois qu'une telle séquence est générée, elle se fixera dans la population complète ou s'éteindra. Le paramètre important est alors la probabilité de fixation, qui dépend de l'affinité de liaison des séquences originales et mutées. Nous choisissons d'utiliser la probabilité de fixation classique couramment utilisée48, pour une mutation de coefficient de sélection σ dans une population de taille N :

Ici, le coefficient de sélection est proportionnel à la différence des log affinités de liaison entre les deux séquences. Nous utilisons ce modèle dans la limite de "sélection forte" (N → ∞ et σ → ∞), où une mutation fixe si elle est avantageuse ou si c'est le choix le moins délétère parmi toutes les mutations restantes. Les modèles de sélection plus faibles, avec des valeurs inférieures de σ et N, donnent des résultats qualitativement similaires à condition que la pression de sélection soit suffisamment élevée (voir Fig. 11b supplémentaire ; pour des pressions de sélection suffisamment faibles, l'ordre devient aléatoire comme prévu). Pour implémenter ce modèle, nous utilisons une approche de matrice de transition qui nous permet de calculer rapidement la probabilité que chaque résidu apparaisse à une position spécifique. Pour vérifier que l'ordre des mutations spécifiques est statistiquement significatif, nous utilisons une méthode de bootstrap et échantillonnons des valeurs d'affinité à partir de distributions normales avec une moyenne et un écart type donnés par nos mesures expérimentales. Nous échantillonnons ensuite les mutations selon le modèle décrit précédemment et utilisons des méthodes standard pour déterminer la signification.

Le paysage d'affinité de liaison à haute dimension peut être projeté en deux dimensions avec une approche de mise en page graphique dirigée par la force (voir https://desai-lab.github.io/wuhan_to_omicron/). Chaque séquence de la bibliothèque d'anticorps est un nœud, relié par des arêtes à ses voisins à mutation unique. Une arête entre deux séquences s et t reçoit le poids :

Dans une représentation dirigée par la force, les nœuds se repoussent, tandis que les arêtes rapprochent les nœuds auxquels elles sont attachées. Dans notre scénario, cela signifie que les nœuds avec un génotype similaire (quelques mutations à part) et un phénotype similaire (affinité de liaison) seront proches les uns des autres en deux dimensions.

Il est important de noter qu'il ne s'agit pas d'une représentation "paysage": la distance entre deux points n'est pas liée à la facilité avec laquelle il est possible d'atteindre un génotype à partir d'un autre dans un modèle de sélection particulier. Pratiquement, après avoir attribué tous les poids des bords, nous utilisons la fonction de mise en page layout_drl du package Python iGraph, avec les paramètres par défaut, pour obtenir les coordonnées de mise en page pour chaque variante.

Pour analyser la phylogénie du SRAS-CoV-2 (Fig. 4a, b), nous avons utilisé toutes les séquences RBD complètes de tous les génomes du SRAS-CoV-2 déposés dans le référentiel de l'Initiative mondiale sur le partage de toutes les données sur la grippe (GISAID)49,50,51 avec la phylogénie globale GISAID Audacity (EPI_SET ID : EPI_SET_20220615uq, disponible sur GISAID jusqu'au 15 juin 2 022, et accessible sur https://doi.org/10.55876/gis8.220615uq). Nous avons élagué l'arbre pour supprimer toutes les séquences avec RBD ne correspondant à aucun des intermédiaires possibles entre Wuhan Hu-1 et Omicron BA.1 et avons analysé cet arbre à l'aide de la boîte à outils python ete352. Nous avons mesuré la fréquence de chaque mutation (Fig. 4a) en comptant le nombre de fois qu'elle se produit indépendamment dans l'arbre (c'est-à-dire la fréquence à laquelle la mutation apparaît sur un nœud dont le nœud parent n'a pas cette mutation). Pour la figure 4b, nous avons compté deux mutations comme co-apparaissant si les deux mutations sont absentes dans le nœud parent et contenues dans au moins un des nœuds descendants. Par conséquent, nous limitons notre champ d'application aux mutations qui apparaissent dans la même branche plutôt que de considérer les mutations dans tous les descendants. Cela nous permet de réduire l'effet du bruit et des contingences. Par exemple, une mutation neutre qui arrive tôt dans une lignée aura de nombreux descendants, ce qui pourrait biaiser son influence. Cette stratégie d'étude de la fréquence relative des mutations co-apparaissant est un cas particulier de la méthode développée dans Kryazhimskiy et al47, qui déduit l'épistasie entre les mutations à partir des données phylogénétiques (la méthode générale n'était pas applicable dans cet ensemble de données spécifique en raison de sa taille).

Tous les traitements de données et analyses statistiques ont été effectués à l'aide de R v4.1.053 et de python 3.10.054. Tous les chiffres ont été générés à l'aide de ggplot255 et matplotlib56.

De plus amples informations sur la conception de la recherche sont disponibles dans le résumé des rapports sur le portefeuille Nature lié à cet article.

Les lectures de séquençage brutes générées dans cette étude ont été déposées dans la base de données NCBI BioProject sous le numéro d'accession PRJNA849979. Le référentiel github39 https://github.com/desai-lab/compensatory_epistasis_omicron/ contient toutes les métadonnées associées ('Titeseq/metadata') et les fichiers fcs de cytométrie en flux ('Titeseq/facs_data'). Nous avons également utilisé un ensemble de données tiers accessible au public de GISAID, accessible à l'adresse https://doi.org/10.55876/gis8.220615uq.

Le référentiel Github39 https://github.com/desai-lab/compensatory_epistasis_omicron/Titeseq/ contient tous les codes d'analyse associés.

Viana, R. et al. Expansion épidémique rapide de la variante SARS-CoV-2 Omicron en Afrique australe. Nature 603, 679–686 (2022).

Article ADS CAS PubMed PubMed Central Google Scholar

Dejnirattisai, W. et al. Le SRAS-CoV-2 Omicron-B.1.1.529 conduit à une fuite généralisée des réponses d'anticorps neutralisants. Cellule 185, 467–484.e15 (2022).

Article CAS PubMed PubMed Central Google Scholar

Cameroni, E. et al. Les anticorps largement neutralisants surmontent le déplacement antigénique du SARS-CoV-2 Omicron. Nature 602, 664–670 (2022).

Article ADS CAS PubMed Google Scholar

Cao, Y. et al. Omicron échappe à la majorité des anticorps neutralisants SARS-CoV-2 existants. Nature 602, 657–663 (2022).

Article ADS CAS PubMed Google Scholar

Liu, L. et al. Évasion frappante des anticorps manifestée par la variante Omicron du SRAS-CoV-2. Nature 602, 676–681 (2022).

Article ADS CAS PubMed Google Scholar

Planas, D. et al. Échappement considérable du SARS-CoV-2 Omicron à la neutralisation des anticorps. Nature 602, 671–675 (2022).

Article ADS CAS PubMed Google Scholar

Mannar, D. et al. Variante SARS-CoV-2 Omicron : évasion des anticorps et structure cryo-EM du complexe protéine de pointe-ACE2. Sciences 375, 760–764 (2022).

Article ADS CAS PubMed Google Scholar

Starr, TN et al. Déplacement des contraintes mutationnelles dans le domaine de liaison au récepteur SARS-CoV-2 au cours de l'évolution virale. bioRxiv https://doi.org/10.1101/2022.02.24.481899 (2022).

Starr, TN et al. L'analyse mutationnelle profonde du domaine de liaison du récepteur SARS-CoV-2 révèle des contraintes sur le repliement et la liaison ACE2. Cellule 182, 1295–1310.e20 (2020).

Article CAS PubMed PubMed Central Google Scholar

Wu, L. et al. SARS-CoV-2 Omicron RBD montre une affinité de liaison plus faible que la variante Delta actuellement dominante à l'ACE2 humain. Sig. Transduct. Cible 7, 8 (2022).

Article CAS Google Scholar

Han, P. et al. Liaison au récepteur et structures complexes de l'ACE2 humain pour stimuler le RBD à partir d'omicron et de delta SARS-CoV-2. Cellule 185, 630–640.e10 (2022).

Article CAS PubMed PubMed Central Google Scholar

Greaney, AJ et al. Cartographie complète des mutations dans le domaine de liaison au récepteur SARS-CoV-2 qui affectent la reconnaissance par les anticorps plasmatiques humains polyclonaux. Microbe hôte cellulaire 29, 463–476.e6 (2021).

Article CAS PubMed PubMed Central Google Scholar

Adams, RM, Mora, T., Walczak, AM & Kinney, JB Mesure du paysage séquence-affinité des anticorps avec des courbes de titrage massivement parallèles. Elife 5, (2016).

Phillips, AM et al. Les paysages d'affinité de liaison limitent l'évolution des anticorps anti-grippaux largement neutralisants. Elife 10, (2021).

Adams, RM, Kinney, JB, Walczak, AM & Mora, T. Epistasis dans un paysage de remise en forme défini par l'énergie libre de liaison anticorps-antigène. Cellule Syst. 8, 86–93.e3 (2019).

Article CAS PubMed PubMed Central Google Scholar

McCallum, M. et al. Base structurelle de l'évasion immunitaire SARS-CoV-2 Omicron et de l'engagement des récepteurs. Sciences 375, 864–868 (2022).

Article ADS CAS PubMed Google Scholar

Greaney, AJ et al. Cartographie des mutations du SARS-CoV-2 RBD qui échappent à la liaison par différentes classes d'anticorps. Nat. Commun. 12, 4196 (2021).

Article ADS CAS PubMed PubMed Central Google Scholar

Greaney, AJ, Starr, TN & Bloom, JD Un calculateur d'échappement d'anticorps pour les mutations du domaine de liaison au récepteur SARS-CoV-2. bioRxiv https://doi.org/10.1101/2021.12.04.471236 (2021).

Sailer, ZR & Harms, MJ L'épistasie d'ordre élevé façonne les trajectoires évolutives. Calcul PLoS. Biol. 13, e1005541 (2017).

Article ADS PubMed PubMed Central Google Scholar

Wells, JA Additivité des effets mutationnels dans les protéines. Biochimie 29, 8509–8517 (1990).

Article CAS PubMed Google Scholar

Olson, CA, Wu, NC et Sun, R. Une description biophysique complète de l'épistasie par paires dans tout un domaine protéique. Courant. Biol. 24, 2643-2651 (2014).

Article CAS PubMed PubMed Central Google Scholar

Otwinowski, J., McCandlish, DM & Plotkin, JB Déduire la forme de l'épistasie globale. Proc. Natl Acad. Sci. États-Unis 115, E7550–E7558 (2018).

Article ADS CAS PubMed PubMed Central Google Scholar

Starr, TN & Thornton, JW Epistasis dans l'évolution des protéines. Protéine Sci. 25, 1204-1218 (2016).

Article CAS PubMed PubMed Central Google Scholar

Zahradnik, J. et al. La prévision des variantes du SRAS-CoV-2 et la conception de médicaments antiviraux sont activées par l'évolution in vitro du RBD. Nat. Microbiol. 6, 1188-1198 (2021).

Article PubMed Google Scholar

Laffeber, C., de Koning, K., Kanaar, R. & Lebbink, JHG Preuve expérimentale d'une meilleure liaison aux récepteurs en propageant rapidement les variants du SRAS-CoV-2. J. Mol. Biol. 433, 167058 (2021).

Article CAS PubMed PubMed Central Google Scholar

Rochman, ND et al. Épistasie à l'interface du domaine de liaison au récepteur SARS-CoV-2 et les implications propices ennuyeuses pour l'évasion vaccinale. MBio 13, e0013522 (2022).

Article PubMed Google Scholar

Javanmardi, K. et al. Évasion d'anticorps et stabilisation cryptique interdomaine dans la protéine de pointe SARS-CoV-2 Omicron. bioRxiv https://doi.org/10.1101/2022.04.18.488614 (2022).

Rochman, ND et al. Évolution adaptative mondiale et régionale en cours du SARS-CoV-2. Proc. Natl. Acad. Sci. États-Unis 118, (2021).

Lythgoe, KA et al. Diversité et transmission intra-hôte du SRAS-CoV-2. Sciences 372, eabg0821 (2021).

Article CAS PubMed PubMed Central Google Scholar

Kemp, SA et al. Évolution du SRAS-CoV-2 au cours du traitement d'une infection chronique. Nature 592, 277-282 (2021).

Article CAS PubMed PubMed Central Google Scholar

Choi, B. et al. Persistance et évolution du SRAS-CoV-2 chez un hôte immunodéprimé. N. Engl. J. Med. 383, 2291-2293 (2020).

Article PubMed Google Scholar

Hale, VL et al. Infection par le SRAS-CoV-2 chez le cerf de Virginie en liberté. Nature 602, 481–486 (2022).

Article ADS CAS PubMed Google Scholar

Bate, N. et al. L'évolution in vitro prédit les mutations émergentes du CoV-2 avec une forte affinité pour l'ACE2 et la liaison inter-espèces. bioRxiv https://doi.org/10.1101/2021.12.23.473975 (2021).

Gobeil, SM-C. et coll. Diversité structurelle de la pointe SARS-CoV-2 Omicron. Mol. Cellule 82, 2050-2068.e6 (2022).

Article CAS PubMed PubMed Central Google Scholar

Wentz, AE & Shusta, EV Un nouveau criblage à haut débit révèle des gènes de levure qui augmentent la sécrétion de protéines hétérologues. Appl. Environ. Microbiol. 73, 1189-1198 (2007).

Article ADS CAS PubMed Google Scholar

Gietz, RD & Schiestl, RH Transformation rapide et facile de la levure à l'aide de la méthode LiAc/SS transporteur ADN/PEG. Nat. Protocole 2, 35–37 (2007).

Article CAS PubMed Google Scholar

Boder, ET & Wittrup, KD Affichage de surface de levure pour cribler des bibliothèques de polypeptides combinatoires. Nat. Biotechnol. 15, 553-557 (1997).

Article CAS PubMed Google Scholar

Nguyen Ba, AN et al. Le suivi de la lignée à haute résolution révèle une vague d'adaptation progressive dans la levure de laboratoire. Nature 575, 494–499 (2019).

Article ADS CAS PubMed Google Scholar

Moulana, A. et al. desai-lab/compensatory_epistasis_omicron. (Zenodo, 2022). https://doi.org/10.5281/ZENODO.7235104.

Barnett, M. Regex. Préimpression à (2013).

Starr, TN et al. Cartographie prospective des mutations virales qui échappent aux anticorps utilisés pour traiter le COVID-19. Sciences 371, 850–854 (2021).

Article ADS CAS PubMed PubMed Central Google Scholar

Poelwijk, FJ, Krishna, V. & Ranganathan, R. La dépendance contextuelle des mutations : un lien de formalismes. Calcul PLoS. Biol. 12, e1004771 (2016).

Article ADS PubMed PubMed Central Google Scholar

Sailer, ZR & Harms, MJ Détection d'épistasie d'ordre élevé dans les cartes génotype-phénotype non linéaires. Génétique 205, 1079-1088 (2017).

Article CAS PubMed PubMed Central Google Scholar

Pettersen, EF et al. UCSF ChimeraX : visualisation de la structure pour les chercheurs, les éducateurs et les développeurs. Protéine Sci. 30, 70–82 (2021).

Article CAS PubMed Google Scholar

Schrodinger, LLC Le système graphique moléculaire PyMOL. (2015).

Upadhyay, V., Patrick, C., Lucas, A. & Mallela, KMG L'évolution convergente de plusieurs mutations améliore l'aptitude virale des variantes du SRAS-CoV-2 en équilibrant la sélection positive et négative. Biochimie 61, 963–980 (2022).

Article CAS PubMed Google Scholar

Kryazhimskiy, S., Dushoff, J., Bazykin, GA et Plotkin, JB Prévalence de l'épistasie dans l'évolution des protéines de surface de la grippe A. PLoS Genet. 7, e1001301 (2011).

Article CAS PubMed PubMed Central Google Scholar

Kimura, M. Sur la probabilité de fixation de gènes mutants dans une population. Génétique 47, 713–719 (1962).

Article CAS PubMed PubMed Central Google Scholar

Khare, S. et al. Rôle du GISAID dans la réponse à la pandémie. Chine CDC Wkly 3, 1049–1051 (2021).

Article PubMed PubMed Central Google Scholar

Elbe, S. & Buckland-Merrett, G. Données, maladie et diplomatie : la contribution innovante du GISAID à la santé mondiale. Glob. Chall. 1, 33–46 (2017).

Article PubMed PubMed Central Google Scholar

Shu, Y. & McCauley, J. GISAID : Initiative mondiale sur le partage de toutes les données sur la grippe – de la vision à la réalité. Euro Surveillance. 22, (2017).

Huerta-Cepas, J., Serra, F. & Bork, P. ETE 3 : Reconstruction, analyse et visualisation de données phylogénomiques. Mol. Biol. Évol. 33, 1635-1638 (2016).

Article CAS PubMed PubMed Central Google Scholar

Équipe de base R. R : Un langage et un environnement pour le calcul statistique. (2017).

Van Rossum, G. & Drake, FL Python 3 Reference Manual. (Créer Espace, 2009).

Wickham, H. Ggplot2. (Springer International Publishing, 2016).

Hunter, JD Matplotlib : Un environnement graphique 2D. Calcul. Sci. Ing. 9, 90–95 (2007).

Article Google Scholar

Télécharger les références

Nous remercions Zach Niziolek pour son aide avec la cytométrie en flux et les membres du laboratoire Desai pour des discussions utiles. La TD reconnaît le soutien de la bourse postdoctorale du Human Frontier Science Program, l'AMP reconnaît le soutien de la bourse postdoctorale Hanna H. Gray de l'Institut médical Howard Hughes, JC reconnaît le soutien de la bourse de recherche supérieure de la National Science Foundation et MMD reconnaît le soutien du NSF-Simons Center for Mathematical and Statistical Analysis of Biology de l'Université Harvard, soutenu par la subvention NSF no. DMS-1764269 et la Harvard FAS Quantitative Biology Initiative, accordent PHY-1914916 de la NSF et accordent GM104239 du NIH. JDB reconnaît le soutien de la subvention NIH/NIAID R01AI141707 et est chercheur au Howard Hughes Medical Institute. Nous remercions tous les contributeurs de données, c'est-à-dire les auteurs et leurs laboratoires d'origine responsables de l'obtention des spécimens, et leurs laboratoires de soumission pour la génération de la séquence génétique et des métadonnées et le partage via l'initiative GISAID. Des travaux de calcul ont été effectués sur le cluster FASRC Cannon soutenu par le FAS Division of Science Research Computing Group de l'Université de Harvard.

Ces auteurs ont contribué à parts égales : Alief Moulana, Thomas Dupic, Angela M. Phillips, Jeffrey Chang.

Département de biologie de l'organisme et de l'évolution, Université de Harvard, Cambridge, MA, 02138, États-Unis

Alief Moulana, Thomas Dupic, Angela M. Phillips & Michael M. Desai

Département de physique, Harvard University, Cambridge, MA, 02138, États-Unis

Jeffrey Chang et Michael M. Desai

Département de biologie moléculaire et cellulaire, Université de Harvard, Cambridge, MA, 02138, États-Unis

Serafina Nieves

Sciences biologiques et biomédicales, Harvard Medical School, Boston, MA, 02115, États-Unis

Anne A. Roffler

Division des sciences fondamentales et programme de biologie computationnelle, Fred Hutchinson Cancer Research Center, Seattle, WA, 98109, États-Unis

Allison J. Greaney, Tyler N. Starr et Jesse D. Bloom

Département des sciences du génome, Université de Washington, Seattle, WA, 98195, États-Unis

Allison J. Greaney et Jesse D. Bloom

Programme de formation des scientifiques médicaux, Université de Washington, Seattle, WA, 98195, États-Unis

Allison J. Greaney

Institut médical Howard Hughes, Seattle, WA, 98109, États-Unis

Jesse D. Bloom

NSF-Simons Center for Mathematical and Statistical Analysis of Biology, Harvard University, Cambridge, MA, 02138, États-Unis

Michael M. Desai

Initiative de biologie quantitative, Université Harvard, Cambridge, MA, 02138, États-Unis

Michael M. Desai

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Conceptualisation : AM, TD, AMP, JC, TNS, AJG, JDB et MMD Méthodologie : AM, TD, AMP, JC, SN, TNS et AJG Conception et production de la bibliothèque : AM, TD, AMP, JC et AJG Expériences : AM, TD, AMP, JC et AAR Validation : AM, TD, AMP, JC, SN et TNS Analyse des données : AM, TD, AMP, JC , SN et TNS Supervision : AMP, JDB et MMD Financement de l'acquisition : JDB et MMD Rédaction — version originale : AM, TD, AMP, JC et MMD Tous les auteurs ont révisé et édité le manuscrit.

Correspondance à Angela M. Phillips ou Michael M. Desai.

AMP et MMD ont ou ont récemment consulté pour Leyden Labs. JDB a ou a récemment consulté Apriori Bio, Oncorus, Moderna et Merck. JDB, AJG et TNS sont les inventeurs des brevets sous licence de Fred Hutch liés au balayage mutationnel profond viral. Les autres auteurs ne déclarent aucun intérêt concurrent.

Nature Communications remercie Joachim Krug et le(s) autre(s) relecteur(s) anonyme(s) pour leur contribution à la relecture par les pairs de ce travail.

Note de l'éditeur Springer Nature reste neutre en ce qui concerne les revendications juridictionnelles dans les cartes publiées et les affiliations institutionnelles.

Libre accès Cet article est sous licence Creative Commons Attribution 4.0 International License, qui permet l'utilisation, le partage, l'adaptation, la distribution et la reproduction sur n'importe quel support ou format, tant que vous donnez le crédit approprié à l'auteur ou aux auteurs originaux et à la source, fournissez un lien vers la licence Creative Commons et indiquez si des modifications ont été apportées. Les images ou tout autre matériel tiers dans cet article sont inclus dans la licence Creative Commons de l'article, sauf indication contraire dans une ligne de crédit au matériel. Si le matériel n'est pas inclus dans la licence Creative Commons de l'article et que votre utilisation prévue n'est pas autorisée par la réglementation légale ou dépasse l'utilisation autorisée, vous devrez obtenir l'autorisation directement du détenteur des droits d'auteur. Pour voir une copie de cette licence, visitez http://creativecommons.org/licenses/by/4.0/.

Réimpressions et autorisations

Moulana, A., Dupic, T., Phillips, AM et al. L'épistasie compensatoire maintient l'affinité ACE2 dans SARS-CoV-2 Omicron BA.1. Nat Commun 13, 7011 (2022). https://doi.org/10.1038/s41467-022-34506-z

Télécharger la citation

Reçu : 08 septembre 2022

Accepté : 26 octobre 2022

Publié: 16 novembre 2022

DOI : https://doi.org/10.1038/s41467-022-34506-z

Toute personne avec qui vous partagez le lien suivant pourra lire ce contenu :

Désolé, aucun lien partageable n'est actuellement disponible pour cet article.

Fourni par l'initiative de partage de contenu Springer Nature SharedIt

BMC Biologie (2023)

En soumettant un commentaire, vous acceptez de respecter nos conditions d'utilisation et nos directives communautaires. Si vous trouvez quelque chose d'abusif ou qui ne respecte pas nos conditions ou directives, veuillez le signaler comme inapproprié.