Conception de novo de luciférases à l'aide de l'apprentissage en profondeur

Nouvelles

MaisonMaison / Nouvelles / Conception de novo de luciférases à l'aide de l'apprentissage en profondeur

Jan 03, 2024

Conception de novo de luciférases à l'aide de l'apprentissage en profondeur

Nature tome 614, pages

Nature volume 614, pages 774–780 (2023)Citer cet article

68 000 accès

4 Citations

494 Altmétrique

Détails des métriques

La conception d'enzymes de novo a cherché à introduire des sites actifs et des poches de liaison au substrat qui devraient catalyser une réaction d'intérêt dans des échafaudages natifs géométriquement compatibles1,2, mais a été limitée par un manque de structures protéiques appropriées et la complexité des relations séquence-structure des protéines natives. Nous décrivons ici une approche « d'hallucination à l'échelle de la famille » basée sur l'apprentissage en profondeur qui génère un grand nombre de structures protéiques idéalisées contenant diverses formes de poche et des séquences conçues qui les codent. Nous utilisons ces échafaudages pour concevoir des luciférases artificielles qui catalysent sélectivement la chimiluminescence oxydative des substrats synthétiques de luciférine diphénylterazine3 et 2-désoxycoelenterazine. Les sites actifs conçus positionnent un groupe arginine guanidinium adjacent à un anion qui se développe au cours de la réaction dans une poche de liaison à forte complémentarité de forme. Pour les deux substrats de luciférine, nous obtenons des luciférases conçues avec une sélectivité élevée ; la plus active d'entre elles est une petite enzyme (13,9 kDa) et thermostable (avec une température de fusion supérieure à 95 °C) qui a une efficacité catalytique sur la diphényltérazine (kcat/Km = 106 M−1 s−1) comparable à celle des luciférases natives, mais une spécificité de substrat beaucoup plus élevée. La création de biocatalyseurs hautement actifs et spécifiques à partir de zéro avec de larges applications en biomédecine est une étape clé pour la conception d'enzymes computationnelles, et notre approche devrait permettre la génération d'une large gamme de luciférases et d'autres enzymes.

La lumière bioluminescente produite par l'oxydation enzymatique d'un substrat de luciférine par des luciférases est largement utilisée pour les essais biologiques et l'imagerie dans la recherche biomédicale. Puisqu'aucune source de lumière d'excitation n'est nécessaire, des photons luminescents sont produits dans l'obscurité ; cela se traduit par une sensibilité plus élevée que l'imagerie par fluorescence dans les modèles animaux vivants et dans les échantillons biologiques dans lesquels l'autofluorescence ou la phototoxicité est une préoccupation4,5. Cependant, le développement des luciférases en tant que sondes moléculaires a pris du retard par rapport à celui des boîtes à outils de protéines fluorescentes bien développées pour un certain nombre de raisons : (i) très peu de luciférases natives ont été identifiées6,7 ; (ii) bon nombre de ceux qui ont été identifiés nécessitent de multiples liaisons disulfure pour stabiliser la structure et sont donc sujets à un mauvais repliement dans les cellules de mammifères8 ; (iii) la plupart des luciférases natives ne reconnaissent pas les luciférines synthétiques avec des propriétés photophysiques plus souhaitables9 ; et (iv) l'imagerie multiplexée pour suivre plusieurs processus en parallèle en utilisant des paires luciférase-luciférine mutuellement orthogonales a été limitée par la faible spécificité de substrat des luciférases natives10,11.

Nous avons cherché à utiliser la conception de protéines de novo pour créer des luciférases petites, très stables, bien exprimées dans les cellules, spécifiques d'un substrat et ne nécessitant aucun cofacteur pour fonctionner. Nous avons choisi une luciférine synthétique, la diphényltérazine (DTZ), comme substrat cible en raison de son rendement quantique élevé, de son émission décalée vers le rouge3, de sa pharmacocinétique in vivo favorable et de l'absence de cofacteurs requis pour l'émission de lumière. Les efforts antérieurs de conception d'enzymes computationnelles ont principalement réutilisé les échafaudages de protéines natives dans la Protein Data Bank (PDB)1,2, mais il existe peu de structures natives avec des poches de liaison appropriées pour DTZ, et les effets des changements de séquence sur les protéines natives peuvent être imprévisibles (des faisceaux hélicoïdaux conçus ont également été utilisés comme échafaudages enzymatiques14,15,16, mais ceux-ci sont en nombre limité et la plupart n'ont pas de poches adaptées à la liaison DTZ). Pour contourner ces limitations, nous avons entrepris de générer un grand nombre d'échafaudages protéiques petits et stables avec des poches de taille et de forme appropriées pour DTZ, et avec des relations séquence-structure claires pour faciliter l'incorporation ultérieure du site actif. Pour identifier les plis protéiques capables d'héberger de telles poches, nous avons d'abord ancré DTZ dans 4 000 protéines natives de liaison aux petites molécules. Nous avons constaté que de nombreux plis de type facteur de transport nucléaire 2 (NTF2) ont des poches de liaison avec une complémentarité de forme et une taille appropriées pour le placement de DTZ (tirets roses sur la figure 1e), et avons donc sélectionné la superfamille de type NTF2 comme topologie cible.

a, Hallucination familiale. Les séquences codant pour les protéines avec la topologie souhaitée sont optimisées par échantillonnage de la chaîne de Markov Monte Carlo (MCMC) avec une fonction de perte à plusieurs composants. Les régions structurellement conservées (pêche) sont évaluées sur la base de la cohérence avec les distributions de distance et d'orientation résidu-résidu d'entrée obtenues à partir de 85 structures expérimentales de protéines de type NTF2, tandis que les régions variables non idéales (sarcelle) sont évaluées sur la base de la confiance des géométries inter-résidus prédites calculées comme la divergence KL entre les prédictions du réseau et la distribution de fond. L'échantillonnage MCMC de l'espace de séquence intègre à la fois les changements de séquence et les insertions et les suppressions (voir Méthodes supplémentaires) pour guider la séquence hallucinée vers les structures de codage avec les plis souhaités. Des réseaux de liaisons hydrogène sont incorporés dans les structures conçues pour augmenter la spécificité structurelle. b–d, La conception des sites actifs de la luciférase. b, Génération de conformères de substrat de luciférase (DTZ). c, Génération d'un champ d'interaction rotamère (RIF) pour stabiliser le DTZ anionique et former des interactions de garnissage hydrophobes. d, Amarrage du RIF dans les échafaudages hallucinés et optimisation des interactions substrat-échafaudage à l'aide d'une conception de séquence biaisée par des matrices de scores spécifiques à la position (PSSM). e, Sélection de la topologie NTF2. Le RIF a été ancré dans 4 000 protéines natives de liaison aux petites molécules, à l'exclusion des protéines qui se lient au substrat de la luciférine en utilisant plus de cinq résidus de boucle. La plupart des meilleurs résultats provenaient de la superfamille des protéines de type NTF2 (tirets roses). En utilisant le protocole de génération d'échafaudages d'hallucinations à l'échelle de la famille, nous avons généré 1 615 échafaudages et constaté que ceux-ci produisaient des énergies de liaison RIF mieux prédites que les protéines natives. f, g, nos échafaudages optimisés DL échantillonnent davantage dans l'espace des structures natives (f) et ont des relations séquence-structure plus fortes (prédictions de structure Alphafold2 plus sûres) (g) que les échafaudages optimisés en énergie natifs ou précédents sans apprentissage en profondeur.

Les structures natives NTF2 ont une gamme de tailles et de formes de poche, mais contiennent également des caractéristiques qui ne sont pas idéales, telles que de longues boucles qui compromettent la stabilité. Pour créer un grand nombre de structures idéales de type NTF2, nous avons développé une approche d '«hallucination à l'échelle de la famille» basée sur l'apprentissage en profondeur qui intègre des approches de conception de novo sans contrainte17,18 et de conception de séquence Rosetta19 pour permettre la génération d'un nombre essentiellement illimité de protéines qui ont un pli souhaité (Fig. 1a). L'approche de l'hallucination à l'échelle de la famille a utilisé la capacité de découverte de séquence et de structure de novo de l'hallucination protéique sans contrainte17,18 pour les régions de boucle et variables, et l'optimisation de séquence guidée par la structure pour les régions centrales. Nous avons utilisé le réseau neuronal de prédiction de structure trRosetta20, qui est efficace pour identifier des protéines conçues de novo et hallucinantes de nouvelles protéines globulaires de diverses topologies. À partir des séquences de 2 000 NTF2 naturels, nous avons effectué des recherches de Monte Carlo dans l'espace des séquences, en effectuant à chaque étape un changement de séquence et en prédisant la structure à l'aide de trRosetta. En tant que fonction de perte guidant la recherche, nous avons utilisé la confiance du réseau neuronal dans la structure prédite (comme dans notre précédente étude d'hallucination libre) complétée par une fonction de perte spécifique à la topologie sur les géométries des paires de résidus de base (voir Méthodes supplémentaires) ; dans les régions de boucle, nous avons également permis au nombre de résidus de varier, ce qui a entraîné de courtes boucles presque idéales. Pour coder davantage la spécificité structurelle, nous avons incorporé des réseaux de liaisons hydrogène enterrés à longue portée. Les 1 615 échafaudages NTF2 hallucinés à l'échelle de la famille qui en ont résulté ont fourni plus de poches de liaison complémentaires à la forme pour DTZ que les protéines natives de liaison aux petites molécules (Fig. 1e). Cette méthode échantillonne des squelettes de protéines qui sont plus proches des protéines natives de type NTF2 (Fig. 1f) et qui ont de meilleures mesures de qualité d'échafaudage que celles produites dans une précédente approche basée sur l'énergie sans apprentissage en profondeur21 (Fig. 1g).

La conception d'enzymes computationnelles commence généralement à partir d'un site actif idéal ou d'un théozyme constitué de groupes fonctionnels protéiques entourant l'état de transition de la réaction qui est ensuite adapté à un ensemble d'échafaudages existants1,2. Cependant, la géométrie catalytique détaillée des luciférases marines natives n'est pas bien comprise car seule une poignée de structures apo et aucune structure holo avec des substrats de luciférine ont été résolues (au moment de cette étude)22,23,24. Les calculs de chimie quantique25,26 et les données expérimentales27,28 suggèrent que la réaction chimiluminescente passe par une espèce anionique et que la polarité de l'environnement peut modifier considérablement l'énergie libre du processus de transfert d'électron unique (SET) ultérieur avec l'oxygène moléculaire triplet (3O2). Guidés par ces données (Extended Data Fig. 1), nous avons cherché à concevoir un site catalytique complémentaire de forme qui stabilise l'état anionique du DTZ et abaisse la barrière énergétique SET, en supposant que les étapes de thermolyse de l'émetteur de lumière dioxétane en aval sont spontanées. Pour stabiliser l'état anionique, nous nous sommes concentrés sur le placement du groupe guanidinium chargé positivement d'un résidu arginine pour stabiliser la charge négative en développement sur le groupe imidazopyrazinone.

Pour concevoir par ordinateur de tels sites actifs dans un grand nombre d'échafaudages NTF2 hallucinés, nous avons d'abord généré un ensemble de conformères DTZ anioniques (Fig. 1b). Ensuite, autour de chaque conformateur, nous avons utilisé la méthode RifGen29,30 pour énumérer les champs d'interaction rotamère (RIF) sur des grilles tridimensionnelles constituées de millions de placements de chaînes latérales d'acides aminés créant des liaisons hydrogène et des interactions non polaires avec DTZ (Fig. 1c). Un groupe arginine guanidinium a été placé à côté de l'atome N1 du groupe imidazopyrazinone pour stabiliser la charge négative. RifDock a ensuite été utilisé pour ancrer chaque conformateur DTZ et le RIF associé dans la cavité centrale de chaque échafaudage afin de maximiser les interactions protéine-DTZ. En moyenne, huit rotamères à chaîne latérale, y compris un résidu d'arginine pour stabiliser le noyau anionique d'imidazopyrazinone, ont été positionnés dans chaque poche (Fig. 2a supplémentaire). Pour les 50 000 meilleurs docks avec les interactions chaîne latérale-DTZ les plus favorables, nous avons optimisé le reste de la séquence à l'aide de RosettaDesign (Fig. 1d) pour une liaison de haute affinité à DTZ avec un biais vers la variation de séquence naturellement observée pour assurer la pliabilité. Au cours du processus de conception, les réseaux de liaisons hydrogène prédéfinis (HBNets) dans les échafaudages ont été conservés intacts pour la spécificité et la stabilité structurelles, et les interactions de ces chaînes latérales HBNet avec DTZ ont été explicitement requises dans l'étape RifDock pour assurer la pré-organisation des résidus qui sont essentiels pour la catalyse. Dans la première étape de conception de séquence, les identités de tous les résidus RIF et HBNet ont été maintenues fixes et les résidus environnants ont été optimisés pour maintenir les interactions chaîne latérale-DTZ en place et maintenir la spécificité structurelle. Dans la deuxième étape de conception de séquence, les identités des résidus RIF (à l'exception de l'arginine) ont également été autorisées à varier, car Rosetta peut identifier les interactions d'emballage apolaires et aromatiques qui ont été manquées dans le RIF en raison des effets de binning. Au cours de la conception de la séquence, le squelette de l'échafaudage, les chaînes latérales et le substrat DTZ ont été autorisés à se détendre dans l'espace cartésien. Après optimisation de la séquence, les conceptions ont été filtrées sur la base de l'énergie de liaison du ligand, des liaisons hydrogène protéine-ligand, de la complémentarité de forme et de la surface moléculaire de contact, et 7 648 conceptions ont été sélectionnées et commandées sous forme d'oligos regroupés pour un criblage expérimental.

Les oligonucléotides codant pour les deux moitiés de chaque conception ont été assemblés en gènes de pleine longueur et clonés dans un vecteur d'expression d'Escherichia coli (voir Méthodes supplémentaires). Une méthode de criblage basée sur les colonies a été utilisée pour imager directement les colonies de luciférase active de la bibliothèque et les activités des clones sélectionnés ont été confirmées à l'aide d'une expression sur plaque à 96 puits (Extended Data Fig. 2). Trois conceptions actives ont été identifiées ; nous appelons le plus actif d'entre eux LuxSit (du latin lux sit , «laisser la lumière exister»), qui à 117 résidus (13,9 kDa) est, à notre connaissance, plus petit que toute luciférase précédemment décrite. L'analyse biochimique, y compris la SDS – PAGE et la chromatographie d'exclusion de taille (Fig. 2a, b et Extended Data Fig. 3), a indiqué que LuxSit est fortement exprimé dans E. coli, soluble et monomérique. La spectroscopie de dichroïsme circulaire (CD) a montré une forte signature CD dans l'ultraviolet lointain, suggérant une structure α-β organisée. Des expériences de fusion de CD ont montré que la protéine n'est pas complètement dépliée à 95 ° C et que la structure complète est retrouvée lorsque la température baisse (Fig. 2c). L'incubation de LuxSit avec DTZ a entraîné une luminescence avec un pic d'émission à environ 480 nm (Fig. 2d), compatible avec le spectre de chimiluminescence DTZ. Bien que nous n'ayons pas été en mesure de déterminer la structure cristalline de LuxSit, la structure prédite par AlphaFold2 (réf. 31) est très proche du modèle de conception au niveau du squelette (écart quadratique moyen (RMSD) = 1, 35 Å) et sur les chaînes latérales interagissant avec le substrat (Fig. 2e). Le site actif LuxSit conçu contient des dyades Tyr14 – His98 et Asp18 – Arg65, les atomes d'azote imidazole de His98 établissant des interactions de liaison hydrogène avec Tyr14 et l'atome O1 de DTZ (Fig. 2f). Le centre du cation guanidinium Arg65 est à 4, 2 Å de l'atome N1 de DTZ et Asp18 forme une liaison hydrogène bidentée avec le groupe guanidinium et le squelette NH de Arg65 (Fig. 2g).

a, SDS-PAGE coloré au Coomassie de LuxSit recombinant purifié de E. coli (pour les données de source de gel, voir la Fig. 1 supplémentaire). b, la chromatographie d'exclusion de taille de LuxSit purifié suggère des propriétés monodispersées et monomères. c, spectres CD dans l'ultraviolet lointain à 25 °C (noir), 95 °C (rouge) et refroidi à 25 °C (vert). Encart, courbe de fusion CD de LuxSit à 220 nm. MRE, ellipticité des résidus molaires. d, Spectre d'émission de luminescence de DTZ en présence (bleu) et en absence (vert) de LuxSit. e, Alignement structurel du modèle de conception (bleu) et du modèle prédit par AlphaFold2 (gris), qui concordent étroitement au niveau de la colonne vertébrale (à gauche) et de la chaîne latérale (à droite). f – i, Mutagenèse par saturation du site des résidus interagissant avec le substrat. Vues agrandies (à gauche) des modèles conçus (bleu) et AlphaFold2 (gris) au niveau de la chaîne latérale, illustrant les interactions enzyme-substrat conçues du noyau Tyr14–His98 HBNet (f), Asp18–Arg65 dyade (g), π-empilement (h) et résidus de garnissage hydrophobe (i). Les profils de séquence (à droite) sont mis à l'échelle par les activités de différentes variantes de séquence : (activité pour l'acide aminé indiqué)/(somme des activités sur tous les acides aminés testés à la position indiquée). Les substitutions A96M et M110V avec une activité accrue sont surlignées en rose.

Données source

Nous avons ensuite cherché à appliquer les connaissances acquises lors de la conception de LuxSit pour créer des luciférases spécifiques à la 2-désoxycoelenterazine (h-CTZ). Étant donné que la forme moléculaire de h-CTZ est différente de celle de DTZ, nous avons créé un ensemble supplémentaire d'échafaudages de la superfamille NTF2 (voir Méthodes supplémentaires) avec des formes de poche correspondantes et une confiance élevée dans le modèle (test de différence de distance locale prédit par AlphaFold2 (pLDDT)> 92). Nous avons ensuite installé des sites catalytiques dans ces échafaudages et conçu les premières interactions chaîne latérale-protéine-h-CTZ en utilisant les géométries d'interaction de substrat d'histidine et d'arginine qui ont été les plus réussies au premier tour pour DTZ. Pour concevoir le reste de la séquence, nous avons utilisé ProteinMPNN32, qui peut entraîner une meilleure stabilité, solubilité et précision que RosettaDesign. Après filtrage sur la base du pLDDT prédit par AlphaFold2, du Cα RMSD, de la surface moléculaire de contact et des énergies de liaison calculées par Rosetta (voir Méthodes supplémentaires), nous avons sélectionné et exprimé expérimentalement 46 modèles dans E. coli et identifié 2 (HTZ3-D2 et HTZ3-G4) qui avaient une activité de luciférase avec le substrat de luciférine h-CTZ. Les deux conceptions étaient hautement solubles, monodispersées et monomères, et les activités de luciférase étaient du même ordre de grandeur que LuxSit (Extended Data Fig. 4). Le taux de réussite est passé de 3/7 648 à 2/46 séquences au second tour, probablement en raison de la connaissance de la géométrie du site actif dès le premier tour et de la robustesse accrue de la méthode ProteinMPNN de conception de séquences.

Pour mieux comprendre les contributions à la catalyse de LuxSit, la plus active de nos conceptions, nous avons construit une bibliothèque de mutagenèse à saturation de site (SSM) dans laquelle chaque résidu de la poche de liaison au substrat a été muté en chaque autre acide aminé un à la fois (voir Méthodes supplémentaires) et déterminé l'effet de chaque mutation sur l'activité de la luciférase. La figure 2f – i montre les préférences en acides aminés aux positions clés. Arg65 est hautement conservé (Fig. 2g) et son partenaire de la dyade Asp18 ne peut être muté qu'en Glu (ce qui réduit l'activité), ce qui suggère que la liaison hydrogène carboxylate-Arg65 est importante pour l'activité de la luciférase. Dans la dyade Tyr14-His98 (Fig. 2f), Tyr14 peut être remplacé par Asp et Glu, et His98 peut être remplacé par Asn. Comme toutes les variantes actives avaient des donneurs et des accepteurs de liaison hydrogène à ces positions, les dyades pourraient aider à assurer la médiation du transfert d'électrons et de protons requis pour la luminescence. Les résidus hydrophobes (Fig. 2i) et π-empilement (Fig. 2h) à l'interface de liaison tolèrent d'autres substitutions aromatiques ou aliphatiques et préfèrent généralement l'acide aminé dans la conception d'origine, conformément aux prédictions d'affinité basées sur le modèle des effets mutationnels (Extended Data Fig. 5). Les mutants A96M et M110V (surlignés en rose) augmentent l'activité de 16 fois et 19 fois, respectivement, par rapport à LuxSit (tableau supplémentaire 1). L'optimisation guidée par ces résultats a donné LuxSit-f (A96M/M110V), avec une cinétique d'émission de type flash, et LuxSit-i (R60S/A96L/M110V), avec un flux de photons plus de 100 fois supérieur à celui de LuxSit (Extended Data Fig. 6). Dans l'ensemble, les résultats de la mutagenèse à saturation du site actif appuient le modèle de conception, les dyades Tyr14 – His98 et Asp18 – Arg65 jouant un rôle clé dans la catalyse et la poche de liaison au substrat largement conservée.

Les catalyseurs les plus actifs, LuxSit-i (données étendues Fig. 3b, e, h) et LuxSit-f (données étendues Fig. 3c, f, i), ont tous deux été exprimés de manière soluble dans E. coli à des niveaux élevés et sont monomères (une certaine dimérisation a été observée à la concentration élevée en protéines; données étendues Fig. 3l) et thermostables (données étendues Fig. 3j, k). Semblables aux luciférases natives qui utilisent la CTZ, les constantes apparentes de Michaelis (Km) de LuxSit-i et de LuxSit-f se situent dans la plage micromolaire faible (Fig. 3a) et le signal luminescent diminue avec le temps en raison d'un renouvellement catalytique rapide (Extended Data Fig. 7a). LuxSit-i est une enzyme très efficace, avec une efficacité catalytique (kcat/Km) de 106 M−1 s−1. Le signal de luminescence est facilement visible à l'œil nu (Fig. 3b) et le flux de photons (photons par seconde) est supérieur de 38 % à celui de la luciférase native de Renilla reniformis (RLuc) (tableau supplémentaire 2). La réaction luminescente DTZ catalysée par LuxSit-i dépend du pH (données étendues Fig. 7b), conformément au mécanisme proposé. Nous avons utilisé une combinaison de calculs de la théorie fonctionnelle de la densité (DFT) et de simulations de dynamique moléculaire (MD) pour étudier plus en détail la base de l'activité de LuxSit ; les résultats confirment le mécanisme de stabilisation des anions (données étendues Fig. 8a et Fig. 3a supplémentaire) et suggèrent que LuxSit-i offre une meilleure stabilisation de la charge de l'état de transition DTZ que LuxSit (données étendues Fig. 8b).

a, Dépendance à la concentration du substrat de l'activité de LuxSit, LuxSit-f et LuxSit-i. Les nombres indiquent le rapport signal sur fond (S/N) à Vmax (photon s-1 molécule-1). Les données sont moyennes ± sd (n = 3). b, images de luminescence acquises par un BioRad Imager (en haut) ou une caméra Apple iPhone 8 (en bas). Tubes de gauche à droite : DTZ uniquement ; DTZ plus LuxSit purifié à 100 nM ; et DTZ plus LuxSit-i purifié à 100 nM, montrant la haute efficacité de la production de photons. c, Images microscopiques de fluorescence et de luminescence de cellules HEK293T vivantes exprimant de manière transitoire LuxSit-i-mTagBFP2 ; L'activité LuxSit-i peut être détectée à une résolution de cellule unique. A gauche, canal de fluorescence représentant le signal mTagBFP2. À droite, les photons de luminescence totale ont été collectés au cours d'une exposition de 10 s sans lumière d'excitation, immédiatement après l'ajout de 25 µM de DTZ. Encarts, contrôle négatif, cellules non transfectées avec DTZ. Barres d'échelle, 20 μm ; Grossissement 40×.

Données source

Comme les luciférases sont des marqueurs génétiques et des rapporteurs couramment utilisés pour les études de biologie cellulaire, nous avons évalué l'expression et la fonction de LuxSit-i dans des cellules de mammifères vivants. Les cellules HEK293T exprimant LuxSit-i-mTagBFP2 ont montré une luminescence spécifique au DTZ (Fig. 3c), qui a été maintenue après le ciblage de LuxSit-i-mTagBFP2 sur le noyau, la membrane et les mitochondries (Extended Data Fig. 9). Les luciférases natives et précédemment modifiées sont assez promiscuité, avec une activité sur de nombreux substrats de luciférine (Fig. 4ac et Fig. 4 supplémentaire); ceci est peut-être le résultat de leurs poches grandes et ouvertes (une luciférase avec une spécificité élevée pour un substrat de luciférine a été difficile à contrôler même avec une évolution dirigée étendue33,34). En revanche, LuxSit-i a présenté une spécificité exquise pour sa luciférine cible, avec une sélectivité de 50 fois pour le DTZ par rapport au bis-CTZ (qui ne diffère que par un carbone benzylique; les simulations MD suggèrent que cela résulte d'une plus grande complémentarité de forme d'état de transition (données étendues Fig. 8b, c et Fig. plier la sélectivité par rapport aux autres substrats de luciférine (Fig. 4b). L'une de nos conceptions actives pour h-CTZ (HTZ3-G4) était également très spécifique pour son substrat cible (Fig. 4c et Extended Data Fig. 4d). Dans l'ensemble, la spécificité de nos luciférases conçues est bien supérieure à celle des luciférases natives35,36 ou des luciférases précédemment conçues37 (tableau supplémentaire 5).

a, Structures chimiques des analogues de substrat de coelenterazine. b, Activité normalisée de LuxSit-i sur des substrats de luciférine sélectionnés. Image de luminescence (en haut) et quantification du signal (en bas) du substrat indiqué en présence de 100 nM LuxSit-i. LuxSit-i a une grande spécificité pour le substrat cible de conception, DTZ. c, visualisation par carte thermique de la spécificité de substrat de LuxSit-i ; luciférase de Renilla (RLuc); Gaussia luciférase (GLuc); NLuc modifié à partir de la luciférase d'Oplophorus ; et la luciférase de novo (HTZ3-G4) conçue pour h-CTZ. La carte thermique montre la luminescence de chaque enzyme sur chaque substrat ; les valeurs sont normalisées sur une base par enzyme au signal le plus élevé pour cette enzyme sur tous les substrats. d, Le spectre d'émission de luminescence de LuxSit-i-DTZ (vert) et RLuc-PP-CTZ (violet) peut être résolu spectralement par des filtres 528/20 et 390/35 (indiqués en barres pointillées) et ne reconnaît que le substrat apparenté. e, Schéma du dosage multiplex de la luciférase. Les cellules HEK293T transfectées de manière transitoire avec les plasmides CRE-RLuc, NF-κB-LuxSit-i et CMV-CyOFP ont été traitées avec de la forskoline (FSK) ou du facteur de nécrose tumorale humaine (TNF) pour induire l'expression de luciférases marquées. f, g, les signaux de luminescence des cellules peuvent être mesurés selon des méthodes résolues par le substrat ou résolues spectralement par un lecteur de plaque. f, Pour la méthode résolue par le substrat, l'intensité de la luminescence a été enregistrée sans filtre après l'ajout de PP-CTZ ou de DTZ. g, Pour la méthode à résolution spectrale, PP-CTZ et DTZ ont été ajoutés, et les signaux ont été acquis en utilisant simultanément des filtres 528/20 et 390/35. En f et g, le panneau du bas indique l'ajout de FSK ou de TNF. Des signaux de luminescence ont été acquis à partir du lysat de 15 000 cellules dans le réactif CelLytic M, et le signal de fluorescence CyOFP a été utilisé pour normaliser le nombre de cellules et l'efficacité de la transfection. Toutes les données ont été normalisées par rapport au témoin non stimulé correspondant. Les données sont moyennes ± sd (n = 3).

Données source

Nous avons estimé que la spécificité élevée du substrat de LuxSit-i pourrait permettre le multiplexage de reporters luminescents via des signaux luminescents spécifiques au substrat ou résolus spectralement (Fig. 4d et Données étendues Fig. 10a, b). Pour étudier cette possibilité, nous avons placé LuxSit-i en aval de l'élément de réponse NF-κB et RLuc en aval de l'élément de réponse cAMP (Fig. 4e). L'ajout d'activateurs (TNF) de la voie de signalisation NF-κB a entraîné une luminescence lorsque les cellules ont été incubées avec DTZ, tandis que la luminescence de PP-CTZ (le substrat de RLuc) n'a été observée que lorsque la voie cAMP – PKA a été activée (Fig. 4f). Étant donné que DTZ et PP-CTZ émettent une luminescence à différentes longueurs d'onde, ils peuvent en principe être combinés et les deux signaux peuvent être déconvolués par analyse spectrale. En effet, nous avons observé que l'activation de la signalisation NF-κB entraînait une luminescence à la longueur d'onde DTZ, tandis que l'ajout d'activateurs de la voie cAMP – PKA (FSK) générait une luminescence à la longueur d'onde PP-CTZ, nous permettant d'évaluer simultanément l'activation des deux voies de signalisation dans le même échantillon avec des lysats cellulaires (Fig. 4g) ou des cellules HEK293T intactes (Extended Data Fig. 10c – e) en fournissant les deux substrats ensemble. Ainsi, la haute spécificité de substrat de LuxSit-i permet un rapport multiplexé de diverses réponses cellulaires.

La conception d'enzymes computationnelles a été limitée par le nombre d'échafaudages disponibles, ce qui limite la mesure dans laquelle les configurations catalytiques et la complémentarité de forme enzyme-substrat peuvent être atteintes14,15,16. L'utilisation de l'apprentissage en profondeur pour produire un grand nombre d'échafaudages conçus de novo ici élimine cette restriction, et le RoseTTAfold plus précis (réf. 38) et AlphaFold2 (réf. 31) devraient permettre aux échafaudages protéiques d'être générés encore plus efficacement grâce à des hallucinations à l'échelle de la famille et d'autres approches18,39. La diversité des formes et des tailles des poches d'échafaudage nous a permis de considérer une gamme de géométries catalytiques et de maximiser la complémentarité de la forme de l'enzyme intermédiaire de réaction ; à notre connaissance, aucune luciférase native n'a de plis similaires à LuxSit, et l'enzyme a une spécificité élevée pour un substrat de luciférine entièrement synthétique qui n'existe pas dans la nature. Avec l'incorporation de trois substitutions qui fournissent une poche plus complémentaire pour stabiliser l'état de transition, LuxSit-i a une activité plus élevée que n'importe quelle enzyme conçue de novo, avec un kcat/Km (106 M−1 s−1) dans la gamme des luciférases natives. Il s'agit d'une avancée notable pour la conception d'enzymes computationnelles, car des dizaines de cycles d'évolution dirigée ont été nécessaires pour obtenir des efficacités catalytiques dans cette plage pour une rétroaldolase conçue, et la structure a été considérablement remodelée40 ; en revanche, les différences prédites dans les interactions ligand-chaîne latérale entre LuxSit et LuxSit-i sont très subtiles (Fig. 2b supplémentaire ; atteindre des activités aussi élevées directement à partir de l'ordinateur reste un défi dans la conception d'enzymes computationnelles). La petite taille, la stabilité et le repliement robuste de LuxSit-i le rendent bien adapté aux fusions de luciférase avec des protéines d'intérêt et comme étiquette génétique pour les vecteurs viraux à capacité limitée. Du côté de la science fondamentale, la petite taille, la simplicité et la haute activité de LuxSit-i en font un excellent système modèle pour les études informatiques et expérimentales du mécanisme catalytique de la luciférase. L'extension de l'approche utilisée ici pour créer des luciférases spécifiques similaires pour les substrats synthétiques de luciférine au-delà de DTZ et de h-CTZ étendrait considérablement les opportunités de multiplexage illustrées à la Fig. 4 (en particulier avec les progrès récents de la microscopie41) et permettrait une nouvelle génération de boîtes à outils luminescentes multiplexées. Plus généralement, notre méthode d'hallucination à l'échelle de la famille ouvre un nombre presque illimité de possibilités d'échafaudage pour la liaison au substrat et le placement des résidus catalytiques, ce qui est particulièrement important lorsque le mécanisme de réaction et la manière de le promouvoir ne sont pas complètement compris : de nombreuses hypothèses structurelles et catalytiques alternatives peuvent être facilement énumérées avec des poches de liaison de forme et chimiquement complémentaires mais différents placements de résidus catalytiques. Bien que les luciférases soient uniques pour catalyser l'émission de lumière, la transformation chimique des substrats en produits est commune à toutes les enzymes, et l'approche développée ici devrait être facilement applicable à une grande variété de réactions chimiques.

De plus amples informations sur la conception de la recherche sont disponibles dans le résumé des rapports sur le portefeuille Nature lié à cet article.

Données sources pour les Fig. 2 à 4 sont disponibles en ligne. La séquence du gène de LuxSit-i a été déposée auprès de GenBank sous le numéro d'accession OP820699. Voir les données supplémentaires pour les modèles de conception de LuxSit et LuxSit-i. Des plasmides optimisés en codons codant LuxSit-i pour l'expression bactérienne et mammifère sont disponibles via Addgene. Les données sources sont fournies avec ce document.

La suite de modélisation macromoléculaire Rosetta (https://www.rosettacommons.org) est disponible gratuitement pour les utilisateurs académiques et non commerciaux. Des licences commerciales pour la suite sont disponibles auprès du bureau de transfert de technologie de l'Université de Washington. Le code source pour la mise en œuvre de l'amarrage RIF est disponible gratuitement sur https://github.com/rifdock/rifdock. Tous les scripts pertinents et un cahier Jupiter d'accompagnement pour la génération d'échafaudages d'hallucinations à l'échelle de la famille sont disponibles ici : https://files.ipd.uw.edu/pub/luxSit/scaffold_generation.tar.gz. Tous les échafaudages générés sont disponibles ici : https://files.ipd.uw.edu/pub/luxSit/scaffolds.tar.gz. Les scripts de conception informatique pour les bibliothèques de luciférase sont disponibles ici : https://files.ipd.uw.edu/pub/luxSit/luciferase_designs_methods.zip.

Jiang, L. et al. Conception informatique de novo d'enzymes rétro-aldol. Sciences 319, 1387-1391 (2008).

Article ADS CAS PubMed PubMed Central Google Scholar

Rothlisberger, D. et al. Catalyseurs d'élimination de Kemp par conception enzymatique computationnelle. Nature 453, 190–195 (2008).

Article ADS PubMed Google Scholar

Oui, HW et al. Paires luciférase-luciférine décalées vers le rouge pour une meilleure imagerie par bioluminescence. Nat. Méthodes 14, 971–974 (2017).

Article CAS PubMed PubMed Central Google Scholar

Love, AC & Prescher, JA Voir (et utiliser) la lumière : développements récents de la technologie de la bioluminescence. Chimie cellulaire. Biol. 27, 904–920 (2020).

Article CAS PubMed PubMed Central Google Scholar

Syed, AJ & Anderson, JC Applications de la bioluminescence en biotechnologie et au-delà. Chim. Soc. Rév. 50, 5668–5705 (2021).

Article CAS PubMed Google Scholar

Ouais, H.-W. & Ai, H.-W. Développement et applications de reporters et de biocapteurs bioluminescents et chimioluminescents. Annu. Rév. Anal. Chim. 12, 129-150 (2019).

Article CAS Google Scholar

Zambito, G., Chawda, C. & Mezzanotte, L. Outils émergents pour l'imagerie par bioluminescence. Courant. Avis. Chim. Biol. 63, 86–94 (2021).

Article CAS PubMed Google Scholar

Markova, SV, Larionova, MD & Vysotski, ES Pleins feux sur les luciférases sécrétées des copépodes marins : connaissances actuelles et applications. Photochem. Photobiol. 95, 705–721 (2019).

Article CAS PubMed Google Scholar

Jiang, TY, Du, LP & Li, MY Éclairage de la bioluminescence avec la coelenterazine : stratégies et applications. Photochem. Photobiol. Sci. 15, 466–480 (2016).

Article CAS PubMed Google Scholar

Michelini, E. et al. Technologie génétique à résolution spectrale pour la bioluminescence multiplexée et le criblage à haute teneur. Anal. Chim. 80, 260-267 (2008).

Article CAS PubMed Google Scholar

Rathbun, CM et al. Criblage parallèle pour une identification rapide des outils bioluminescents orthogonaux. ACS Cent. Sci. 3, 1254-1261 (2017).

Article CAS PubMed PubMed Central Google Scholar

Yeh, H.-W., Wu, T., Chen, M. & Ai, H.-W. Identification des facteurs compliquant l'imagerie par bioluminescence. Biochimie 58, 1689–1697 (2019).

Article CAS PubMed Google Scholar

Su, YC et al. Les nouveaux substrats NanoLuc permettent une imagerie lumineuse par bioluminescence à deux populations chez les animaux. Nat. Méthodes 17, 852–860 (2020).

Article CAS PubMed Google Scholar

Lombardi, A., Pirro, F., Maglio, O., Chino, M. & DeGrado, WF Conception de novo de métalloprotéines à quatre hélices : un échafaudage, diverses réactivités. Acc. Chim. Rés. 52, 1148–1159 (2019).

Article CAS PubMed PubMed Central Google Scholar

Chino, M. et al. Enzymes diiron artificielles avec une structure de faisceau à quatre hélices conçue de novo. EUR. J.Inorg. Chim. 2015, 3352–3352 (2015).

Article ADS CAS Google Scholar

Basler, S. et al. Catalyse acide de Lewis efficace d'une réaction biologique dans un échafaudage protéique de novo. Nat. Chim. 13, 231-235 (2021).

Article CAS PubMed Google Scholar

Anishchenko, I. et al. Conception de protéines de novo par hallucination en réseau profond. Nature 600, 547-552 (2021).

Article ADS CAS PubMed PubMed Central Google Scholar

Wang, J. et al. Sites fonctionnels de protéines d'échafaudage à l'aide de l'apprentissage en profondeur. Sciences 377, 387–394 (2022).

Article ADS CAS PubMed PubMed Central Google Scholar

Norn, C. et al. Conception de séquences protéiques par optimisation conformationnelle du paysage. Proc. Natl Acad. Sci. ETATS-UNIS. 118, e2017228118 (2021).

Article CAS PubMed PubMed Central Google Scholar

Yang, JY et al. Amélioration de la prédiction de la structure des protéines à l'aide des orientations inter-résidus prédites. Proc. Natl Acad. Sci. États-Unis 117, 1496-1503 (2020).

Article ADS CAS PubMed PubMed Central Google Scholar

Basanta, B. et al. Un algorithme énumératif pour la conception de novo de protéines avec diverses structures de poche. Proc. Natl Acad. Sci. États-Unis 117, 22135–22145 (2020).

Article ADS CAS PubMed PubMed Central Google Scholar

Loening, AM, Fenn, TD & Gambhir, SS Structures cristallines de la luciférase et de la protéine fluorescente verte de Renilla reniformis. J. Mol. Biol. 374, 1017-1028 (2007).

Article CAS PubMed PubMed Central Google Scholar

Tomabechi, Y. et al. Structure cristalline du nanoKAZ : le composant muté de 19 kDa de la luciférase d'Oplophorus catalysant la réaction bioluminescente avec la coelenterazine. Biochimie. Biophys. Rés. Commun. 470, 88-93 (2016).

Article CAS PubMed Google Scholar

Wu, N. et al. Structure en solution de la Gaussia luciférase avec cinq liaisons disulfure et identification d'une cavité de liaison putative à la coelenterazine par RMN hétéronucléaire. Sci. Rep. 10, 20069 (2020).

Article ADS CAS PubMed PubMed Central Google Scholar

Ding, BW & Liu, YJ Bioluminescence du calmar luciole via un mécanisme d'oxygénation par transfert d'électron unique et de luminescence induite par transfert de charge. Confiture. Chim. Soc. 139, 1106-1119 (2017).

Article CAS PubMed Google Scholar

Isobe, H., Yamanaka, S., Kuramitsu, S. & Yamaguchi, K. Mécanisme de régulation du couplage spin-orbite dans la luminescence induite par transfert de charge de dérivés d'imidazopyrazinone. Confiture. Chim. Soc. 130, 132–149 (2008).

Article CAS PubMed Google Scholar

Kondo, H. et al. Effets des substituants sur la cinétique de la réaction de chimiluminescence des 6-arylimidazo[1,2-a]pyrazin-3(7H)-ones (analogues de la luciférine de Cypridina) : support du mécanisme d'oxygénation par transfert d'électron unique (SET) avec l'oxygène moléculaire triplet. Tétraèdre Lett. 46, 7701–7704 (2005).

Article CAS Google Scholar

Branchini, BR et al. Support expérimental pour un mécanisme d'oxydation par transfert d'électrons unique dans la bioluminescence des lucioles. Confiture. Chim. Soc. 137, 7592–7595 (2015).

Article CAS PubMed Google Scholar

Dou, JY et al. Conception de novo d'un barillet β activant la fluorescence. Nature 561, 485–491.

Article ADS CAS PubMed PubMed Central Google Scholar

Cao, L. et al. Conception de protéines de liaison aux protéines à partir de la structure cible seule. Nature 605, 551–560 (2022).

Article ADS CAS PubMed PubMed Central Google Scholar

Jumper, J. et al. Prédiction très précise de la structure des protéines avec AlphaFold. Nature 596, 583–589 (2021).

Article ADS CAS PubMed PubMed Central Google Scholar

Dauparas, J. et al. Conception robuste de séquences de protéines basée sur l'apprentissage en profondeur à l'aide de ProteinMPNN. Sciences 378, 49–56 (2022).

Article ADS CAS PubMed PubMed Central Google Scholar

Ouais, H.-W. et coll. Variantes de rapporteurs bioluminescents indépendants de l'ATP pour améliorer l'imagerie in vivo. ACS Chem. Biol. 14, 959–965 (2019).

Article CAS PubMed PubMed Central Google Scholar

Xiong, Y. et al. Nano luciférase émettant de l'ambre et son utilisation pour l'imagerie par immunobioluminescence in vivo. Confiture. Chim. Soc. 144, 14101–14111 (2022).

Article CAS PubMed Google Scholar

Bhaumik, S. & Gambhir, SS Imagerie optique de l'expression du gène rapporteur de la luciférase de Renilla chez des souris vivantes. Proc. Natl Acad. Sci. États-Unis 99, 377–382 (2002).

Article ADS CAS PubMed Google Scholar

Szent-Gyorgyi, C., Ballou, BT, Dagnal, E. & Bryan, B. Clonage et caractérisation de nouvelles protéines bioluminescentes. Dans Proc. SPIE 3600, Imagerie biomédicale : reporters, colorants et instrumentation (eds. Bornhop, DJ, Contag, CH & Sevick-Muraca, EM) https://doi.org/10.1117/12.351015 (SPIE, 1999).

Hall, MP et al. Journaliste de luciférase conçu à partir d'une crevette de haute mer utilisant un nouveau substrat d'imidazopyrazinone. ACS Chem. Biol. 7, 1848–1857 (2012).

Article CAS PubMed PubMed Central Google Scholar

Baek, M. et al. Prédiction précise des structures et des interactions des protéines à l'aide d'un réseau de neurones à trois voies. Sciences 373, 871-+ (2021).

Article ADS CAS PubMed PubMed Central Google Scholar

Wicky, BIM et al. Assemblages protéiques symétriques hallucinants. Sciences 378, 56–61 (2022).

Article ADS CAS PubMed PubMed Central Google Scholar

Giger, L. et al. L'évolution d'une rétro-aldolase conçue conduit à un remodelage complet du site actif. Nat. Chim. Biol. 9, 494–498 (2013).

Article CAS PubMed PubMed Central Google Scholar

Yao, Z. et al. Microscopie de bioluminescence multiplexée par analyse de phaseur. Nat. Méthodes 19, 893–898 (2022).

Article CAS PubMed Google Scholar

Télécharger les références

Nous remercions B. Wicky et R. Kibler pour leur aide sur les mesures de CD ; X. Li pour son aide dans l'analyse par spectrométrie de masse des protéines ; D. Feldman pour l'investigation initiale de l'imagerie cellulaire ; L. Milles pour l'optimisation du protocole d'assemblage du Golden Gate ; et la Fondation nationale des sciences naturelles de Chine (22103060) pour avoir fourni des ressources informatiques qui ont été utilisées dans la mécanique quantique et les simulations MD. Certains panneaux de figures ont été partiellement créés avec BioRender.com (Fig. 4e et Extended Data Figs. 2 et 10c). La recherche rapportée dans cette publication a été partiellement soutenue par l'Institut national d'imagerie biomédicale et de bioingénierie des National Institutes of Health sous le numéro de prix K99EB031913. Le contenu relève de la seule responsabilité des auteurs et ne représente pas nécessairement les opinions officielles des National Institutes of Health. Nous reconnaissons le financement du Howard Hughes Medical Institute (YK, BC et DB); la chaire Henrietta and Aubrey Davis Endowed Professorship du département de biochimie de l'Université de Washington (DB); le prix NIH Pathway to Independence (AH-WY, K99EB031913); le United World Antiviral Research Network (UWARN) (l'un des centres de recherche sur les maladies infectieuses émergentes ; CREID) NIAID 1 U01 AI151698-01 (DB et AH-WY) ; le projet Audacious à l'Institute for Protein Design (DB et AH-WY); l'Open Philanthropy Project Improving Protein Design Fund (DB) ; la Novo Nordisk Foundation (CN, NNF18OC0030446), une bourse de la Washington Research Foundation (SP); E. et W. Schmidt, sur recommandation du programme Schmidt Futures (DT, GRL, JZZ, LC, SH, MD, LC et DB) ; et la National Science Foundation (KNH, DE et PM, CHE-1764328 et OCI-1053575 à XSEDE).

Ces auteurs ont contribué à parts égales : Andy Hsien-Wei Yeh, Christoffer Norn

Département de biochimie, Université de Washington, Seattle, WA, États-Unis

Andy Hsien-Wei Yeh, Christoffer Norn, Yakov Kipnis, Doug Tischer, Samuel J Pellock, Gyu Rie Lee, Jason Z Zhang, Ivan Anishchenko, Brian Coventry, Longxing Cao, Justas Dauparas et David Baker

Institute for Protein Design, Université de Washington, Seattle, WA, États-Unis

Andy Hsien-Wei Yeh, Christoffer Norn, Yakov Kipnis, Doug Tischer, Samuel J Pellock, Gyu Rie Lee, Jason Z Zhang, Ivan Anishchenko, Brian Coventry, Longxing Cao, Justas Dauparas, Samer Halabiya, Michelle DeWitt, Lauren Carter et David Baker

Département de génie biomoléculaire, Université de Californie, Santa Cruz, Santa Cruz, Californie, États-Unis

Andy Hsien-Wei Yeh

Howard Hughes Medical Institute, Université de Washington, Seattle, WA, États-Unis

Yakov Kipnis, Brian Coventry et David Baker

Département de chimie et de biochimie, Université de Californie, Los Angeles, Los Angeles, Californie, États-Unis

Declan Evans, Pengchen Ma et KN Houk

École de chimie, Xi'an Key Laboratory of Sustainable Energy Materials Chemistry, MOE Key Laboratory for Nonequilibrium Synthesis and Modulation of Condensed Matter, Xi'an Jiaotong University, Xi'an, Chine

Pengchen Ma

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

DB a supervisé ce travail. AH-WY a conçu le projet et réalisé la caractérisation expérimentale. AH-WY, YK et CN ont conceptualisé et étudié les stratégies de conception initiales et AH-WY a réalisé la conception informatique des luciférases. Le CN a conceptualisé et mis en œuvre le pipeline d'hallucinations à l'échelle de la famille. CN, DT, SJP et IA ont réalisé la conception de l'échafaudage. SJP a réalisé la conception de la séquence ProteinMPNN des échafaudages NTF2. KNH a encadré DE et PM pour les calculs de MD et de mécanique quantique et a contribué à la rédaction des parties mécanistes du manuscrit. GRL a développé la simulation informatique SSM. JZZ a préparé des cellules de mammifères et réalisé une imagerie par microscopie. BC et LC ont intégré la fonction de fichier de réglage dans RifDock. JD a développé ProteinMPNN. SH a aidé à assembler la bibliothèque conçue. MD et LC ont aidé à l'expression et à la purification des protéines. AH-WY, CN et DB ont rédigé le manuscrit initial. Tous les auteurs ont discuté des résultats et contribué au manuscrit final.

Correspondance avec Andy Hsien-Wei Yeh ou David Baker.

AH-WY, CN, YK, DT, SJP, IA et DB sont co-inventeurs dans plusieurs demandes de brevet provisoires (numéros de demandes 63/300171, 63/300178, 63/381922 et 63/381924 soumises par l'Université de Washington) couvrant les luciférases de novo et les échafaudages protéiques décrits dans cet article. AH-WY, CN, JZ et DB sont actionnaires de Monod Bio, une société qui vise à développer les inventions décrites dans ce manuscrit. Les autres auteurs ne déclarent aucun intérêt concurrent.

Nature remercie les relecteurs anonymes pour leur contribution à la relecture par les pairs de ce travail. Les rapports des pairs examinateurs sont disponibles.

Note de l'éditeur Springer Nature reste neutre en ce qui concerne les revendications juridictionnelles dans les cartes publiées et les affiliations institutionnelles.

Le calcul de la théorie fonctionnelle de la densité (DFT) a suggéré que la formation d'un état anionique est la source d'électrons essentielle pour l'activation de l'oxygène triplet (3O2). Soutenu à la fois par des preuves théoriques25,26 et expérimentales27,28, le prochain processus d'oxygénation passe probablement par un mécanisme de transfert d'électron unique (SET) dans lequel le champ de réaction environnant pourrait fortement influencer le changement d'énergie libre de Gibbs (ΔGSET). Enfin, la thermolyse d'un intermédiaire émetteur de lumière dioxétane peut produire des photons via le mécanisme de luminescence induite par transfert de charge progressivement réversible (GRCTIL), qui est généralement exergonique. Comme toutes les preuves historiques sont basées sur des calculs dans les solvants virtuels ou sur la chimiluminescence dans des solvants organiques idéaux, le mécanisme détaillé d'une réaction de luminescence catalysée par la luciférase est resté incertain. Nous avons proposé que l'étape clé de l'enzyme est de favoriser la formation d'un état anionique et de créer un environnement approprié pour faciliter un SET efficace. Par conséquent, le but de cette étude est de concevoir un champ de réaction enzymatique entourant le substrat pour stabiliser l'état anionique du substrat et modifier l'activité protonique locale, la polarité du solvant et l'hydrophobicité pour l'activation efficace du 3O2.

Des séquences d'ADN conçues par ordinateur ont été achetées dans un réseau d'oligo, où les fragments ont été amplifiés par PCR, assemblés et ligaturés dans un vecteur d'expression bactérien pBAD. La banque de plasmides a été utilisée pour transformer des cellules DH10B. Chaque colonie cultivée sur la plaque de gélose LB représentait un modèle de luciférase. Les plaques ont été pulvérisées avec une solution de DTZ et imagées pour identifier les colonies actives à l'aide d'un imageur ChemiDoc. Les colonies sélectionnées ont été inoculées dans des plaques à 96 puits, exprimées et purifiées pour confirmer l'activité individuelle de la luciférase. Les plasmides peuvent ensuite être séquencés individuellement pour indiquer des modèles de conception actifs qui fournissent des informations sur le principe de conception et les fonctions enzymatiques ou peuvent être soumis à une mutagenèse aléatoire pour une évolution ultérieure. Encart : trois luciférases ont été identifiées à partir de ce criblage. Nous appelons "LuxSit" la luciférase la plus active et spécifique à la DTZ.

a–c, l'expression recombinante de a, LuxSit, b, LuxSit-i et c, LuxSit-f dans E. coli. Les annotations pour chaque voie sont les suivantes – 1 : Pré-IPTG ; 2 : Post-IPTG ; 3 : Lysat soluble ; 4 : Flow-through ; 5 : laver ; 6 : illusion ; 7 : clivage post-TEV ; 8 : Post-SEC. d–f, Chromatographie d'exclusion de taille du d, LuxSit purifié ; e, LuxSit-i ; et f, monomère LuxSit-f. g–i, spectre de masse déconvolué de g, LuxSit, h, LuxSit-i et i, LuxSit-f. j,k, spectres de dichroïsme circulaire (CD) dans l'ultraviolet lointain (panneau de gauche) de j, LuxSit-i ; et k, LuxSit-f à 25 °C (ligne noire), 95 °C (ligne rouge) et refroidi à 25 °C (ligne verte). Courbe de fusion du CD à 220 nm (panneau de droite). l, un pic Dimeric SEC a été observé lorsque LuxSit-i a été concentré à une concentration élevée (~ 50 μM) dans un tampon Tris pH 8,0. Les fractions SEC dimères et monomères ont montré la taille attendue sur SDS – PAGE et les deux pics étaient catalytiquement actifs pour émettre une luminescence en présence de 25 μM de DTZ.

a, SDS – PAGE coloré au Coomassie de HTZ3-D2 et HTZ3-G4 purifiés à partir de l'expression recombinante dans E. coli. b, des vues agrandies de HTZ3-D2 (panneau de gauche) et HTZ3-G4 (panneau de droite) illustrent la préorganisation de la chaîne latérale des interactions luciférase-h-CTZ. c, d, Chromatographie d'exclusion de taille (à gauche), spectre de masse déconvolué (au milieu) et les activités de luciférase normalisées sur des composés sélectionnés (à droite) de c, HTZ3-D2 et d, HTZ3-G4, qui suggèrent une spécificité élevée pour le substrat cible de conception, h-CTZ. e, Dépendance à la concentration du substrat de l'activité de LuxSit (avec DTZ), HTZ3-D2 (avec/h-CTZ) et HTZ3-G4 (avec/h-CTZ) dans du PBS. Tous les points de données ont été ajustés à l'équation de Michaelis-Menten. HTZ3-D2 et HTZ3-G4 ont montré des valeurs de Km de 7,9 et 19,5 μM avec ~25% et ~58% Imax de LuxSit, respectivement. Les données sont présentées sous forme de moyenne ± écart-type (n = 3).

Le ddGbind calculé de chaque mutation a été tracé en fonction de l'activité expérimentale moyenne relative de la luciférase. Le ddGbind de résidus catalytiques hypothétiques : a, Tyr14 – His98 et b, Asp18 – Arg65 dyades n'était généralement pas le plus bas, ce qui suggère que ces résidus catalytiques conçus ne sont pas favorables à la liaison au substrat. Les points rouges représentent les acides aminés de type sauvage (LuxSit). Le rang de ddGbind de type sauvage pour chaque position criblée pour l'activité est montré avec une carte thermique en c. d – f, le ddGbind de type sauvage des résidus conçus pour l'empilement d, e, π – π ou f, les interactions hydrophobes étaient les plus faibles par rapport aux valeurs de mutation ddGbind. Cela montre que la séquence est presque optimale pour la liaison au substrat et que le modèle de conception est fiable.

Nous avons généré une bibliothèque entièrement randomisée à 60, 96 et 110 positions pour filtrer toutes les combinaisons possibles de manière exhaustive. Après le criblage basé sur les colonies, nous avons identifié de nombreuses colonies avec de fortes activités luciférase avec DTZ. Chaque colonie a été exprimée individuellement dans chaque puits de plaques à 96 puits (culture de 1 mL) et purifiée en conséquence (voir Méthodes supplémentaires). a, L'activité de luminescence individuelle de chaque mutant sélectionné a été tracée et comparée au parent, LuxSit. Les activités de luminescence ont été mesurées en présence de 25 μM de DTZ. L'activité de luminescence (RLU) a été montrée comme le signal intégré au cours des 15 premières minutes. Analyse statistique de la fréquence des acides aminés par rapport à l'activité de la luciférase aux résidus b, 60, c, 96 et d, 110. Les données sont présentées sous forme de moyenne ± sd (n varie sur chaque barre car les mutants ont été sélectionnés dans une bibliothèque randomisée). Arg60 est confirmé comme étant mutable parmi tous les mutants sélectionnés car Arg60 peut être structurellement moins bien défini car il émane d'une boucle et n'a pas de partenaire de liaison hydrogène. Ala96 préfère les substitutions de chaînes latérales plus grandes (Leu, Ile, Met et Cys) et Met110 favorise les résidus hydrophobes (Val, Ile et Ala). Une variante récemment découverte (R60S/A96L/M110V) avec un flux de photons plus de 100 fois supérieur à LuxSit a été attribuée à LuxSit-i pour sa haute luminosité. Dans l'alignement de séquence, les mutations sont mises en évidence dans des polices jaunes et des arrière-plans gris. Les dyades catalytiques conservées de Asp18 – Arg65 et Tyr14 – His98 sont en polices vertes et bleues.

a, Cinétique d'émission normalisée de 15 000 cellules HeLa intactes exprimant LuxSit-i (rouge), 100 nM purifié LuxSit-i (vert) ou 100 nM purifié LuxSit-f (bleu) en présence de 50 μM DTZ. La cinétique d'émission plus étendue dans les cellules HeLa est probablement due au taux de diffusion du DTZ à travers les membranes cellulaires. b, Les courbes de décroissance de la luminescence normalisées de LuxSit-i dans divers tampons de pH ont révélé un mécanisme catalytique dépendant du pH. c, le rendement quantique luminescent a été estimé à partir du signal de luminescence intégré jusqu'à la conversion complète des substrats de 125 pmol en photons en présence de 50 nM de luciférase correspondante (voir Méthodes supplémentaires). Les données sont présentées sous forme de moyenne (n = 3).

a, Le profil d'énergie libre calculé par la théorie de la fonctionnelle de la densité (DFT) montre que l'oxygène triplet peut réagir directement avec les espèces anioniques de DTZ (Int1) via le complexe réactif Int2 et TS1. L'intermédiaire dioxétane Int3 se clive ensuite dans un état de transition singulet à coque ouverte OSSTS2 pour former l'intermédiaire excité Int4*, qui extrude rapidement le CO2 et forme le produit émissif Int5. Remarque : Int4* ou Int5* émettent dans la région observée, mais la durée de vie de Int4* est très courte et se convertit probablement complètement en Int5* avant l'émission. b, Int2 et Int3 ont été ancrés dans LuxSit et LuxSit-i et les liaisons ont été évaluées par dynamique moléculaire (MD). Les distances entre His98 à O1 (rangée du haut) et Arg65 à N1 (rangée du bas) du substrat ont été tracées tout au long des simulations MD de 500 ns. LuxSit-i (trace bleue) lie Int2 '(milieu) considérablement mieux que LuxSit (trace rouge), ce qui suggère que les mutations de LuxSit-i fournissent une poche de liaison plus complémentaire à TS1. Cette orientation de liaison rapproche N1 du substrat beaucoup plus de Arg65, offrant une meilleure stabilisation de la charge pour l'état de transition à haute énergie. c, Amarrage de la forme anion peroxyde de bis-CTZ dans la poche de LuxSit-i ; la superposition bleue représente DTZ dans le modèle de conception d'origine. Lors de la simulation MD, le carbone benzylique ajouté du bis-CTZ (trace verte) perturbe la complémentarité de forme entre LuxSit-i et les états de transition (TS1 et TS2), réduisant la stabilisation de la charge par Arg65. Cette stabilisation de la charge est nécessaire pour que la réaction se déroule, expliquant la grande spécificité de substrat de LuxSit-i pour le DTZ par rapport au bis-CTZ.

a, b, imagerie par fluorescence de cellules vivantes a, HEK293T et b, HeLa exprimant LuxSit-i-mTagBFP2, non ciblées ou localisées dans les compartiments cellulaires du noyau (Histone2B), de la membrane plasmique (KRasCAAX) ou des mitochondries (DAKAP). Barre d'échelle : 10 μm. c, d, Les signaux de luminescence ont été mesurés avec 15 000 cellules c, HEK293T ou d, HeLa intactes en présence de 25 μM de DTZ dans du DPBS. Les efficacités de transfection varient de 60 à 70 % pour les cellules HEK293T et de 5 à 10 % pour les cellules HeLa. e, Les spectres d'émission de luminescence acquis à partir de cellules HEK293T exprimant LuxSit-i sont cohérents avec les spectres d'émission de LuxSit-i recombinant purifié à partir d'E. coli. f, g, Les signaux de luminescence ont été mesurés avec 15 000 f, cellules LuxSit-i intactes exprimant HEK293T ou g, lysat cellulaire en présence de 25 μM de substrat indiqué dans du DPBS. Les intensités de luminescence ont été normalisées au signal DTZ, montrant une spécificité DTZ élevée par rapport à d'autres substrats dans des essais cellulaires. Les données ont été présentées sous forme de signal de luminescence total au cours des 20 premières minutes ± sd (n = 3). h, profil d'intensité de luminescence normalisé des lignes traversant différentes cellules (n = 10) de l'image de luminescence principale de la Fig. 3c ; les lignes grises représentent les cellules non transfectées. Les barres d'erreur représentent ± SEM.

a, La relation d'orthogonalité entre les paires luminescentes LuxSit-i-DTZ et RLuc-PP-CTZ (Prolume Purple, méthoxy e-Coelenterazine). Les pourcentages indiqués de chaque luciférase ont été mélangés à différents rapports totalisant 100 %. Après l'ajout des deux substrats DTZ 25 µM et PP-CTZ, la lumière filtrée des canaux 528/20 et 390/35 a été mesurée simultanément. b, la carte thermique montre le signal de luminescence pour la luciférase individuelle (100 nM) ou le mélange 1: 1 en présence des substrats apparentés ou non apparentés (DTZ ou PP-CTZ ou les deux). Les signaux de réponse ont été acquis par un lecteur de plaques Neo2 avec des filtres 528/20 et 390/35 nm simultanément. c, Essai multiplex de luciférase dans HEK293T vivant après co-transfection des plasmides CRE-RLuc, NFκB-LuxSit-i et CMV-CyOFP et stimulation par la forskoline (FSK) ou le TNF humain. d, e, 15 000 cellules intactes ont été analysées (voir Méthodes supplémentaires) soit par les modes d, résolus par le substrat ou e, résolus spectralement après l'ajout de DTZ, de PP-CTZ ou à la fois de DTZ et de PP-CTZ dans du DPBS sans lyse cellulaire. Le balayage de zone du signal de fluorescence CyOFP a été utilisé pour estimer le nombre de cellules et l'efficacité de la transfection. L'unité rapportée était RLU/au ; unités lumineuses relatives/mesures d'intensité de fluorescence à Ex./Em. = 480/580 nm. Toutes les données ont été normalisées par rapport au témoin non stimulé correspondant. Les données sont présentées sous forme de moyenne ± écart-type (n = 3).

Ce fichier contient la section Méthodes

Libre accès Cet article est sous licence Creative Commons Attribution 4.0 International, qui autorise l'utilisation, le partage, l'adaptation, la distribution et la reproduction sur tout support ou format, à condition que vous accordiez le crédit approprié à l'auteur ou aux auteurs originaux et à la source, fournissez un lien vers la licence Creative Commons et indiquez si des modifications ont été apportées. Les images ou tout autre matériel de tiers dans cet article sont inclus dans la licence Creative Commons de l'article, sauf indication contraire dans une ligne de crédit au matériel. Si le matériel n'est pas inclus dans la licence Creative Commons de l'article et que votre utilisation prévue n'est pas autorisée par la réglementation légale ou dépasse l'utilisation autorisée, vous devrez obtenir l'autorisation directement du détenteur des droits d'auteur. Pour voir une copie de cette licence, visitez http://creativecommons.org/licenses/by/4.0/.

Réimpressions et autorisations

Yeh, A.HW., Norn, C., Kipnis, Y. et al. Conception de novo de luciférases par apprentissage en profondeur. Nature 614, 774–780 (2023). https://doi.org/10.1038/s41586-023-05696-3

Télécharger la citation

Reçu : 19 janvier 2022

Accepté : 03 janvier 2023

Publié: 22 février 2023

Date d'émission : 23 février 2023

DOI : https://doi.org/10.1038/s41586-023-05696-3

Toute personne avec qui vous partagez le lien suivant pourra lire ce contenu :

Désolé, aucun lien partageable n'est actuellement disponible pour cet article.

Fourni par l'initiative de partage de contenu Springer Nature SharedIt

Chimie de la nature (2023)

En soumettant un commentaire, vous acceptez de respecter nos conditions d'utilisation et nos directives communautaires. Si vous trouvez quelque chose d'abusif ou qui ne respecte pas nos conditions ou directives, veuillez le signaler comme inapproprié.