Mechanizm działania CRISPR-Cas9: szczegóły molekularne i strukturalne

🧬 Seria artykułów o CRISPR:

  • Część 1: Historia i podstawy CRISPR
  • Część 2: Mechanizm działania CRISPR-Cas9
  • Część 3: Enhancery i promotory w edycji genomu
  • Część 4: Sekwencjonowanie i kodowanie genomu
  • Część 5: Programowanie CRISPR - bioinformatyka
  • Część 6: Zastosowania i dostępność technologii
Cas9 to niezwykła molekularna maszyneria – białko o masie 160 kDa składające się z 1368 aminokwasów, które działa jak programowalne nożyce do DNA. Aby zrozumieć, jak dokładnie CRISPR-Cas9 przecina genom w precyzyjnie wybranym miejscu, musimy zanurzyć się w fascynujący świat biologii strukturalnej i biochemii nukleaz.

🏗️ Architektura molekularna białka Cas9

Białko Cas9 z Streptococcus pyogenes (SpCas9) – najczęściej wykorzystywany wariant w badaniach – posiada złożoną strukturę składającą się z dwóch głównych lob (części):

Strukturalna organizacja Cas9

1. Lob rozpoznawania (Recognition Lobe - REC)

Masa: ~60 kDa | Aminokwasy: 1-713

Składa się z trzech domen helikalnych:

  • REC1 (aa 94-179, 308-713): Największa domena, tworzy kanał wiążący sgRNA
  • REC2 (aa 180-307): Most łączący REC1 z domeną nukleazową
  • REC3 (domena helical, aa 1093-1368): Oddziałuje z kompleksem RNA:DNA

Funkcja: Wiązanie sgRNA, rozpoznawanie RNA-DNA heteroduplex, zmiany konformacyjne podczas aktywacji

2. Lob nukleazowy (Nuclease Lobe - NUC)

Masa: ~100 kDa | Aminokwasy: 714-1092 + inserje

Zawiera dwie niezależne domeny nukleazowe:

  • Domena HNH (aa 775-908): Metaloenzym zależny od Mg2+, przecina nić komplementarną (target strand)
  • Domena RuvC (aa 1-59, 718-769, 909-1098): Nukleaza typu RNaza H, przecina nić niekomplementarną (non-target strand)
  • Domena PAM-interacting (PI domain, aa 1099-1368): Rozpoznaje sekwencję PAM (5'-NGG-3')

Funkcja: Kataliza cięcia obu nici DNA, rozpoznawanie PAM

🔬 Kluczowe struktury krystaliczne

Przełomowe badania strukturalne:

1. Struktura apo-Cas9 (2014): Pierwszy obraz Cas9 bez RNA pokazał, że białko przyjmuje "zamkniętą" konformację, w której centra aktywne nukleaz są oddalone o ~50 Å od siebie – zbyt daleko, aby efektywnie ciąć DNA.

Jinek et al. (2014) Science, 343(6176): 1247997

2. Kompleks Cas9:sgRNA:DNA (2014): Struktura kompleksu z docelowym DNA ujawniła dramatyczną zmianę konformacyjną – lob REC obraca się o ~30°, zbliżając domeny nukleazowe do DNA. Dodatkowo pokazała, jak sgRNA tworzy scaffold stabilizujący kompleks.

Nishimasu et al. (2014) Cell, 156(5): 935-949

3. Wysokorozdzielcze struktury (2019-2023): Struktury uzyskane metodą kriopikosekundowej mikroskopii elektronowej (cryo-EM) z rozdzielczością 2.6-3.2 Å ujawniły szczegóły na poziomie atomowym, w tym pozycje jonów Mg2+ w centrach aktywnych.

🧩 Komponenty układu CRISPR-Cas9

Single guide RNA (sgRNA)

sgRNA to syntetyczna fuzja dwóch naturalnych RNA bakteryjnych, zaprojektowana przez Doudnę i Charpentier w 2012 roku. Składa się z:

5'-[20 nt spacer - sekwencja przewodnikowa] [42 nt crRNA repeat] [80 nt tracrRNA scaffold] [UUUU - terminator]-3' Długość całkowita: ~100 nukleotydów Przykładowa struktura drugorzędowa sgRNA: spacer (20 nt) 5'-NNNNNNNNNNNNNNNNNNNN ||||||||||||||||| 3'-NNNNNNNNNNNNNNNNN-5' DNA docelowe [stem-loop 1] [stem-loop 2] [stem-loop 3] O---O O---O O---O | | | | | | O---O O---O O---O scaffold tracrRNA (80 nt)

Kluczowe elementy strukturalne sgRNA:

Optymalizacja sgRNA: Nie wszystkie sgRNA działają jednakowo efektywnie. Skuteczność zależy od:
  • Zawartości GC w spacerze (optymalne: 40-60%)
  • Struktury drugorzędowej spacera (unikać silnych struktur hairpin)
  • Nukleotydu na pozycji bezpośrednio przed PAM (najlepsza skuteczność: G)
  • Dostępności chromatyny w miejscu docelowym
  • Modyfikacji chemicznych zwiększających stabilność (2'-O-metylacja, fosforotioat)

⚙️ Mechanizm działania krok po kroku

Proces rozpoznawania i cięcia DNA przez CRISPR-Cas9 można podzielić na osiem precyzyjnie zdefiniowanych etapów:

1 Formowanie kompleksu Cas9:sgRNA

Białko Cas9 wiąże sgRNA z wysokim powinowactwem (Kd ~ 1-10 nM). Wiązanie RNA indukuje znaczące zmiany konformacyjne:

  • Lob REC otwiera się, tworząc kanał dla sgRNA
  • Domena PI ulega reorientacji, przygotowując miejsce wiązania PAM
  • Centra aktywne nukleaz pozostają w stanie nieaktywnym

Czas formowania: ~100 ms w warunkach in vitro

2 Skanowanie DNA w poszukiwaniu PAM

Kompleks Cas9:sgRNA przeszukuje DNA w poszukiwaniu motywu PAM (5'-NGG-3'). Proces ten zachodzi poprzez:

  • Dyfuzję 1D: Cas9 ślizga się wzdłuż DNA (1D sliding)
  • Przeskoki 3D: Dysocjacja i ponowne wiązanie w innym miejscu
  • Próbkowanie PAM: Domena PI oddziałuje z małym rowkiem DNA, testując kolejne trójnukleotydy

Kluczowe aminokwasy rozpoznające PAM w SpCas9:

Arg1333, Arg1335 – wiązanie wodorowe z G na pozycji +2 i +3 PAM

Szybkość skanowania: Cas9 testuje ~1000 sekwencji PAM na sekundę

3 Rozpoznanie PAM i destabilizacja DNA

Po znalezieniu odpowiedniej sekwencji PAM (5'-NGG-3'):

  • Domena PI Cas9 wiąże się z PAM, indukując lokalne rozplecenie DNA (melting)
  • Powstaje krótki bąbel denaturacyjny (~3 pz) bezpośrednio przed PAM
  • Ten proces jest niezależny od komplementarności spacera do DNA!
PAM: 5'-NGG-3' |:: <- wiązanie przez domenę PI Region rozplecenia: 5'-[protospacer 20 bp]---NGG-3' <- target strand 3'-[komplementarna]------NCC-5' <- non-target strand \/\/\/ rozplecenie

4 Formowanie heterodupleksu RNA:DNA (R-loop)

Najbardziej krytyczny etap rozpoznawania:

  • Spacer w sgRNA (20 nt) rozpoczyna parowanie z nićią target DNA od strony PAM (pozycja +1)
  • Parowanie postępuje w kierunku 5'→3' względem sgRNA (pozycje +1 do +20)
  • Tworzy się struktura R-loop: hybryda RNA:DNA (target strand) + wypartą nić DNA (non-target strand)
  • Nić non-target jest wyparta i biegnie przez oddzielny kanał w Cas9

Seed sequence – kluczowy region rozpoznawania:

10-12 nukleotydów najbliższych PAM (pozycje +1 do +12) stanowi "seed region" – region o najwyższych wymaganiach komplementarności. Nawet pojedyncze niedopasowanie w seed region może całkowicie zablokować cięcie.

🔄 Kaskada zmian konformacyjnych

Pełne formowanie R-loop indukuje dramatyczne reorganizacje strukturalne:

  • Rotacja lobu REC: Obrót o ~30° względem lobu NUC
  • Reorientacja domeny HNH: Przemieszczenie o ~40 Å w kierunku nici target
  • Aktywacja katalityczna: Centrum aktywne HNH i RuvC zajmują pozycje kompetentne katalitycznie
  • Wiązanie jonów Mg2+: Koordynacja 2-3 jonów Mg2+ w każdym centrum aktywnym

5 Aktywacja centrum aktywnego HNH

Domena HNH przecina nić target (komplementarną do sgRNA). Mechanizm katalityczny:

Katalityczna triada HNH:

  • Asp839 – wiązanie Mg2+ i aktywacja nukleofilowej cząsteczki wody
  • His840 – kwas ogólny/zasada ogólna
  • Asn863 – stabilizacja stanu przejściowego

Miejsce cięcia: 3 pz przed PAM (między pozycjami +3 i +4 protospacera)

Mechanizm: Hydroliza wiązania fosfodiestrowego poprzez atak nukleofilu (H2O lub OH-) na atom fosforu, katalizowana przez jony Mg2+

6 Aktywacja centrum aktywnego RuvC

Domena RuvC przecina nić non-target (wypartą). Mechanizm typu RNazy H:

Katalityczna triada RuvC:

  • Asp10 – koordynacja Mg2+
  • Glu762 – kwas ogólny
  • Asp986 – koordynacja drugiego Mg2+

Miejsce cięcia: 3-8 pz przed PAM (między pozycjami +3 i +8), typowo ~3-4 pz

Koordynacja czasowa: Cięcie przez RuvC może następować nieco później niż przez HNH (opóźnienie ~0.5-5 sekund), co prowadzi do przejściowego powstania nacięć pojedynczej nici (SSB, single-strand breaks) przed ostatecznym podwójnym pęknięciem (DSB, double-strand break)

7 Powstanie podwójnego pęknięcia DNA (DSB)

Skoordynowana aktywność HNH i RuvC prowadzi do powstania DSB z charakterystyką:

  • Typ końców: Tępe końce (blunt ends) z 5'-fosforan i 3'-hydroksyl
  • Lokalizacja: 3 pz przed PAM (głównie od strony +3)
  • Precyzja: >90% cięć w dokładnie tym samym miejscu
Przed cięciem: 5'-[protospacer 20 bp]---NGG-3' target strand 3'-[komplementarna]------NCC-5' non-target strand Po cięciu (DSB): 5'-[17 bp] [3 bp+PAM]-3' target strand ← cięcie przez HNH \ / DSB / \ 3'-[17 bp] [3 bp+PAM]-5' non-target strand ← cięcie przez RuvC Tępe końce z 5'-PO₄ i 3'-OH na obu niciach

8 Dysocjacja kompleksu i recykling Cas9

Po przecięciu DNA:

  • Cas9 pozostaje związany z przeciętym DNA przez 5-60 minut (w zależności od warunków)
  • Dysocjacja jest wolna (koff ~ 0.001-0.01 s-1), co może ograniczać efektywność wielokrotnego użycia
  • Po dysocjacji Cas9:sgRNA może uczestniczyć w kolejnym cyklu cięcia
  • Pojedyncza cząsteczka Cas9 może przeciąć wiele cząsteczek DNA in vitro (katalityczny turnover)

🎯 Specyficzność i efekty off-target

Jednym z największych wyzwań w zastosowaniu CRISPR-Cas9 jest zjawisko efektów off-target – cięcia DNA w miejscach podobnych, ale nie identycznych do sekwencji docelowej.

📊 Determinanty specyficzności Cas9

1. Reguły niedopasowań (mismatch tolerance):

  • Seed region (pozycje +1 do +12): bardzo niska tolerancja – nawet 1 niedopasowanie drastycznie redukuje cięcie
  • Region dystalny (pozycje +13 do +20): wyższa tolerancja – 2-3 niedopasowania mogą być tolerowane
  • Pozycja PAM: absolutnie krytyczna – żadne cięcie bez prawidłowego PAM

2. Typ niedopasowań:

  • rG:dT i rG:dG (rybonukleotyd : deoksyrybonukleotyd) są lepiej tolerowane niż inne niedopasowania
  • Ciągłe niedopasowania (consecutive mismatches) bardziej redukują aktywność niż rozproszone

3. Efekt Cas9 pozostającego na DNA:

Nawet jeśli Cas9 zwiąże się off-target bez cięcia, może blokować DNA binding proteins, wpływając na ekspresję genów (CRISPRi effect)

Warianty Cas9 o zwiększonej specyficzności

Inżynieria białkowa pozwoliła na rozwój wariantów Cas9 z drastycznie zredukowanymi efektami off-target:

Wariant Cas9 Modyfikacje Redukcja off-target On-target activity
SpCas9 (WT) Typ dziki Baseline 100%
eSpCas9(1.1) 3 mutacje zmniejszające niespecyficzne wiązanie DNA
(K810A, K1003A, R1060A)
10-100x mniej 70-100%
SpCas9-HF1 4 mutacje redukujące wiązanie do non-target strand
(N497A, R661A, Q695A, Q926A)
10-1000x mniej 50-100%
HypaCas9 Kombinacja mutacji eSpCas9 i HF1 100-1000x mniej 50-80%
xCas9 Rozszerzona rozpoznawanie PAM (NG, GAA, GAT)
+ zwiększona specyficzność
10-50x mniej 60-100%
Cas9-NG PAM: NG (najbardziej elastyczny) Porównywalna do WT 40-80%

🧪 Kinetyka i termodynamika reakcji

Parametry kinetyczne CRISPR-Cas9 (warunki in vitro):
  • Kd (Cas9:sgRNA): 1-10 nM (bardzo silne wiązanie)
  • kon (wiązanie do DNA z PAM): ~105 M-1s-1
  • koff (dysocjacja od przeciętego DNA): 0.001-0.01 s-1 (bardzo wolna)
  • kcat (kataliza cięcia): 0.01-0.1 s-1 (cięcie w ciągu 10-100 sekund po związaniu)
  • Temperatura optymalna: 37°C (dla SpCas9)
  • pH optymalny: 7.5-8.0
  • Wymaganie Mg2+: 5-10 mM (kofaktor niezbędny)

Uwaga dotycząca warunków in vivo: W komórce kinetyka jest bardziej złożona ze względu na:

🔬 Metody badania mechanizmu CRISPR-Cas9

Nasze rozumienie mechanizmu molekularnego CRISPR-Cas9 pochodzi z różnorodnych technik biofizycznych i biochemicznych:

Kluczowe techniki badawcze:

1. Krystalografia rentgenowska (X-ray crystallography):

Pierwsze struktury atomowe Cas9 (rozdzielczość 2.2-2.6 Å). Wymaga krystalizacji białka, co może stabilizować nienatywne konformacje.

2. Kriopikosekundowa mikroskopia elektronowa (Cryo-EM):

Obrazowanie kompleksów Cas9:RNA:DNA w roztworze bez krystalizacji. Najwyższa osiągnięta rozdzielczość: 2.6 Å. Pozwala obserwować różne konformacje w heterogennej populacji.

3. Fluorescencja pojedynczej cząsteczki (smFRET - single-molecule FRET):

Obserwacja dynamiki konformacyjnej Cas9 w czasie rzeczywistym. Ujawniła, że formowanie R-loop zachodzi stopniowo i może być odwrócone przy niedopasowaniach.

4. Testy aktywności in vitro:

Analiza kinetyki cięcia plazmidowego lub linearnego DNA. Identyfikacja produktów reakcji przez elektroforezę.

5. Sekwencjonowanie nowej generacji (NGS) dla wykrywania off-target:

Techniki takie jak GUIDE-seq, CIRCLE-seq, DISCOVER-seq pozwalają na identyfikację wszystkich miejsc cięcia genomu przez CRISPR-Cas9 w komórkach.

🎓 Podsumowanie

Mechanizm działania CRISPR-Cas9 to fascynujący przykład precyzji molekularnej biologii. Od formowania kompleksu Cas9:sgRNA, przez skanowanie genomu w poszukiwaniu PAM, rozpoznawanie sekwencji docelowej poprzez parowanie zasad RNA:DNA, aż po skoordynowaną aktywność dwóch niezależnych nukleaz – każdy etap został ewolucyjnie zoptymalizowany przez bakterie do obrony przed fagami.

Zrozumienie tych mechanizmów na poziomie atomowym pozwoliło naukowcom na dalszą inżynierię systemu – tworzenie wariantów o zwiększonej specyficzności, rozszerzonym zakresie PAM, oraz całkowicie nowych funkcjach poza cięciem DNA.

W kolejnym artykule zagłębimy się w rolę elementów regulatorowych genomu – enhancerów i promotorów – oraz ich znaczenie w kontekście edycji genomu przez CRISPR.

← Powrót do bloga