А теперь поговорим о той системе редактирования генома, о которой многие из вас наверняка слышали. В конце 2018 – начале 2019 года было много новостей о первых CRISPR-детях из Китая. В целом, можно выделить две группы молекулярных ножниц: на основе белков и на основе РНК. К первой системе относят системы ZFN иTALEN (про них я расскажу в следующий раз), а ко второй – CRISPR/Cas систему. CRISPR – clustered regularly interspaced short palindromic repeats — короткие палиндромные повторы, регулярно расположенные группами. Это своеобразный иммунитет бактерий. Когда они встречаются с чужеродной ДНК и выживают, они могут «нарезать» эту чужеродную ДНК на короткие кусочки и вставить себе в геном в CRISPR- кассету. Причем, каждый чужеродный фрагментик будет окружен повторами. В случае, если бактериальная клетка второй раз встретится с этой чужеродной ДНК – она транскрибирует РНК с CRISPR кассеты, синтезирует CRISPR ассоциированный белок (Cas) и начнет атаковать эту ДНК. РНК свяжется с ДНК, эту связь распознает Cas белок сделает двухцепочечный разрыв. При этом родная ДНК будет защищена.
Описав данный механизм, ученые решили попробовать применить данную систему на благо науки и у них все получилось. На сегодняшний момент существует огромное количество разных систем, основанных на CRISPR. Как это работает?
Для простоты будем рассматривать классическую CRISPR/Cas9 систему. Белок Cas9 синтезируется в цитоплазме и направляется в ядро клетки, поскольку имеет два сигнала ядерной локализации, где ждет появление определенной молекулы РНК. В бактериальной клетке после транскрипции CRISPR кассеты и последующего процессинга формируется большое количество crРНК – это короткие молекулы, которые несут в себе 19-20 нуклеотидов комплементарной чужеродной ДНК. Эти crРНК связываются с tracrРНК , которая имеет определенную структуру и ее распознает белок Cas9. В лабораторной практике не используют две молекулы РНК, а синтезируют химерную молекулу, которую называют гидовой или gРНК. Это облегчает работу и повышает эффективность. А как эта молекула может быть нам полезна? Все просто. Вместо тех 20 нуклеотидов, которые используются в бактериальной клетке мы можем вписать те, которые нас интересуют. То есть те, где нам нужно внести двухцепочечный разрыв в геномной ДНК. Однако не все так просто. Есть ограничения. Например, должна быть определенная последовательность, предшествующая нашим 20 нуклеотидам. Так называемая PAM область. Она обязательно должна присутствовать в геномной ДНК и отсутствовать в CRISPR кассете. Именно поэтому бактерии умудряются сохранять свою геномную ДНК целой. Они не включают PAM между повторами, тем самым избегают распознавания crРНК. Аналогично и в лабораторной практике. Мы находим PAM область в том гене, который необходимо повредить, берем 20 нуклеотидов после и синтезируем gРНК. Белок Cas9 практически такой же, как и у бактерий, но не будем вдаваться в подробности. В общем, вводим в клетку ДНК, кодирующую гидовую РНК и белок Cas9, в клетке синтезируется gРНК и белок, gРНК распознает целевой участок в гене, связывается с ним, эту связь распознает белок Cas9 (нуклеаза) и производит двухцепочечный разрыв в том месте, где мы ожидали.
Радуемся? Нет. В ДНК используется 4 типа нуклеотидов. Геномная ДНК длинная. Может так получиться, что наши 20 букв встречаются где-то еще. Может быть они совпадают на 17 букв, а 3 отличаются. К сожалению эти различия для РНК ничего не значат, и наша геномная ДНК может повредиться где-то еще. Как быть? Ну, во-первых, геном человека известен. Мы можем найти все гены, которые гипотетически могут повредиться в нашем эксперименте. После этого сделать секвенирование этих генов после «редактирования» и узнать повредилось ли что-то или нет. Мы можем изначально выбрать такой участок, который будет уникален, но это редкость. Но если мы не можем ничего сделать и у нас повреждается ДНК в нескольких метах? В таком случае целесообразно использовать другую форму Cas9. Белок Cas9 состоит из нескольких доменов. Один из них производит гидролиз (расщепление) одной цепи геномной ДНК, второй домен гидролизует вторую цепь. Таким образом, получается двухцепочечный разрыв. Если провести мутагенез одного из доменов – то есть заменить одну аминокислоту в активном центре, то домен потеряет свою функцию. Второй останется функциональным. Такая форма белка Cas9 названа никазой, от слова nick – «однонитевой разрыв». Это разрыв при котором страдает только одна цепь ДНК. Вторая остается неповрежденной. Такие однонитевые разрывы очень легко репарируются клеткой без каких-либо последствий, однако, если эти разрывы будут находиться близко друг к другу, то клетка распознает это как двухцепочечный разрыв и запустит системы репарации NHEJ или гомологичную рекомбинацию. Для применения никазы – мутантной формы Cas9 целесообразно использовать донорную ДНК, для введения мутации в геном. Но основное ее преимущество в том, что мы исключаем нецелевые распознавания, поскольку однонитевые бреши восстанавливаются быстро и просто.
Можно «выключить» два домена сразу, но об этом я расскажу в следующий раз.