Найти тему

Секвенирование в реальном времени полной мРНК у Saccharina japonica

Saccharina japonica - наиболее экономически важная морская водоросль, культивируемая в странах Восточной Азии, особенно в Китае. В 2016 году культивирование Saccharina охватывало около 44 000 га с годовым урожаем в сухом весе более одного миллиона тонн в Китае.

Помимо его высокой экономической ценности в пищевой, минеральной, фармацевтической и фитоколлоидной отраслях промышленности, другим важным аспектом его крупномасштабного производства является высокая производительность биомассы.

Продуктивность Saccharina japonica и других крупных бурых водорослей колеблется от 3300 до 11,300 г / м2в год сухого веса. Культивируемый Saccharina japonica может превышать 15 000 г / м2 сухого веса, что в 6,5 раз превышает максимальный прогнозируемый урожай сахарного тростника, наиболее продуктивного культивируемого наземного растения.

Это явление предполагает, что Saccharina japonica обладает более высокой фотосинтетической способностью, чем наземные растения. Рубиско является основным ферментом карбоксилирования в пути фотосинтетической фиксации углерода.

В морской воде концентрация субстрата рубиско, СО2 составляет около 12 мкмоль/л, что намного ниже, чем константа полунасыщения (Ks) рубиско для СО2 у макроводорослей (40–90 мкмоль/л). В результате почти все макроводорослей развивались углекислые anhydrases (КАС), в зависимости углерод-обогатительный механизм (СКК) для повышения концентрации СО2 вокруг RUBISCO, чтобы увеличить скорость карбоксилирования.

CA принадлежат к суперсемейству, которое было классифицировано на семь подтипов: -CA, -CA, -CA, -CA, -CA, -CA и -CA на основе сходства их аминокислотных последовательностей. Эти подтипы не разделяют гомологию последовательностей так же, как и эпитопы, но их функции сохраняются.

Все они представляют собой металлоферменты цинка, которые катализируют обратимую конверсию CO2 и HCO3. За последнее десятилетие исследование широкого разнообразия генома показали, что у растений существует множество изоформ CA.

Изображение взято из открытых источников Яндекс. Картинки
Изображение взято из открытых источников Яндекс. Картинки

Например, в геноме Arabidopsis thaliana было идентифицировано 19 генов, кодирующих CA, которые включали восемь, - шесть - и пять - CAs. В Chlamydomonas reinhardtii, модели микроводорослей, существует по меньшей мере 12 генов - (три, - шесть - и три - или-подобные CAs), и в Phaeodactylum tricornutum и Thalassiosira pseudonana 9 (пять, - два - и два -) и 13 (три, - пять, - четыре - и один -) гены CA были идентифицированы. Калифорниягены также были идентифицированы в ряде макроводорослей.

Например, два, - три - и один -CA были зарегистрированы в Pyropia haitanensis, а также один -CA и одного -CA в P. yezoensis. У S. japonica был описан только уникальный -CA. Чтобы лучше понять СКК в S. japonica, необходимо охарактеризовать СА.

Платформа Single Molecule Real Time (SMRT) была представлена Pacific Bio-Sciences для секвенирования ДНК. По сравнению с высокопроизводительными секвенирующими платформами пиросеквенирования Roche 454, секвенированием Illumina, секвенированием SOLiD и платформой Ion Torrent, эта технология секвенирования обеспечивает более длительное считывание по размеру килобаза, а также позволяет избежать процесса сборки и включения процесса возможные ошибки, которые могут быть получены из более коротких чтений.

Процессы генерации круговой консенсусной последовательности(CCS), итеративная кластеризация для исправления ошибок (ICE) и качественная фильтрация (Quiver), предоставляемые Pacific Biosciences, генерируют высококачественные полированные изоформы полной длины. В данном исследовании мы использовали технологию секвенирования PacBioSMRT для анализа полной длиной транскрипт из С.

В сочетании с общедоступным транскриптомом секвенирования следующего поколения (NGS) разнообразие генов подсемейства CA S. japonica было изучено с помощью алгоритмов кластеризации и филогенетического анализа. Выделение полноразмерных транскриптов также будет полезно для будущей аннотации генома и функциональные исследования в этой водоросли.

С помощью поиска гомологий BLASTX аногены аннотировали путем сравнения с последовательностями, помещенными в базу данных NCBI без избыточного белка (nr), с отсечением ниже, чем E- значение<10 -5. Программа InterProScan была использована для анализа функциональной классификации генной ортологии (GO). Классификация ортологичных групп (COG) была выполнена с использованием программы BLASTX (E- значение <10 -5).

Было получено 5028003 субпотока от гаметофитов S. japonica со средней длиной субпотока 1910 п.н. и общей длиной 9830,4 мегабазы. Эти подзаписи сформировали 433 480 CCS после слияния и исправления ошибок. Было обнаружено, что из 433 480 CCS 326,512 являются считываниями FLNC со средней длиной 2181 п.н.

Инструмент ICE был использован для дальнейшего раунда исправления ошибок, и было получено 180 069 расшифровок. Чтобы уменьшить избыточность последовательностей, мы использовали программное обеспечение CD-HIT для кластеризации консенсуса и было получено 79 010 унигенов.

Семь предполагаемых CA были идентифицированы из SMRT-транскриптома S. japonica: 3 CA (2- и 1 -CA) были идентичны транскриптам, полученным из NGS-транскриптома, и 4 (2-, 1- и 1 -CA) были недавно идентифицированы. Сочетание этих двух наборов транскриптомных данных идентифицировало в общей сложности 11 CAs у S. japonica.

За исключением SjCA2, были найдены полноразмерные CDS для всех CA. SjCA2, SjCA3, SjCA5 и два SjCAs были секретируемыми белками и, вероятно, были локализованы в периплазматическом пространстве, клеточной стенке или цитомембране. SjCA1 был ранее описан в хлоропласте, и SjCA4 также, как было предсказано, находится в этоморганеллы. Все SjCA были предсказаны, чтобы быть расположенными в митохондрии.

Выделение транскриптов мРНК полной длины имеет решающее значение для понимания функции гена. Геном S. japonica имеет размер приблизительно 537 Мб и кодирует 18 733 кодирующих белок гена. В другом сообщении о наборе транскриптомных данных S. japonica было предсказано 19 040 унигенов. В этом исследовании была аннотирована двойная доля кодирующих белок генов, и наши данные о транскриптоме вносят ценный вклад в понимание организации генома и генов S. japonica. для будущих исследований.

Анализ GO показал, что в обоих транскриптомах большинство транскриптов были аннотированы в функциональной категории «категория биологического процесса» и в подкатегории «связывание». Аналогичным образом, анализ COG классифицировал большинство транскриптов в категории «посттрансляционная модификация, белковый обмен, шапероны» для обоих транскриптомов. Анализ KEGG показал, что наибольшее количество генов было в пути «трансляции» «Обработки генетической информации».

Всего из S. japonica было идентифицировано 11 СА, из которых 4 были вновь идентифицированными транскриптами. Однако четыре CA, ранее идентифицированные в NGS-транскриптоме, не были обнаружены в нашем наборе данных, что может быть связано с различными методами секвенирования. В SMRT гены низкой численности часто пропускаются, в то время как в NGS гены со сложными структурами, такими как G / C-rich, G / C-кластер или poly A / T / C / G, обычно не секвенируются успешно.

Таким образом, комбинация данных NGS- и SMRT-транскриптома может быть необходима для получения полной информации о мультигенных семействах. В предыдущем отчете 12 CA (7 -CA, 2 -CA и 3 -CA) были скринированы на NGS-транскриптоме S. japonica, но только 3 -CA, 2 -CA и 2 -CA были подтверждены методом ПЦР.

До настоящего времени субклеточные местоположения СА интенсивно изучались в модельном организме C. reinhardtii. Среди сообщенных 12 изоформ CA в C. reinhardtii, два -CA (CAH1 и CAH2) и два -CA (CAH7 и CAH8) были расположены в периплазматическом пространстве; два -CAs (CAH4 и CAH5) и все три - или-подобные CA были расположены в митохондрии; один -CA (CAH3) был расположен в тилакоидном просвете; один -CA (CAH6) был локализован в строме хлоропластов, а другой -CA (CAH9) локализован в цитоплазме.

Филогенетический анализ показал, что SjCA3 кластеризовался с CAH1 и CAH2C. Предполагая, что он также может быть расположен в периплазматическом пространстве, а предсказание субклеточного расположения показало, что это секретируемый белок. Аналогично, в соответствии с предсказаниями биоинформатики SjCA1 и SjCA2 были секретируемыми белками и кластеризовались с CAH7 и CAH8 из C. reinhardtii. Более того, в митохондриях были предсказаны - или-подобные СА C. reinhardtii и всех трех SjCA.

Учитывая, что функции CA будут зависеть от их субклеточного расположения, соответствующие прогнозы, приведенные выше, в будущем будут подтверждены с помощью электронной микроскопии иммуноколлоидного золота.

Эти результаты в сочетании с активностью фермента CA поможет понять механизм поглощения и транспортировки неорганического углерода у S. japonica.