Белковая вселенная состоит из множества структур, варьирующихся от полного порядка до полного беспорядка. По мере интенсивного изучения структурированной части протеома стабильно свернутые белки становятся все более хорошо документированными и понятными.
Однако белки, которые полностью или в значительной степени неупорядочены, характеризуются гораздо менее хорошо. Здесь мы собрали химические сдвиги ЯМР в небольшой базе данных для 117 белковых последовательностей, которые, как известно, содержат беспорядок.
Мы демонстрируем, что данные ЯМР-химического сдвига могут использоваться в качестве точного судьи нарушения белка на уровне остатков и помогают в проверке.
С помощью анализа вторичного химического сдвига мы демонстрируем, что белки в базе данных охватывают полный спектр расстройств, но все же в значительной степени разделяются на два класса: неупорядоченные с небольшими сегментами порядка, разбросанными по последовательности, и структурированные с небольшими сегментами беспорядка, вставленными между различными структурированными областями.
Детальный анализ показывает, что распределение порядка/беспорядка вдоль последовательности демонстрирует сложное и асимметричное распределение, которое сильно зависит от белка.
Доступ к ратифицированным данным обучения также предлагает путь к улучшению прогнозирования беспорядка на основе последовательности.