Компьютерное моделирование уже давно пропагандируется для производственных систем. Вместо того, чтобы рассчитывать R для отдельных скрещиваний с помощью уравнения селекционера, можно смоделировать генетические выгоды для программы разведения в целом с учетом затрат и времени. Пакеты моделирования, такие как QU-GENE (Podlich и Cooper 1998 ), AlphaSim (Faux и др. 2016) и DeltaGen (Jahufer и Luo 2018) были разработаны для моделирования количественных вариаций и отбора, и такое программное обеспечение использовалось для сравнения схем размножения (Wang et al. 2003; Jahufer and Luo 2018). В будущем инструменты моделирования должны иметь возможность включать существующие зародышевую плазму, данные молекулярных маркеров и фенотипические данные в качестве входных переменных. Это означает, что, например, в программе селекции пшеницы генетические объекты в процессе моделирования не будут родовыми особями, а вместо этого будут отражать родословные фактических линий пшеницы, используемых в программе, а также связанные с ними SNP и данные о производительности для несколько черт.
Включение средств моделирования в селекцию растений потребовало бы изменений в типовой учебной программе по селекции растений, а также более тесного сотрудничества со специалистами по исследованию операций, науке о данных и моделированию производственных систем. Коммерческие племенные организации будут иметь возможность нанимать выпускников с опытом работы в этих областях.
Анализ смешанной модели
Анализ смешанной модели, который включает в себя наилучшую линейную несмещенную оценку (СИНИЙ) фиксированных эффектов и BLUP случайных эффектов, оказался эффективной основой для анализа фенотипических данных и данных SNP, обычно генерируемых в программе разведения. Селекционеры пропашных культур проводят сбалансированные эксперименты, оценивая один и тот же набор кандидатов в каждом из нескольких мест в течение одного или нескольких лет. Однако полные фенотипические данные по кандидатам, местам и годам крайне несбалансированы. Анализ смешанной модели обеспечивает два ключевых преимущества: он обрабатывает несбалансированные данные и может включать информацию от родственников через одну или несколько ковариационных матриц случайных генетических эффектов.
Линейная модель, лежащая в основе анализа смешанной модели или его расширение. Например, линейная модель может быть расширена, чтобы включить фиксированные генетические эффекты из-за основных QTL (Bernardo 2016), субпопуляций (Yu et al. 2006), трансгенов или различных типов цитоплазмы, или фиксированных воздействий на окружающую среду, таких как уровень азотных удобрений или предыдущий урожай, выращенный в поле. Случайные генетические эффекты могут соответствовать линиям, клонам или гибридам, как в GBLUP, или маркерам SNP, как в RR-BLUP. Связь между маркерами отражается в матрице коэффициентов в RR – BLUP, тем самым обходя необходимость предполагать равновесие сцепления.
Подход BLUP впервые был использован в животноводстве в 1970 году для оценки около 1200 молочных быков голштинской породы в рамках программы искусственного оплодотворения (Freeman 1991). Использование BLUP на растениях начиналось как струйка, сначала с сокращения оценок сочетания способности к среднему (Melchinger et al. 1987 ), за которым следовало использование информации от родственников для прогнозирования эффективности одного скрещивания (Bernardo 1994). Отрадно, что с 2000-х годов смешанный модельный анализ стал привычным для учащихся по селекции растений и стал обычным явлением в программах селекции растений.
Использование смешанного модельного анализа снижает роль генетики и повышает роль статистики в количественной генетике. Эта тенденция уже наблюдалась в животноводстве более 30 лет назад статистическим генетиком Оскаром Кемпторном, который дал следующую характеристику теории размножения животных (Kempthorne 1988):
«Учитывая идею о том, что гены индивида являются случайными генами из популяции генов с независимостью между локусами, и идею о том, что воздействие на окружающую среду можно рассматривать как реализации независимых гауссовских случайных величин, мы видим, что мы сократили всю теорию до что мы в статистике называем смешанной теорией линейной модели. В результате то, что называется теорией разведения животных, сводится к теории смешанной линейной модели с фиксированными эффектами и независимыми гауссовыми случайными эффектами.
В целом, переосмысление количественной генетики, как описано в этой статье Мнения, включает в себя подходы, которые являются вычислительными и эмпирическими, а не основаны на классической теории и предположениях. Эта тенденция, несомненно, будет продолжаться, поскольку все большее количество фенотипических данных и данных SNP и дополнительных типов данных (например, климатические или культурные методы управления) станут доступными для принятия решений о размножении.
Продолжение следует....