Общие принципы построения филогенетических деревьев

0
276
views
Phylogenetic Trees

В связи с геометрической прогрессией эволюционных идеи генеалогического развития живых существ стала нужна в наглядном отражении данных связей в виде графической схемы. Первая древовидная схема была нарисована Ламарком (1809). Данные схемы строились умозрительно, руководствуясь общими сходствами или различиями. 

Ситуация изменилась после опубликованной В. Хеннигом книги «Филогенетическая систематика» (Hennig,1950). Последователи учения Хеннига называют себя кладистами. 

Основные принципы кладизм следующие:

  • Кладограммы (филогенетические деревья) строятся по дихотомическому принципу.
  • Таксоны выделяются только по вертикальному приципу.
  • Ранг таксонов определяется последовательностью их ветвления на кладиограмме, понижаясь от основания кладиограммы к вершине; таким образом степень родства таксонов соответсвует времени их разделения. 
  • Пары таксонов, исходящие на кладограмме из одной точки, образуют «сестринские группы», связанные друг с другом максимальным родством.
  • Из пары сестринских групп обычно одна сохраняет значительно большее сходство с передковым таксоном, чем другая (правило девиации). 
  • Передковых таксон, давая начало двум сестринским, исчезает,  что определяется требованиями дихотомического принципа построения кладиограмм. 

В 1970 году был предложен новый метод построения филогенетических деревьев — метод максимальной экономии (Farris, 1970). Метод максимальной экономии MP (maximum parsimony) направлен на поиск филогенетического дерева, которое можно описать минимальным числом изменений признака (нуклеотидных замен в случае ДНК). Алгоритм MP подразумевает для каждой нуклеотидной позиции минимальное число мутаций, необходимых для определения состояний признака в терминальных узлах дерева. Сумма этих мутаций называется экономной длиной дерева и вычисляется для разных топологий. Алгоритм построен таким образом, что после оценки достаточного количества топологий производится выбор максимально экономного дерева, для которого требуется минимальное число изменений. Недостаток этого метода заключается в том, что он предполагает прямое наследование общего признака от общего предка, таким образом недооценивая реально существующую дивергенцию между отдаленными таксонами.

В 1981 году Felsenstein вывел новый метод — метод максимального правдоподобия. На основе метода максимального правдоподобия ML (maximum likelihood) проводится поиск филогенетического дерева, которое максимально увеличивает вероятность наблюдаемых состояний признака. В соответствии с выбранной моделью эволюции, алгоритм ML делает предположение о вероятности замещения за определенное время одного нуклеотида на другой в данной позиции последовательности, и так для всего множества анализируемых последовательностей. Оценки правдоподобия для каждой позиции образуют общую оценку. Для получения максимального правдоподобия проводится анализ всех возможных комбинаций длин ветвей. Дерево с самой высокой оценкой правдоподобия отбирается как наилучшее. Минусом данного метода является большое вычислительных затрат при работе с реальными данными он используется реже всего. 

Общие данные о филогенетических деревьях 

Топология дерева — уникальная конфигурация узлов и ветвей.

Узел — точка разделения предковой последовательности (вида, популяции на две независимо эволюционирующие).

Корень — гипотетический общий предок.

Клада — группа организмов, которые являются потомками единственного общего предка и всех потомков этого предка.

Дерево, отражающее только топологию и не содержащее информации о длине ветвей, называется кладограммой. Филограмма, в отличие от кладограммы, несет информацию о длине ветвей.

Степень узла — число связанных с ним ветвей. Дерево, в котором степень всех узлов не превышает 3-х, а степень корня не превышает 2-х называется бинарным.

Способы построения филогенетических деревьев 

К важным этапам филогенетического анализа, которые необходимо оценивать особенно тщательно, относятся: формирование выборки таксонов (размер, точность таксономической идентификации), поиск молекулярных маркеров (длина нуклеотидной последовательности, согласованная с таксономическим уровнем исследования степень изменчивости, сдвиг нуклеотидного состава, эффект насыщения мутациями), выбор внешней группы, определение алгоритма анализа (подбор оптимальных моделей эволюции, формирование частей данных, методы построения деревьев и оценки достоверности их топологии).

В настоящее время довольно обширный набор последовательностей ДНК находит применение в геносистематике и филогенетике. Различные области ДНК накапливают мутации с отличающимися скоростями, а значит они несут разный филогенетический сигнал. Важнейшей характеристикой функционально значимых последовательностей ДНК является их эволюционный консерватизм. Чем меньше функциональная важность отдельных участков генома, тем выше тенденция к их изменчивости. Области ДНК, некодирующие белки, гораздо быстрее накапливают нуклеотидные замены, вставки и делеции. Очевидно, что близкородственные таксоны должны сравниваться посредством использования высоко вариабельных последовательностей (но не достигших насыщения мутациями), а сильно дивергировавшие организмы – с помощью консервативных к мутациям участков ДНК.

Современные молекулярные маркеры, используемые для филогенетических и систематических реконструкций животных, получают на основе полиморфизма ДНК – это митохондриальные и ядерные гены, диспергированные (ретропозоны) повторяющиеся последовательности. 

Митохондриальные маркёры

Преимущества мтДНК заключаются в том, что она наследуется по материнской линии и без рекомбинаций, последовательности генов легко получить, и они проявляют высокую степень вариабельности, которая изменяется в зависимости от таксономических уровней. Средняя скорость эволюции мтДНК в 7-10 раз выше, чем у генов ядерного генома.

Большое внимание исследователей привлекает ген субъединицы I цитохром-с-оксидазы (COI) в связи с разработкой единой генетической идентификационной системы организмов (ДНК-штрихкода). Функционально важный энзим дыхательной цепи митохондрий цитохром-с- оксидаза катализирует перенос электронов от цитохрома-с к кислороду и восстанавливает кислород до воды. Он представляет собой мультисубъединичный интегральный мембранный белок, содержащий 2 гема и 2 иона меди. У высших животных этот фермент состоит из 12-13 субъединиц. Домен С цитохром-с-оксидазы выступает из плоскости мембраны с цитоплазматической стороны, с матричной стороны выступают два домена, которые состоят из спирализованных участков полипептидных цепей. Ген COI имеет два важных преимущества: для его амплификации разработаны универсальные праймеры, пригодные для многих групп высших животных; темпы его эволюции позволяют различать как близкие виды, так и таксоны более высокого ранга вплоть до семейств. 

Цитохром b – один из наиболее изученных в структурно-функциональном плане белков, кодируемых мтДНК. Показано неслучайное распределение вариабельных позиций в нуклеотидных последовательностях гена цитохрома b у млекопитающих. К наиболее вариабельным областям цитохрома b относятся трансмембранные домены, а последовательности, образующие окислительно- восстановительные центры, являются самыми консервативными. Несмотря на то, что скорость эволюции гена цитохрома b не очень высока в сравнении с некоторыми другими митохондриальными генами, он проявляет значительную внутривидовую изменчивость. Благодаря этому ген цитохрома b применяется в молекулярно-генетических исследованиях позвоночных животных для определения структуры популяций, родственных отношений и происхождения видов, филогенетических связей в пределах семейств. 

Хорошие филогенетические маркеры – это не только гены, кодирующие белки, но и самые медленно эволюционирующие в митохондриальном геноме гены субъединиц 12S и 16S рибосомных РНК. В этих генах, кроме транзиций и трансверсий, возможны инсерции и делеции размером 1-5 пар нуклеотидов. Рибосомы играют важную функциональную роль в синтезе белка. РНК-компоненты рибосомы участвуют в связываниях аминоацил-тРНК, мРНК, факторов инициации, элонгации и терминации, в формировании пептидной связи.

Большинство функциональных сайтов рРНК картировано в области, где первичная последовательность и вторичная структура высоко консервативны. К таким регионам относятся: сайт связывания для сборки рибосомных белков домена III; основания, участвующие в ассоциации субъединиц и пептидилтрансферазы домена IV; пептидилтрансферазный центр домена V и сайт связывания фактора элонгации домена VI. Анализ моделей вторичной структуры рРНК используется в филогенетических исследованиях. Стеблевые и петлевые части генов рРНК характеризуются различиями в составе оснований, типах замен и скорости эволюции. Так, например, двухцепочечные регионы (стебли) эволюционируют в несколько раз медленнее, чем одноцепочечные (петли). Анализ изменчивости нуклеотидных последовательностей генов 12S и 16S рРНК применяется для получения молекулярных филогенетических схем на различных таксономических уровнях – от видов и родов до семейств и даже отрядов. 

Маркеры ядерной ДНК

На сегодняшний день для определения изменчивости ядерной ДНК в распоряжении исследователей имеется ряд маркеров. В молекулярно-генетических исследованиях «больших» таксонов в качестве маркерных последовательностей применяют высоко консервативные гены рибосомных РНК – субъединиц 7S, 18S, 28S.

Еще одним типом популярных ДНК-маркеров являются повторяющиеся последовательности, распространенные по всему эукариотическому геному, которые делятся на две группы – тандемные и рассеянные по геному.

Тандемные повторы, или сателлитная ДНК, высоко полиморфны и расположены в нефункциональных участках – гетерохроматиновых регионах хромосомных центромер. Функции сателлитной ДНК точно не определены, однако предполагается, что она участвует в образовании центромер, и, следовательно, в процессах митоза и мейоза.

Тандемные повторы используют в основном для оценки внутри- и межпопуляционной генетической изменчивости, изучения видообразования и родственных связей видов и родов. 

Оценки правильности филогенетических деревьев 

Для построенного филогенетического дерева обычно проводят оценку устойчивости по отношению к шумовым данным. Одним из способов оценки достоверности дерева является непараметрический бутстрэп-анализ. Бутстрэп-анализ применим к любым алгоритмам построения деревьев, таким как дистанционные методы, методы максимальной экономии и максимального правдоподобия. Процедура бутстрэппинга включает два этапа. На первом этапе генерируется некоторое количество новых наборов данных как производных от исходного набора. Новый набор данных по размеру идентичен исходному, но отличается по содержанию. Некоторые дискретные участки исходной последовательности могут входить в новый набор два и больше раз, а некоторые – отсутствовать. На втором этапе рассчитывается число, ассоциированное с каждой из ветвей дерева; значение этого числа определяет частоту встречаемости данной ветви в общем наборе деревьев. Считается, что оно характеризует точность, с которой полученное дерево отражает истинную филогению. Параметрический бутстрэп-анализ (SOWH test) отличается от непараметрического тем, что производные наборы данных генерируются с учетом некоторой модели эволюции последовательности.

Метастазы являются причиной смерти в 90% случаев рака. Несмотря на очевидную клиническую значимость процессов метастазирования, о принципах, лежащих в их основе, пока известно довольно мало. Известно, что в процессе развития опухоли претерпевают эволюцию. При делении клетки опухоли накапливают различные мутации и дают начало разнообразным клонам, которые образуют гетерогенную (разнородную) первичную опухоль. Клетки одного или нескольких уникальных клонов приобретают способность проникать в кровеносные или лимфатические сосуды и диссеминировать — распространяться в другие органы или ткани. Там они формируют вторичные опухоли — метастазы.Принятая и экспериментально подтвержденная в настоящее время теория считает родоначальниками метастаз уникальные по свойствам единичные клетки первичной опухоли, способные к диссеминации. Но совсем недавно на модельных мышах были получены данные, свидетельствующие о возможности возникновения метастаз из нескольких клонов клеток гетерогенной первичной опухоли и о взаимодействии между отдельными клонами при формировании метастаз.

Субклональная структура опухолей и метастаз у десяти пациентов с раком простаты. Показаны мутации, имеющиеся в «стволе» (первичная опухоль, серые линии), и дополнительные мутации, найденные в метастазах. Длина ветвей соответствует количеству приобретенных дополнительно аномалий. Внизу подписаны органы и ткани, в которых локализовались метастазы. Сокращения: AR — андрогеновый рецептор; amp — амплификация; HD — гомозиготная делеция; Abd. para — брюшная парааортальная область; diaph. — диафрагма; ing. — паховая область; subclav. — подключичная область; super. — поверхностный. Большинство найденных мутаций уже известны как драйверы онкогенеза при раке простаты. Метастазы-«ветви» — субклоны родительского клона первичной опухоли — наследуют мутации от первичной опухоли и накапливают новые мутации. «Ветвей» оказалось достаточно много, что свидетельствует о накоплении в метастазах разнообразных новых мутаций и об образовании различных метастаз-субклонов. В метастазах возникают дополнительные драйверные мутации, в том числе мутации, связанные с приобретением устойчивости к традиционной при раке простаты терапии — подавлению андрогенового рецептора. Были также получены доказательства формирования некоторых метастаз двумя или более клонами раковых клеток. Эти клоны могут функционально взаимодействовать друг с другом, чтобы обеспечить более эффективное развитие метастаз. Новым установленным фактом оказалось и то, что некоторые метастазы формируются не клетками первичной опухоли, а путем диссеминации клеток ранее образовавшихся метастаз

Полученные результаты раскрывают молекулярные механизмы возникновения устойчивости к терапии при раке простаты. Известно, что опухоли рака простаты зависят от андрогенных гормонов. Поэтому блокада функции этих гормонов, например, путем блокирования андрогенового рецептора работает как эффективная терапия и приводит к деградации опухоли. Но опухоль может дать рецидив, если она становится устойчивой к терапии. Чаще всего это случается вследствие активации функции андрогенового рецептора. В метастазах найдены аномалии, активирующие эту функцию: амплификации гена рецептора и мутации в гене, активирующие сам рецептор. Найдены также аномалии других генов, связанных с сигнальным механизмом рецептора (например, гена FOXA1), с обходными путями развития резистентности (амплификация гена MYC, мутация в гене CTNNB1). У всех пациентов было найдено по одной или по нескольку аномалий такого рода. Как правило, они наблюдались в метастазах, сформировавшихся в ходе лечения. Но в двух случаях это были ранние события: в одном произошла амплификация гена рецептора, в другом была активирующая мутация.

Каждое дерево представляет рак молочной железы отдельного пациента, выведенный из анализа подобранной нормальной пробы и 2–4 образцов опухоли (всего 40образцов опухоли). Деревья происходят от общегеномных замен. Деревья сгруппированы по плану: отдаленные метастазы (красная панель), местно-регионарный рецидив (синяя панель) или синхронный метастаз подмышечного лимфатического узла (зеленая панель). Частные ветви к метастазированию или рецидивам следуют той же цветовой теме, в то время как ветви, представляющие клоны, специфичные для первичной опухоли, серого цвета. Черный ствол представляет собой клональные мутации, которые присутствуют в 100% клеток в каждом образце. Фиолетовые ветви представляют собой мутации в метастазе или рецидиве, которые являются субклональными в пределах первичной опухоли. Длина ветвей отражает пропорцию кластерных соматических мутаций, приписанные этому субклону. Все дерево масштабируется до максимальной длины, которая будет выведена из выявленных мутаций в первичной опухоли. Красные кружки обозначают точку расхождения между метастазирующим / рецидивирующим клоном и первичной опухолью. Расчетное время удвоения цельного генома (WGD) обозначено доверительным интервалом в 95%. Числа в скобках отражают месяцы, прошедшие между первичной опухолью и метастазированием.

ОСТАВЬТЕ ОТВЕТ

Please enter your comment!
Please enter your name here

три × один =