Выравнивание последовательностей

Материал из Википедии — свободной энциклопедии
Это старая версия этой страницы, сохранённая P.avdiunina (обсуждение | вклад) в 15:12, 21 апреля 2019 (Структурное выравнивание). Она может серьёзно отличаться от текущей версии.
Перейти к навигации Перейти к поиску

Выравнивание последовательностей — биоинформатический метод, основанный на размещении двух или более последовательностей мономеров ДНК, РНК или белков друг под другом таким образом, чтобы легко увидеть сходные участки в этих последовательностях. Сходство первичных структур двух молекул может отражать их функциональные, структурные или эволюционные взаимосвязи[1]. Выровненные последовательности оснований нуклеотидов или аминокислот обычно представляются в виде строк матрицы. Добавляются разрывы между основаниями таким образом, чтобы одинаковые или похожие элементы были расположены в следующих друг за другом столбцах матрицы.

Алгоритмы выравнивания последовательностей также используются в NLP.

Графическое и текстовое представление

В большинстве представлений результата выравнивания последовательности располагаются в строчках матрицы таким образом, что совпадающие элементы (нуклеотиды или аминокислоты) находятся один под другим (в одной колонке). «Разрывы» заменяются знаком «-» или ячейка остается пустой.

Выравнивание двух последовательностей аминокислот («цинковых пальцев»), сгенерированное программой ClustalW. В левой колонке находятся идентификаторы этих последовательностей в базе GenBank.
Обозначения: Буквы — Аминокислоты. Знаки под колонками: «*» — одинаковые; «.» — сходные по свойствам; «:» — близкие по свойствам

Парное выравнивание

Парное выравнивание используется для нахождения сходных участков двух последовательностей. Различают глобальное и локальное выравнивание. Глобальное выравнивание предполагает, что последовательности гомологичны по всей длине. В глобальное выравнивание включаются обе входные последовательности целиком. Локальное выравнивание применяется, если последовательности содержат как родственные (гомологичные), так и неродственные участки. Результатом локального выравнивания является выбор участка в каждой из последовательностей и выравнивание между этими участками.

Для получения парного выравнивания используются разновидности метода динамического программирования. В частности, эти алгоритмы реализованы в сервисах европейской молекулярно-биологической лаборатории (EMBL). Так, например, Needle, алгоритм глобального выравнивания, использует алгоритм Нидлмана — Вунша, а Water, алгоритм локального выравнивания  — алгоритм Смита — Ватермана.

Алгоритмы поиска

Применяются для поиска в больших базах данных последовательностей, схожих с некой заданной последовательностью по указанным критериям. Применяемое выравнивание — локальное. Для повышения скорости поиска используются различные эвристические методы. Наиболее известные программы: BLAST и FASTA3x.

Множественное выравнивание

Множественное выравнивание — это выравнивание трёх и более последовательностей. Применяется для нахождения консервативных участков в наборе гомологичных последовательностей. В большинстве случаев построение множественного выравнивания — необходимый этап реконструкции филогенетических деревьев. Нахождение оптимального множественного выравнивания методом динамического программирования имеет слишком большую временную сложность, поэтому множественные выравнивания строятся на базе различных эвристик. Наиболее известные программы, осуществляющие множественное выравнивание — Clustal (http://www.clustal.org/), шаблон не поддерживает такой синтаксис (http://www.tcoffee.org), шаблон не поддерживает такой синтаксис (http://www.drive5.com/muscle/) и шаблон не поддерживает такой синтаксис (http://mafft.cbrc.jp/alignment/software/). Имеются также программы для просмотра и редактирования множественных выравниваний, например шаблон не поддерживает такой синтаксис или русскоязычный UGENE.

Структурное выравнивание

Пространственное выравнивание тиоредоксинов человека и мушки Drosophila melanogaster. Белки отображены в ленточном виде, белок человека — в красном, мушки — в жёлтом цвете. Получено из PDB 3TRX и 1XWC.

Может быть построено для белков или рибонуклеиновых кислот с использованием информации о вторичной и третичной пространственной структуре молекул. Целью является попытка установить гомологию двух или нескольких структур путем нахождения и сопоставления участков, одинаково уложенных в пространстве. Структурное выравнивание обычно сопровождается наложением структур, то есть нахождением движений пространства, применение которых к заданным молекулам наилучшим образом совмещает их. Но в отличие от простой пространственной суперпозиции с известным сопоставлением эквивалентных остатков двух структур, алгоритмы структурного выравнивания обычно не требуют априорного знания выравнивания последовательностей. Существует большое количество алгоритмов, на которых основаны различные шаблон не поддерживает такой синтаксис.

Структурное выравнивание успешно используется для сравнения белков с низким уровнем гомологии последовательностей, когда эволюционные связи не могут быть установлены стандартными методами выравнивания последовательностей, но в этом случае необходимо принимать во внимание влияние конвергентной эволюции, основной эффект которой проявляется в сходстве третичных структур неродственных аминокислотных последовательностей.

Пространственное выравнивание позволяет сравнивать две и более молекулы с известными трехмерными структурами, экспериментальное получение которых основано на использовании методов рентгеноструктурного анализа и ЯМР-спектроскопии. Также есть данные об использовании метода малоуглового рентгеновского рассеяния для анализа трехмерных структур различных белковых молекул[2] . Для пространственного выравнивания можно также использовать структуры, полученные методами предсказания структуры белка. Пространственные выравнивания особенно важны для анализа данных, полученных методами структурной геномики и протеомики, они также могут использоваться для оценки выравниваний, полученных путём сравнения последовательностей

Примечания

  1. Mount DM. Bioinformatics: Sequence and Genome Analysis. — 2nd. — Cold Spring Harbor Laboratory Press: Cold Spring Harbor, NY., 2004. — ISBN 0-87969-608-7.
  2. GL Hura; AL Menon (July 2009). "Robust, high-throughput solution structural analyses by small angle X-ray scattering (SAXS)". Nature Methods. doi:10.1038/nmeth.1353. PMC 3094553. PMID 19620974.