Рефераты. Визуализация генов: методы и проблемы

Ниже мы опишем методы визуализации, которые используются для отображения синтении на микро и макро уровнях (таб.3).

Визуализация геномного выравнивания

Широкие спектры стратегии были изучены для графического синтении на уровне целого генома. Двумерные точечные графики, которые традиционно используются при анализе локального выравнивания, увидели современное возрождение в качестве мощного способа визуализации более доступного геномного выравнивания(DaGChainer, Vista-Dot MUMmer62,Genome Matcher и другие).

Геномы этих двух организмов представлены по осям х и у графика, с указанием линий сетки хромосомных границ. Точки на графике указывают на некоторую степень выравнивания, образуя 45 градусные линии на отдельном месте.

Геном реконструкции и дублирования сразу опознает их как, соответственно вне диагонали и идентифицирует линии как горизонтально так и вертикально сложенные. Dag- первое общедоступное средство для создания графиков, рассчитывает синтении на основе мета-выравнивании генов в родственных BLAST сочетаниях между двумя организмами.

Vista - диаграммы предложили точечный графический режим для просмотра синтении на основе геномного ДНК выравнивания (доп.рис.1). Эти средства имеют интерактивные карты типа Google интерфейса, позволяющие пользователям масштабировать и паномировать в пределах областей, а также на ссылку из соответствующего сегмента для просмотра в Vista или в геномном JGI браузере.

Точечные графики являются полезными не только при анализе синтении между готовыми геномами, но и геномной обработки. Например, OSLAY средство, которое автоматизирует все более распространенные методы использования точечных графиков и приводит коллекцию наборов генов из незавершенного ассемблирования с эталонной сборкой, и тем самым карту целого генома.

Глобальное сохранение может быть визуализировано и представлено ссылкой генома с использованием таблеточной формы идеограмм хромосом и ленточных для обозначения областей приведенных в соответствии, с каким либо геном. Группы имеют цветовую маркировку для обозначения хромосом в соответствии с геном, с которым они сравниваются.

Идеограмма представленных геномов выравнивания является самым предпочтительным выбором для индивидуального генерирования данных в публикациях новой последовательности геномов.

Три варианта являются доступными для автоматической генерации вариантов этой визуализации для определенных пользователей геномной информации:Cinteny,Apollo, « Градиент изображения» Сибилла использует инновационные визуализации, в которых гены отображаются по цвету по геномным ссылкам, эти цвета используются для обозначения гомологичных мест в наборе унифицированных геномов.

VISTA синтении изображения (доп.рис.2) используют основную идеограмму, которая описывает выравнивание родственных генома в качестве направляющего средства отбора хромосом в организме, в ссылках рассмотрено более детально. По сравнению с точечными графиками представление синтении с помощью диаграммы способствует утере информации о местонахождении унифицированных областей для сравнения геномов. Тем не менее, использование цветов в этих диаграммах способствует возможности с легкостью представлять себе, геном и сравнивать его с другими.

Кроме того, цветные сегменты в информационно-справочном геноме могут быть связаны с какими-то конкретными положениями хромосом и линии рисуются более мелкие по сравнению с хромосомными символами в организмах. Этот подход используется в «Apollo», а также в PhiGs веб сайте, который позволяет пользователям создавать синтении карт из 45 последовательностей грибов и многоклеточных.

Альтернативный эстетический подход к геномным изображениям представил Circos. Средства, представляющие из себя Circos, две или более геномные дуги на одном круге. Линии, которые пересекают центр круга, связывают и выравнивают соответствующие области.

В этом циркуляре систематизированы и уменьшены визуальные путаницы, которые вытекают из эквивалентных линейных представлений, в которых паутины соединяют отдаленные области во множестве геномов.

Этот инструмент также поддерживает анимацию выравнивания связей между отдельными геномами, а хромосомы могут быть просмотрены в последовательности и в дальнейшем путаницы сокращаются.

Циркуляционное геномное изображение также доступно в MEDEA и в Miz Bce.

Точечные графики, идеограммы и циркулярные изображения представляют собой оперативное исскуство (стратегию) для визуального изображения и обеспечивают сохранность геномных шкал. Инструменты для реализации этих изображений могут быть использованы для выявления областей синтении, дублирования и перемещения между геномами. После выявления таких областей исследователям необходимы средства, чтобы просмотреть их на более высоком уровне разрешения для визуальной ассоциации с аннотациями данных.

Визуализация геномной защиты

Наиболее простым способом визуально связываться с аннотацией сохраненных данных будет представление выравнивания геномов и сравнение их как «треков» в УСК браузере и браузере VISTA (рис.3).

В обоих случаях попарное или множественное выравнивание представлено в виде двухмерного графика, в котором по оси х указывается положение вдоль представленного генома, а по оси у представлено и сохранено множественное выравнивания этого генома.

Вдобавок, UCSC браузер имеет следы «цепочки выравнивания» показаны как различные оттенки серого.

В случае следов VISTA, такие функции как сохранение экзонов,UTRS и некодирующие области обозначены цветом, находившимся под кривыми.

VISTA треки могут быть экспортированы для просмотра в рамках соответствующих организмов ссылаясь на другие геномные браузеры, такие как JGI геномный браузер и УСК геномный браузер.

Выравнивание треков предоставляет ценные средства для быстрой идентификации и сохранения при просмотре отдельных геномов. Тем не менее, это сохранение изображения не позволяет исследователям использовать функции в двух направлениях: просматривать и сравнивать выравнивания одновременно.

По этой причине многие инструменты были разработаны с возможной визуализацией локальных синтений (таб.3). Как правило, эти инструменты используют общую стратегию, изображающую множественную цепочку и сравнения местоположения одного или более генома рисуя при этом линии между ними, чтобы указать синтении (изображающие связанные следы).

Функции треков с указанной аннотацией геномной модели и определил последовательности тега, которые могут быть наложены выше или ниже соответствующих регионов, аналогично тому, который используется геномным браузером.

Это представление позволяет визуально просматривать выравнивание, сохраняя при этом в контексте геномной аннотации, которая описывает содержание исследованных областей, ссылки подключений в сохраненных областях могут быть сделаны на основе геномных выравниваний ортологичных генов, кластерных белков или даже модельной структуры GMOD Общие Модельные организмы Данного проекта. В том числе популярные геномные браузеры GBrowse являются, пожалуй, наиболее широко используемой основой для программного обеспечения для поддержки геномного анализа и хранения.

Три синтении веб обозревателей были разработаны в рамках GMOD: Syn Browse и GBrowse Syn, а расширение семейства инструментов из GBrowse позволяет пользователям переключатся между тремя режимами отображения с сохранением связи между регионами.

В режиме «синтении блоков», области связаны в соответствии с заданными пользователем определениями синтении (определенное количество коллинеарных генов на протяжении определенного минимального расстояния).

В режиме «кодирования генов» и «кодирование экзонов», белковое выравнивание отображается в виде линейной группировки генов и экзонов, и соответственно через ссылку сравниваются сегменты. Характерной особенностью выравнивания является индикация по цвету каждой линии.

Различные представления, которые используют для визуализации синтении на шкалах, в качестве цепей выравнивания генома с сохранением итронно-экзонной структуры в области геномной последовательности.

Основной проблемой в будущем развитии этих средств заключается в том, чтобы предоставить средства для исследователя обеспечения возможности перемещения через эти уровни безпрепятствий.

К счастью, все большее усложнение веб- технологий обеспечивает еще большую интерактивность и возможность подключения визуальных элементов к информационным ресурсам в интернете.

VS V, использует эти технологии, предоставляя новый интерфейс для объединения шкал в дисплее синтении. VS V изображает в три кросс навигационные панели предоставляющей разные шкалы выравнивания.

Combo и Genome партнер предоставляют решение в визуализации синтении путем подключения интерактивных точек графика с просмотрами «связанных треков» сохраненных локально.

MizBee, вышедший совсем недавно предоставляет интерактивные просмотры, бок о бок, данных по всему спектру шкал, оказывая поддержку изучению всех типов связей.

Большинство средств описанных выше следуют модели выравнивания одного или более геномов, сравнение одного генома против базового.

Этой модели характерно визуальное ограничение, которое состоит в том, что связи между организмами, которые сравниваются, не могут быть изучены.

Одним из путей решения этого ограничения, принятые в обоих средствах сравнения Artemis и CMAP, дают представление пользователю о стеке генома, так, что произвольный набор сравнения родственных геномов можно представить (хотя данный геном еще можно сравнить с более чем двумя другими).

Еще одним недостатком «геномной ссылки» моделью для отображения синтении, является то, что ось х на протяжении всего выравнивания , как правило, определяется положением вдоль ссылки генома, что делает возможным затемнения интересных особенностей сравнения последовательностей. Два инструмента Phylo-Vista и SynPlot,осуществляют визуализацию, сохраненную в положениях которые изображены по отношению к длине общего выравнивания.

Еще одной проблемой в визуализации синтении является графическое представление вставки и удаления, которые являются критическими для отслеживания эволюции генома в хромосомах, родственных генов и структурных шкал генов.

Хотя многие алгоритмы выравнивания способны выявлять удаления, большинство изображений синтении не предлагают средства для их визуальной индикации, отображая только сохраненные соответствия между областями.Насколько нам известно, только GBrowse syn изображение позволяет визуализировать удаление.

Когда «сетки линии», включены в GBrowse syn, удаление представлено сеткой линий соединяющих вставки областей на одном геноме единой точкой удаления на других.

Многие успешные средства визуализации особенно тщательно учитывали требования для специализированных анализов своих пользователей и маловероятно, что универсальный инструмент для анализа генов останется подходящим или желанным.

Существует, однако, крайняя необходимость улучшить интеграцию между средствами и облегчает переход от одного анализа к другому. Стремительный прогресс в области технологии секвенирования продолжают деформацию существующего программного обеспечения и создают проблему прогнозирования будущих потребностей.

Парадигма более зрелых инструментов, как с точки зрения вычислительных методов, так и визуальных представлений это борьба за соответствие информационным требованиям.

Более поздние средства решают некоторые из основных вопросов, но они часто проигрывают в многофункциональности ради удовлетворения неотложных потребностей, которые состоят в скорости и легкости распространения.

Вполне вероятно, что широко распространенная интеграция между средствами, будет когда-нибудь реализована, и тогда мы приобретем большую стабильность в технологии генерации данных и форматов стандартных файлов.

Мы выявили несколько широко используемых средств для руководства исследователями желающими совершать геномный анализ сегодня.

Однако, учитывая скорость, с которой, это относительно молодая область развивается, очень вероятно, что новые программные средства появятся, а пересмотренный формат файлов будет уже предложен в ближайшем будущем. Как следствие этого динамического характера, инновационный потенциал в этой области велик.

Во-первых, для удовлетворения будущих потребностей анализа, необходима их визуализация. Необходима для успешной интеграции различных форм данных, таких как клиническая информация в совокупности с данными генома.

Во-вторых, эти средства требуют визуального представления на шкалах равномерного сравнения тысячи и даже миллионов элементов.

Например, основанный на треках экран использует текущий геномный браузер, не смогут обеспечить вывод на экран 1000генного проекта.

В-третьих, достижения в этой области требуют беспрепятственного направления по соответствующим уровням резолюции, пользуясь методом агрегирования выявлять глобальные тенденции интерактивных интерфейсов для обеспечения доступа пользователям с более низкими уровнями требований.

И в - четвертых, улучшение интеграции между автоматизированным расчетом и визуализацией необходимо достигнуть, чтобы пользователи могли интерактивно уточнять и повторять анализы.

Такого рода интеграция также позволит более широкому сообществу биологов выполнить геномный анализ, а не ограничиваться только расчетами программистов.

Страницы: 1, 2, 3, 4



2012 © Все права защищены
При использовании материалов активная ссылка на источник обязательна.