Реферат: Визуализация генов: методы и проблемы
Следовательно, появляется возможность взаимодействовать с браузером, располагать в определенном порядке, фильтровать агрегаты и отображения данных в соответствии с клиническими признаками, аннотировать биологическим путем или редактировать пользователем коллекцию генов.
Статистический анализ может быть применен к определенным наборам данных и графикам в браузере.
УСК геномный браузер рака использует изображения тепловых карт, на которых х-оси координат и геномные оси у необходимы для стека больших геномов, где каждая строка предоставляет данные образца. Этот дисплей позволяет легко определять закономерности всей выборки. Например, пользователь может точно определить , где область хромосомы по местоположению PTEN, удаляя их периодически, по имеющимся в наличии образцам опухолей головного мозга. Ниже тепловые карты генома можно просмотреть суммарно и те данные, где очевидно есть характерные изменения количества видимых копий.
Клинические тепловые карты позволяют исследователям визуально изучить взаимосвязь между геномным измерением и отдельными клиническими признаками, имеющимися в распоряжении пользователей на основе их уровня доступа к данным. Перестройка вертикальной (клинической пробы) необходима как в клинических так и в геномных тепловых картах, и может быть выполнена одновременной сортировкой на основе численно закодированных клинических функций или совокупности признаков.
Например, когда глиобластомные данные отсортированы на опухоли сравнения, то существует очевидная разница между генами, содержащими эти два типа образца и «нормальными образцами», отображающими какое-либо крупное нарушение, которое характеризуется большим количеством копий опухолей.
Ограничение визуализации последовательности данных в основе координат взаимодействие между двумя местоположениями генома. Кроме того, глобластные тенденции в геномах лучше оценивать в контексте возможностей, которых нет на геномной карте.
Одним из последних примеров является УСКА Геномный браузер рака, в котором геномные данные отображаются в контексте биологического направления.
Организовуются размещение данных в наборе генов в соответствии с индивидуальными направлениями в отличии от местоположения хромосом, пользователи могут получать более надежную и биологически значимую информацию о геномных данных через гены, которые могут действовать согласованно.
Андерс и его коллеги обеспечили другой подход, в котором геномные данные организованы по кривой Гильберта, что обеспечивает глобальный обзор. В будущем, существует огромный потенциал в освоении новых способов лучшего ориентирования геномных пейзажей.
Проблемы
Некоторые ключевые проблемы в области генного анализа данных, появились в последние годы, в том числе и вопросы: объемы данных, тип данных и представления данных. Несколько новых геномных браузеров, которые были, упомянуты выше, решают некоторые из этих вопросов, однако согласованности пока недостигнуто. Кроме того, важно то, что новые геномные браузеры построены с помощью успешных инструментов, включая легкий доступ кросс платформенных данных и отображения настройки и возможности выполнять мгновенные вычисления и визуализацию.
Геномные Браузеры начинают взаимодействовать с конфиденциальной информацией, так как общество осознает проблемы защиты данных. Личная информация, закодированная в геномном ДНК, клинические параметры, а также другая информация личного характера требует тщательной защиты.
Геномным обозревателем могут воспользоваться многие системы безопасности, разработанные для электронной информации с целью обеспечения доступа только для авторизованных исследователей.
Кроме того, эти средства способны максимизировать служебные программы, обеспечивая конфиденциальность данных, представляя в их анонимной форме, например, в виде совокупности или суммарности, не допуская при этом извлечения личной информации от таких агрегатов.
Сравнения геномов
Последнее наличие большого числа полностью секвенированных геномов их ассамблея стимулировала активные исследования в области сравнительной геномики. Это включает разработку алгоритмов и средств для парного и множественного выравнивания очень длинных геномных промежутков и полных геномов. Среди целей этой работы были выявлены такие функциональные элементы, 1)такие как экзоны или усиливающие агенты 2)исследование крупномасштабных перестроек и эволюции индивидуальных геномов и их ссылок в ходе ассемблирования и завершения. Визуализация согласованных данных является критически важной для каждой из этих целей, но является сложной задачей из-за графических трудностей выявления взаимосвязи интересующих хромосом в разных геномах на многократно повторяющихся шкалах. В этом разделе мы рассмотрим различные методы, которые будут разработаны для того, чтобы помочь исследователям в направлении последовательностей между двумя и более геномами.
Расчет геномного выравнивания и синтении
Существуют различные методы для парных и множественных генных выравниваний, например, BLASTZ50, MULTIZ51,Shuffle – LAGAN52 «Меркатор» и MAID53, Mauve и несколько симметричных выравниваний. Все эти методы обьеденены общим принципом нахождением наиболее близких геномных интервалов (якорей), расширение этих регионов, цепочек группировок, которые граничат между собой и анализ реконструкций.
После выравнивания следующий шаг заключается в том, чтобы найти сохраненные сигналы, которые могут указывать на потенциально функциональные области. Методы расчета коротких сигналов сохранены в области простого окна похожего на PipMaker и Vista, филогенетически скрывающие модели Маркова Phastcons57,58 и другие статистические модели Gamby59. Расчет сохраняющихся синтений, означает сохранение хромосом, которые расположены в нескольких генах, основанные на анализе ДНК либо на выравнивании или двунаправленном сравнении ортологичных генов с интервалом в 2 гена. Эволюционное значение синтении вытекает из предположения, что точный порядок генов в хромосоме идет от общего предка.
Визуализация выравнивания необходима для разработки способов решения различных аналитических задач. Графическое представление о синтении на уровне всего генома имеет решающее значение для изучения эволюции генома. Кроме того, важным является возможность «развернуть» для глобального представления о синтении и для изучения конкретных областей сохраненных генов в контексте аннотации. В добавок, собрание геномов и аннотация их модели может быть представлена путем сравнения положения неизвестного гена и его гомологической последовательности из одного организма в другой, который имеет готовые или хорошо аннотированные последовательности генома.
Ниже мы опишем методы визуализации, которые используются для отображения синтении на микро и макро уровнях (таб.3).
Визуализация геномного выравнивания
Широкие спектры стратегии были изучены для графического синтении на уровне целого генома. Двумерные точечные графики, которые традиционно используются при анализе локального выравнивания, увидели современное возрождение в качестве мощного способа визуализации более доступного геномного выравнивания(DaGChainer, Vista-DotMUMmer62,GenomeMatcher и другие).
Геномы этих двух организмов представлены по осям х и у графика, с указанием линий сетки хромосомных границ. Точки на графике указывают на некоторую степень выравнивания, образуя 45 градусные линии на отдельном месте.
Геном реконструкции и дублирования сразу опознает их как, соответственно вне диагонали и идентифицирует линии как горизонтально так и вертикально сложенные. Dag- первое общедоступное средство для создания графиков, рассчитывает синтении на основе мета-выравнивании генов в родственных BLAST сочетаниях между двумя организмами.
Vista – диаграммы предложили точечный графический режим для просмотра синтении на основе геномного ДНК выравнивания (доп.рис.1). Эти средства имеют интерактивные карты типа Google интерфейса, позволяющие пользователям масштабировать и паномировать в пределах областей, а также на ссылку из соответствующего сегмента для просмотра в Vista или в геномном JGI браузере.
Точечные графики являются полезными не только при анализе синтении между готовыми геномами, но и геномной обработки. Например, OSLAY средство, которое автоматизирует все более распространенные методы использования точечных графиков и приводит коллекцию наборов генов из незавершенного ассемблирования с эталонной сборкой, и тем самым карту целого генома.
Глобальное сохранение может быть визуализировано и представлено ссылкой генома с использованием таблеточной формы идеограмм хромосом и ленточных для обозначения областей приведенных в соответствии, с каким либо геном. Группы имеют цветовую маркировку для обозначения хромосом в соответствии с геном, с которым они сравниваются.
Идеограмма представленных геномов выравнивания является самым предпочтительным выбором для индивидуального генерирования данных в публикациях новой последовательности геномов.
Три варианта являются доступными для автоматической генерации вариантов этой визуализации для определенных пользователей геномной информации:Cinteny,Apollo, « Градиент изображения» Сибилла использует инновационные визуализации, в которых гены отображаются по цвету по геномным ссылкам, эти цвета используются для обозначения гомологичных мест в наборе унифицированных геномов.
VISTA синтении изображения (доп.рис.2) используют основную идеограмму, которая описывает выравнивание родственных генома в качестве направляющего средства отбора хромосом в организме, в ссылках рассмотрено более детально. По сравнению с точечными графиками представление синтении с помощью диаграммы способствует утере информации о местонахождении унифицированных областей для сравнения геномов. Тем не менее, использование цветов в этих диаграммах способствует возможности с легкостью представлять себе, геном и сравнивать его с другими.
Кроме того, цветные сегменты в информационно-справочном геноме могут быть связаны с какими-то конкретными положениями хромосом и линии рисуются более мелкие по сравнению с хромосомными символами в организмах. Этот подход используется в «Apollo», а также в PhiGs веб сайте, который позволяет пользователям создавать синтении карт из 45 последовательностей грибов и многоклеточных.
Альтернативный эстетический подход к геномным изображениям пред