Методы поиска повторов в последовательностях ДНК

РефератПомощь в написанииУзнать стоимостьмоей работы

Повторенная ДНК состоит из нуклеотидных последовательностей различной длины и состава, которые встречаются в геноме несколько раз либо в тандемно-повторенном, либо в диспергированном виде. Последовательности ДНК, которые не повторяются, называются уникальной ДНК (single-copy DNA). Размер части генома, занятой повторяющимися последовательностями, широко варьирует между таксонами. У дрожжей… Читать ещё >

Методы поиска повторов в последовательностях ДНК (реферат, курсовая, диплом, контрольная)

Геном эукариот характеризуется двумя основными особенностями: повторенность нуклеотидных последовательностей; разделением по составу на различные фрагменты, характеризуемые специфическим содержанием нуклеотидов.

Для поиска повторов используются различные методы, которые можно разделить на несколько групп. Первые 3 группы решают задачу, когда максимум что известно про повторы — примерная длина и степень дивергенции.

1. Точные методы. В эту группу включены методы, которые гарантируют обнаружение всех специфицированных повторов.
2. Приближенные, в том числе эвристические методы строятся с целью убыстрения точных методов.
3. Методы, использующие статистические особенности последовательности, например, методы сжатия, фурье-трансформации, байесовский подход. Однако эти методы работают только на протяженных кластерах сравнительно коротких повторов.
4. Поиск по образцу. Эта группа отличается тем, что прототип повтора известен заранее. Образец может быть представлен одиночной последовательностью, консенсусом, консенсусной матрицей или более сложной моделью. Например, многие известные повторы собраны в БД (база данных) RepBase (http://www.girinst.org/~server/repbase.html). В случае короткого повтора, когда внутренние делеции-вставки маловероятны, для поиска используется простое сканирование последовательности заданной моделью. В случае длинного прототипа используются методы поиска выравнивания прототипа с исследуемой последовательностью [6].

Поиск гомологии в БД нуклеотидных последовательностей

Поиск гомологии в БД нуклеотидных последовательностей необходим при решении самых разных задач, например:

ь предсказание функций неизвестных генов;

ь сравнительное изучение структурно-функциональных особенностей целых геномов, их частей, а также их эволюции.

ь Предсказание экзон-интронной структуры генов;

ь Стыковка и проверка секвенированных фрагментах в проектах по секвенированию. Несмотря на то, что имеются эффективные методы и алгоритмы сравнения пары нуклеотидных последовательностей, они недостаточно быстры, чтобы выполнить сравнение между заданной последовательностью и всеми последовательностями БД ввиду большого объема последней. Для поиска гомологии по БД часто применяют методы фильтрации, а именно для пары последовательностей предварительно вычисляют некоторую величину, которая могла бы отбросить заведомо негомологичные пары. Для оставшихся пар уже можно было бы выполнить сравнение с помощью какого-либо детального метода [7].

Показать весь текст

Заполнить форму текущей работой

Другие работы

Понятия технологии программирования и программного продукта

Главное различие между технологией программирования и программной инженерией как дисциплинами для изучения заключается в способе рассмотрения и систематизации материала. В технологии программирования акцент делается на изучении процессов разработки ПС (технологических процессов) и порядке их прохождения методы и инструментальные средства разработки ПС используются в этих процессах (их применение…

Реферат

Подробнее...

Контроль технического состояния средств вычислительной техники и компьютерных сетей

Техническое состояние компьютерных сетей. Во всех кабинетах АН «Мегаполис» имеется своя локальная сеть, а также сеть Интернет. Многие отделы предприятия имеют свою отдельную рабочую группу техников, что облегчает обслуживание маленьких отделов. За состоянием сетей во всех корпусах следит ОКС — отдел компьютерных сетей. В данный момент состояние сетей находится в отличном состоянии, практически…

Реферат

Подробнее...

Типы данных. Анализ понятия базы данных

Значения календарной даты по умолчанию отображаются в Американском формате ММ/ЧЧ/ГГ (ММ-месяц, ЧЧ-число, ГГ-год). Длина этого поля установлена автоматически и равна 8. Данные логического типа имеют значения ДА (YES) и НЕТ (NO). Длина поля ЧИСЛОВОГО типа равна количеству десятичных разрядов числа, умещающегося в поле, включая знак числа, десятичную точку, целую и дробную часть. Например, если…

Реферат

Подробнее...

Введение. Использование Adobe Photoshop для разработки веб-сайтов

В данной курсовой работе содержится также приложение, а именно разработка собственной небольшой Web-странички с помощью HTML-редактора DreamWeaver. Цель: Рассмотреть возможности визуального редактора DreamWeaver. Для достижения этой цели были поставлены следующие задачи: Рассмотреть средства создания Web-страниц, которые предшествовали и являлись предпосылками возникновения DreamWeaver…

Реферат

Подробнее...

Выбор варианта создания ЛВС

Центр «Мария» расположен в 2-х этажном здании по адресу г. Тюмень, ул. Ермака, 1-А. В данном здании проведена полная реконструкция. Требуется создать локальной вычислительную сеть (ЛВС), IP-телефонию с указанием информации обо всех компонентах, системах, подсистемах, сетевых и системных сервисах, системном программном обеспечении, входящих в состав ЛВС и выполняющих определенные функции…

Реферат

Подробнее...

Выбор модема. Возможности сети Интернет

Модемы бывают внешние и внутренние. И первые, и вторые делятся в свою очередь на полуфункциональные аппаратные модемы и программные модемы. На отечественном рынке чаще всего встречаются полуфункциональные внешние модемы и программные внутренние. Подавляющее большинство внешних модемов оснащено отдельными процессорами, позволяющими им самостоятельно выполнять поставленными перед ними задачи, так…

Реферат

Подробнее...

Программное обеспечение. Развитие Интернета

Программные ресурсы Сети представлены программами, функционирующими в составе сетевого оборудования. Работу пользователя в Сети обслуживают тысячи программ, работающих на тех компьютерах, через которые проходят запросы пользователя к поставщикам информации. Все эти программы кому-то принадлежат по праву собственности (их производителям) и по праву на их использование (тем, у кого они установлены.

Реферат

Подробнее...

Метаонтология грануляции информации

Где X — область рассуждений; C — множество требований к выбору метода грануляции M — множество формальных методов грануляции; G — семейство информационных гранул; T — множество переходов между уровнями грануляции (преобразований гранул). Когда говорят о метаонтологии, речь идет непосредственно об используемом классе моделей (языке) представления информации и знаний, например, семантические сети…

Реферат

Подробнее...

Достоинства и недостатки эволюционных вычислений

Результаты сравнительного анализа известных форм эволюционных алгоритмов показывают определенные методологические различия между ними. Эти различия касаются формы представления целевой функции и альтернативных решений, операторов рекомбинации, мутации и вероятностей их использования, стратегии селективного отбора и методов повышения эффективности эволюционных вычислений путем адаптации. Решающим…

Реферат

Подробнее...

Интегрированные АИС. Классификация информационных систем

По характеру использования информации Информационно-поисковые системы (ИПС) ориентированны на решение задач поиска информации, документа или факта в некотором множестве источников. Содержательная обработка информации в таких системах отсутствует. В таких системах хранится информационный массив, из которого по требованиям пользователей выдается нужная информация. Поиск информации по требованию…

Реферат

Подробнее...

Технологии обработки текстовой информации

В данном реферате приведены наиболее распространенные или ставшие стандартом в ряде учреждений и организаций редакторы. В данной работе достаточно подробно рассмотрены шесть текстовых редакторов: Лексикон, WordPad, Microsoft Word, Word Perfect, Notepad++, Microsoft Word 2003 а также пользовательский интерфейс Microsoft Word 2010. Цель работы изучая набор функций, возможностей выбранных текстовых…

Реферат

Подробнее...

Анализ современного рынка микропроцессорных информационно-управляющих систем

В классе «тяжелых», традиционно популярных в России контроллеров, востребованы резервированные структуры с развитой диагностикой и мощные процессоры, снимающие ограничения на масштаб проекта и сложность технологических алгоритмов. Наличие у фирмы поставщика широкой линейки PLC различных классов (от Micro до Large) с единой системой программирования. Такой подход дает проектировщику АСУТП…

Реферат

Подробнее...

Типы интерфейсов. Использование общих типов при описании интерфейсов и делегатов на примерах задач поиска в массивах

Делегаты очень удобны, когда требуется обеспечить одну сущность возможностью перенаправлять вызов другой сущности и образовывать основу для архитектуры обработки событий.NET. Делегаты обладают внутренней поддержкой для групповой адресации (т.е. пересылки запроса сразу множеству получателей) и асинхронного вызова методов (т.е. вызова методов во вторичном потоке). Делегаты (delegate…

Реферат

Подробнее...

Разработка требований к разрабатываемой системе

Программа должна содержать подробную инструкцию для пользователя на русском языке; Программа должна иметь образовательную значимость и помогать в процессе обучения; Из главного меню приложения можно выбрать по нажатию кнопки режим работы; Пользователь устанавливает программу на устройство под управлением Android; Программа должна стабильно работать и не содержать багов / ошибок; Программа должна…

Реферат

Подробнее...