Notice: Function _load_textdomain_just_in_time was called incorrectly. Translation loading for the cyrlitera domain was triggered too early. This is usually an indicator for some code in the plugin or theme running too early. Translations should be loaded at the init action or later. Please see Debugging in WordPress for more information. (This message was added in version 6.7.0.) in /var/www/html/wp-includes/functions.php on line 6114 Notice: Function _load_textdomain_just_in_time was called incorrectly. Translation loading for the easy-watermark domain was triggered too early. This is usually an indicator for some code in the plugin or theme running too early. Translations should be loaded at the init action or later. Please see Debugging in WordPress for more information. (This message was added in version 6.7.0.) in /var/www/html/wp-includes/functions.php on line 6114 Notice: Function _load_textdomain_just_in_time was called incorrectly. Translation loading for the all-in-one-wp-security-and-firewall domain was triggered too early. This is usually an indicator for some code in the plugin or theme running too early. Translations should be loaded at the init action or later. Please see Debugging in WordPress for more information. (This message was added in version 6.7.0.) in /var/www/html/wp-includes/functions.php on line 6114 Warning: Cannot modify header information - headers already sent by (output started at /var/www/html/wp-includes/functions.php:6114) in /var/www/html/wp-content/plugins/all-in-one-wp-security-and-firewall/classes/wp-security-utility.php on line 216 Биоинформатика — Umschool
Предметы

Биоинформатика

  • Кто может работать биоинформатиком?
  • Как современная молекулярная биология справляется с огромными массивами данных?
  • Как нейросети помогают развитию биологической науки? 

Зачем нужна биоинформатика?

Чтобы разобраться с целями и задачами этой новой и для многих таинственной науки, в первую очередь нужно понимать, что биоинформатика является прикладной дисциплиной – своеобразным помощником молекулярной биологии. При этом молекулярная биология сейчас – это один из самых бурно развивающихся разделов биологии, поэтому чуть ли не каждый год у него появляются новые «помощники»: молекулярная филогенетика, эпигенетика, этногенетика, био- и нанобиотехнология… 

Перечислять все эти прикладные науки можно еще очень долго, но все они крутятся вокруг молекулярных механизмов хранения, передачи и реализации наследственных признаков – именно этим занимается молекулярная биология. Таким образом, одним из главных объектов исследования молекулярных биологов становится ДНК – генетический код организма, в котором «записаны» все положенные ему признаки. Если ты не уверен, что хорошо знаком с генетическим кодом и особенностями строения ДНК, то советую сначала ознакомиться со статьей, посвященной нуклеиновым кислотам. Ну а если ты уже постиг азы молекулярной биологии, то давай вспомним, из чего состоит эта молекула:

Первичная структура ДНК представлена двойной спиралью, состоящей из мономеров – нуклеотидов. Именно нуклеотидная последовательность определяет, какие аминокислоты будут входить в состав определенного белка. Мы называем шифр из нуклеотидов «генетическим кодом». Можно представить, что каждый отдельный нуклеотид является буквой, которая в сочетании с другими буквами-соседками превращается в конкретное слово. Например, последовательность букв «ТАЦ» на матричной ДНК читается в пептидной последовательности как аминокислота «метионин». Полный «алфавит» аминокислот можно найти в таблице генетического кода – обрати внимание, здесь очень много всевозможных сочетаний.

Итак, мы разобрались, что при желании можем читать генетический код, как открытую книгу, главное – быть знакомым с особым алфавитом. Но, к сожалению, эта открытая книга содержит много глав, разделов и страниц… Например, если мы захотим полностью прочитать геном человека, то нам придется проанализировать более 3 миллиардов пар нуклеотидов… Для сравнения, количество символов во всех четырех томах всемирно известного произведения Л.Н. Толстого «Война и мир» равно всего лишь 2 966 547… По этой причине прочтение и анализ нуклеотидных последовательностей – дело трудоемкое и очень длительное. Настолько, что прочтение генома только одного человека в рамках международной программы «Геном человека» заняло у молекулярных биологов и генетиков из 18 (!) стран мира заняло целых 15 лет!

А ведь у каждого человека есть свои индивидуальные особенности, также закодированные в ДНК. Да и человеческий геном является не единственным объектом исследования молекулярной биологии. Для полного понимания причин возникновения различий между организмами в идеале человечеству необходимо исследовать геномы множества живых организмов, одновременно сравнивая их между собой. Если проводить такое сравнение «по буквам» вручную, то исследование будет продолжаться долгие годы. Таким образом, уже обработанные данные рискуют потерять свою актуальность за то время, пока исследователи их проанализируют. 

Например, для создания рекомбинантной вакцины  от нового вируса ученым необходимо знать последовательность нуклеотидов в его ДНК сейчас, а не через 3 года, когда вирус уже мутирует и распространится по планете. В такой ситуации потраченное время – это не только деньги, но и человеческие жизни… Разумеется, мы никак не можем позволить себе медлить в таких важных вопросах. Поэтому современные ученые активно применяют IT-технологии в обработке биологических данных. И постепенно вспомогательный инструмент молекулярной биологии становится отдельно существующей наукой, которая ускоряет работу биологов в десятки, а то и сотни раз!

Биоинформатика – наука, изучающая методы обработки больших объемов биологических данных с использованием информационных технологий.

А если сказать еще проще, то биология + информатика = биоинформатика. На данный момент биоинформатика является самостоятельной специальностью, которой обучают во многих ВУЗах по всему миру – настолько сильно эта область деятельности отличается от классической биологии и информатике. А чтобы стать биоинформатиком, нужно хорошо знать молекулярную биологию и отлично разбираться в особых пакетах программ, которые зачастую сильно отличаются от используемых в других областях информатики.

Чем занимаются биоинформатики?

1. Выравнивание последовательностей

Итак, в прошлой главе мы разобрались, что основным направлением биоинформатики является обработка и сравнение нуклеотидных последовательностей ДНК и РНК различных организмов. А добиваются этого биоинформатики с помощью выравнивания последовательностей. Главная задача выравнивания – расположить секвенированные («прочитанные») фрагменты ДНК друг под другом так, чтобы можно было легко заметить отличия между ДНК двух (парное выравнивание) или более организмов (множественное выравнивание). Грубо говоря, в лаборатории мы нарезаем ДНК на множество коротких читаемых кусочков, которые потом пытаемся выложить в этакую мозаику из ленточек и сравнить с подобными другими такими «мозаиками».

Стоит помнить, что анализируемые фрагменты очень длинные, и выравнивание последовательностей – не такая простая задача, как может показаться на первый взгляд. Для выполнения ее в различных ситуациях необходимо использовать разные пакеты программ, «заточенные» под определенную задачу. Наиболее распространенных способа выравнивания всего 3:

  1. Глобальное выравнивание используется тогда, когда нам нужно сравнить заведомо эволюционно близкие последовательности. Например, фрагменты ДНК, кодирующие один и тот же белок (допустим, инсулин) у двух млекопитающих: кота и мыши. 
  2. Локальное выравнивание применяют в случае, если к нам попала неизвестная ДНК, которая могла принадлежать разным организмам. Для этого биоинформатики используют сравнение анализируемой последовательности с уже прочитанными генами, информация о которых хранится в базах данных. Такой метод хорошо подходит для работы с «ДНК окружающей среды», взятой, допустим, из какого-то водоема. Локальное выравнивание поможет узнать, какие виды зоопланктона водятся в этом биотопе. Работа программ, нацеленных на локальное выравнивание, чем-то похоже на Google для биоинформатика: мы вводим нужные данные в поисковую строку и ждем, пока программа найдет похожие последовательности в базе данных.
  3. Выравнивание на референсный геном. Референс – это стандартный вид генома изучаемого организма, который присутствует в базе данных как образец генома того или иного вида. Мы можем сравнить геном организма того же вида с референсом, чтобы узнать, какие фрагменты консервативны – практически никогда не изменяются (а значит, кодируют какие-то важные для организма свойства), а какие – вариабельны (не кодируют очень важные белки и могут меняться без потерь для организма).

Рассмотрим пример работы биоинформатиков с выравниванием. Картинка ниже взята из реального исследования аминокислотных последовательностей близкородственных вирусов. Цель – понять, какие участки у этих вирусов могут быть измененными, а какие – нет. Если участок вариабелен, то скорее всего мутация в этих генах не смертельна для организма. А вот если консервативен, то наверняка он представлен жизненно важными генами для всего семейства вирусов – именно по этим генам нужно «бить», чтобы уничтожить вирус. Полученные данные можно впоследствии использовать для разработки новых противовирусных препаратов.

Консервативные участки генома рассматриваются учеными как «ошибка выжившего», хорошо описанная ранее на примере опасных повреждений самолета. Если самолет получил критичные для дальнейшего движения повреждения, то он не сможет дальше летать – соответственно, на базу смогут вернуться только самолеты с незначительными повреждениями.
Так же и в молекулярной биологии – вариабельные участки генома изменяются организмом хаотично, и никто от этого не умирает. В то время как мутация в жизненно важных консервативных участках ДНК провоцирует гибель биологического объекта, и такой организм просто не попадает на глаза исследователю.

2. Аннотация геномов

Помимо сравнения геномов различных организмов, биоинформатика берет на себя еще одну сложную задачу – аннотацию геномов. В ходе аннотации геномов выясняются более деликатные подробности его функционирования: какие гены являются структурными, а какие – нет, в какой хромосоме расположены изучаемые последовательности, какие из них принимают участие в регуляции экспрессии генов и так далее. Таким образом, в ходе аннотации геномов мы получаем детальные сведения о структуре и функциях изучаемой ДНК, поэтому аннотация генома может быть структурной или функциональной: 

1. Структурная аннотация «размечает» геном на разные участки, например, кодирующие (экзоны) и некодирующие (интроны) белок. 

2. Функциональная же аннотация необходима для определения функций гена, с ее помощью можно узнать, в какой части клетки будет работать определенный белок и для чего конкретно он нужен. 

3. Упаковка генома и молекулярное моделирование

Важно понимать, что далеко не все свойства, закодированные в ДНК, будут проявляться у организма. Существуют особые механизмы эпигенетики, которые могут остановить синтез белка или, наоборот, запустить работу определенного гена. Одним из таких механизмов является модификация белков-гистонов, которые упаковывают наш геном в более компактную структуру. Упакованная на гистоны ДНК не доступна для считывания с нее информации (как, например, недоступны для поедания запакованные продукты, купленные на Новый год, до 31 числа декабря).

Модифицированные (поврежденные) гистоны, наоборот, способствуют распаковке и разблокировке какого-либо прежде недоступного участка генома. А ведь гены, находящиеся на таких участках могут отвечать за наследование каких-то заболеваний… Поэтому современным ученым необходимо представлять, каким конкретно образом упакован тот или иной геном. И в этом им тоже помогают инновационные технологии и биоинформатика! Компьютерная графика помогает предсказать, как будет осуществляться упаковка ДНК у близких видов и не только. Помимо укладки хроматина таким же образом можно исследовать пространственную структуру белков и создавать их 3D-модели. На картинке ниже Вы можете увидеть, как выглядит работа одного из последних прорывов биоинформатики – нейросети, создающей и предсказывающей возможные модели еще не исследованных белков и даже целых белковых комплексов! С помощью таких моделей можно гораздо быстрее изучать белки, которые выполняют множество функций в живом организме. 

И все перечисленное выше – вовсе не предел возможностей и направлений работы биоинформатики! Тем не менее чем бы ни занимались отдельные биоинформатики, они все так или иначе решают биологические проблемы. С этой точки зрения биоинформатик — это тоже биолог. Только для работы они используют другие инструменты: вместо пипетки и реактивов у них под рукой клавиатура и прочая вычислительная техника. 

Биоинформатиком может стать кто угодно – в эту область приходят люди самой разной специализации: биологи, программисты, физики и многие другие. Каждый способен найти что-то себе по душе и привнести новый подход. Работая вместе с биологами из лабораторий, можно найти ответы на многие важные вопросы и внести свой вклад в развитие наук о жизни.

Фактчек

1. Биоинформатика – наука, изучающая методы обработки больших объемов биологических данных с использованием информационных технологий.

2. Биоинформатика является прикладной дисциплиной молекулярной биологии.

3. Основные объекты исследования биоинформатики: последовательности ДНК, РНК, аминокислот в белках.

4. К направлениям работы биоинформатиков относятся сборка и аннотация геномов, выравнивание последовательностей и изучение пространственной структуры биополимеров.

Проверь себя

Задание 1
Из перечисленного ниже перечня выберите объект исследования биоинформатики:

1. геном кишечной палочки
2. строение проводящих тканей растения
3. строение желудочно-кишечного тракта
4. работа проводящей системы сердца

Задание 2
Выберите основную задачу биоинформатики:

1. разработка новых методов селекции животных
2. обработка больших массивов данных в короткие сроки
3. изучение алгоритмов посадки растений
4. разработка роботов на основе биологических систем

Задание 3
Выберите два верных ответа из пяти. Какие методы работы с биологическим материалом используются в биоинформатике?

1. культура клеток и тканей
2. рентгеноструктурный анализ
3. выравнивание последовательностей
4. аннотация геномов
5. прививка культурных растений

Ответы: 1)1; 2)2; 3)34

Понравилась статья? Оцени:
Звёзд: 1Звёзд: 2Звёзд: 3Звёзд: 4Звёзд: 5
Загрузка...
Полезный материал? Поделись им со своими друзьями, пусть они тоже почитают
Я нашёл ошибку Если вы обнаружили ошибку, свяжитесь с нами с помощью короткой формы обратной связи
О чем эта статья: