Основы биоинформатики - Огурцов А.Н. 2013

Введение

Понятие "информация" проникает во все сферы деятельности человека, объединяя их в единый взаимосвязанный и взаимозависимый комплекс. Относительно недавно появился даже термин "инфосфера" - информационные структуры, системы и процессы в науке, обществе и производстве. Вместе с тем до сих пор отсутствует единая точка зрения на предмет информатики, и до сих пор не вполне ясны соотношения между различными информационными дисциплинами, связанными с различными предметными областями.

Интуитивно ясно, что биоинформатика нацелена на использование информации и информационных технологий при исследовании биологических систем. В биоинформатике биология, информатика и математика сливаются в единую дисциплину. В каком-то смысле биоинформатика, изучающая применение информационных технологий для управления биологическими данными, является продолжением вычислительной биологии, изучающей применение методов количественного анализа в моделировании биологических систем.

Интенсивность исследования геномов различных организмов с каждым годом нарастает, ежегодно появляются новые базы данных, в которых хранится информация об исследованных геномах, а уже существующие базы данных непрерывно наращивают свои мощности. Следовательно, с такой же огромной скоростью растёт и объём доступной исследователям биологической информации. Без использования современных информационных технологий уже невозможно ни отыскать, ни обработать ту конкретную биологическую информацию, которая необходима в данном исследовании или в данном биотехнологическом процессе.

В широком смысле биотехнология означает любое производство коммерческих продуктов, образуемых микроорганизмами в результате их жизнедеятельности. Более формально биотехнология определяется как применение научных, инженерных и информационных принципов к переработке материалов живыми организмами с целью создания товаров и услуг.

Успех любой современной биотехнологии - от промышленной, экологической и сельскохозяйственной до фармацевтической и молекулярной - напрямую определяется как эффективностью использования и управления биологической информацией, содержащейся в организмах- продуцентах, так и генерацией новой биологической информации для генетической модификации этих организмов, с целью получения новых, необходимых в конкретном производстве биотехнологических продуктов.

Целью информационной биотехнологии вообще и фармакоинформатики как частного применения информационной биотехнологии для открытия и разработки лекарственных препаратов, является использование существующих и разработка новых компьютерных и информационных ресурсов для анализа и интерпретации биологических данных различного типа (последовательностей ДНК, РНК и белков, пространственных структур РНК и белков, профилей экспрессии, метаболических путей и др.) с целью разработки новых биотехнологических продуктов.

Задачи информационной биотехнологии и фармакоинформатики органично связаны с этапами разработки новых продуктов:

1) анализ организации и эволюции геномов, что является предметом геноинформатики;

2) расшифровка, предсказание структуры и проектирование необходимых белков и белковых комплексов;

3) выяснение механизмов действия биологически активных веществ в цепи ген — белок - функция и использование полученной информации как для разработки новых биотехнологий, так и для создания лекарственных препаратов.

Успех в решении этих задач определяется эффективным и комплементарным использованием, наряду с биоинформационными подходами, также и методов таких наук, как геномика (структурная, функциональная, сравнительная, медицинская и т. д.), протеомика (выразительная, цитографическая, структурная, функциональная и т. д.), компьютерная фармакология и токсикология, комбинаторная химия, методики высокопроизводительных отборочных испытаний.

Триединая цель биоинформатики включает в себя:

1) организацию и сохранение биологических данных;

2) разработку программных средств и создание специализированных информационных ресурсов;

3) автоматизацию анализа биологических данных, интерпретацию и использование полученных результатов.

Таким образом, биоинформатика - это наука о хранении, извлечении, организации, анализе, интерпретации и использовании биологической информации.

Современная биоинформатика возникла в конце семидесятых годов двадцатого века одновременно с появлением эффективных методов расшифровки нуклеотидных последовательностей ДНК.

Датой выделения биоинформатики в отдельную научную область можно считать 1980 год, когда началось издание журнала Nucleic Acids Research, целиком посвящённого компьютерным методам анализа последовательностей (см. [1], п. 1.2). Очевидно, не случайно 1980 год считается и годом рождения и молекулярной биотехнологии - 15 октября 1980 г. на Нью-Йоркской фондовой бирже стоимость одной акции биотехнологической компании Genentech, которая первой организовала производство рекомбинантного инсулина человека с помощью Escherichia coli. поднялась с 35 до 89 долларов - это событие принято считать началом биотехнологической революции (см. [4], п. 1.1), в результате чего биотехнология вместе с информационными технологиями и нанотехнологией составили "технологическую триаду" цивилизационного развития человечества в XXI веке (см. [5], разд. 1).

Важной вехой в становлении и развитии биоинформатики стал проект по секвенированию генома человека. Именно с этого времени биоинформатика перестала быть только вспомогательным инструментом. Переход к обработке, анализу и сравнению полных геномов организмов был невозможен без использования компьютерных методов информационного анализа, в результате эти исследования оформились в самостоятельное научное направление. Геномы содержат огромное количество генов, многие из которых до настоящего времени не идентифицированы экспериментально.

Поскольку технологии чтения генетической информации невозможны без использования компьютерной техники и вычислительных методов, то возникновение и интенсивное развитие биоинформатики происходило синхронно с возникновением и повсеместным распространением компьютерных технологий. Это является лишним подтверждением того факта, что глубина научного знания чрезвычайно сильно зависит от технических возможностей.

Другой важнейшей вехой в развитии биоинформатики стало возникновение всемирной сети Интернет и повсеместное распространение интернет-технологий. Сегодня уже нет необходимости разрабатывать программные продукты в каждой исследовательской лаборатории, поскольку большое число разнообразных баз данных и программных инструментов сегодня доступны через Интернет. Биоинформатика, пожалуй, является одной из тех областей науки, которые в очень большой степени зависимы от Интернета и успешно развиваются благодаря Интернету. Именно очень важное для биологии и медицины политическое решение об открытости сложнейшего биологического текста современности - генома человека - сделало эту информацию по-настоящему доступной для учёных всего мира лишь благодаря Интернету.

Сегодня мы находимся на начальном этапе использования генетической информации о живой материи, однако развитие всё более эффективных методов расшифровки биологических текстов и разработка методов биоинформатики позволяет надеяться на серьёзный прогресс в понимании строения, механизмов функционирования и регуляции живых систем. В результате становится возможным изучение и понимание всё более сложных биологических систем, появляется возможность их системного исследования, установления эволюционных связей в живой природе, создания новых лекарственных препаратов, методов лечения и новых биотехнологий.

Предметом учебных дисциплин "Биоинформатика и информационная биотехнология" и "Биоинформатика и фармакоинформатика" являются компьютерно-ориентированные методы решения информационных задач в области промышленной и фармацевтической биотехнологий. Научную основу курсов составляют молекулярная биофизика, молекулярная биология и общая и молекулярная генетика.

Методическими основами курса являются лекции, в которых излагаются основные положения каждого раздела, практические занятия и самостоятельная работа студентов, являющаяся основным способом усвоения материала в свободное от аудиторных занятий время.

Для самостоятельной работы выделяется больше половины общего объёма времени, предназначенного для изучения данной дисциплины. Самостоятельная работа проводится по всем темам, входящим в дисциплину. В процессе самостоятельной работы студент учится самостоятельно приобретать знания, которые затем используются в ходе выполнения индивидуального задания, практических занятий, при подготовке к выполнению контрольных работ и к экзамену.

Настоящее пособие подготовлено на основе исправленных и дополненных пособий [1-3] и адаптированных работ [4-67], послуживших также источником иллюстраций, таким образом, чтобы максимально облегчить усвоение курсов "Биоинформатика и информационная биотехнология" и "Биоинформатика и фармакоинформатика" студентам направления подготовки "Биотехнология".