Home > Научные статьи > Библиометрия биоинформатики

Библиометрия биоинформатики

Получать обновления Научного блога:

Любецкая А.В.

К настоящему времени уже опубликовано много статьей по биоинформатике, поэтому стало возможным рассматривать закономерности в развитии различных направлений этой науки и пытаться выделить наиболее перспективные среди них.

Для проведения нашего исследования составлена база биоинформатических статей, опубликованных до 1 января 2007 года, на основе информации, размещенной в базе данных PubMed. Для отбора статей использовались следующие критерии.

Биоинформатическим считается журнал, который содержит в своем названии слово «биоинформатика». В качестве биоинформатика рассматривается автор, который хотя бы один раз публиковался в биоинформатическом журнале. Статья относится к числу биоинформатических, если она опубликована в биоинформатическом журнале или имеет не менее двух авторов-биоинформатиков; и имеет хотя бы один биоинформатический MeSH-термин, характеризующий содержание статьи, в ее ASN.1 описании.

Формирование биоинформатической базы данных и ее статистический анализ выполнялись средствами языков программирования Perl и Java.

Изучались следующие характеристики статей: авторы статьи, дата публикации, журнал, в котором опубликована статья, и MeSH-термины. Анализ проводился сначала по каждой характеристике в отдельности и затем по их сочетаниям.

В результате получены распределения, показывающие наиболее распространенное количество статей у авторов, количество авторов в статьях, соотношение количества авторов-биоинформатиков ко всем авторам статьи. Выяснены закономерности для кластеров соавторства, в частности, для всех пар соавторов из нашей базы данных статей. Например, примерно 10% публикаций написано коллективами из 5 человек, среди которых только два автора-биоинформатика.

Вычислялись частоты встречаемости MeSH-терминов в разные годы, и выбор авторами темы статьи в зависимости от даты публикации. Например, термины: «информация о молекулярной последовательности», «аминокислотная последовательность» и «последовательность оснований» – хотя и занимают первые места по числу упоминаний в 2006 году, но их доля в публикациях существенно снизилась за последние годы. В то же время доля таких терминов, как «геномика», «протеомика» и «однонуклеотидная замена», появившихся лишь несколько лет назад, стремительно растет. На основании полученных статистических данных предложен некоторый прогноз возможного развития ряда тем в бионформатике.

Литература

1.  Aerni, S.J, Eskin, E. (2006) 10 Years of the International Conference on Research on Computational Molecular Biology (RECOMB) // RECOMB 2006, LNBI 3909, pp.546-562.

2.  Douglas, S.M., Montelione G.T., Gerstein M. (2005). PubNet: a flexible system for visualizing literature derived networks // Genome Biology, 6(9):R80.

Добавить в:
VKontakte.ru FaceBook Mail.ru Livejournal Liveinternet Twitter ="Google Ya.ru FriendFeed Memori.ru BobrDobr.ru MoeMesto.ru Mister Wong del.icio.us

Оценить:
Categories: Научные статьи Tags:

Нашли необходимую информацию? Подпишитесь на обновления Научного блога. Поддержите проект.

Статьи по теме