Анализ связи между позиционированием нуклеосом в районе промоторов и характером экспрессии генов

Левицкий В.Г.
Институт цитологии и генетики СО РАН, Новосибирск

Подколодная О.А.
Институт цитологии и генетики СО РАН, Новосибирск

Аннотация:

Быстрый рост числа известных генов требует развития автоматических средств их классификации и анализа. В последнее время становится всё более ясным, что нуклеосомная упаковка промоторных районов генов является очень важной для функционирования генов. Применение автоматических средств распознавания плотности нуклеосомной упаковки промоторных районов генов эукариот может быть использовано для изучения характера их экспрессии. Проведено исследование плотности нуклеосомной упаковки для генов человека, отличающихся по характеру экспрессии. Потенциал нуклеосомной упаковки ДНК для промоторов генов, обладающих ткане-специфичной активностью, оказался существенно повышенным нежели для промоторов генов, экспрессирующихся во многих тканях, или для промоторов генов "домашнего хозяйства". Это обстоятельство свидетельствует в пользу того, что одним из факторов, регулирующим характер экспрессии гена, является способность его промотора к позиционированию нуклеосом. Программа распознавания нуклеосомных сайтов входит в состав системы GeneExpress, раздел DNA nucleosomal organization, http://wwwmgs.bionet.nsc.ru/mgs/programs/recon/.

Rapid growth in numbering of known genes provokes to develop automated tools for their classification and analysis. In the last years, it becomes clear that nucleosome packaging of promoter gene regions is very important for gene functioning. Application of automated computer tools for nucleosome packaging density recognition in nucleosome regions in eukaryotes may be used for studying of the pattern of gene expression. An analysis was performed of nucleosome packaging density for human genes differing by expression patterns. The potential of nucleosome packaging DNA for promoters of genes with tissue-specific activity appeared to be essentially higher than that of genes expressed in many tissues or that of "housekeeping" gene promoters. This phenomenon counts in favor that one of the factors regulating gene expression pattern is ability of a gene promoter to nucleosome positioning. The program for nucleosomal sites recognition is included into the GeneExpress system, section DNA nucleosomal organization, http://wwwmgs.bionet.nsc.ru/mgs/programs/recon/.

Ключевые слова: позиционирование нуклеосом, характер экспрессии генов, гены "домашнего хозяйства", ткане-специфичные гены.

Keywords: nucleosome positioning, gene expression pattern, "housekeeping" genes, tissue-specific genes

Введение

Базовым уровнем упаковки ДНК является её нуклеосомная организация. Особенности ДНК, определяющие формирование нуклеосом, важны как для правильной упаковки ДНК, так и для её функционирования. Во многих случаях расположение нуклеосом в районе промотора контролирует активность гена: позиционированная нуклеосома может ингибировать или усиливать экспрессию генов. Выявлены некоторые общие особенности промоторной ДНК, связанные с позиционированием нуклеосом [1,2]. Особенности промоторной ДНК, связанные с позиционированием нуклеосом, могут также быть использованы при разработке методов распознавания промоторов [3,4]. В связи с этим представляется очень интересным анализ и поиск в геномных последовательностях ДНК особенностей, определяющих их способность к формированию нуклеосомных сайтов. Для распознавания нуклеосомных сайтов нами была использован метод, основанный на дискриминантном анализе [4,5].

Исходные данные и методы.

Построение функции распознавания строится на основе анализа выборок нуклеосомных сайтов [6] и случайных последовательностей. Метод дискриминантного анализа использует частоты динуклеотидов, рассчитанные для некоторых специальным образом определённых районов нуклеосомных сайтов [4,5]. Близость значения распознающей функции к единице означает большую способность анализируемой последовательности к позиционированию нуклеосом.

Результаты и обсуждение.

Для анализа зависимости характера экспрессии генов от плотности упаковки ДНК в районах промоторов, 219 промоторов человека в интервале [-300;+100] относительно старта транскрипции были выделены из базы данных EPD [7]. Классификация промоторов по характеру экспрессии генов позволила выделить отдельные классы промоторов. Для этого были использованы базы данных EPD [7], TRRD [8], а также литературные источники. Названия и численности классов приведены в таблице 1. Ранее мы показывали, что район промотора, расположенный непосредственно перед сайтом старта транскрипции, характеризуется пониженными значениями функции распознавания нуклеосомных сайтов [2]. На рисунке 1 приводятся распределения значений функции распознавания нуклеосом для района [-50;+1] относительно старта транскрипции. Можно заметить, что самыми низкими значениями в данном интервале характеризуются промоторы генов "домашнего хозяйства" и генов широкого круга экспрессии. Класс промоторов ткане-специфичных генов характеризуется существенным сдвигом вправо по сравнению с промоторами генов "домашнего хозяйства" и промоторами широкоэкспрессирующихся генов. Сводка результатов для значений функции распознавания нуклеосомных сайтов для разных классов промоторов приведена в таблице 1.


Таблица: 1 Классификация промоторов человека по характеру экспрессии и распределение значений функции распознавания нуклеосомных сайтов по классам промоторов, отличающихся по уровню экспрессии. Распределения рассчитаны для района [-50; +1] промоторов.
Название класса промоторов Число промоторов Среднее значение Число значений функции в интервале (% )
      [0; 2] вне [0 ,2]
Гены "домашнего хозяйства" 32 -1.48$\pm $0.20 11.11% 88.89%
Гены, с экспрессией в широком круге тканей 30 -0.66$\pm $0.21 21.77% 78.13%
Ткане-специфичные гены 141 +0.70$\pm $0.08 80.15% 19.85%

Рис.1а: Гистограмма распределения по значениям функции распознавания нуклеосомных сайтов для промоторных районов генов. Для сравнения приведено распределение значений этой же функции по обучающей выборке нуклеосомных сайтов. Промоторы генов "домашнего хозяйства" и генов с экспрессией в широком круге тканей.

Рис.1b: Гистограмма распределения по значениям функции распознавания нуклеосомных с`айтов для промоторных районов генов. Для сравнения приведено распределение значений этой же функции по обучающей выборке нуклеосомных сайтов. Промоторы ткане-специфичных генов.

Рис.2: Профиль функции распознавания нуклеосомных сайтов для гена гидроксиметилбилансинтетазы человека (AC M95623).

В таблице для каждого класса указаны: численность, среднее значение, его стандартное отклонение и доля промоторов класса, для которых значение распознающей функции расположено внутри и вне интервала [0; +2]. Различие средних классов промоторов генов "домашнего хозяйства" и промоторами широкоэкспрессирующихся генов от промоторов тканеспецифичных генов является значимым по критерию Стьюдента с уровнем значимости $\alpha $>0.99.

Сравнение типичных профилей функции распознавания нуклеосомных сайтов для генов с различным характером экспрессии приведено на рисунке 2. На рисунке 2 приведён ген, экспрессия которого контролируется двумя промоторами: первый промотор контролирует образование продукта "домашнего хозяйства", а второй является ткане-специфичным. Можно видеть, что для генов с ткане-специфичным характером экспрессии значения распознающей функции в промоторном районе существенно ближе к единице.

Можно заметить, что большинство изученных промоторов, выделенных из базы EPD (Таблица 1), обладают ткане-специфичным характером экспрессии. Возможно, именно с этим фактом связано то, что недавно в промоторных районах генов обнаружены периодичности связывания транскрипционных факторов, предположительно связанные с формированием нуклеосомных сайтов [1].

Таким образом, нами показано, что одним из факторов, регулирующих характер экспрессии гена, является способность ДНК в области старта транскрипции гена к образованию нуклеосом. Более того, по-видимому, в ходе эволюции характер экспрессии генов требует формирования такого нуклеотидного контекста ДНК их промоторных районов, который может обеспечить оптимальную для их функционирования плотность нуклеосомной упаковки ДНК. Для промоторов генов, экспрессия которых должна быть тонко регулирующейся или ограниченной (для ткане-специфичных промоторов) происходит отбор в пользу плотно упакованных промоторных районов. Если же ингибирование транскрипции в разных условиях крайне нежелательно (например для генов с широким характером экспрессии или генов "домашнего хозяйства"), то становится необходимой нуклеотидный контекст промоторной области, обеспечивающий менее плотную нуклеосомную упаковку или полное её отсутствие.

Литература

1
Ioshikhes I., Trifonov E.N., Zhang M.Q. Periodical distribution of transcription factor sites in promoter regions and connection with chromatin structure. // Proc Natl Acad Sci USA, 1999, 2891-2895.

2
Levitsky V.G., Ponomarenko M.P., Ponomarenko J.P., Frolov A.S., Kolchanov N.A. Nucleosomal DNA property database. // Bioinformatics, 15, 1999, 582-592.

3
Pedersen A.G., Baldi P., Chauvin Y., Brunak S. The biology of eukaryotic promoter prediction - a review. // Comput. Chem., 23, 191-207.

4
Levitsky V.G., Katokhin A.V., Kolchanov N.A. Inherent modular promoter structure and its application for recognition tools development. // Computational technologies, 5, 2000, 41-47.

5
Levitsky V.G., Podkolodnaya O.A., Kolchanov N.A., Podkolodny N.L. Nucleosome formation potential of eukaryotic DNA: tools for calculation and promoters analysis. // Bioinformatics, 2001 (in press).

6
Ioshikhes I., Trifonov E.N. Nucleosomal DNA sequence database. // Nucl. Acids. Res., 21, 1993, 4857-4859.

7
Perier R.C., Praz V., Junier T., Bonnard C., Bucher P. The eukaryotic promoter database. // Nucleic Acids Res, 28, 2000, 302-303.

8
Kolchanov N.A., Podkolodnaya O.A., Ananko E.A., Ignatieva E.V., Stepanenko I.L., Kel-Margoulis O.V., Kel A.E., Merkulova T.I., Goryachkovskaya T.N., Busygina T.V., Kolpakov F.A., Podkolodny N.L., Naumochkin A.N., Korostishevskaya I.M., Romashchenko A.G., Overton G.C. Transcription regulatory regions database (TRRD): its status in 2000. // Nucleic Acids Res.,28, 2000, 298-301.



Ваши комментарии
[SBRAS]
[Головная страница]
[Конференции]
[СО РАН]

© 2001, Сибирское отделение Российской академии наук, Новосибирск
© 2001, Объединенный институт информатики СО РАН, Новосибирск
© 2001, Институт вычислительных технологий СО РАН, Новосибирск
© 2001, Институт систем информатики СО РАН, Новосибирск
© 2001, Институт математики СО РАН, Новосибирск
© 2001, Институт цитологии и генетики СО РАН, Новосибирск
© 2001, Институт вычислительной математики и математической геофизики СО РАН, Новосибирск
© 2001, Новосибирский государственный университет
Дата последней модификации Sunday, 09-Sep-2001 16:09:45 NOVST