Análise da região promotora do gene FLR1

A procura de sequências específicas de ligação de factores de transcrição, sequências ditas consenso , no promotor do gene FLR1 foi realizada recorrendo à ferramenta RSA-tools, disponível na web.

A página de abertura desta ferramenta apresenta, do lado esquerdo, as várias funcionalidades disponíveis para o genoma de levedura e para outras dezenas de genomas entretanto sequenciados (Fig. 1). Esta ferramenta tem também uma página de instruções (tutorials) muito bem organizada e com exemplos que o utilizador pode seguir para se familiarizar com o programa (Fig. 1).

Fig. 1- Página de face da ferramenta RSA-tools, que permite realizar a análise da região promotora dos genes de S. cerevisiae, bem como de genes de outras dezenas de organismos. Em tutorials, é possível aceder a uma página de instruções onde as várias funcionalidades do barra do lado esquerdo são explicadas e onde são dados exemplos de aplicações.

 

O RSA-tools contempla as várias situações possíveis, quando se procede à análise de regiões promotoras:

1. O utilizador conhece a sequência consenso de um dado factor de transcrição e pretende pesquisar a sua existência num dado gene (ou genes). Esta busca é denominada de “pattern matching”;

2. O utilizador conhece a sequência consenso de um dado factor de transcrição e pretende pesquisar a sua existência em todas as regiões promotoras do genoma. Esta busca, denominada “genome-scale pattern matching”, permite identificar os eventuais genes alvo da regulação de um dado factor de transcrição;

3. O utilizador detém um grupo de genes sujeitos à mesma regulação mas desconhece o consenso envolvido. A busca “pattern discovery” permite identificar sequências existentes nas regiões promotoras de genes co-regulados e assim revelar consensos desconhecidos.

O exemplo escolhido, para abordar no presente portal, enquadra-se na condição descrita acima, no ponto 1, ou seja vai-se pesquisar na região promotora do gene FLR1, a existência dos consensos de ligação dos factores de transcrição Yap1 e Pdr3, envolvidos na resposta da levedura ao stresse oxidativo e ao stresse causado por drogas, respectivamente (Fernandes et al., 1997 e Delaveau et al., 1994).

O objectivo deste portal é uma breve exemplificação do uso desta ferramenta, pelo que as funcionalidades do RSA-tools não serão alvo de uma explicação exaustiva. Para um esclarecimento mais aprofundado das funcionalidades aqui não exploradas aconselha-se a leitura da página “tutorials”.

Para melhor compreensão das tarefas que a seguir se descrevem, sugere-se que as vá realizando, em paralelo, na página original da RSA-toolls, que pode aceder em http://rsat.ulb.ac.be/rsat/.

Assim, escolhendo a opção “retrieve sequence” na página de abertura do site (Fig. 2.1), tem-se acesso à página que permite escolher as regiões promotoras a analisar (Fig. 2.2). Na Figura 2 estão descritos os procedimentos a seguir até obter a sequência desejada.

 

Fig. 2 - Acesso à página que permite seleccionar as regiões promotoras dos genes a analisar. Começa-se por seleccionar o organismo a que pertence o gene em estudo (A), escreve-se o nome do gene (ou genes) a analisar sendo também aceite o nome sistemático da ORF correspondente (B). Por defeito, a zona do promotor a ser analisada será a que compreende -800 pb até ao ATG do gene em questão e não permite sobreposição dessa zona com as regiões codificantes de outros genes (C e D). No entanto, estes parâmetros podem ser alterados pelo utilizador. Ao seleccionar GO, o programa ira então buscar a sequência das regiões promotoras em questão (E).

 

Após a selecção dos vários parâmetros a opção GO permite aceder a uma página onde a sequência da região promotora escolhida pelo utilizador não é apresentada mas sim, guardada num ficheiro a que este pode aceder caso deseje (Fig. 3). Seque-se a escolha do tipo de análise a efectuar. Como no presente exemplo as sequências consenso a pesquisar são conhecidas, a opção a seleccionar é “DNA pattern (IUPAC)” (Fig. 3).

Fig. 3 - Acesso à página que permite seleccionar os vários tipos de análises permitidas pelo programa RSA-tools. No presente exemplo, como são conhecidas as sequências a pesquisar na região promotora do gene FLR1, a opção a seleccionar é “DNA pattern (IUPAC)”.

 

Tem-se assim acesso a uma nova página (Fig. 4), onde se vai proceder à inserção das sequências consenso a pesquisar.

O consenso de ligação do factor de transcrição Yap1, conhecido por YRE (de “Yap1 response element”), foi descrito como sendo a sequência T T/G A C/G TAA (Toone and Jones, 1999), onde a segunda e a quarta posição se chamam degeneradas e podem ser ocupadas por uma T ou G e por uma C ou G, respectivamente. O consenso PDRE (de “Pleotropic drug resistance element”) é a sequência TCC G/a C/t G G/c A/g (DeRisi et al., 2000), onde a quarta posição pode ser ocupada por uma G ou uma A, embora preferencialmente seja ocupada pela primeira base (daí a representação da segunda base em minúsculas), o mesmo se aplicando à posição 5, 7 e 8 do consenso.

Para facilitar a representação das sequências consenso com degenerescência (que aceitam várias bases numa dada posição), pode ser adoptada a nomenclatura IUPAC, estabelecida para o efeito pelo Comité de Nomenclatura da União Internacional de Bioquímica (NC-IUB). Assim, duas ou mesmo três bases podem ser representadas por uma dada letra convencionada para o efeito (ver tabela UPAC). No entanto, a escrita de sequências consensos na nomenclatura IUPAC deve ser feita com especial cuidado pois o seu uso indevido pode levar à consideração de sequências sem significado biológico (ver exemplo). Para evitar esse problema, no presente exemplo, vão ser usadas as sequências descritas para o YRE (TTAGTCA; TGACTAA; TTACTAA) e para PDRE (TCCGCGGA; TCCGTGGA; TCCACGGA; TCCGCGCA; TCCGCGGG) por Toone and Jones, 1999 e DeRisi et al., 2000 (Fig. 4).

Fig. 4 As sequências consenso, cuja existência na região promotora do gene FLR1, se pretende pesquisar, são introduzidas na janela assinalada (A). O programa permite ainda a pesquisa de sequências consenso com uma ou duas substituições (B).

 

Os resultados podem ser apresentados em forma de tabela (Fig. 5) ou de gráfico (Fig. 6).

Fig. 5 - Resultado da pesquisa dos consensos YRE e PDRE na região promotora do gene FLR1 apresentado em tabela. São mostradas as coordenadas bem como as regiões flanqueantes das sequências consenso encontradas na região promotora do gene FLR1. Assim, é possível constatar a existência de 3 sequências YRE (na tabela são visíveis 5, mas duas são repetidas pois são polindrómicas e por isso se encontram nas duas cadeias do DNA; ver coordenadas) e uma PDRE.

Fig. 6 - Resultado da pesquisa dos consensos YRE e PDRE na região promotora do gene FLR1 apresentado em gráfico. É possível alterar as especificações dos gráficos apresentados, tanto nesta página como na que a antecede.

A presente análise permitiu identificar a existência de três sequências consenso YRE de ligação ao factor de transcrição Yap1 e uma sequência PDRE de ligação ao factor de transcrição PDR1/3. Tais resultados permitiram orientar o estudo da expressão genética do gene FLR1  e ajudaram a interpretar os resultados experimentais obtidos, tal como descrito em Broco et al., 1999 e Tenreiro et al., 2001.

.