Nome sistemático das ORFs da levedura

A fase que se seguiu à sequenciação sistemática genoma da levedura Saccharomyces cerevisiae, foi a da anotação de todos os possíveis genes que este comportava. As 3 bases de dados (SGD - Saccharomyces Genome Database, MIPS - Munich Information Center for Protein Sequences e NCBI - National Center for Biotechnology Information), que se dedicaram à compilação da informação que progressivamente ia sendo obtida, adoptaram uma estratégia comum de nomenclatura das ORFs (grelhas de leitura aberta) da levedura. Considerou-se que constituíam possíveis ORFs todas as grelhas de leitura aberta correspondentes a proteínas com mais de 100 aminoácidos e a estas foi atribuído um nome sistemático:

YX(R/L)(no)(w/ c)

onde Y representa “Yeast”, X a letra que corresponde ao cromossoma (por exemplo A para cromossoma I, B para cromossoma II e assim sucessivamente); R ou L consoante a ORF se localize no lado esquerdo ou direito do cromossoma, relativamente ao centrómero  no, o número relacionado com a posição relativa da ORF, atribuído na direcção do centrómero para o telómerow ou c, consoante a ORF esteja na cadeia “Watson” ou na sua complementar “Crick”.

Por exemplo, o gene FLR1 tem como nome sistemático YBR008c por, entre outras particularidades, ser uma ORF do cromossoma II e ser codificada pela cadeia de “Crick".