ZAHA et al. Biologia Molecular Básica. 4a ed. Artmed, 2012, 403p.
Motivos
Cerca de dois a algumas dezenas de pares de bases
Podem estar dispersas ou agrupadas
Em muitos casos são unidades formadoras de repetição
Motivos são sequências nucleotídicas curtas, em geral de dois até algumas dezenas de pares de bases de extensão, que podem ser relativamente comuns em genomas procarióticos. Essas sequências podem estar dispersas ou agrupadas no genoma e, em muitos casos, são unidades formadoras de repetições.
Sequências repetidas são compostas por unidades de repetição em geral curtas, com menos de 10pb, mas que, no conjunto, podem representar uma fração significativa de um genoma procariótico, embora sempre minoritária em relação à fração correspondente às sequências únicas (não repetidas). Menos de 2% de qualquer genoma procariótico são compostos de sequências repetidas, o que contrasta com a representatividade desse tipo de sequência em genomas eucarióticos, que pode chegar a mais de 50%.
Diferentes famílias de sequências repetidas estão presentes, com números de cópias que podem variar de menos de 5 até algumas centenas ou até milhares por genoma. As unidades de repetição de uma determinada família podem estar distribuídas de maneira aparentemente aleatória no genoma ou em arranjos em tandem (agrupadas lado a lado).
Em E. coli K-12, por exemplo, pelo menos sete famílias de sequências repetidas estão representadas no genma. A família mais representada do ponto de vista do número de unidades de repetição é a dos elementos REP. Essas sequências palindrômicas (idênticas quando lidas da esquerda para a direita ou da direita para a esquerda) têm aproximadamente 40pb e estão presentes em 314 unidades organizadas em 12 arranjos em tandem.
Processos envolvendo integração e excisão de genomas de bacteriófagos ou elementos transponíveis em genomas procarióticos geram sequências repetidas, que podem se acumular ao longo da evolução. Independentemente da origem, algumas repetições de genomas procarióticos podem estar associadas a funções importantes. As repetições CRISPR (de clustered regularly interspaced short palindromic repeats, repetições palindrômicas curtas agrupadas e regularmente espaçadas). As CRISPR são componentes de um sistema de defesa antiviral (contra bacteriófagos), e já foram identificadas em cerca de 40% dos genomas bacterianos e 90% dos genomas de arqueas analisados até o momento. Elas são constituída por unidades de repetição palindrômicas, com extensão e organização em arranjos que variam de espécie para espécie. O tamanho das unidades de repetição das CRISPR varia de 24 a 47pb e, nos arranjos, elas estão presentes em um número de cópias que pode variar de 2 até 249. Muitos genomas, principalmente os de bactérias, contêm apenas um ou poucos arranjos (ou lócus) CRISPR, mas em genomas de arqueas, vários lócus CRISPR podem estar presentes, chegando a representar até 1% das sequências do genoma.