Alinhamento Local - Smith-Waterman

O alinhamento local consiste no alinhamento de apenas parte das sequências envolvidas. É feita uma procura por regiões com semelhança local e não é considerada a sequência em todo o seu comprimento. O algoritmo de Smith-Waterman é usado no âmbito do alinhamento local de pares de sequências.

Para exemplifica o funcionamento deste algoritmo são escolhidas duas sequências de aminoácidos:

HEAGAWGHEE (sequência #1)

PAWHEAE (sequência #2)

Temos que M = 10 (comprimento da sequência #1) e N = 7 (comprimento da sequência #2)

Este algoritmo de programação dinâmica é dos mais simples usados para este tipo alinhamento e tal como o algoritmo de Needleman-Wunsch, também se processa em três passos: inicialização, preenchimento da matriz (scoring) e Alinhamento (traceback).

Inicialização
- O primeiro passo é criar a matriz com M + 1 colunas (uma coluna é para o espaçamento) e N + 1 linhas onde M e N correspondem ao comprimento das sequências a alinhar.
- Inicializar a matriz de acordo com a condição inicial, sendo que F(i,j) é a Função de Pontuação para o preenchimento da matriz e d a pontuação do espaçamento:
Preenchimento da Matriz (scoring)
- Escolher a Função de Pontuação e a Matriz de Mérito
- Preencher o resto da tabela de acordo com a função de pontuação e a matriz de mérito.
  
  A matriz totalmente preenchida fica da seguinte forma:
Alinhamento (traceback)

A pontuação máxima de alinhamento local é 28, que se encontra na posição 9,5.
Começar na posição com pontuação máxima (9,5 neste caso) e olhar para as células vizinhas que podem ser as precedentes directos de acordo com a seguinte regra de alinhamento:
- Diagonal: x_ialinha com y_j;
- Cima: y_ialinha com espaço;
- Esquerda: x_jalinha com espaço;

Na realidade, para o primeiro passo, significa olhar para a diagonal (x_ialinha com y_j).
Seguir todo o caminho até alcançar uma célula com valor 0 (zero).

O valor na posição 9,5 é dado pela soma das parcelas correspondentes à pontuação de cada alinhamento individual.

Segue-se uma animação, que ajuda compreender o funcionamento deste algoritmo para uma alinhamento entre estas duas sequências de aminoácidos: