Semantic Analysis/Exercise 01

From Wiki**3

< Semantic Analysis

Problema

Considere o analisador sintáctico da linguagem Let (abaixo). Considere que as variáveis só podem ser utilizadas em expressões (tID ou tASSIGN) depois de declaradas (tLET); que variáveis com o mesmo nome não podem ser declaradas no mesmo bloco; e que os tokens tINT e tSTRING correspondem a literais, respectivamente, dos tipos inteiro e cadeia de caracteres.

Traduza para C (visitor em C++: c_writer) e valide semanticamente (visitor em C++: type_checker) a árvore sintáctica abstracta, emitindo mensagens se forem detectados erros de validação semântica. Utilize as classes da CDK (cdk::symbol_table, nós, etc.) na resolução do problema. Pode ser útil definir outras classes auxiliares de validação de tipos (symbol, etc.). Nos visitors, implemente apenas os métodos do_XXX (onde XXX é o nome da classe do nó). O acesso às sub-árvores de nós binários faz-se através dos métodos left() e right() e às sub-árvores de nós unários através do método argument().

%token tSTART tBLOCK tEND tLET tPRINT tASSIGN
%token <str>     tID tSTRING
%token <i>       tINT 
%type <node>     program block decl instr
%type <sequence> decls instrs
%right tASSIGN
%left '-'
%nonassoc tUNARY

%%
program : tSTART block  { _compiler->ast(new program_node(LINE, $2)); }
        ;
block   : tBLOCK decls instrs tEND { $$ = new block_node(LINE, $2, $3); }
        ;
decls   : decl                     { $$ = new cdk::sequence_node(LINE, $1); }
        | decls decl               { $$ = new cdk::sequence_node(LINE, $2, $1); }
        ;
decl    : tLET tID	           { $$ = new declaration_node(LINE, $2); }
        ;
instrs  : instr                    { $$ = new cdk::sequence_node(LINE, $1); }
        | instrs instr             { $$ = new cdk::sequence_node(LINE, $2, $1); }
        ;
instr   :                ';'       { $$ = new cdk::nil_node(LINE); }
        | block          ';'       { $$ = $1; }
        | tPRINT expr    ';'       { $$ = new print_exp_node(LINE, $2); }
        | tPRINT tSTRING ';'       { $$ = new print_str_node(LINE, $2); }
        ;
expr    : tID                      { $$ = new rvalue_node(LINE, new cdk::variable_node(LINE, $1)); }
        | tINT                     { $$ = new cdk::integer_node(LINE, $1); }
        | expr '-' expr            { $$ = new cdk::sub_node(LINE, $1, $3); }
        | '-' expr %prec tUNARY    { $$ = new cdk::neg_node(LINE, $2); }
        | tID tASSIGN expr         { $$ = new assignment_node(LINE, $1, $3); }
        ;
%%

Solution

The solution is straightforward and very similar to that obtained for the the Tiny language. The main difference is in block generation (c_writer): _symtab.push(); and _symtab.pop(); are needed at the beginning and ending of the generation method.