\0 is a delimiter
[henge/apc.git] / src / lexer.rl
index 5e2fb77..da397c0 100644 (file)
@@ -6,26 +6,27 @@
 #include "apc.h"
 #include <unistdio.h>
 #include <unistr.h>
-extern //lexer.c
-void lexer_pushtok(int, YYSTYPE);
 /* Public */
-int lexer_setdirection(uint8_t*, int);
-int lexer_lexfile(uint8_t*);
-int lexer_lexdir(uint8_t*);
-int lexer_lexstring(uint8_t*, int);
-int lexer_setstr(uint8_t*, int);
+int  lexer_init(void);
+void lexer_quit(void);
+int  lexer_lexfile(uint8_t*);
+int  lexer_lexdir(uint8_t*);
+int  lexer_lexstring(uint8_t*, int);
 //apc.c
-extern
-yypstate* apc_pstate;
-extern
-yycstate* apc_cstate;
 static
-YYSTYPE   lval_stack[1024], * lvalsp;
-#define PUSHTOK(T,L) yypush_parse(apc_pstate, T, (L), apc_cstate)
+yypstate* pstate;
+static
+yycstate* cstate;
+/* Ring buffer for keeping lexical tokens valid for up to 255 tokens */
+static
+YYSTYPE   lval_stack[0xFF + 1];
+static
+uint8_t   lval_offs;
+#define PUSHTOK(T,L) yypush_parse(pstate, T, (L), cstate)
 #define LEXTOK(T,Y,L) do {                     \
-    lvalsp->Y = L;                             \
-    PUSHTOK(T,lvalsp);                         \
-    lvalsp++;                                  \
+    lval_stack[lval_offs].Y = L;               \
+    PUSHTOK(T,lval_stack + lval_offs);         \
+    lval_offs++;                               \
     ntok++;                                    \
   } while (0);
 #define PUSHFACE(F) LEXTOK(FACING, face, F)
@@ -36,6 +37,8 @@ YYSTYPE   lval_stack[1024], * lvalsp;
 #define PUSHOP(O)   LEXTOK(O, val, 0)
 #define PUSHPATH(P) LEXTOK(PATH, str, P)
 
+#define DEBUG 1
+
 /* Lexstring is the main lexer for APC and is generated by ragel. It lexes file names of files 
    that have been scanned and pushes their types and values into the tok_stack, which yyparse 
    eventually calls during parsing. */
@@ -61,44 +64,46 @@ YYSTYPE   lval_stack[1024], * lvalsp;
                            }
                          PUSHNUM(lval.val);
                         }
-  action push_name      { printf("Lexer_lexstring:: action:push_name: from %s to %s\n", ts, p);
+  action push_name      { if(DEBUG) printf("Lexer_lexstring:: action:push_name: from %s to %s\n", ts, p);
                          PUSHNAME(ts);
                         }
-  action push_map       { printf("Lexer_lexstring:: action:push_map: pushing map token\n");
+  action push_map       { if(DEBUG) printf("Lexer_lexstring:: action:push_map: pushing map token\n");
                          PUSHOP(MAP);
                        }
-  action set_ts         { printf("Lexer_lexstring:: action:set_ts. ts = %s\n", p); ts = p; }
-  action push_SS        { printf("Lexer_lexstring:: action:push_SS. p = %s\n",p);
+  action set_ts         { if(DEBUG) printf("Lexer_lexstring:: action:set_ts. ts = %s\n", p);
+                          ts = p; }
+  action push_SS        { if(DEBUG) printf("Lexer_lexstring:: action:push_SS. p = %s\n",p);
                           PUSHOP(SS);
                         }
-  action push_S         { printf("Lexer_lexstring:: action:push_S. p = %s\n", p);
+  action push_S         { if(DEBUG) printf("Lexer_lexstring:: action:push_S. p = %s\n", p);
                          PUSHFACE(SFACE);
                         }
-  action push_SW        { printf("Lexer_lexstring:: action:push_SW. p = %s\n", p);
+  action push_SW        { if(DEBUG) printf("Lexer_lexstring:: action:push_SW. p = %s\n", p);
                           PUSHFACE(SWFACE);
                        }
-  action push_W         { printf("Lexer_lexstring:: action:push_W. p = %s\n", p);
+  action push_W         { if(DEBUG) printf("Lexer_lexstring:: action:push_W. p = %s\n", p);
                           PUSHFACE(WFACE);
                         }
-  action push_NW        { printf("Lexer_lexstring:: action:push_NW. p = %s\n", p);
+  action push_NW        { if(DEBUG) printf("Lexer_lexstring:: action:push_NW. p = %s\n", p);
                          PUSHFACE(NWFACE);
                         }
-  action push_N         { printf("Lexer_lexstring:: action:push_N. p = %s\n", p);
+  action push_N         { if(DEBUG) printf("Lexer_lexstring:: action:push_N. p = %s\n", p);
                           PUSHFACE(NFACE);
                         }
-  action push_NE        { printf("Lexer_lexstring:: action:push_NE. p = %s\n", p);
+  action push_NE        { if(DEBUG) printf("Lexer_lexstring:: action:push_NE. p = %s\n", p);
                          PUSHFACE(NEFACE);
                         }
-  action push_E         { printf("Lexer_lexstring:: action:push_N. p = %s\n", p);
+  action push_E         { if(DEBUG) printf("Lexer_lexstring:: action:push_N. p = %s\n", p);
                          PUSHFACE(EFACE);
                         }
-  action push_SE        { printf("Lexer_lexstring:: action:push_N. p = %s\n", p);
+  action push_SE        { if(DEBUG) printf("Lexer_lexstring:: action:push_N. p = %s\n", p);
                          PUSHFACE(SEFACE);
                         }
-  action ref_error      { printf("ref from %s to %s has an inappropriate amount of hex digits, it must have eight.\n", ts, p);
+  action ref_error      { if(DEBUG) printf("ref from %s to %s has an inappropriate amount of hex digits, it must have eight.\n", ts, p);
                           exit(1);
                         }
-  action p              { printf("Lexer_lexstring:: p = %s\n", p);}
+  action p              { if(DEBUG) printf("Lexer_lexstring:: p = %s\n", p);
+                        }
     
   N = 'N' %push_N;
   W = 'W' %push_W;
@@ -109,7 +114,7 @@ YYSTYPE   lval_stack[1024], * lvalsp;
   SW = 'SW' %push_SW;
   SE = 'SE' %push_SE;
 
-  tok_delimiter = [_];
+  tok_delimiter = [_\0];
 
   direction = (N | W | S | E | NW | NE | SW | SE) ;
   dimensions = (digit+ - '0') >set_ts %push_val 'x' (digit+ - '0') >set_ts  %push_val;
@@ -128,6 +133,20 @@ YYSTYPE   lval_stack[1024], * lvalsp;
   
 }%%
 
+int lexer_init
+( void )
+{ pstate = yypstate_new();
+  cstate = yycstate_new();
+  lval_offs = 0;
+  return !pstate || !cstate;
+}
+
+void lexer_quit
+( void )
+{ if (pstate) yypstate_delete(pstate);
+  if (cstate) yycstate_delete(cstate);
+}
+
 int lexer_lexstring
 ( uint8_t* str, 
   int size
@@ -137,17 +156,16 @@ int lexer_lexstring
   int cs, ntok;
   YYSTYPE lval;
 
-  lvalsp = lval_stack;
   ntok = 0;
   p = ts = str;
   pe = eof =  p + size + 1;
 
-  printf("|---Begin lexstring on p = %s, pe = %s.\n",p, pe);
+  if(DEBUG) printf("|---Begin lexstring on p = %s, pe = %s.\n",p, pe);
 
   %%write init;
   %%write exec;
 
-   printf("Ending lexstring of file %s, pushed %d tokens.\n",str, ntok);
+  if(DEBUG) printf("Ending lexstring of file %s, pushed %d tokens.\n",str, ntok);
 
   return ntok;
 }
@@ -160,7 +178,7 @@ int lexer_lexstring
 int lexer_lexfile
 ( uint8_t* filename )
 { uint8_t* last_period,* iter,* filename_end;
-  int            ntok;
+  int      ntok;
   last_period = NULL;
   for (iter = filename; *iter; iter++)
     switch (*iter)
@@ -203,235 +221,3 @@ int lexer_closedir
   PUSHOP(CLCLOSE);
   return ntok;
 }
-
-/**************************/
-/****Abandon All Hope******/
-/**************************/
-/***                    ***/
-/***                    ***/       
-/***                    ***/
-/***                    ***/
-
-
-#if 0 
-
-%%{
-  machine setdirection;
-
-  action ret_north {printf("Lexer_setdirection:: direction is north, returning 4\n"); return 4;; }
-  action ret_west { printf("Lexer_setdirection:: direction is west, returning 2\n");return 2;}
-  action ret_east { printf("Lexer_setdirection:: direction is east, returning 6\n");return 6;}
-  action ret_south { printf("Lexer_setdirection:: direction is south, returning 0\n");return 0;}
-  action ret_northeast { printf("Lexer_setdirection:: direction is northeast, returning 5\n");return 5 ;}
-  action ret_northwest { printf("Lexer_setdirection:: direction is northwest, returning 3\n");return 3;}
-  action ret_southeast { printf("Lexer_setdirection:: direction is southeast, returning 7\n");return 7;}
-  action ret_southwest { printf("Lexer_setdirection:: direction is southwest, returning 1\n");return 1;}
-
-  def = [_\0] %to(ret_south);
-  N = 'N'[_\0] %to(ret_north);
-  W = 'W' [_\0] %to(ret_west);
-  S = 'S' [_\0] %to(ret_south);
-  E = 'E' [_\0] %to(ret_east);
-  NW = 'NW' [_\0] %to(ret_northwest);
-  NE = 'NE' [_\0] %to(ret_northeast);
-  SW = 'SW' [_\0] %to(ret_southwest);
-  SE = 'SE' [_\0] %to(ret_southeast);
-
-  direction = (N | W | S | E | NW | NE | SW | SE | def);
-
-  main := direction; 
-
-  write data nofinal noprefix noerror;
-
-}%%
-
-
-int
-lexer_setdirection
-(uint8_t* str, int size)
-{ uint8_t *p, *pe, *eof;
-  int cs;
-
-
-  p = str;
-  pe = str + size + 1; 
-  
-  printf("|--- Begin lexer_setdirection str = %s, p = %s, pe = %s ---|\n", str,p,  pe);
-  
-  %%write init;
-  %%write exec noend;
-
-  printf("|--- Error in: lexer_setdirection ---|\n");
-  
-  return -1;
-}
-
-
-
-%%{
-  machine setstr;
-
-  
-  action lex_setvlink {printf("Lexer_setstr:: Returning setvlink filetype for %s\n", str); type =  5; newstrt = lexer_lexsetvlink(str); fbreak;}
-  action lex_elevlink {printf("Lexer_setstr:: Returning elevlink filetype for %s\n", str); type =  6; newstrt = lexer_lexelevlink(str); fbreak;}
-  action lex_setmodel {printf("Lexer_setstr:: Returning setmodel filetype\n"); newstrt = lexer_lexsetmodel(str); type =  1; fbreak;}
-  action lex_setmap {printf("Lexer_setstr:: Returning setmap filetype\n"); newstrt = lexer_lexsetmap(str); type =  2; fbreak;}
-  action lex_elemodel {printf("Lexer_setstr:: Returning elemodel filetype for %s\n", str); newstrt = lexer_lexelemodel(str); type =  3; fbreak;}
-  action lex_elemap {printf("Lexer_setstr:: Returning elemap filetype for %s\n", str); newstrt = lexer_lexelemap(str); type = 4; fbreak;}
-  action lex_setolink  { printf("Lexer_setstr:: Returning setolink filetype\n"); type = 8; newstrt = lexer_lexsetolink(str); fbreak;}
-  action lex_eleolink  { printf("Lexer_setstr:: Returning eleolink filetype\n"); type = 7; newstrt = lexer_lexeleolink(str); fbreak;}
-  action p {printf("p = %s \n",p);}
-  action name_error {printf("In %s, there is a syntactic error. Make sure your set/element names dont conflict with the reserved keywords.\n", str);}
-
-  
-  N = 'N';
-  W = 'W';
-  S = 'S';
-  E = 'E';
-  NW = 'NW';
-  NE = 'NE';
-  SW = 'SW';
-  SE = 'SE';
-
-  SS = 'SS';
-  direction = (N | W | S | E | NW | NE | SW | SE) $p;
-  
-  SSD = SS direction;
-
-  
-
-  name = alpha+ $p - SSD $p;
-  num = digit+ $p;
-  ref = '0x' $p alnum+ $p;
-
-  
-  set_label = name | (name '_' ref);
-  ele_label = name | (name '_' ref);
-
-  model_types = (name) | (name '_' num '_' num) | (name '_' num);
-  
-
-  set_model =  set_label '_' SS  %to(lex_setmodel);
-  set_map = set_label '_' '~'  %to(lex_setmap);
-  ele_model = set_label '_' ele_label '_' SS %to(lex_elemodel);
-  ele_map = set_label '_' ele_label '_' '~' %to(lex_elemap);
-  set_olink = ref %to(lex_setolink) [\0] ;
-  ele_olink = set_label '_' '~' '_' ref [\0] %to(lex_eleolink);
-  set_vlink = set_label '_' '#' '_' (ref | ref '_' name) [\0]  %to(lex_setvlink);
-  ele_vlink = set_label '_' ele_label '_' '#' '_' (ref | ref '_' name) [\0] %to(lex_elevlink);
-  
-   main := (ele_map | set_model | set_map |ele_model | ele_vlink | set_vlink | set_olink | ele_olink);
-
-  write data;
-
-
-}%%
-
-int
-lexer_setstr
-(uint8_t* str, int size)
-{ uint8_t *p, *pe, *eof;
-  int cs, type, newstrt;
-
-  type = newstrt = 0;
-
-  p = str;
-  pe = str + size + 1;
-  
-  printf("|--- Begin lexer_setstr with str = %s, p = %s, pe = %s ---|\n", str,p,  pe);
-  
-  %%write init;
-  %%write exec noend;
-
-  printf("|--- End lexer_setstr. Incrementing str by %d, type is %d ---|\n", newstrt, type);
-  
-  return newstrt;
-}
-
-#endif
-
-
-/* %%{ */
-/*   machine file_matcher; */
-  
-/*   action call_ml { ts = p; fgoto set_hw ;} */
-/*   action call_tl { return 0;} */
-/*   action set_height {height = ttov(p, p-ts+1); ts = p;} */
-/*   action set_width { width = ttov(p, p-ts+1);} */
-/*   action call_lmf {lexer_lexmapfile(height, width); } */
-/*   action lex_error {printf("input error: character %c in filename %s is invalid\n  = %s\n", fc, str, p);} */
-  
-/*   #This machine determines the type of file we are lexing */
-/*   #and calls the appropriate machine to handle it. */
-
-/*   #TODO add mapping name */
-/*   width = digit+ %set_width; */
-/*   height = digit+ %set_height; */
-
-/*   set_hw :=  height . '_' . width [\0] %to(call_lmf); */
-
-/*   tok_segment = alnum; */
-/*   map_end = 'm' . '_' %to(call_ml); */
-/*   tok_end = alnum+  . [\0] %to(call_tl); */
-
-/*   file_matcher := (tok_segment+ . '_' )+ ( map_end | tok_end ); */
-
-/*   write data; */
-/* }%% */
-
-/* int */
-/* lexer_matchfile */
-/* (char* str, int size) */
-/* {  *p, *pe; */
-/*   char* ts; */
-/*   int  cs, ntok, height, width; */
-
-/*   p =  str; */
-/*   pe = p + size; */
-/*   height = width = 0; */
-
-/*   printf("Checking if filename is a map file:: filename = %s, p = %c, pe = %c\n", str, *p, *pe); */
-
-/*   %%write init; */
-/*   %%write exec noend; */
-
-/*   printf("Ending lexer_ismapfile on %s\n", str); */
-
-/*   return ntok; */
-/* } */
-
-/* %%{ */
-/*   machine vartype; */
-
-/*   action isele {return 0;} */
-/*   action ismodel {return 1;} */
-
-/*   set_name = alpha+; */
-/*   ele_name = alpha+; */
-/*   model_name = alpha+; */
-
-/*   ele = set_name  '_' model_name '_' ele_name %isele; */
-/*   model = set_name '_'  model_name [\0] %ismodel; */
-  
-
-/*   ismodel := (ele | model); */
-
-/*   write data; */
-
-/* }%% */
-
-/* int */
-/* lexer_ismodel */
-/* (uint8_t* str, int size) */
-/* { uint8_t *p, *pe, *eof; */
-/*   int cs; */
-
-/*   p = str; */
-/*   pe = p + size + 1; */
-
-/*   %%write init; */
-/*   %%write exec; */
-  
-
-/* } */