Expose API to seed the initial line number of the parser. (#65)

IwanKaramazow · web-flow · commit a612f224a0f0 · 2020-07-22T22:01:59.000+02:00
* Expose API to seed the initial line number of the parser.
* Add extra documentation for line param in parser interface.
* Add extra test for Napkin_parser.make with default line number
diff --git a/.depend b/.depend
@@ -75,5 +75,6 @@ src/napkin_scanner.cmx : src/napkin_token.cmx src/napkin_diagnostics.cmx \
     src/napkin_scanner.cmi
 src/napkin_scanner.cmi : src/napkin_token.cmx src/napkin_diagnostics.cmi
 src/napkin_token.cmx : src/napkin_comment.cmx src/napkin_character_codes.cmx
-tests/napkin_test.cmx : src/napkin_outcome_printer.cmx \
-    src/napkin_multi_printer.cmx src/napkin_io.cmx src/napkin_driver.cmx
+tests/napkin_test.cmx : src/napkin_token.cmx src/napkin_parser.cmx \
+    src/napkin_outcome_printer.cmx src/napkin_multi_printer.cmx \
+    src/napkin_io.cmx src/napkin_driver.cmx
diff --git a/src/napkin_parser.ml b/src/napkin_parser.ml
@@ -8,152 +8,150 @@ module Comment = Napkin_comment
 
 type mode = ParseForTypeChecker | Default
 
-  type regionStatus = Report | Silent
-
-  type t = {
-    mode: mode;
-    mutable scanner: Scanner.t;
-    mutable token: Token.t;
-    mutable startPos: Lexing.position;
-    mutable endPos: Lexing.position;
-    mutable prevEndPos: Lexing.position;
-    mutable breadcrumbs: (Grammar.t * Lexing.position) list;
-    mutable errors: Reporting.parseError list;
-    mutable diagnostics: Diagnostics.t list;
-    mutable comments: Comment.t list;
-    mutable regions: regionStatus ref list;
-  }
-
-  let err ?startPos ?endPos p error =
-    let d = Diagnostics.make
-      ~filename:p.scanner.filename
-      ~startPos:(match startPos with | Some pos -> pos | None -> p.startPos)
-      ~endPos:(match endPos with | Some pos -> pos | None -> p.endPos)
+type regionStatus = Report | Silent
+
+type t = {
+  mode: mode;
+  mutable scanner: Scanner.t;
+  mutable token: Token.t;
+  mutable startPos: Lexing.position;
+  mutable endPos: Lexing.position;
+  mutable prevEndPos: Lexing.position;
+  mutable breadcrumbs: (Grammar.t * Lexing.position) list;
+  mutable errors: Reporting.parseError list;
+  mutable diagnostics: Diagnostics.t list;
+  mutable comments: Comment.t list;
+  mutable regions: regionStatus ref list;
+}
+
+let err ?startPos ?endPos p error =
+  let d = Diagnostics.make
+    ~filename:p.scanner.filename
+    ~startPos:(match startPos with | Some pos -> pos | None -> p.startPos)
+    ~endPos:(match endPos with | Some pos -> pos | None -> p.endPos)
+    error
+  in
+  try
+    if (!(List.hd p.regions) = Report) then (
+      p.diagnostics <- d::p.diagnostics;
+      List.hd p.regions := Silent
+    )
+  with Failure _ -> ()
+
+let beginRegion p =
+  p.regions <- ref Report :: p.regions
+let endRegion p =
+  try p.regions <- List.tl p.regions with Failure _ -> ()
+
+(* Advance to the next non-comment token and store any encountered comment
+* in the parser's state. Every comment contains the end position of its
+* previous token to facilite comment interleaving *)
+let rec next ?prevEndPos p =
+ let prevEndPos = match prevEndPos with Some pos -> pos | None -> p.endPos in
+ let (startPos, endPos, token) = Scanner.scan p.scanner in
+ match token with
+ | Comment c ->
+   Comment.setPrevTokEndPos c p.endPos;
+   p.comments <- c::p.comments;
+   p.prevEndPos <- p.endPos;
+   p.endPos <- endPos;
+   next ~prevEndPos p
+ | _ ->
+   p.token <- token;
+   (* p.prevEndPos <- prevEndPos; *)
+   p.prevEndPos <- prevEndPos;
+   p.startPos <- startPos;
+   p.endPos <- endPos
+
+let checkProgress ~prevEndPos ~result p =
+  if p.endPos == prevEndPos
+  then None
+  else Some result
+
+let make ?(mode=ParseForTypeChecker) ?line src filename =
+  let scanner = Scanner.make ~filename ?line (Bytes.of_string src) in
+  let parserState = {
+    mode;
+    scanner;
+    token = Token.Eof;
+    startPos = Lexing.dummy_pos;
+    prevEndPos = Lexing.dummy_pos;
+    endPos = Lexing.dummy_pos;
+    breadcrumbs = [];
+    errors = [];
+    diagnostics = [];
+    comments = [];
+    regions = [ref Report];
+  } in
+  parserState.scanner.err <- (fun ~startPos ~endPos error ->
+    let diagnostic = Diagnostics.make
+      ~filename
+      ~startPos
+      ~endPos
       error
     in
-    try
-      if (!(List.hd p.regions) = Report) then (
-        p.diagnostics <- d::p.diagnostics;
-        List.hd p.regions := Silent
-      )
-    with Failure _ -> ()
-
-  let beginRegion p =
-    p.regions <- ref Report :: p.regions
-  let endRegion p =
-    try p.regions <- List.tl p.regions with Failure _ -> ()
-
-   (* Advance to the next non-comment token and store any encountered comment
-    * in the parser's state. Every comment contains the end position of its
-    * previous token to facilite comment interleaving *)
-   let rec next ?prevEndPos p =
-     let prevEndPos = match prevEndPos with Some pos -> pos | None -> p.endPos in
-     let (startPos, endPos, token) = Scanner.scan p.scanner in
-     match token with
-     | Comment c ->
-       Comment.setPrevTokEndPos c p.endPos;
-       p.comments <- c::p.comments;
-       p.prevEndPos <- p.endPos;
-       p.endPos <- endPos;
-       next ~prevEndPos p
-     | _ ->
-       p.token <- token;
-       (* p.prevEndPos <- prevEndPos; *)
-       p.prevEndPos <- prevEndPos;
-       p.startPos <- startPos;
-       p.endPos <- endPos
-
-  let checkProgress ~prevEndPos ~result p =
-    if p.endPos == prevEndPos
-    then None
-    else Some result
-
-  let make ?(mode=ParseForTypeChecker) src filename =
-    let scanner = Scanner.make (Bytes.of_string src) filename in
-    let parserState = {
-      mode;
-      scanner;
-      token = Token.Eof;
-      startPos = Lexing.dummy_pos;
-      prevEndPos = Lexing.dummy_pos;
-      endPos = Lexing.dummy_pos;
-      breadcrumbs = [];
-      errors = [];
-      diagnostics = [];
-      comments = [];
-      regions = [ref Report];
-    } in
-    parserState.scanner.err <- (fun ~startPos ~endPos error ->
-      let diagnostic = Diagnostics.make
-        ~filename
-        ~startPos
-        ~endPos
-        error
-      in
-      parserState.diagnostics <- diagnostic::parserState.diagnostics
-    );
-    next parserState;
-    parserState
-
-  let leaveBreadcrumb p circumstance =
-    let crumb = (circumstance, p.startPos) in
-    p.breadcrumbs <- crumb::p.breadcrumbs
-
-  let eatBreadcrumb p =
-    match p.breadcrumbs with
-    | [] -> ()
-    | _::crumbs -> p.breadcrumbs <- crumbs
-
-  let optional p token =
-    if p.token = token then
-      let () = next p in true
-    else
-      false
-
-  let expect ?grammar token p =
-    if p.token = token then
-      next p
-    else
-      let error = Diagnostics.expected ?grammar p.prevEndPos token in
-      err ~startPos:p.prevEndPos p error
-
-  (* Don't use immutable copies here, it trashes certain heuristics
-   * in the ocaml compiler, resulting in massive slowdowns of the parser *)
-  let lookahead p callback =
-    let err = p.scanner.err in
-    let ch = p.scanner.ch in
-    let offset = p.scanner.offset in
-    let rdOffset = p.scanner.rdOffset in
-    let lineOffset = p.scanner.lineOffset in
-    let lnum = p.scanner.lnum in
-    let mode = p.scanner.mode in
-    let token = p.token in
-    let startPos = p.startPos in
-    let endPos = p.endPos in
-    let prevEndPos = p.prevEndPos in
-    let breadcrumbs = p.breadcrumbs in
-    let errors = p.errors in
-    let diagnostics = p.diagnostics in
-    let comments = p.comments in
-
-    let res = callback p in
-
-    p.scanner.err <- err;
-    p.scanner.ch <- ch;
-    p.scanner.offset <- offset;
-    p.scanner.rdOffset <- rdOffset;
-    p.scanner.lineOffset <- lineOffset;
-    p.scanner.lnum <- lnum;
-    p.scanner.mode <- mode;
-    p.token <- token;
-    p.startPos <- startPos;
-    p.endPos <- endPos;
-    p.prevEndPos <- prevEndPos;
-    p.breadcrumbs <- breadcrumbs;
-    p.errors <- errors;
-    p.diagnostics <- diagnostics;
-    p.comments <- comments;
-
-    res
-
-
+    parserState.diagnostics <- diagnostic::parserState.diagnostics
+  );
+  next parserState;
+  parserState
+
+let leaveBreadcrumb p circumstance =
+  let crumb = (circumstance, p.startPos) in
+  p.breadcrumbs <- crumb::p.breadcrumbs
+
+let eatBreadcrumb p =
+  match p.breadcrumbs with
+  | [] -> ()
+  | _::crumbs -> p.breadcrumbs <- crumbs
+
+let optional p token =
+  if p.token = token then
+    let () = next p in true
+  else
+    false
+
+let expect ?grammar token p =
+  if p.token = token then
+    next p
+  else
+    let error = Diagnostics.expected ?grammar p.prevEndPos token in
+    err ~startPos:p.prevEndPos p error
+
+(* Don't use immutable copies here, it trashes certain heuristics
+ * in the ocaml compiler, resulting in massive slowdowns of the parser *)
+let lookahead p callback =
+  let err = p.scanner.err in
+  let ch = p.scanner.ch in
+  let offset = p.scanner.offset in
+  let rdOffset = p.scanner.rdOffset in
+  let lineOffset = p.scanner.lineOffset in
+  let lnum = p.scanner.lnum in
+  let mode = p.scanner.mode in
+  let token = p.token in
+  let startPos = p.startPos in
+  let endPos = p.endPos in
+  let prevEndPos = p.prevEndPos in
+  let breadcrumbs = p.breadcrumbs in
+  let errors = p.errors in
+  let diagnostics = p.diagnostics in
+  let comments = p.comments in
+
+  let res = callback p in
+
+  p.scanner.err <- err;
+  p.scanner.ch <- ch;
+  p.scanner.offset <- offset;
+  p.scanner.rdOffset <- rdOffset;
+  p.scanner.lineOffset <- lineOffset;
+  p.scanner.lnum <- lnum;
+  p.scanner.mode <- mode;
+  p.token <- token;
+  p.startPos <- startPos;
+  p.endPos <- endPos;
+  p.prevEndPos <- prevEndPos;
+  p.breadcrumbs <- breadcrumbs;
+  p.errors <- errors;
+  p.diagnostics <- diagnostics;
+  p.comments <- comments;
+
+  res
diff --git a/src/napkin_parser.mli b/src/napkin_parser.mli
@@ -22,7 +22,8 @@ type t = {
   mutable regions: regionStatus ref list;
 }
 
-val make: ?mode: mode -> string -> string -> t
+(* `line` seeds the parser's state with an initial line number. *)
+val make: ?mode:mode -> ?line:int -> string -> string -> t
 
 val expect: ?grammar:Grammar.t -> Token.t -> t -> unit
 val optional: t -> Token.t -> bool
@@ -43,4 +44,4 @@ val checkProgress:
   prevEndPos: Lexing.position ->
   result: 'a ->
   t ->
-  'a option
+  'a option
diff --git a/src/napkin_reason_binary_driver.ml b/src/napkin_reason_binary_driver.ml
@@ -15,7 +15,7 @@ let extractConcreteSyntax filename =
     if String.length filename > 0 then IO.readFile ~filename
     else IO.readStdin ()
   in
-  let scanner = Napkin_scanner.make (Bytes.of_string src) filename in
+  let scanner = Napkin_scanner.make (Bytes.of_string src) ~filename in
 
   let rec next prevEndPos scanner =
     let (startPos, endPos, token) = Napkin_scanner.scan scanner in
diff --git a/src/napkin_scanner.ml b/src/napkin_scanner.ml
@@ -77,7 +77,7 @@ let peek scanner =
   else
     -1
 
-let make b filename =
+let make ?(line=1) ~filename b =
   let scanner = {
     filename;
     src = b;
@@ -86,7 +86,7 @@ let make b filename =
     offset = 0;
     rdOffset = 0;
     lineOffset = 0;
-    lnum = 1;
+    lnum = line;
     mode = [];
   } in
   next scanner;
@@ -726,4 +726,4 @@ let isBinaryOp src startCnum endCnum =
       CharacterCodes.isLineBreak c ||
       c == CharacterCodes.eof
     in
-    leftOk && rightOk
+    leftOk && rightOk
diff --git a/src/napkin_scanner.mli b/src/napkin_scanner.mli
diff --git a/tests/napkin_test.ml b/tests/napkin_test.ml