xref: /OpenGrok/opengrok-indexer/src/main/jflex/analysis/erlang/ErlangSymbolTokenizer.lex (revision d219b4cea555a12b602d2d5518daa22134ad4879)
1*d219b4ceSAdam Hornacek /*
2*d219b4ceSAdam Hornacek  * CDDL HEADER START
3*d219b4ceSAdam Hornacek  *
4*d219b4ceSAdam Hornacek  * The contents of this file are subject to the terms of the
5*d219b4ceSAdam Hornacek  * Common Development and Distribution License (the "License").
6*d219b4ceSAdam Hornacek  * You may not use this file except in compliance with the License.
7*d219b4ceSAdam Hornacek  *
8*d219b4ceSAdam Hornacek  * See LICENSE.txt included in this distribution for the specific
9*d219b4ceSAdam Hornacek  * language governing permissions and limitations under the License.
10*d219b4ceSAdam Hornacek  *
11*d219b4ceSAdam Hornacek  * When distributing Covered Code, include this CDDL HEADER in each
12*d219b4ceSAdam Hornacek  * file and include the License file at LICENSE.txt.
13*d219b4ceSAdam Hornacek  * If applicable, add the following below this CDDL HEADER, with the
14*d219b4ceSAdam Hornacek  * fields enclosed by brackets "[]" replaced with your own identifying
15*d219b4ceSAdam Hornacek  * information: Portions Copyright [yyyy] [name of copyright owner]
16*d219b4ceSAdam Hornacek  *
17*d219b4ceSAdam Hornacek  * CDDL HEADER END
18*d219b4ceSAdam Hornacek  */
19*d219b4ceSAdam Hornacek 
20*d219b4ceSAdam Hornacek /*
21*d219b4ceSAdam Hornacek  * Copyright (c) 2015, 2021, Oracle and/or its affiliates. All rights reserved.
22*d219b4ceSAdam Hornacek  * Portions Copyright (c) 2017, Chris Fraire <cfraire@me.com>.
23*d219b4ceSAdam Hornacek  */
24*d219b4ceSAdam Hornacek 
25*d219b4ceSAdam Hornacek /*
26*d219b4ceSAdam Hornacek  * Gets Erlang symbols - ignores comments, strings, keywords
27*d219b4ceSAdam Hornacek  */
28*d219b4ceSAdam Hornacek 
29*d219b4ceSAdam Hornacek package org.opengrok.indexer.analysis.erlang;
30*d219b4ceSAdam Hornacek 
31*d219b4ceSAdam Hornacek import org.opengrok.indexer.analysis.JFlexSymbolMatcher;
32*d219b4ceSAdam Hornacek %%
33*d219b4ceSAdam Hornacek %public
34*d219b4ceSAdam Hornacek %class ErlangSymbolTokenizer
35*d219b4ceSAdam Hornacek %extends JFlexSymbolMatcher
36*d219b4ceSAdam Hornacek %unicode
37*d219b4ceSAdam Hornacek %int
38*d219b4ceSAdam Hornacek %include ../CommonLexer.lexh
39*d219b4ceSAdam Hornacek %char
40*d219b4ceSAdam Hornacek 
41*d219b4ceSAdam Hornacek %state STRING COMMENT QATOM
42*d219b4ceSAdam Hornacek 
43*d219b4ceSAdam Hornacek %include ../Common.lexh
44*d219b4ceSAdam Hornacek %include Erlang.lexh
45*d219b4ceSAdam Hornacek %%
46*d219b4ceSAdam Hornacek 
47*d219b4ceSAdam Hornacek <YYINITIAL> {
48*d219b4ceSAdam Hornacek 
49*d219b4ceSAdam Hornacek "?" {Identifier}    {  // Macros
50*d219b4ceSAdam Hornacek }
51*d219b4ceSAdam Hornacek 
52*d219b4ceSAdam Hornacek {Identifier} {
53*d219b4ceSAdam Hornacek     String id = yytext();
54*d219b4ceSAdam Hornacek                 if (!id.equals("_") && !Consts.kwd.contains(id)) {
55*d219b4ceSAdam Hornacek                         onSymbolMatched(id, yychar);
56*d219b4ceSAdam Hornacek                         return yystate();
57*d219b4ceSAdam Hornacek                 }
58*d219b4ceSAdam Hornacek  }
59*d219b4ceSAdam Hornacek 
60*d219b4ceSAdam Hornacek ^"-" {Identifier} {
61*d219b4ceSAdam Hornacek     String capture = yytext();
62*d219b4ceSAdam Hornacek     String punc = capture.substring(0, 1);
63*d219b4ceSAdam Hornacek     String id = capture.substring(1);
64*d219b4ceSAdam Hornacek     if (!Consts.modules_kwd.contains(id)) {
65*d219b4ceSAdam Hornacek         onSymbolMatched(id, yychar + 1);
66*d219b4ceSAdam Hornacek         return yystate();
67*d219b4ceSAdam Hornacek     }
68*d219b4ceSAdam Hornacek }
69*d219b4ceSAdam Hornacek 
70*d219b4ceSAdam Hornacek {ErlInt}        {}
71*d219b4ceSAdam Hornacek {Number}        {}
72*d219b4ceSAdam Hornacek 
73*d219b4ceSAdam Hornacek  \"     { yybegin(STRING); }
74*d219b4ceSAdam Hornacek  \'     { yybegin(QATOM); }
75*d219b4ceSAdam Hornacek  "%"   { yybegin(COMMENT); }
76*d219b4ceSAdam Hornacek  }
77*d219b4ceSAdam Hornacek 
78*d219b4ceSAdam Hornacek <STRING> {
79*d219b4ceSAdam Hornacek  \\[\"\\]    {}
80*d219b4ceSAdam Hornacek  \"     { yybegin(YYINITIAL); }
81*d219b4ceSAdam Hornacek }
82*d219b4ceSAdam Hornacek 
83*d219b4ceSAdam Hornacek <QATOM> {
84*d219b4ceSAdam Hornacek  \\[\'\\]    {}
85*d219b4ceSAdam Hornacek  \'     { yybegin(YYINITIAL); }
86*d219b4ceSAdam Hornacek }
87*d219b4ceSAdam Hornacek 
88*d219b4ceSAdam Hornacek <COMMENT> {
89*d219b4ceSAdam Hornacek  {EOL}    { yybegin(YYINITIAL);}
90*d219b4ceSAdam Hornacek }
91*d219b4ceSAdam Hornacek 
92*d219b4ceSAdam Hornacek <YYINITIAL, STRING, QATOM, COMMENT> {
93*d219b4ceSAdam Hornacek {ErlangWhiteSpace}    {}
94*d219b4ceSAdam Hornacek 
95*d219b4ceSAdam Hornacek [^]    {}
96*d219b4ceSAdam Hornacek }
97