1*d219b4ceSAdam Hornacek /* 2*d219b4ceSAdam Hornacek * CDDL HEADER START 3*d219b4ceSAdam Hornacek * 4*d219b4ceSAdam Hornacek * The contents of this file are subject to the terms of the 5*d219b4ceSAdam Hornacek * Common Development and Distribution License (the "License"). 6*d219b4ceSAdam Hornacek * You may not use this file except in compliance with the License. 7*d219b4ceSAdam Hornacek * 8*d219b4ceSAdam Hornacek * See LICENSE.txt included in this distribution for the specific 9*d219b4ceSAdam Hornacek * language governing permissions and limitations under the License. 10*d219b4ceSAdam Hornacek * 11*d219b4ceSAdam Hornacek * When distributing Covered Code, include this CDDL HEADER in each 12*d219b4ceSAdam Hornacek * file and include the License file at LICENSE.txt. 13*d219b4ceSAdam Hornacek * If applicable, add the following below this CDDL HEADER, with the 14*d219b4ceSAdam Hornacek * fields enclosed by brackets "[]" replaced with your own identifying 15*d219b4ceSAdam Hornacek * information: Portions Copyright [yyyy] [name of copyright owner] 16*d219b4ceSAdam Hornacek * 17*d219b4ceSAdam Hornacek * CDDL HEADER END 18*d219b4ceSAdam Hornacek */ 19*d219b4ceSAdam Hornacek 20*d219b4ceSAdam Hornacek /* 21*d219b4ceSAdam Hornacek * Copyright (c) 2017, 2021, Oracle and/or its affiliates. All rights reserved. 22*d219b4ceSAdam Hornacek * Portions Copyright (c) 2017, Chris Fraire <cfraire@me.com>. 23*d219b4ceSAdam Hornacek */ 24*d219b4ceSAdam Hornacek 25*d219b4ceSAdam Hornacek /* 26*d219b4ceSAdam Hornacek * Gets Kotlin symbols - ignores comments, strings, keywords 27*d219b4ceSAdam Hornacek */ 28*d219b4ceSAdam Hornacek 29*d219b4ceSAdam Hornacek // comments can be nested in kotlin, so below logic doesn't allow that with yybegin we save only one nesting 30*d219b4ceSAdam Hornacek // same for strings 31*d219b4ceSAdam Hornacek 32*d219b4ceSAdam Hornacek package org.opengrok.indexer.analysis.kotlin; 33*d219b4ceSAdam Hornacek 34*d219b4ceSAdam Hornacek import org.opengrok.indexer.analysis.JFlexSymbolMatcher; 35*d219b4ceSAdam Hornacek %% 36*d219b4ceSAdam Hornacek %public 37*d219b4ceSAdam Hornacek %class KotlinSymbolTokenizer 38*d219b4ceSAdam Hornacek %extends JFlexSymbolMatcher 39*d219b4ceSAdam Hornacek %unicode 40*d219b4ceSAdam Hornacek %buffer 32766 41*d219b4ceSAdam Hornacek %int 42*d219b4ceSAdam Hornacek %include ../CommonLexer.lexh 43*d219b4ceSAdam Hornacek %char 44*d219b4ceSAdam Hornacek %{ 45*d219b4ceSAdam Hornacek private int nestedComment; 46*d219b4ceSAdam Hornacek 47*d219b4ceSAdam Hornacek @Override reset()48*d219b4ceSAdam Hornacek public void reset() { 49*d219b4ceSAdam Hornacek super.reset(); 50*d219b4ceSAdam Hornacek nestedComment = 0; 51*d219b4ceSAdam Hornacek } 52*d219b4ceSAdam Hornacek %} 53*d219b4ceSAdam Hornacek 54*d219b4ceSAdam Hornacek %state STRING COMMENT SCOMMENT QSTRING TSTRING 55*d219b4ceSAdam Hornacek 56*d219b4ceSAdam Hornacek %include ../Common.lexh 57*d219b4ceSAdam Hornacek %include Kotlin.lexh 58*d219b4ceSAdam Hornacek %% 59*d219b4ceSAdam Hornacek 60*d219b4ceSAdam Hornacek /* TODO : support identifiers escaped by ` `*/ 61*d219b4ceSAdam Hornacek <YYINITIAL> { 62*d219b4ceSAdam Hornacek {Identifier} {String id = yytext(); 63*d219b4ceSAdam Hornacek if(!Consts.kwd.contains(id)){ 64*d219b4ceSAdam Hornacek onSymbolMatched(id, yychar); 65*d219b4ceSAdam Hornacek return yystate(); } 66*d219b4ceSAdam Hornacek } 67*d219b4ceSAdam Hornacek {Number} {} 68*d219b4ceSAdam Hornacek \" { yybegin(STRING); } 69*d219b4ceSAdam Hornacek \' { yybegin(QSTRING); } 70*d219b4ceSAdam Hornacek \"\"\" { yybegin(TSTRING); } 71*d219b4ceSAdam Hornacek "//" { yybegin(SCOMMENT); } 72*d219b4ceSAdam Hornacek 73*d219b4ceSAdam Hornacek } 74*d219b4ceSAdam Hornacek 75*d219b4ceSAdam Hornacek <STRING> { 76*d219b4ceSAdam Hornacek \\[\"\$\\] {} 77*d219b4ceSAdam Hornacek \" { yybegin(YYINITIAL); } 78*d219b4ceSAdam Hornacek } 79*d219b4ceSAdam Hornacek 80*d219b4ceSAdam Hornacek <QSTRING> { 81*d219b4ceSAdam Hornacek \\[\'\\] {} 82*d219b4ceSAdam Hornacek \' { yybegin(YYINITIAL); } 83*d219b4ceSAdam Hornacek } 84*d219b4ceSAdam Hornacek 85*d219b4ceSAdam Hornacek <TSTRING> { 86*d219b4ceSAdam Hornacek /* 87*d219b4ceSAdam Hornacek * "raw string ... doesn't support backslash escaping" 88*d219b4ceSAdam Hornacek */ 89*d219b4ceSAdam Hornacek \"\"\" { yybegin(YYINITIAL); } 90*d219b4ceSAdam Hornacek } 91*d219b4ceSAdam Hornacek 92*d219b4ceSAdam Hornacek <STRING, TSTRING> { 93*d219b4ceSAdam Hornacek /* 94*d219b4ceSAdam Hornacek * TODO : support template expressions inside curly brackets 95*d219b4ceSAdam Hornacek */ 96*d219b4ceSAdam Hornacek \$ {Identifier} { 97*d219b4ceSAdam Hornacek String capture = yytext(); 98*d219b4ceSAdam Hornacek String sigil = capture.substring(0, 1); 99*d219b4ceSAdam Hornacek String id = capture.substring(1); 100*d219b4ceSAdam Hornacek if (!Consts.kwd.contains(id)) { 101*d219b4ceSAdam Hornacek onSymbolMatched(id, yychar + 1); 102*d219b4ceSAdam Hornacek return yystate(); 103*d219b4ceSAdam Hornacek } 104*d219b4ceSAdam Hornacek } 105*d219b4ceSAdam Hornacek } 106*d219b4ceSAdam Hornacek 107*d219b4ceSAdam Hornacek <YYINITIAL, COMMENT> { 108*d219b4ceSAdam Hornacek "/*" { 109*d219b4ceSAdam Hornacek if (nestedComment++ == 0) { 110*d219b4ceSAdam Hornacek yybegin(COMMENT); 111*d219b4ceSAdam Hornacek } 112*d219b4ceSAdam Hornacek } 113*d219b4ceSAdam Hornacek } 114*d219b4ceSAdam Hornacek 115*d219b4ceSAdam Hornacek <COMMENT> { 116*d219b4ceSAdam Hornacek "*/" { 117*d219b4ceSAdam Hornacek if (--nestedComment == 0) { 118*d219b4ceSAdam Hornacek yybegin(YYINITIAL); 119*d219b4ceSAdam Hornacek } 120*d219b4ceSAdam Hornacek } 121*d219b4ceSAdam Hornacek } 122*d219b4ceSAdam Hornacek 123*d219b4ceSAdam Hornacek <SCOMMENT> { 124*d219b4ceSAdam Hornacek {EOL} { yybegin(YYINITIAL);} 125*d219b4ceSAdam Hornacek } 126*d219b4ceSAdam Hornacek 127*d219b4ceSAdam Hornacek <YYINITIAL, STRING, COMMENT, SCOMMENT, QSTRING, TSTRING> { 128*d219b4ceSAdam Hornacek {WhspChar}+ | 129*d219b4ceSAdam Hornacek [^] {} 130*d219b4ceSAdam Hornacek } 131