swlab_parser_lib

swlap_parser_cpp version

0. parser_lib 사용 요령

만들어야 할 class

Token class : 해당 언어의 Token 명세서
Lexer class : 해당 언어의 regex - Token 관계를 기술
Parser class: 해당 언어의 grammar를 기술
Expr class : 해당 언어의 Abstract Syntax Tree 의 node를 기술

CommonParserUtil 함수 설명

void AddTokenLambda(string regex_exp, function<TOKEN(string)> lambda_token)

regex - Token 관계를 추가한다.
ex)
AddTokenLambda("[0-9]+", [](string text)->Token {return Token(EToken::INTEGER_NUMBER); });

void LexEndOfToken(Token token)

END_OF_TOKEN을 추가한다
ex)
LexEndOfToken(Token(EToken::END_OF_TOKEN));

CONTAINER Parsing(vector filepaths)

Parsing을 시작한다

void AddTreeLambda(string grammar_rule, function<CONTAINER<AST*>()> lambda_grammar_rule)

grammar_rule - tree 관계를 추가한다
ex)
parser_util.AddTreeLambda("SeqExpr' -> SeqExpr", [this]()->CONTAINER<AST*> {
	...
}

void SetStartSymbol(string start_symbol)

start_symbol을 추가한다
ex)
parser_util.SetStartSymbol("SeqExpr'");

CONTAINER<AST*> GetStackInTrees(int idx)

CommonParserUtil 내부 stack의 idx번째 tree를 가져온다

string GetStackInSyntax(int idx)

CommonParserUtil 내부 stack의 idx번째 syntax를 가져온다

1. Token class 작성요령

enum class ENUM_TOKEN 을 만듭니다.

enum class ENUM_TOKEN
{
	END_OF_TOKEN,
	EMPTY_EPACE,
	OPEN_PAREN,
	CLOSE_PAREN,
	IDENTIFIER,
	INTEGER_NUMBER,
	ADD,
	SUB,
	MUL,
	DIV,
	EQ,
	SEMICOLON
};

ENUM_TOKEN 과 str_token 사이의 정보를 가지고 있어야 합니다.

map<ENUM_TOKEN, string> str_to_enum_token =
{
	{ENUM_TOKEN::END_OF_TOKEN, "$"} ,
	{ENUM_TOKEN::EMPTY_EPACE, "_" },{ ENUM_TOKEN::OPEN_PAREN, "(" },
	{ENUM_TOKEN::CLOSE_PAREN, ")" },{ ENUM_TOKEN::IDENTIFIER, "identifier" },
	{ENUM_TOKEN::INTEGER_NUMBER, "integer_number" },{ ENUM_TOKEN::ADD, "+" },
	{ ENUM_TOKEN::SUB, "-" },{ ENUM_TOKEN::MUL, "*" },{ ENUM_TOKEN::DIV, "/" },
	{ ENUM_TOKEN::EQ, "=" },{ ENUM_TOKEN::SEMICOLON, ";" }
};

Token class 는 반드시 아래의 멤버를 가져야 합니다.

멤버 변수

ENUM_TOKEN enum_token
string str_token

생성자

Token(ENUM_TOKEN enum_token)

멤버 함수

string get_str_token() : ENUM_TOKEN 에 대응되는 str_token을 반환

2. Lexer class 작성요령

Lexer class는 AST class와 그 node를 담는 CONTAINER를 템플릿 인자를 가져야 합니다.

CONTAINER는 vector, list 가 가능합니다. (다른 container는 확인하지 않음)

template<typename AST,
	template<typename ELEM, typename = allocator<ELEM>> class CONTAINER>
class Lexer
{
	...
};

Lexer class의 생성자에서 Token을 생성하는 lambda식을 만듭니다.

CommonParserUtil 의 void AddTokenLambda(regex_expr, lambda_exp) 함수 사용
END_OF_TOKEN은 CommonParserUtil 의 void LexEndOfTokn(ENUM_TOKEN) 함수 사용

Lexer(CommonParserUtil<Token, AST, CONTAINER> &parser_util)
{
	parser_util.LexEndOfToken(Token(ENUM_TOKEN::END_OF_TOKEN));
	parser_util.AddTokenLambda("[0-9]+"[]()->Token {return Token(ENUM_TOKEN::INTEGER_NUMBER); });
	...
}

3. Parser class 작성요령

Parser class는 AST node class와 그 node를 담는 CONTAINER를 템플릿 인자를 가져야 합니다.

CONTAINER는 vector, list 가 가능합니다. (다른 container는 확인하지 않음)

template<typename AST,
	template<typename ELEM, typename = allocator<ELEM>> class CONTAINER>
class Parser
{
	...
}

Parser class의 생성자에서 Token을 생성하는 lambda식을 만듭니다.

CommonParserUtil의 void AddTreeLambda(grammar, lambda_exp) 함수 사용
start_symbol은 CommonParserUtil 의 void SetStartSymbol(start_tymbol) 함수 사용

tree lambda 작성요령

production_rule 작성

AssignExpr -> identifier = AssignExpr

작성한 production_rule을 실행하는 코드 작성

Nonterminal: CONTAINER GetStackInTrees(index) 함수 사용
Terminal: CONTAINER GetStackInSyntax(index) 함수 사용
index: production_rule 오른쪽에서의 위치를 x라고 했을때 2*x -1
오른쪽의 결과를 CONTAINER 의 형태로 만들어서 반환

최종 예시

parser()
{
	parser_util.SetStartSymbol("SeqExpr`");
	...
	parser_util.AddTreeLambda("AssignExpr -> identifier = AssignExpr", []()->CONTAINER<AST*> {
		string identifier = parser_util.GetStackInSyntax(1);
		CONTAINER<AST*> assignexpr = parser_util.GetStackInTrees(3);
		CONTAINER<AST*> ret(1, new Assign(identifier, *assignexpr.begin()));
		return ret;
	});
	...
}

Name		Name	Last commit message	Last commit date
Latest commit History 43 Commits
doc		doc
swlab_parser_cpp		swlab_parser_cpp
.gitattributes		.gitattributes
.gitignore		.gitignore
README.md		README.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

swlab_parser_lib

0. parser_lib 사용 요령

1. Token class 작성요령

2. Lexer class 작성요령

3. Parser class 작성요령

About

Releases

Packages

Languages

tlsdorye/swlab-parser-lib

Folders and files

Latest commit

History

Repository files navigation

swlab_parser_lib

0. parser_lib 사용 요령

1. Token class 작성요령

2. Lexer class 작성요령

3. Parser class 작성요령

About

Topics

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages