Posted 2025-09-24Updated 2025-10-21Note6 minutes read (About 858 words)0 visits

《Let’s Build A Simple Interpreter》学习笔记（三）

该笔记基于教程 Let’s Build A Simple Interpreter. from Ruslan’s Blog，原文使用 Python 为 Pascal 编写解释器，在该笔记中我将使用 Rust 进行解释器的编写。

1 核心概念

1.1 语法分析

根据语言的上下文无关文法，检查词法单元流的排列顺序是否符合语法规则，并将其组织成一个树形结构，称为语法树（Syntax Tree）。

2 语法分析（编译第二步）

2.1 任务

token流 -> 语法树: 语法分析器（Parser）通过自顶向下（如 LL）或自底向上（如 LR）的算法，来解析词法单元流，并生成语法树。这棵树清晰地展示了代码的层次结构，例如，一个 if-else 语句是如何由条件、then 块和 else 块构成的。

2.2 检查错误

报告语法错误，比如缺少分号或括号不匹配。（转换语法树失败，存在未知模式）

3 问题

编写一个解释器程序，解释器通过标准输入模拟接受一个加法语句，通过标准输出模拟返回解释的结果，该节中加法语句有如下要求：

加数为 0-9 的数字
无空白字符
只实现纯加法，无减法

4 代码实现

3.1 interpreter/token.rs

相较第二节无改动

3.2 interpreter/mod.rs

// interpreter/mod.rs

pub mod token;
pub use token::*;

#[derive(Debug, PartialEq, Eq, Clone)]
pub struct Interpreter {
    text: String,
    pos: usize,
    current_token: Option<Token>,
    current_char: Option<char>,
}

impl Interpreter {
    // 初始化函数
    pub fn new() -> Self {
        Interpreter {
            text: String::new(),
            pos: 0,
            current_token: None,
            current_char: None,
        }
    }

    pub fn error(&self, message: &str) -> ! {
        panic!("Error parsing input: {}", message);
    }

    // lexer 部分，只负责提供把字节流转为 token 的相关方法
    pub fn advance(&mut self) {
        self.pos += 1;
        if self.pos > self.text.len() {
            self.current_char = None;
            return;
        }
        self.current_char = self.text.chars().nth(self.pos);
    }

    pub fn integer(&mut self) -> String {
        let mut result = String::new();
        while let Some(c) = self.current_char {
            if c.is_digit(10) {
                result.push(c);
                self.advance();
            } else {
                break;
            }
        }
        result
    }

    pub fn get_next_token(&mut self) -> Token {
        // End of input
        if self.pos >= self.text.len() {
            return Token::new(TokenType::Eof, None);
        }

        // Skip whitespace
        if self.current_char.unwrap().is_whitespace() {
            self.advance();
            return self.get_next_token();
        }

        if self.current_char.unwrap().is_digit(10) {
            return Token::new(TokenType::Integer, Some(self.integer()));
        }

        if self.current_char == Some('+') {
            self.advance();
            return Token::new(
                TokenType::Plus,
                Some(self.current_char.unwrap().to_string()),
            );
        }
        if self.current_char == Some('-') {
            self.advance();
            return Token::new(
                TokenType::Minus,
                Some(self.current_char.unwrap().to_string()),
            );
        }
        self.error("Unexpected character");
    }

    // parser/interpreter 部分，负责识别结构和按照结构进行结果的生成

    pub fn eat(&mut self, token_type: TokenType) {
        if let Some(ref current_token) = self.current_token {
            if current_token.token_type == token_type {
                self.current_token = Some(self.get_next_token());
            } else {
                self.error("Unexpected token");
            }
        } else {
            self.error("Unexpected end of input");
        }
    }

    // 主要改动 1：增加可以根据当前 token 返回数字并“吃掉”数字的函数
    pub fn term(&mut self) -> i32 {
        let token = self.current_token.clone().unwrap();
        self.eat(TokenType::Integer);
        return token.value.unwrap().parse::<i32>().unwrap();
    }

    // 主要改动 2：修改 expr 函数，先初始化第一个数字 Token，然后循环“吃掉”运算符和数字，更新结果。
    pub fn expr(&mut self, text: String) -> i32 {
        self.text = text;
        self.pos = 0;
        self.current_char = self.text.chars().nth(self.pos);
        self.current_token = Some(self.get_next_token());

        let mut result = self.term();

        while let Some(ref token) = self.current_token.clone() {
            if token.token_type == TokenType::Plus {
                self.eat(TokenType::Plus);
                result += self.term();
            } else if token.token_type == TokenType::Minus {
                self.eat(TokenType::Minus);
                result -= self.term();
            } else {
                break;
            }
        }
        result
    }
}

3.3 main.rs

相较第二节无改动

《Let’s Build A Simple Interpreter》学习笔记（三）

http://localhost/2025/09/24/interpreter-3/

Author

Zero'F_Fa

Posted on

2025-09-24

Updated on

2025-10-21

《Let’s Build A Simple Interpreter》学习笔记（三）

1 核心概念

1.1 语法分析

2 语法分析（编译第二步）

2.1 任务

2.2 检查错误

3 问题

4 代码实现

3.1 interpreter/token.rs

3.2 interpreter/mod.rs

3.3 main.rs

Author

Posted on

Updated on

Licensed under

Comments

Links

Archives

Recents

Categories

Tags