Java源码编译过程
源代码(.java文件)--->分析(词法、语法分析)和填充符号表--->注解处理--->语义分析和字节码生成(.class文件)
词法分析:
将源代码转变成标记(Token)集合,标记是编译过程的最小元素。如 int a = b + 2; ---> int、a、=、b、+、2
语法分析:
根据语法由Token序列生成抽象语法树。(抽象语法树:描述程序代码语法结构的树形表示方式)
填充符号表:
符号表是由一组符号地址和符号信息组成的表格(类似哈希表的K-V值对形式)、符号表所登记的信息在编译的不同阶段都要用到。如在语义分析中,符号表用于语义检查(如检查一个名字的使用和原先的说明是否一致)和产生中间代码。在目标代码生成阶段,当对符号名地址分配时,符号表是其依据。
(补充:如果用户代码没有提供任何构造函数,此阶段会添加无参访问性与当前类一致的默认构造方法)
注解处理:
处理用户自定义的annotation,可以生成附加代码,节省共用代码的编写
语义分析:
1、标注检查:包括变量使用前是否声明,变量与赋值之间的数据类型是否匹配,常量折叠(int a = 1 + 2; ---> int a = 3;)等等
2、数据及控制流分析:包括方法每条路径是否有返回值异常是否处理等
3、解语法糖:语法糖是指在语言中添加某种语法,对语言功能没有影响,但方便程序员使用,Java中最常见的语法糖有泛型,Java虚拟机运行时不支持,故需要还原原来的语法
字节码生成:此阶段除了字节码的生成外,还包括实例构造器<init>()方法和类构造器<clinit>()方法添加到语法树,把字符串的加操作替换成StringBuffer或StringBuilder的append()操作