【编译原理】编译原理简单介绍
本文关键词:编译原理
<main> 【编译原理】编译原理简单介绍
原创 2017年05月07日 13:27:20
编译原理简单介绍 什么叫编译程序 翻译程序
翻译程序(Translator)是一种程序,其输入是某种语言的一系列语句,而其输出则是另一种语言的一系列语句,二者在逻辑上是等价的。就类似生活中的翻译官一样,把英语翻译成汉语,二者在意思上也是等价的。
编译程序(Compiler)是一种程序。它把用高级语言写的源程序作为数据接收,经过翻译转换,产生面向机器的代码作为输出。
这当中代码还可能要由汇编程序或装配程序作进一步加工,得出目标程序,交给计算机执行。
编译程序的工作过程一般可以分为5个阶段:
1. 词法分析
2. 语法分析
3. 语义分析和中间代码的产生
4. 优化
5. 目标代码生成
词法分析的任务是:输入源程序,对构成源程序的字符串进行扫描和分解,识别出一个个单词(定义符、标识符、运算符、界符、常数)。
在词法分析阶段的工作中所依循的是语言的语法规则(或称构词规则)。
描述语法规则的有效工具是正规式和有限自动机。
语法分析的任务是:在词法分析的基础上,根据语言的语法规则,把单词符号串分解成各类语法单元(语法范畴)(短语、子句、句子、程序段、程序),并确定整个输入串是否构成语法上正确的程序。
语法分析所依循的是语言的语法规则。
语法规则通常用上下文无关文法描述。
词法分析是一种线性分析,而语法分析是一种层次结构分析。
这一阶段的任务是:对语法分析所识别出的各类语法范畴,分析其含义,并进行初步翻译(产生中间代码)。这一阶段通常包含两个方面的工作。
1. 对每种语法范畴进行静态语义的检查,例如,变量是否定义、类型是否正确等等。
2. 如果语义正确则进行中间代码的翻译。
这一阶段所依循的是语言的语义规则,通常使用属性文法描述语义规则。
优化对于代码(主要是中间代码)进行加工变换,以期能够产生更为高效(省时间和空间)的目标代码 。
优化的主要方面有:公共子表达式的提取、循环优化、删除无用代码等等。
优化所依循的是程序的等价变换规则。
目标代码生成这一阶段的任务是:把中间代码(经过优化处理之后的)变换成特定机器上的低级语言代码(绝对指令、可重定位指令、汇编指令
)。
编译程序在工作过程中需要保持一系列的表格,以登记源程序的各类信息和编译各阶段的进展状况。
最重要的是符号表,用来等级源程序中出现的每个名字以及名字的各种属性。例如,一个名字是常量名还是变量名,还是过程名;如果是变量名,类型是什么,占多大内存,地址是多少等等。
编译各阶段均须维持表格并进行表格管理,建表的技术支持是数据结构,表格的分类、结构、处理方法决定于语言及机器,还有优化措施。
出错处理如果源程序有错误,编译程序应设法发现错误,并把有关错误的信息报告给用户。一个好的编译程序:
1. 全
最大限度发现错误
2. 准
准确指出错误的性质和发生地点
3. 局部化
将错误的影响限制在尽可能小的范围内
4. 自动校正
若能自动校正错误则更好,但其代价非常高
源程序中的错误一般分为语法错误和语义错误。
1. 语法错误
指源程序中不符合不符合语法(或词法)规则的错误,例如:单词拼写错误、括号不匹配等等。
2. 语义错误
指源程序中不符合语义规则的错误,例如:说明错误、作用域错误、类型不匹配等等。
一般在语义分析时检出来,有的语义错误要在运行时才能检测出来。
遍 是对源程序或源程序的中间结果从头到尾扫描一次,并作有关的加工处理,生成新的中间结果或目标程序。遍数多了,整个编译程序的逻辑结构就比较清晰,但是会增加输入和输出所消耗的时间。因此,在主存可能的前提下,一般还是遍数少的好。
分遍的依据:
1. 源程序的结构
2. 选用机型的内存大小
3. 设计目标的技术指标
4. 参加编译程序人员的数量、素质
好的编译程序的指标:
1. 符合语法规则的程序都可执行。
2. 任何非法的错误都有可能识别,并尽量少的产生连锁反应。
3. 错误不至于导致系统崩溃。
4. 可维护和可读性。
5. 模块化和结构化。
概念上我们有时候把编译程序分成编译前端和编译后端。
编译前端前端主要由源语言有关但与目标机无关的那些部分组成,通常包括词法分析、语法分析、语义分析与中间代码的产生,有的代码优化工作也可以包括在前端。
编译后端后端包括编译程序中与目标机有关的那些部分,如与目标机有关的代码优化和目标代码生成等。
通常后端不依赖源语言而仅仅依赖于中间语言。
以前人们构造编译程序大多数采用的是机器语言或汇编语言,现在只有为了充分发挥各种不同硬件系统的效率,为了满足各种不同的具体要求,才会采用这种工具来构造编译程序(或编译程序的“核心”部分)。现在越来越多采用高级语言来构造编译程序。
T型图为了便于说明,我们常采用T型图来表示源语言S、目标语言T、和比编译程序实现语言I之间的关系。
每个T型图相当于一个编译程序。
如果A机器上有一个使用A机器代码实现的某高级语言L1的编译程序(黄色),则我们可以使用L1语言编写另外一种高级语言L2的编译程序(橙色)。把写好的L2编译程序经过L1编译程序编译后就可以得到A机器码实习的L2编译程序(绿色)。
通过上面用高级语言L1构造编译程序的原理,我们可以实现编译程序的“移植”。首先我们有一个可以在A机器上编译的高级语言L,
接下来我们使用L去写一个能够在B机器上运行的编译程序,
然后通过L的编译程序就可以生成在A机器上可以运行的产生B机器代码的编译程序(3)。
使用这个编译程序(3)去编译一遍(2)就可以得到能在B机器上运行的B机器代码的编译程序(4).
自编译方式
先对语言的核心部分构造一个小小的编译程序(可用低级语言实现),再以它为工具构造能编译更多语言成分的较大编译程序,如此不断扩展,最后形成整个编译程序(滚雪球),,这种通过一系列自展途径而形成的编译程序的过程叫做自编译过程。
构造工具现在人们已经建立了多种编制部分编译程序或者整个编译程序的有效工具。构造编译程序的工具称为编译程序-编译程序、编译程序产生器或翻译程序书写系统。
例如:
自动产生扫描器:LEX FLEX
自动产生语法分析器:YACC BISON
阅读全文
版权声明:本文为博主原创文章,未经博主允许不得转载。
编译原理#简介
编译器概述什么是编译器? 编译器是一个程序 核心功能是把源代码翻译成目标代码 源代码:C/C++、Java、C#、html、SQL… 目标代码:x86、IA64、ARM、MIPS… 编译器的核心功能...
C语言编译原理简介1. 编辑器: 我们编写代码的一些窗口,如:记事本、word、notepad等。 2. 编译器: 检查用户代码的一些语法错误并且将其编译成汇编代码。 3.汇编器:将编译出来的文件变成目标代码(wi...
JDBC数据库操作封装(PreparedStatement)之前有用过老师给的实现好的JDBC封装类,今天自己看着书按自己思路实现了一遍,并将Statement改为了PreparedStatement。 代码import com.sun.tools.java...
Java处理控制台输入的长度可变的数组数据问题由来Java编程中有的时候我们会在控制台输入长度可变的数组数据(分隔符一致),例如:1 2 3 4 5 6或者1,2,3,4,5,6,7然后对这串未知长度的数据进行处理,得到对应类型的数组。分析1...
linux Shell中read的选项及用法1、Read的一些选项 Read可以带有-a, -d, -e, -n, -p, -r, -t, 和 -s八个选项。 -a :将内容读入到数值中echo -n "Input muliple val...
.Net编译原理简单介绍首先简单说一下计算机软件运行。所谓软件运行,就是一步一步做一些事情。计算机只认识0和1.给计算机下命令,只能是0与1的方式,确切的说,其实是CPU只认识0和1,因为软件运行是CPU控制的。人直接操作0...
编译原理简单介绍编译原理学习导论 大学课程为什么要开设编译原理呢?这门课程关注的是编译器方面的产生原理和技术问题,似乎和计算机的基础领域不沾边,可是编译原理却一直作为大学本科的必修课程,同时也成为了研究...
深入浅出编译原理-4-一个简单词法分析器的C语言实现引言 光说不练,假把式。 此小节来做一个实验,用c语言自己实现一个简单的词法分析器,来加深对词法分析的理解。感兴趣的就自己分析一下源码吧,挺简单的,就没画流程图,请见谅。闲言少叙,我们开始吧。 ...
编译原理:短语,简单短语,句柄,语法树在文法和语言概念这里,比较难理解的是短语、简单短语,所以好好梳理一下。 先给出短语、简单短语的概念: (备注:Vn代表非终结符号集,V+代表字汇表的正闭包,V*代表字汇表的闭包) 所以,短语、简单...
编译原理 语法树 句柄 简单短语 短语
编译原理犛锓ㄊ鳡句柄牸虻ザ逃餇短语
关于编译原理犛锓ㄊ
本文编号:1335200
本文链接:https://www.wllwen.com/wenshubaike/dxkc/1335200.html