Linux下GCC编程的四个步骤

LINUX2010-11-21 04:50

在Linux下进行C语言编程,必然要采用GNU GCC来编译C源代码生成可执行程序。

一、GCC快速入门
GCC指令的一般格式为:gcc [选项] 要编译的文件 [选项] [目标文件]
其中,目标文件可缺省,GCC默认生成可执行的文件名为:a.out
我们来看一下经典入门程序"Hello World!"
vi hello.c

#include <stdlib.h>
#include <stdio.h>
void main(void)
{
    printf("hello world!\r\n");
}

用GCC编译成执行程序:
gcc hello.c
该命令将 hello.c 直接生成最终二进制可执行程序 a.out
这条命令隐含执行了:
(1)预处理
(2)汇编
(3)编译
(4)链接
这里未指定输出文件,默认输出为 a.out
如果要指定最终二进制可执行程序名,那么用 -o 选项来指定名称,比如需要生成执行程序 hello.exe,那么可以:
gcc hello.c -o hello.exe

二、GCC的命令剖析 - 四步走
从上面我们知道GCC编译源代码生成最终可执行的二进制程序,GCC后台隐含执行了四个阶段步骤。
GCC 编译C源码有四个步骤:
预处理----> 编译 ----> 汇编 ----> 链接
现在我们就用GCC的命令选项来逐个剖析GCC过程。

1 )预处理(Pre-processing)
在该阶段,编译器将C源代码中的包含的头文件,如 stdio.h 编译进来,用户可以使用 gcc 的选项 -E 进行查看。
用法:gcc -E hello.c -o hello.i
作用:将 hello.c 预处理输出 hello.i 文件。

gcc -E hello.c -o hello.i
ls # 输出 hello.c hello.i
vi hello.i

(太多了,略)
2) 编译阶段(Compiling)
第二步进行的是编译阶段,在这个阶段中,GCC首先要检查代码的规范性、是否有语法错误等,以确定代码的实际要做的工作,在检查无误后,GCC把代码翻译成汇编语言。
用户可以使用 -S 选项来进行查看,该选项只进行编译而不进行汇编,即只生成汇编代码。
用法:gcc -S hello.i -o hello.s
作用:将预处理输出文件hello.i汇编成hello.s文件。

ls # 输出 hello.c hello.i hello.s

如下为 hello.s 汇编代码

.file    "hello.c"
.section    .rodata
.LC0:
.string    "hello world!\r"
.text
.globl main
.type    main, @function
main:
pushl    %ebp
movl    %esp, %ebp
andl    $-16, %esp
subl    $16, %esp
movl    $.LC0, (%esp)
call    puts
leave
ret
.size    main, .-main
.ident    "GCC: (Ubuntu 4.4.1-4ubuntu9) 4.4.1"
.section    .note.GNU-stack,"",@progbits

3) 汇编阶段(Assembling)
汇编阶段是把编译阶段生成的 .s 文件转成二进制目标代码,用 -c 参数。
用法:gcc -c hello.s -o hello.o
作用:将汇编输出文件 test.s 编译输出 test.o 文件。

gcc -c hello.s -o hello.o
ls # 输出 hello.c hello.i hello.o hello.s

4 )链接阶段(Link)
在成功编译之后,就进入了链接阶段。
用法:gcc hello.o -o hello.exe
作用:将编译输出文件 hello. o链接成最终可执行文件 hello.exe。

ls # 输出 hello.c hello.exe hello.i hello.o hello.s

运行该可执行文件,出现正确的结果如下。

./hello # 输出 "Hello World!"

在这里涉及到一个重要的概念:函数库
读者可以重新查看这个小程序,在这个程序中并没有定义「printf」的函数实现,且在预编译中包含进的「stdio.h」中也只有该函数的声明,而没有定义函数的实现。
那么,是在哪里实现「printf」函数的呢?最后的答案是:系统把这些函数实现都被做到名为 libc.so.6 的库文件中去了,在没有特别指定时,GCC会到系统默认的搜索路径「/usr/lib」下进行查找,也就是链接到 libc.so.6 库函数中去,这样就能实现函数「printf」了,而这也就是链接的作用。
你可以用ldd命令查看动态库加载情况:

ldd ./hello.exe
    #linux-gate.so.1 => (0x002cc000)
    #libc.so.6 => /lib/tls/i686/cmov/libc.so.6 (0x0045e000)
    #/lib/ld-linux.so.2 (0x00392000)

函数库一般分为静态库和动态库两种。
静态库是指编译链接时,把库文件的代码全部加入到可执行文件中,因此生成的文件比较大,但在运行时也就不再需要库文件了,其后缀名一般为『.a』。
动态库与之相反,在编译链接时并没有把库文件的代码加入到可执行文件中,而是在程序执行时由运行时链接文件加载库,这样可以节省系统的开销,动态库一般后缀名为『.so』,如前面所述的 libc.so.6 就是动态库。
GCC在编译时默认使用动态库(全文完)


原文链接: http://blog.jtwo.me/four-steps-of-the-gcc-program-in-linux