一、基本概念
1.1 什么是库
在Windows平台和Linux平台下都大量存在着库。
本质上来说,库是一种可执行代码的二进制形式,可以被操作系统载入内存执行。
由于windows和linux的平台不同(主要是编译器、汇编器和连接器的不同),因此二者的库的二进制是不兼容的。
本文仅限于介绍linux下的库。
1.2 库的种类
linux下的库有两种:静态库和共享库(动态库)。
二者的不同点在于代码被载入的时刻不同。
静态库的代码在编译过程中已经被载入可执行程序,因此体积较大。
共享库的代码是在可执行程序运行时才载入内存的,在编译过程中仅简单的引用,因此代码体积较小。
1.3 库存在的意义
库是别人写好的现有的,成熟的,可以复用的代码,你可以使用,但要记得遵守许可协议。
现实中每个程序都要以来很多基础的底层库,不可能每个人的代码都从零开始,因此库的存在意义非同寻常。
共享库的好处是,不同的应用程序如果调用相同的库,那么在内存里只需要有一份该共享库的实例。
1.4 库文件是如何产生的在linux下
静态库的后缀是.a,它的产生分两步
1.由源文件编译生成一堆.o,每个.o里都包含这个编译单元的符号表
2.ar命令将很多.o转换成.a,成为静态库
动态库的后缀是.so,它由gcc加特定参数编译产生。
具体方法参见后文实例。
1.5 库文件是如何命名的,有没有规范
在linux下,库文件一般放在/usr/lib和/lib下,
静态库的名字一般为libxxxx.a,其中xxxx是该lib的名称
动态库的名字一般为libxxxx.so.major.minor,xxxx是lib的名称,major是主版本号,minor是副版本号
1.6 如何知道一个可执行程序依赖哪些库
ldd命令可以查看一个可执行程序依赖的共享库,
例如:
ldd /bin/lnlibc.so. => /lib/libc.so. (×)/lib/ld-linux.so.
=> /lib/ld- linux.so. (×)
可以看到ln命令依赖于libc库和ld-linux库。
1.7 可执行程序在执行的时候如何定位共享库文件
当系统加载可执行代码时候,能够知道其所依赖的库的名字,但是还需要知道绝对路径。
此时,就需要系统动态载入器(dynamic linker/loader)
对于elf格式的可执行程序,是由ld-linux.so*来完成的,它先后搜索elf文件的DT_PRATH段——环境变量LD_LIBRARY_PATH——/etc/ld.so.cache缓存文件列表——/lib/、/usr/lib目录,找到库文件后将其载入内存。如:
export LD_LIBRARY_PATH='pwd'
将当前文件目录添加为共享目录
1.8 在新安装一个库之后如何让系统能够找到它
如果安装在/lib或者/usr/lib下,那么ld默认能够找到,无需其它操作。
如果安装在其它目录,需要将其添加到/etc/ld.so.cache文件中,步骤如下:
1.vi编辑/etc/ld.so.conf 文件,加入库文件所在目录的路径
2.运行ldconfig -v ,该命令会重建/etc/ld.so.cache缓存文件
注:
1)ldconfig命令的用途主要是在默认搜索目录/lib和/usr/lib以及动态库配置文件/etc/ld.so.conf内所列的目录下,搜索出可共享的动态链接库(格式如lib*.so*),进而创建出动态装入程序(ld.so)所需的连接和缓存文件。缓存文件默认为/etc/ld.so.cache。ldconfig通常在系统启动时运行,而当用户安装一个新的动态链接库时,就需要手工运行这个命令。
2)/etc/ld.so.cache包含了在/etc/ld.so.conf中指定的目录中查找到的所有链接库,按顺序存储。
二、用gcc生成静态库和动态链接库的示例
我们通常把一些公用函数制作成函数库,供其它程序使用。
函数库在程序编译时会被链接到目标代码中,程序运行时将不再需要该静态库。
动态库在程序编译时并不会被连接到目标代码中,而是在程序运行时才被载入,因此在程序运行时,还需要动态库存在。
本文主要通过举例来说明在linux中如何创建静态库和动态库,以及使用它们。
为了便于阐述,我们先做一部分准备工作。
2.1 准备好测试代码
hello.h(见程序1)为该函数库的头文件。
hello.c(见程序2)是函数库的源程序,其中包含公用函数hello,该函数将在屏幕上输出"Hello XXX!"。
main.c(见程序3)为测试库文件的主程序,在主程序中调用了公用函数hello。
三个程序都放在文件夹~/testso中
程序1:hello.h
#ifndef HELLO_H
#define HELLO_H
void hello(const char *name);
#endif
程序2:hello.c
#include <stdio.h>
void hello(const char *name) {
printf("Hello %s!\n", name);
}
程序3:main.c
#include "hello.h"
int main()
{
hello("everyone");
return ;
}
2.2 问题的提出
注意:这个时候,我们编译好的hello.o是无法通过gcc -o编译的(生成可执行程序),这个道理非常简单,hello.c是一个没有main函数的.c程序,因此不构成一个完整的程序,如果使用gcc -o编译并连接它,GCC将报错。
无论静态库,还是动态库,都是由.o文件创建的。因此,我们必须将源程序hello.c通过gcc先编译成.o文件。
这个时候,我们有三种思路:
1)通过编译多个源文件,直接将目标代码合成一个.o文件。
2)通过创建静态链接库libmyhello.a,使得main函数调用hello函数时可调用静态链接库。
3)通过创建动态链接库libmyhello.so,使得main函数调用hello函数时可调用静态链接库。
2.3 思路一:编译多个源文件
在系统提示符下键入以下命令得到hello.o文件。
gcc -c hello.c
为什么不使用gcc -o hello hello.c这个道理我们之前已经说了,使用-c是什么意思呢?这涉及到gcc编译选项的常识。
gcc -o是将.c源文件编译成为一个可执行的二进制代码(-o选项其实是指定输出文件名,如果不加-c选项,gcc默认会编译连接生成可执行文件,文件的名称由-o选项指定),这包括调用作为GCC内的一部分——真正的C编译器(ccl),以及调用GNU C编译器的输出中实际可执行代码的外部GNU汇编器(as)和连接器工具(ld)。
gcc -c是使用GNU汇编器将源文件转化为目标代码之后就结束,在这种情况下,只调用了C编译器(ccl)和汇编器(as),而连接器(ld)并没有被执行,所以输出的目标文件不会包含作为Linux程序在被装载和执行时所必须的包含信息,但它可以在以后被连接到一个程序。
我们运行ls命令看看是否生成了hello.o文件。
ls
hello.c hello.h hello.o main.c
在ls命令结果中,我们看到了hello.o文件,本步操作完成。
同理编译main
gcc -c main.c
将两个文件链接成一个.o文件。
gcc hello.o main.o -o hello
运行
$ ./hello Hello everyone!
完成!
2.4思路二:静态链接库
下面我们先来看看如何创建静态库,以及使用它。
静态库文件名的命名规范是以lib为前缀,紧接着跟静态库名,扩展名为.a。例如:我们将创建的静态库名为myhello,则静态库文件名就是libmyhello.a。在创建和使用静态库时,需要注意这点。创建静态库用ar命令。
在系统提示符下键入以下命令将创建静态库文件libmyhello.a。
$ ar rcs libmyhello.a hello.o
我们同样运行ls命令查看结果:
$ ls
hello.c hello.h hello.o libmyhello.a main.c
ls命令结果中有libmyhello.a。
静态库制作完了,如何使用它内部的函数呢?只需要在使用到这些公用函数的源程序中包含这些公用函数的原型声明,然后再用gcc命令生成可执行文件时指明静态库,gcc将会从静态库中将公用函数连接到可执行文件中。注意,gcc会在静态库名前加上前缀lib,然后追加扩展名.a得到的静态库文件名来查找静态库文件,因此,我们在写需要连接的库时,只写名字就可以,如libmyhello.a的库,只写:myhello。
在程序3:main.c中,我们包含了静态库的头文件hello.h,然后在主程序main中直接调用公用函数hello。
下面先生成目标程序hello,然后运行hello程序看看结果如何。
$ gcc -o hello main.c -static -L. -lmyhello $ ./hello Hello everyone!
我们删除静态库文件试试公用函数hello是否真的连接到目标文件hello中了。
$ rm libmyhello.a $ ./hello Hello eceryone!
程序照常运行,说明静态库中的公用函数已经连接到目标程序中了。
静态链接库的一个缺点是,如果同时运行了许多程序,并且它们使用了同一个库函数,这样,在内存中会大量拷贝同一库函数。这样,就会浪费很多珍贵的内存和存储空间。使用了共享链接库的linux就可以避免这个问题。
当一个程序使用共享函数库时,在连接阶段并不把函数代码连接进来,而只是链接函数的一个引用。当最终的函数导入内存开始真正执行时,函数引用被解析,共享函数库的代码才真正导入到内存中。这样,共享链接库的函数就可以被许多程序同时共享,并且只需存储一次就可以了。共享函数库的另一个优点是,它可以独立更新,与调用它的函数毫不影响。
2.5 思路三:动态链接库(共享函数库)
我们继续看看如何在linux中创建动态库。还是从.o文件开始。
动态库文件名命名规范和静态库文件名类似,也是在动态库名增加前缀lib,但其文件扩展名为.so。例如:我们将创建的动态库名为myhello,则动态库文件名就是libmyhello.so。用gcc来创建动态库:
1)第一步:生成hello.o目标文件,使用如下命令。在此处需要添加-fPIC参数,该参数用于生成位置无关代码,以供生成动态库使用:
gcc -c -o hello.o -fPIC hello.c
2)第二步:使用-shared参数生成动态库:
gcc -shared -o libmyhello.so hello.o
上述两个命令可以连在一起:
gcc -shared -fPIC -o libmyhello.so hello.c
在程序中使用动态库和使用静态库完全一样,也是在使用到这些公用函数的源程序中包含这些公用函数的原型声明,然后再用gcc命令生成目标文件时指明动态库名进行编译。我们先运行gcc命令生成目标文件,再运行它看看结果。
如果直接用如下方法进行编译,并连接:
$ gcc -o hello main.c -L. -lmyhello
(使用" -lmyhello"标记来告诉GCC驱动程序在连接阶段引用共享函数库libmyhello.so。"-L."标记告诉GCC函数库可能位于当前目录。注:"."表示当前目录)
执行目标程序:
$ ./hello
出错:
./hello: error while loading shared libraries: libmyhello.so: cannot open shared object
错误提示:找不到动态库文件libmyhello.so。程序在运行时,会查找需要的动态库文件,顺序参考后文介绍。若找到,则载入动态库,否则将提示类似上述错误而终止程序运行。有多种方法可以解决:
1)我们将文件libmyhello.so复制到目录/usr/lib中,再试试。
$ sudo mv libmyhello.so /usr/lib $ ldconfig -v
2)既然连接器会搜寻LD_LIBRARY_PATH所指定的目录,那么我们可以将当前目录加入这个环境变量中
export LD_LIBRARY_PATH=$(LD_LIBRARY_PATH) :$(pwd)
3)将当前目录写入/etc/ld.so.conf中,然后执行ldconfig -v命令,将动态库写入/etc/ld.so.cache文件。
正确设置后,执行./hello即可执行程序。
可以查看它是如何调用动态库中的函数的。
linux-vdso.so. => (0x00007fffe8f9b000)
libmyhello.so => /home/chenjw/testso/libmyhello.so (0x00007fbe807d5000)
libc.so. => /lib/x86_64-linux-gnu/libc.so. (0x00007fbe80410000)
/lib64/ld-linux-x86-.so. (0x000055dc016c2000)
2.6 静态库链接时搜索路径顺序:
ld会去找GCC命令中的参数-L
再找gcc的环境变量LIBRARY_PATH
再找内定目录/lib /usr/lib /usr/local/lib 这是当初Compile gcc时写在程序内的。
2.7 动态库链接时,执行时搜索路径顺序:
编译目标代码时指定的动态库搜索路径;
环境变量LD_LIBRARY_PATH指定的动态库搜索路径;
配置文件/etc/ld.so.conf中指定的动态库搜索路径;
默认的动态库搜索路径 /lib;
默认的动态库搜索路径/usr/lib。
2.8 有关环境变量
LIBRARY_PATH环境变量:指定程序静态链接库文件搜索路径
LD_LIBRARY_PATH环境变量:指定程序动态链接库文件搜索路径