Linux系统编程之进程间通信(IPC)
1.IPC 方法
Linux 环境下,进程地址空间相互独立,每个进程各自有不同的用户地址空间。任何一个进程的全局变量在另 一个进程中都看不到,所以进程和进程之间不能相互访问,要交换数据必须通过内核,在内核中开辟一块缓冲区, 进程 1 把数据从用户空间拷到内核缓冲区,进程 2 再从内核缓冲区把数据读走,内核提供的这种机制称为进程间通信
(IPC,InterProcess Communication)。
在进程间完成数据传递需要借助操作系统提供特殊的方法,如:文件、管道、信号、共享内存、消息队列、套 接字、命名管道等。随着计算机的蓬勃发展,一些方法由于自身设计缺陷被淘汰或者弃用。现今常用的进程间通信方式有:
① 管道 (使用最简单)
② 信号 (开销最小)
③ 共享映射区 (无血缘关系)
④ 本地套接字 (最稳定)
下面重点介绍管道,其余方式后续会再讲。
2.匿名管道
2.1 什么是匿名管道
匿名管道是管道的一种,既然是匿名也就是说这个管道没有名字,但其本质是不变的,就是位于内核中的一块内存,匿名管道拥有上面介绍的管道的所有特性,额外的我们需要知道,匿名管道只能实现有血缘关系的进程间通信,什么叫有血缘的进程关系
呢,比如:父子进程
,兄弟进程
,爷孙进程
,叔侄进程
。最后说一下创建匿名管道的函数pipe()
,函数如下:
2.2 pipe() 函数
函数原型
1 |
|
函数参数:
传出参数,需要传递一个整形数组的地址,数组大小为 2,也就是说最终会传出两个元素
- pipefd[0]: 对应管道读端的文件描述符,通过它可以将数据从管道中读出
- pipefd[1]: 对应管道写端的文件描述符,通过它可以将数据写入到管道中
向管道文件读写数据其实是在读写内核缓冲区。
函数返回值
成功返回 0,失败返回 -1
2.3 管道特性
其本质是一个伪文件(实为内核缓冲区,不占用磁盘大小)
有两个文件描述符引用,一个表示读端,一个表示写端。
规定数据从管道的写端流入管道,从读端流出。
管道的原理: 管道实为内核使用
环形队列机制
,借助内核缓冲区(4k)实现
。管道的局限性:
① 数据不能进程自己写,自己读。
② 管道中数据不可反复读取。一旦读走,管道中不再存在。
③ 采用
半双工通信方式
,数据只能在单方向上流动。④ 只能在有公共祖先的进程间使用管道。
常见的通信方式有,
单工通信
、半双工通信
、全双工通信
。
管道在内核中,不能直接对其进行操作,我们通过什么方式去读写管道呢?其实管道操作就是文件 IO 操作,内核中管道的两端分别对应两个文件描述符,通过写端的文件描述符把数据写入到管道中,通过读端的文件描述符将数据从管道中读出来。读写管道的函数就是 Linux 中的文件 IO 函数 ==点击查看==-> read()/write()函数详解
1 | // 读管道 |
2.4 父子进程间通信
父子进程通信原理
管道创建成功以后,创建该管道的进程(父进程)同时掌握着管道的读端和写端。如何实现父子进程间通信呢? 通常可以采用如下步骤:
- 父进程调用
pipe
函数创建管道,得到两个文件描述符 fd[0]、fd[1]指向管道的读端和写端。 - 父进程调用
fork
创建子进程,那么子进程也有两个文件描述符指向同一管道。 - 父进程关闭管道读端,子进程关闭管道写端。父进程可以向管道中写入数据,子进程将管道中的数据读出。由于管道是利用环形队列实现的,数据从写端流入管道,从读端流出,这样就实现了进程间通信。
小练习
父进程往管道里写,子进程从管道读,然后打印读取的内容
1 |
|
编译运行,结果如下:
2.5 管道读写行为
读管道:
1 .管道有数据,read返回实际读到的字节数。
2 .管道无数据:
- 没有写端,read返回0 (类似读到文件尾)
- 有写端,read阻塞等待。
写管道:
1 .没有读端, 异常终止。 (SIGPIPE导致的)
2 .有读端:
- 管道已满, 阻塞等待
- 管道未满, 返回写出的字节个数。
小案例
1.使用管道实现父子进程间通信,完成:ls | wc –l。假定父进程实现 wc,子进程实现 ls
==分析==:
ls命令正常会将结果集写到stdout,但现在会写入管道写端
wc -l命令正常应该从stdin读取数据,但此时会从管道的读端读。
1 |
|
编译运行,结果如下:
直接执行命令,如下:
2.使用管道实现兄弟进程间通信。 兄:ls 弟: wc -l 父:等待回收子进程。
1 |
|
2.6 管道缓冲区大小
可以使用 ulimit –a
命令来查看当前系统中创建管道文件所对应的内核缓冲区大小。(默认4096)
也可以使用 fpathconf()
函数,借助参数 选项来查看。使用该宏应引入头文件<unistd.h>
long fpathconf(int fd, int name);
成功:返回管道的大小 失败:-1,设置 errno
2.7 管道的优劣
优点:
简单,相比信号,套接字实现进程间通信,简单很多。
缺点:
- 只能单向通信,双向通信需建立两个管道。
- 只能用于父子、兄弟进程(有共同祖先)间通信。该问题后来使用 fifo 有名管道解决。
3.有名管道
有名管道拥有管道的所有特性,之所以称之为有名是因为管道在磁盘上有实体文件,文件类型为 p
,有名管道文件大小永远为 0,因为有名管道也是将数据存储到内存的缓冲区中,打开这个磁盘上的管道文件就可以得到操作有名管道的文件描述符,通过文件描述符读写管道存储在内核中的数据。
3.1 mkfifio()函数
有名管道也可以称为 fifo (first in first out),使用有名管道既可以进行有血缘关系的进程间通信,也可以进行没有血缘关系的进程间通信。创建有名管道的方式有两种,一种是通过命令,一种是通过函数。
通过命令
1 | mkfifo 有名管道的名字 |
通过函数
1 |
|
参数:
pathname:
要创建的有名管道的名字
mode:
文件的操作权限,和 open () 的第三个参数一个作用,最终权限: (mode & ~umask)
返回值:
创建成功返回 0,失败返回 -1
一旦使用mkfifo
创建了一个 FIFO
,就可以使用 open
打开它,常见的文件 I/O函数
都可用于 fifo
。如:close
、read
、 write
、unlink
等。
3.2 fifo()实现非血缘关系进程间通信
下面这个例子,一个写fifo,一个读fifo,操作起来就像文件一样的:
编译执行,如图:
4.文件用于进程间通信
文件实现进程间通信:
打开的文件是内核中的一块缓冲区。多个无血缘关系的进程,可以同时访问该文件。
文件通信有没有血缘关系都行,
- 只是有血缘关系的进程对于同一个文件,使用的同一个文件描述符,
- 没有血缘关系的进程,对同一个文件使用的文件描述符可能不同。
- 这些都不是问题,打开的是同一个文件就行。
- 用文件通信没有阻塞等管道的特性,可能会遇到问题
5.内存映射 (mmap)
5.1 存储映射 I/O
存储映射I/O (Memory-mapped I/O)
使一个磁盘文件与存储空间中的一个缓冲区相映射。于是当从缓冲区中取数据,就相当于读文件中的相应字节。于此类似,将数据存入缓冲区,则相应的字节就自动写入文件。这样,就可在不适用read
和write
函数的情况下,使用地址(指针)完成 I/O 操作
。 使用这种方法,首先应通知内核,将一个指定文件映射到存储区域中。这个映射工作可以通过mmap 函数
来实现。
5.2 mmap() /munmap()函数
函数原型
1 |
|
函数参数:
addr:
从动态库加载区的什么位置开始创建内存映射区,一般指定为NULL
, 委托内核分配length
: 创建的内存映射区的大小(单位:字节),实际上这个大小是按照4k
的整数倍去分配的prot
: 对内存映射区的操作权限PROT_READ:
读内存映射区PROT_WRITE:
写内存映射区- 如果要对映射区有读写权限:
PROT_READ | PROT_WRITE
flags:
MAP_SHARED
: 多个进程可以共享数据,进行映射区数据同步MAP_PRIVATE
: 映射区数据是私有的,不能同步给其他进程
fd
: 文件描述符,对应一个打开的磁盘文件,内存映射区通过这个文件描述符和磁盘文件建立关联offset
: 磁盘文件的偏移量,文件从偏移到的位置开始进行数据映射,使用这个参数需要注意两个问题:- 偏移量必须是 4k 的整数倍,写 0 代表不偏移
- 这个参数必须是大于 0 的
函数返回值
- 成功:返回一个内存映射区的起始地址
- 失败:
MAP_FAILED (that is, (void *) -1)
mmap () 函数的参数相对较多,在使用该函数创建用于进程间通信的内存映射区的时候,各参数的指定都有一些注意事项,具体如下:
1 | 1. 第一个参数 addr 指定为 NULL 即可 |
内存映射区使用完之后也需要释放,释放函数原型如下:
1 | int munmap(void *addr, size_t length); |
函数参数:
- addr: mmap () 的返回值,创建的内存映射区的起始地址
- length: 和 mmap () 第二个参数相同即可
函数返回值
- 函数调用成功返回 0,失败返回 -1
总结:
1 | 1. 创建映射区的过程中,隐含着一次对映射文件的读操作。 |
小案例:使用mmap建立映射区
下面这个示例代码,使用mmap创建一个映射区(共享内存),并往映射区里写入内容:
编译运行,如下所示:
5.3 父子进程间mmap通信
父子等有血缘关系的进程之间也可以通过mmap
建立的映射区来完成数据通信。但相应的要在创建映射区的时 候指定对应的标志位参数 flags
:
MAP_PRIVATE
:(私有映射) 父子进程各自独占映射区;MAP_SHARED
: (共享映射) 父子进程共享映射区;
1 | /* |
1 |
|
5.4 无血缘关系进程间mmap通信
实质上mmap
是内核借助文件帮我们创建了一个映射区,多个进程之间利用该映射区完成数据传递。由于内核 空间多进程共享,因此无血缘关系的进程间也可使用mmap
来完成通信。只要设置相应的标志位参数 flags
即可。若想实现共享,当然应该使用MAP_SHARED
了。 值得注意的是:MAP_ANON
和 /dev/zero
都不能应用于非血缘关系进程间通信。只能用于亲子进程间。
A代码(进行写操作):
1 |
|
B代码(进行读操作)
1 |
|
5.5 匿名映射
通过使用我们发现,使用映射区来完成文件读写操作十分方便,父子进程间通信也较容易。但缺陷是,每次创建映射区一定要依赖一个文件才能实现。通常为了建立映射区要 open 一个 temp 文件,创建好了再 unlink、close 掉,比较麻烦。可以直接使用匿名映射来代替。其实 Linux 系统给我们提供了创建匿名映射区的方法,无需依赖一个文件即可创建映射区。同样需要借助标志位参数 flags 来指定。
使用MAP_ANONYMOUS
(或MAP_ANON
), 如:int *p = mmap(NULL, 4, PROT_READ|PROT_WRITE, MAP_SHARED|MAP_ANONYMOUS, -1, 0);
需注意的是,MAP_ANONYMOUS 和 MAP_ANON 这两个宏是 Linux 操作系统特有的宏
。在类 Unix 系统中如无该宏定义
,可使用如下两步来完成匿名映射区的建立。
① fd = open("/dev/zero", O_RDWR);
② p = mmap(NULL, size, PROT_READ|PROT_WRITE, MMAP_SHARED, fd, 0);