Linux系统编程之进程间通信(IPC)

1.IPC 方法

Linux 环境下，进程地址空间相互独立，每个进程各自有不同的用户地址空间。任何一个进程的全局变量在另一个进程中都看不到，所以进程和进程之间不能相互访问，要交换数据必须通过内核，在内核中开辟一块缓冲区，进程 1 把数据从用户空间拷到内核缓冲区，进程 2 再从内核缓冲区把数据读走，内核提供的这种机制称为进程间通信（IPC，InterProcess Communication）。

在进程间完成数据传递需要借助操作系统提供特殊的方法，如：文件、管道、信号、共享内存、消息队列、套接字、命名管道等。随着计算机的蓬勃发展，一些方法由于自身设计缺陷被淘汰或者弃用。现今常用的进程间通信方式有：

① 管道 (使用最简单)

② 信号 (开销最小)

③ 共享映射区 (无血缘关系)

④ 本地套接字 (最稳定)

下面重点介绍管道，其余方式后续会再讲。

2.匿名管道

2.1 什么是匿名管道

匿名管道是管道的一种，既然是匿名也就是说这个管道没有名字，但其本质是不变的，就是位于内核中的一块内存，匿名管道拥有上面介绍的管道的所有特性，额外的我们需要知道，匿名管道只能实现有血缘关系的进程间通信，什么叫有血缘的进程关系呢，比如：父子进程，兄弟进程，爷孙进程，叔侄进程。最后说一下创建匿名管道的函数pipe()，函数如下：

2.2 pipe() 函数

函数原型

1
2
3

#include <unistd.h>
// 创建一个匿名的管道, 得到两个可用的文件描述符
int pipe(int pipefd[2]);

函数参数：

传出参数，需要传递一个整形数组的地址，数组大小为 2，也就是说最终会传出两个元素

pipefd[0]: 对应管道读端的文件描述符，通过它可以将数据从管道中读出
pipefd[1]: 对应管道写端的文件描述符，通过它可以将数据写入到管道中

向管道文件读写数据其实是在读写内核缓冲区。

函数返回值

成功返回 0，失败返回 -1

2.3 管道特性

其本质是一个伪文件(实为内核缓冲区,不占用磁盘大小)
有两个文件描述符引用，一个表示读端，一个表示写端。
规定数据从管道的写端流入管道，从读端流出。

管道的原理: 管道实为内核使用环形队列机制，借助内核缓冲区(4k)实现。

管道的局限性：

① 数据不能进程自己写，自己读。

② 管道中数据不可反复读取。一旦读走，管道中不再存在。

③ 采用半双工通信方式，数据只能在单方向上流动。

④ 只能在有公共祖先的进程间使用管道。

常见的通信方式有，单工通信、半双工通信、全双工通信。

管道在内核中，不能直接对其进行操作，我们通过什么方式去读写管道呢？其实管道操作就是文件 IO 操作，内核中管道的两端分别对应两个文件描述符，通过写端的文件描述符把数据写入到管道中，通过读端的文件描述符将数据从管道中读出来。读写管道的函数就是 Linux 中的文件 IO 函数 ==点击查看==-> read()/write()函数详解

// 读管道
ssize_t read(int fd, void *buf, size_t count);
// 写管道的函数
ssize_t write(int fd, const void *buf, size_t count);

2.4 父子进程间通信

父子进程通信原理

管道创建成功以后，创建该管道的进程（父进程）同时掌握着管道的读端和写端。如何实现父子进程间通信呢？通常可以采用如下步骤：

父进程调用 pipe 函数创建管道，得到两个文件描述符 fd[0]、fd[1]指向管道的读端和写端。
父进程调用 fork 创建子进程，那么子进程也有两个文件描述符指向同一管道。
父进程关闭管道读端，子进程关闭管道写端。父进程可以向管道中写入数据，子进程将管道中的数据读出。由于管道是利用环形队列实现的，数据从写端流入管道，从读端流出，这样就实现了进程间通信。

小练习

父进程往管道里写，子进程从管道读，然后打印读取的内容

#include <stdio.h>
#include <stdlib.h>
#include <string.h>
#include <unistd.h>
#include <errno.h>
#include <pthread.h>

void sys_err(const char *str)
{
	perror(str);
	exit(1);
}

int main(int argc, char *argv[])
{
	int ret;
	int fd[2];
	pid_t pid;

	char *str = "hello pipe\n";
	char buf[1024];

	ret = pipe(fd);
	if (ret == -1)
		sys_err("pipe error");

	pid = fork();
	if (pid > 0)
	{
		close(fd[0]); // 关闭读段
					  // sleep(3);  				//防止终端提示和输出混杂在一起
		write(fd[1], str, strlen(str));
		close(fd[1]);
	}
	else if (pid == 0)
	{
		close(fd[1]); // 子进程关闭写段
		ret = read(fd[0], buf, sizeof(buf));
		printf("child read ret = %d\n", ret);
		write(STDOUT_FILENO, buf, ret);

		close(fd[0]);
	}

	return 0;
}

编译运行，结果如下：

2.5 管道读写行为

读管道：

1 .管道有数据，read返回实际读到的字节数。

2 .管道无数据：

没有写端，read返回0 （类似读到文件尾）
有写端，read阻塞等待。

写管道：

1 .没有读端，异常终止。（SIGPIPE导致的）

2 .有读端：

管道已满，阻塞等待
管道未满，返回写出的字节个数。

小案例

1.使用管道实现父子进程间通信，完成：ls | wc –l。假定父进程实现 wc，子进程实现 ls

==分析==:

ls命令正常会将结果集写到stdout，但现在会写入管道写端

wc -l命令正常应该从stdin读取数据，但此时会从管道的读端读。

#include <stdio.h>
#include <stdlib.h>
#include <string.h>
#include <unistd.h>
#include <errno.h>
#include <pthread.h>

void sys_err(const char *str)
{
	perror(str);
	exit(1);
}
int main(int argc, char *argv[])
{
	int fd[2];
	int ret;
	pid_t pid;

	ret = pipe(fd); // 父进程先创建一个管道,持有管道的读端和写端
	if (ret == -1)
	{
		sys_err("pipe error");
	}

	pid = fork(); // 子进程同样持有管道的读和写端
	if (pid == -1)
	{
		sys_err("fork error");
	}
	else if (pid > 0)
	{ // 父进程 读, 关闭写端
		close(fd[1]);
		dup2(fd[0], STDIN_FILENO);		// 重定向 stdin 到 管道的 读端
		execlp("wc", "wc", "-l", NULL); // 执行 wc -l 程序
		sys_err("exclp wc error");
	}
	else if (pid == 0)
	{
		close(fd[0]);
		dup2(fd[1], STDOUT_FILENO); // 重定向 stdout 到 管道写端
		execlp("ls", "ls", NULL);	// 子进程执行 ls 命令
		sys_err("exclp ls error");
	}

	return 0;
}

编译运行，结果如下：

直接执行命令，如下：

2.使用管道实现兄弟进程间通信。兄：ls 弟： wc -l 父：等待回收子进程。

#include <stdio.h>
#include <stdlib.h>
#include <string.h>
#include <unistd.h>
#include <errno.h>
#include <pthread.h>
void sys_err(const char *str)
{
	perror(str);
	exit(1);
}
int main(int argc, char *argv[])
{
	int fd[2];
	int ret, i;
	pid_t pid;

	ret = pipe(fd);
	if (ret == -1)
	{
		sys_err("pipe error");
	}

	for (i = 0; i < 2; i++)
	{ // 表达式2 出口,仅限父进程使用
		pid = fork();
		if (pid == -1)
		{
			sys_err("fork error");
		}
		if (pid == 0) // 子进程,出口
			break;
	}

	if (i == 2)
	{				  // 父进程 . 不参与管道使用.
		close(fd[0]); // 关闭管道的 读端/写端.
		close(fd[1]);

		wait(NULL); // 回收子进程
		wait(NULL);
	}
	else if (i == 0)
	{ // xiong
		close(fd[0]);
		dup2(fd[1], STDOUT_FILENO); // 重定向stdout
		execlp("ls", "ls", NULL);
		sys_err("exclp ls error");
	}
	else if (i == 1)
	{ //弟弟
		close(fd[1]);
		dup2(fd[0], STDIN_FILENO); // 重定向 stdin
		execlp("wc", "wc", "-l", NULL);
		sys_err("exclp wc error");
	}

	return 0;
}

2.6 管道缓冲区大小

可以使用 ulimit –a 命令来查看当前系统中创建管道文件所对应的内核缓冲区大小。(默认4096)

也可以使用 fpathconf() 函数，借助参数选项来查看。使用该宏应引入头文件<unistd.h>
long fpathconf(int fd, int name); 成功：返回管道的大小失败：-1，设置 errno

2.7 管道的优劣

优点：

简单，相比信号，套接字实现进程间通信，简单很多。

缺点：

只能单向通信，双向通信需建立两个管道。
只能用于父子、兄弟进程(有共同祖先)间通信。该问题后来使用 fifo 有名管道解决。

3.有名管道

有名管道拥有管道的所有特性，之所以称之为有名是因为管道在磁盘上有实体文件，文件类型为 p ，有名管道文件大小永远为 0，因为有名管道也是将数据存储到内存的缓冲区中，打开这个磁盘上的管道文件就可以得到操作有名管道的文件描述符，通过文件描述符读写管道存储在内核中的数据。

3.1 mkfifio()函数

有名管道也可以称为 fifo (first in first out)，使用有名管道既可以进行有血缘关系的进程间通信，也可以进行没有血缘关系的进程间通信。创建有名管道的方式有两种，一种是通过命令，一种是通过函数。

通过命令

1	$ mkfifo 有名管道的名字

通过函数

#include <sys/types.h>
#include <sys/stat.h>
// int open(const char *pathname, int flags, mode_t mode);
int mkfifo(const char *pathname, mode_t mode);

参数:

pathname: 要创建的有名管道的名字

mode: 文件的操作权限，和 open () 的第三个参数一个作用，最终权限: (mode & ~umask)

返回值:

创建成功返回 0，失败返回 -1

一旦使用mkfifo 创建了一个 FIFO，就可以使用 open 打开它，常见的文件 I/O函数都可用于 fifo。如：close、read、 write、unlink 等。

3.2 fifo()实现非血缘关系进程间通信

下面这个例子，一个写fifo，一个读fifo，操作起来就像文件一样的：

编译执行，如图：

4.文件用于进程间通信

文件实现进程间通信：

打开的文件是内核中的一块缓冲区。多个无血缘关系的进程，可以同时访问该文件。

文件通信有没有血缘关系都行，

只是有血缘关系的进程对于同一个文件，使用的同一个文件描述符，
没有血缘关系的进程，对同一个文件使用的文件描述符可能不同。
这些都不是问题，打开的是同一个文件就行。
用文件通信没有阻塞等管道的特性，可能会遇到问题

5.内存映射 (mmap)

5.1 存储映射 I/O

存储映射I/O (Memory-mapped I/O)使一个磁盘文件与存储空间中的一个缓冲区相映射。于是当从缓冲区中取数据，就相当于读文件中的相应字节。于此类似，将数据存入缓冲区，则相应的字节就自动写入文件。这样，就可在不适用read和write 函数的情况下，使用地址（指针）完成 I/O 操作。使用这种方法，首先应通知内核，将一个指定文件映射到存储区域中。这个映射工作可以通过mmap 函数来实现。

5.2 mmap() /munmap()函数

函数原型

1
2
3

#include <sys/mman.h>
// 创建内存映射区
void *mmap(void *addr, size_t length, int prot, int flags, int fd, off_t offset);

函数参数:

addr: 从动态库加载区的什么位置开始创建内存映射区，一般指定为 NULL, 委托内核分配
length: 创建的内存映射区的大小（单位：字节），实际上这个大小是按照 4k 的整数倍去分配的
prot: 对内存映射区的操作权限
- PROT_READ: 读内存映射区
- PROT_WRITE: 写内存映射区
- 如果要对映射区有读写权限: PROT_READ | PROT_WRITE
flags:
- MAP_SHARED: 多个进程可以共享数据，进行映射区数据同步
- MAP_PRIVATE: 映射区数据是私有的，不能同步给其他进程
fd: 文件描述符，对应一个打开的磁盘文件，内存映射区通过这个文件描述符和磁盘文件建立关联
offset: 磁盘文件的偏移量，文件从偏移到的位置开始进行数据映射，使用这个参数需要注意两个问题：
- 偏移量必须是 4k 的整数倍，写 0 代表不偏移
- 这个参数必须是大于 0 的

函数返回值

成功：返回一个内存映射区的起始地址
失败: MAP_FAILED (that is, (void *) -1)

mmap () 函数的参数相对较多，在使用该函数创建用于进程间通信的内存映射区的时候，各参数的指定都有一些注意事项，具体如下：

1. 第一个参数 addr 指定为 NULL 即可
2. 第二个参数 length 必须要 > 0
3. 第三个参数 prot，进程间通信需要对内存映射区有读写权限，因此需要指定为：PROT_READ | PROT_WRITE
4. 第四个参数 flags，如果要进行进程间通信, 需要指定 MAP_SHARED
5. 第五个参数 fd，打开的文件必须大于0，进程间通信需要文件操作权限和映射区操作权限相同
     - 内存映射区创建成功之后, 关闭这个文件描述符不会影响进程间通信
6. 第六个参数 offset，不偏移指定为0，如果偏移必须是4k的整数倍

内存映射区使用完之后也需要释放，释放函数原型如下：

1	int munmap(void *addr, size_t length);

函数参数:

addr: mmap () 的返回值，创建的内存映射区的起始地址
length: 和 mmap () 第二个参数相同即可

函数返回值

函数调用成功返回 0，失败返回 -1

总结：

1. 创建映射区的过程中，隐含着一次对映射文件的读操作。
2. 当MAP_SHARED 时，要求：映射区的权限应 <= 文件打开的权限(出于对映射区的保护)。而 MAP_PRIVATE 则无所谓，因为mmap 中的权限是对内存的限制。
3. 映射区的释放与文件关闭无关。只要映射建立成功，文件可以立即关闭。
4. 特别注意，当映射文件大小为 0 时，不能创建映射区。所以：用于映射的文件必须要有实际大小！！ mmap 使用时常常会出现总线错误，通常是由于共享文件存储空间大小引起的。如，400 字节大小的文件， 在建立映射区时 offset 4096 字节，则会报出总线错。
5. munmap传入的地址一定是mmap 的返回地址。坚决杜绝指针++操作。
6. 如果文件偏移量必须为4096的整数倍（MMU 映射的最小单位 4k ）
7. mmap创建映射区出错概率非常高，一定要检查返回值，确保映射区建立成功再进行后续操作。
8. 映射区访问权限为 “私有”MAP_PRIVATE, 对内存所做的所有修改，只在内存有效，不会反应到物理磁盘上。
9. 映射区访问权限为 “私有”MAP_PRIVATE, 只需要open文件时，有读权限，用于创建映射区即可。
10. 映射区访问权限为 “私有”MAP_PRIVATE, 对内存所做的所有修改，只在内存有效，不会反应到物理磁盘上。
11. 映射区访问权限为 “私有”MAP_PRIVATE, 只需要open文件时，有读权限，用于创建映射区即可。

小案例:使用mmap建立映射区

下面这个示例代码，使用mmap创建一个映射区（共享内存），并往映射区里写入内容：

编译运行，如下所示：

5.3 父子进程间mmap通信

父子等有血缘关系的进程之间也可以通过mmap 建立的映射区来完成数据通信。但相应的要在创建映射区的时候指定对应的标志位参数 flags：

MAP_PRIVATE:(私有映射) 父子进程各自独占映射区；
MAP_SHARED: (共享映射) 父子进程共享映射区；

/*
    1. 先创建内存映射区, 得到一个起始地址, 假设使用ptr指针保存这个地址
    2. 通过fork() 创建子进程 -> 子进程中也就有一个内存映射区, 子进程中也有一个ptr指针指向这个地址
    3. 父进程往自己的内存映射区写数据, 数据同步到了磁盘文件中, 磁盘文件数据又同步到子进程的映射区中
       子进程从自己的映射区往外读数据, 这个数据就是父进程写的
*/

#include <sys/mman.h>
#include <fcntl.h>

int main()
{
    // 1. 打开一个磁盘文件
    int fd = open("./english.txt", O_RDWR);
    // 2. 创建内存映射区
    void* ptr = mmap(NULL, 4000, PROT_READ|PROT_WRITE,
                     MAP_SHARED, fd, 0);
    if(ptr == MAP_FAILED)
    {
        perror("mmap");
        exit(0);
    }

    // 3. 创建子进程
    pid_t pid = fork();
    if(pid > 0)
    {
        // 父进程, 写数据
        const char* pt = "我是你爹, 你是我儿子吗???";
        memcpy(ptr, pt, strlen(pt)+1);
    }
    else if(pid == 0)
    {
        // 子进程, 读数据
        usleep(1);	// 内存映射区不阻塞, 为了让子进程读出数据
        printf("从映射区读出的数据: %s\n", (char*)ptr);
    }

    // 释放内存映射区
    munmap(ptr, 4000);

    return 0;
}

5.4 无血缘关系进程间mmap通信

实质上mmap 是内核借助文件帮我们创建了一个映射区，多个进程之间利用该映射区完成数据传递。由于内核空间多进程共享，因此无血缘关系的进程间也可使用mmap 来完成通信。只要设置相应的标志位参数 flags 即可。若想实现共享，当然应该使用MAP_SHARED 了。值得注意的是：MAP_ANON 和 /dev/zero 都不能应用于非血缘关系进程间通信。只能用于亲子进程间。

A代码(进行写操作)：

#include <stdio.h>
#include <stdlib.h>
#include <unistd.h>
#include <string.h>
#include <sys/mman.h>
#include <fcntl.h>

int main()
{
    // 1. 打开一个磁盘文件
    int fd = open("./english.txt", O_RDWR);
    // 2. 创建内存映射区
    void* ptr = mmap(NULL, 4000, PROT_READ|PROT_WRITE,
                     MAP_SHARED, fd, 0);
    if(ptr == MAP_FAILED)
    {
        perror("mmap");
        exit(0);
    }
    
    const char* pt = "==================我是你爹, 你是我儿子吗???****************";
    memcpy(ptr, pt, strlen(pt)+1);

    // 释放内存映射区
    munmap(ptr, 4000);

    return 0;
}

B代码(进行读操作)

#include <stdio.h>
#include <stdlib.h>
#include <unistd.h>
#include <string.h>
#include <sys/mman.h>
#include <fcntl.h>

int main()
{
    // 1. 打开一个磁盘文件
    int fd = open("./english.txt", O_RDWR);
    // 2. 创建内存映射区
    void* ptr = mmap(NULL, 4000, PROT_READ|PROT_WRITE,
                     MAP_SHARED, fd, 0);
    if(ptr == MAP_FAILED)
    {
        perror("mmap");
        exit(0);
    }

    // 读内存映射区
    printf("从映射区读出的数据: %s\n", (char*)ptr);

    // 释放内存映射区
    munmap(ptr, 4000);

    return 0;
}

5.5 匿名映射

通过使用我们发现，使用映射区来完成文件读写操作十分方便，父子进程间通信也较容易。但缺陷是，每次创建映射区一定要依赖一个文件才能实现。通常为了建立映射区要 open 一个 temp 文件，创建好了再 unlink、close 掉，比较麻烦。可以直接使用匿名映射来代替。其实 Linux 系统给我们提供了创建匿名映射区的方法，无需依赖一个文件即可创建映射区。同样需要借助标志位参数 flags 来指定。

使用MAP_ANONYMOUS (或MAP_ANON)，如:int *p = mmap(NULL, 4, PROT_READ|PROT_WRITE, MAP_SHARED|MAP_ANONYMOUS, -1, 0);

需注意的是，MAP_ANONYMOUS 和 MAP_ANON 这两个宏是 Linux 操作系统特有的宏。在类 Unix 系统中如无该宏定义，可使用如下两步来完成匿名映射区的建立。

① fd = open("/dev/zero", O_RDWR);

② p = mmap(NULL, size, PROT_READ|PROT_WRITE, MMAP_SHARED, fd, 0);