进程分配内存的两种方式——brk()和mmap()-淘娜娜副业社

如何查看进程发生缺页中断的次数？

用ps -o , -C 命令查看。

代表major fault，中文名-叫大错误，代表minor fault，中文名叫小错误。

这两个数值表示一个进程自启动以来所发生的缺页中断的次数。

发成缺页中断后，执行了那些操作？

当一个进程发生缺页中断的时候，进程会陷入内核态，执行以下操作：

1、检查要访问的虚拟地址是否合法

2、查找/分配一个物理页

3、填充物理页内容（读取磁盘，或者直接置0，或者啥也不干）

4、建立映射关系（虚拟地址到物理地址）

重新执行发生缺页中断的那条指令

如果第3步，需要读取磁盘，那么这次缺页中断就是，否则就是。

内存分配的原理

从操作系统角度来看，进程分配内存有两种方式，分别由两个系统调用完成：brk和mmap（不考虑共享内存）。

1、brk是将数据段(.data)的最高地址指针往高地址推；

2、mmap是在进程的虚拟地址空间中（堆和栈中间，称为文件映射区域的地方）找一块空闲的虚拟内存。

这两种方式分配的都是虚拟内存，没有分配物理内存。在第一次访问已分配的虚拟地址空间的时候，发生缺页中断，操作系统负责分配物理内存，然后建立虚拟内存和物理内存之间的映射关系。

在标准C库中，提供了/free函数分配释放内存，这两个函数底层是由brk，mmap，这些系统调用实现的。

下面以一个例子来说明内存分配的原理：

情况一、小于128k的内存，使用brk分配内存，将往高地址推(只分配虚拟空间，不对应物理内存(因此没有初始化)，第一次读/写数据时，引起内核缺页中断，内核才分配对应的物理内存，然后虚拟地址空间建立映射关系)，如下图：

1、进程启动的时候，其（虚拟）内存空间的初始布局如图1所示。

其中，mmap内存映射文件是在堆和栈的中间（例如libc-2.2.93.so，其它数据文件等），为了简单起见，省略了内存映射文件。

指针（glibc里面定义）指向数据段的最高地址。

2、进程调用A=(30K)以后，内存空间如图2：

函数会调用brk系统调用，将指针往高地址推30K，就完成虚拟内存分配。

你可能会问：只要把+30K就完成内存分配了？

事实是这样的，+30K只是完成虚拟地址的分配， A这块内存现在还是没有物理页与之对应的，等到进程第一次读写A这块内存的时候，发生缺页中断，这个时候，内核才分配A这块内存对应的物理页。也就是说，如果用分配了A这块内容，然后从来不访问它，那么，A对应的物理页是不会被分配的。

3、进程调用B=(40K)以后，内存空间如图3。

需要C/C++ Linux服务器架构师学习资料后台私信“资料”（资料包括C/C++，Linux，技术，Nginx，，MySQL，Redis，，，ZK，流媒体，CDN，P2P，K8S，，TCP/IP，协程，DPDK，等），免费分享

情况二、大于128k的内存，使用mmap分配内存，在堆和栈之间找一块空闲内存分配(对应独立内存，而且初始化为0)，如下图：

4、进程调用C=(200K)以后，内存空间如图4：

默认情况下，函数分配内存，如果请求内存大于128K（可由选项调节），那就不是去推指针了，而是利用mmap系统调用，从堆和栈的中间分配一块虚拟内存。

这样子做主要是因为::

brk分配的内存需要等到高地址内存释放以后才能释放（例如，在B释放之前，A是不可能释放的，这就是内存碎片产生的原因，什么时候紧缩看下面），而mmap分配的内存可以单独释放。

当然，还有其它的好处，也有坏处，再具体下去，有兴趣的同学可以去看glibc里面的代码了。

5、进程调用D=(100K)以后，内存空间如图5；

6、进程调用free(C)以后，C对应的虚拟内存和物理内存一起释放。

7、进程调用free(B)以后，如图7所示：

B对应的虚拟内存和物理内存都没有释放，因为只有一个指针，如果往回推，那么D这块内存怎么办呢？

当然，B这块内存，是可以重用的，如果这个时候再来一个40K的请求，那么很可能就把B这块内存返回回去了。

8、进程调用free(D)以后，如图8所示：

B和D连接起来，变成一块140K的空闲内存。

9、默认情况下：

当最高地址空间的空闲内存超过128K（可由选项调节）时，执行内存紧缩操作（trim）。在上一个步骤free的时候，发现最高地址空闲内存超过128K，于是内存紧缩，变成图9所示。

在了解了内存分配原理以后来看一个现象：

现象

1 压力测试过程中，发现被测对象性能不够理想，具体表现为：

进程的系统态CPU消耗20，用户态CPU消耗10，系统idle大约70

2 用ps -o , -C 命令查看，发现每秒增量为0，而每秒增量大于10000。

初步分析

代表major fault，中文名叫大错误，代表minor fault，中文名叫小错误。

这两个数值表示一个进程自启动以来所发生的缺页中断的次数。

当一个进程发生缺页中断的时候，进程会陷入内核态，执行以下操作：

检查要访问的虚拟地址是否合法

查找/分配一个物理页

填充物理页内容(读取磁盘，或者直接置0，或者啥也不干)

建立映射关系(虚拟地址到物理地址)

重新执行发生缺页中断的那条指令

如果第3步，需要读取磁盘，那么这次缺页中断就是，否则就是。

此进程如此之高，一秒10000多次，不得不怀疑它跟进程内核态cpu消耗大有很大关系。

分析代码

查看代码，发现是这么写的：一个请求来，用分配2M内存，请求结束后free这块内存。看日志，发现分配内存语句耗时10us，平均一条请求处理耗时。原因已找到!

虽然分配内存语句的耗时在一条处理请求中耗时比重不大，但是这条语句严重影响了性能。要解释清楚原因，需要先了解一下内存分配的原理。

真相大白

说完内存分配的原理，那么被测模块在内核态cpu消耗高的原因就很清楚了：每次请求来都一块2M的内存，默认情况下，调用mmap分配内存，请求结束的时候，调用释放内存。假设每个请求需要6个物理页，那么每个请求就会产生6个缺页中断，在2000的压力下，每秒就产生了10000多次缺页中断，这些缺页中断不需要读取磁盘解决，所以叫做;缺页中断在内核态执行，因此进程的内核态cpu消耗很大。缺页中断分散在整个请求的处理过程中，所以表现为分配语句耗时(10us)相对于整条请求的处理时间()比重很小。

解决办法

将动态内存改为静态分配，或者启动的时候，用为每个线程分配，然后保存在里面。但是，由于这个模块的特殊性，静态分配，或者启动时候分配都不可行。另外，Linux下默认栈的大小限制是10M，如果在栈上分配几M的内存，有风险。

禁止调用mmap分配内存，禁止内存紧缩。

在进程启动时候，加入以下两行代码：

(, 0); // 禁止调用mmap分配内存

(, -1); // 禁止内存紧缩

效果：加入这两行代码以后，用ps命令观察，压力稳定以后，majlt和都为0。进程的系统态cpu从20降到10。

小结

可以用命令ps -o -C 来查看进程的, 的值，这两个值都是累加值，从进程启动开始累加。在对高性能要求的程序做压力测试的时候，我们可以多关注一下这两个值。

如果一个进程使用了mmap将很大的数据文件映射到进程的虚拟地址空间，我们需要重点关注的值，因为相比，对于性能的损害是致命的，随机读一次磁盘的耗时数量级在几个毫秒，而只有在大量的时候才会对性能产生影响。

———END———
限时特惠： 本站每日持续更新海量各大内部创业教程，永久会员只需109元，全站资源免费下载点击查看详情
站长微信： nanadh666

声明：1、本内容转载于网络，版权归原作者所有！2、本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。3、本内容若侵犯到你的版权利益，请联系我们，会尽快给予删除处理！

进程分配内存的两种方式——brk()和mmap()

站长简介

最新实战项目

微头条变现写作课程，掌握流量变现技巧，提升微头条质量，实现收益增长

AI+自媒体运营变现课，掌握AI写作与RPA技术，轻松实现自媒体变现

微信朋友圈广告投放全攻略：ADQ平台介绍、推广层级、商品库与营销目标

人工智能AI时代，饭碗频遭抢夺，普通人咋办？躺赢之道在何方？

图书博主养成记：4类带货方式，视频直播课助力，快速入局图文赛道

YouTube视频营销入门：账号注册指南，平台介绍与外贸推广

小红书飞书模板实战变现：小红书快速起号，搭建一个赚钱的飞书模板

联盟营销实战指南，详解联盟模式、平台规则及联盟客运作，实现流量变现

进程分配内存的两种方式——brk()和mmap()

相关文章

站长简介

最新实战项目