页

概念

在现代计算机系统中，处理器的寻址通常通过 虚拟地址（Virtual Address） 进行，而虚拟地址到物理地址的转换过程涉及“页”（Page）的概念。对于支持内存管理单元（MMU）的处理器（如ARMv7），寻址过程会按照页来划分和管理内存，但具体机制需要结合硬件架构和操作系统来理解。以下是详细说明：

一、处理器寻址的基本概念

虚拟地址与物理地址
- 虚拟地址：应用程序看到的内存地址（由操作系统分配），范围由处理器位数决定（如32位处理器虚拟地址空间为0~4GB）。
- 物理地址：实际内存（RAM）的硬件地址，由处理器地址总线宽度决定（如32位处理器物理地址空间通常也是4GB）。
- MMU的作用：负责将虚拟地址转换为物理地址，这个过程称为 地址转换（Address Translation）。
分页（Paging）机制
- 操作系统将虚拟地址空间和物理地址空间划分为固定大小的块，称为 页（Page）。
- 虚拟地址对应的页称为 虚拟页（Virtual Page），物理地址对应的页称为 物理页（Physical Page）。
- 页的大小由处理器架构决定（如ARMv7支持4KB、64KB等页大小，见前文）。

二、ARMv7的寻址与分页流程

1. 虚拟地址的结构（以32位ARMv7为例）

虚拟地址被划分为多个字段，用于索引页表和定位页内偏移：

大页（64KB）：

  31       20 19      12 11       0
  +----------+---------+-----------+
  | 段索引   | 页索引  | 页内偏移  |
  +----------+---------+-----------+
  （12位）   （8位）   （12位）
  ```  
- **小页（4KB）**：

31 20 19 16 15 0
+———-+———+———–+
| 段索引 | 页表索引| 页内偏移 |
+———-+———+———–+
（12位）（4位）（12位）

  - **段索引**：用于定位一级页表（Section Table）。  
  - **页索引/页表索引**：用于定位二级页表（Page Table）或直接映射大页/小页。  
  - **页内偏移**：确定页内的具体地址（与页大小对应，如4KB页的偏移为12位）。

#### **2. 地址转换过程（以小页为例）**
1. **一级页表查询**：  
   - 虚拟地址的 **段索引（12位）** 作为一级页表的索引，找到对应的一级页表项（PTE）。  
   - 若页表项标记为“小页”（通过标志位`S=1`判断），则进入二级页表查询。  

2. **二级页表查询**：  
   - 虚拟地址的 **页表索引（4位）** 作为二级页表的索引，找到对应的二级页表项。  
   - 二级页表项包含物理页的基地址（高位部分），与虚拟地址的 **页内偏移（12位）** 拼接，得到最终的物理地址。  

#### **3. 关键寄存器与缓存**  
- **页表基址寄存器（TTBR0/TTBR1）**：存储页表的基地址，用于定位一级页表。  
- **转换后备缓冲器（TLB）**：缓存最近使用的虚拟地址到物理地址的映射，加速地址转换（避免每次寻址都查询页表）。


### **三、处理器是否“按页寻址”？**
- **直接回答**：  
  处理器的寻址**基于虚拟地址**，而虚拟地址到物理地址的转换**按页进行**。应用程序和处理器本身不直接操作“页”，但操作系统和硬件通过分页机制管理内存。  

- **核心逻辑**：  
  1. 处理器生成虚拟地址后，MMU自动将其拆分为“页索引”和“页内偏移”，通过页表找到对应的物理页基址，再加上偏移得到物理地址。  
  2. 对处理器而言，寻址是连续的虚拟地址空间；对硬件和操作系统而言，内存管理以“页”为单位（如分配、换入/换出、权限控制等）。  


### **四、分页的作用与优势**
1. **内存保护**：通过页表项的权限标志（如可读、可写、可执行），防止进程越权访问内存。  
2. **内存共享**：多个虚拟地址可映射到同一物理页（如共享库、进程间通信）。  
3. **虚拟内存**：支持将不活跃的页交换到磁盘，扩展可用内存（需操作系统支持）。  
4. **地址空间隔离**：每个进程拥有独立的虚拟地址空间，避免相互干扰。  


### **五、非分页模式（段映射）**
在ARMv7中，若不启用MMU或配置为非分页模式，处理器会使用 **段映射（Segment Mapping）**：  
- 虚拟地址直接划分为1MB的段（无页表参与），段索引对应物理地址的高位，段内偏移直接映射。  
- 此时寻址不涉及“页”，但内存管理粒度较粗（仅1MB），适用于简单系统（如实时操作系统）。  


### **总结**
- **处理器寻址的本质**：基于虚拟地址，通过MMU按页划分和转换地址。  
- **程序员视角**：无需显式操作“页”，仅需处理虚拟地址（由操作系统和编译器抽象）。  
- **硬件与系统视角**：内存以页为单位管理，页大小由处理器架构决定（如ARMv7的4KB/64KB）。  

如需进一步理解，可结合具体处理器的MMU章节（如《ARM Architecture Reference Manual》）和操作系统内存管理原理进行学习。

## 获取页
在Linux内存管理中获取页的方法 
 
在Linux内核内存管理中，获取页（page）是内存分配的基本操作之一。以下是几种主要的获取页的方法：
 
1. 低级页分配器接口 
 
alloc_pages()
```c 
struct page *alloc_pages(gfp_t gfp_mask, unsigned int order);

最基础的页分配函数
gfp_mask：分配标志（如GFP_KERNEL, GFP_ATOMIC等）
order：请求的页数（2^order页）
返回指向第一个页的page结构体指针

alloc_page()

1	struct page *alloc_page(gfp_t gfp_mask);

分配单个页的简化版本（相当于alloc_pages(gfp_mask, 0)）

常用变体

__get_free_pages()

1	unsigned long __get_free_pages(gfp_t gfp_mask, unsigned int order);

类似于alloc_pages()，但返回的是页的虚拟地址而非page结构体

get_zeroed_page()

1	unsigned long get_zeroed_page(gfp_t gfp_mask);

分配单个页并将其内容清零

特定用途的分配器

vmalloc()

1	void *vmalloc(unsigned long size);

分配虚拟地址连续但物理地址可能不连续的内存区域

kmalloc()

1	void *kmalloc(size_t size, gfp_t flags);

用于分配小块内存（小于页大小）

释放页的函数

1
2
3

void __free_pages(struct page *page, unsigned int order);
void free_pages(unsigned long addr, unsigned int order);
void free_page(unsigned long addr);

示例代码

#include <linux/gfp.h>
#include <linux/mm.h>
 
// 分配2个页（8KB）
struct page *page = alloc_pages(GFP_KERNEL, 1);
if (!page) {
    // 处理分配失败 
}
 
// 使用页...
 
// 释放页 
__free_pages(page, 1);

注意事项

分配标志(gfp_mask)非常重要，它决定了：
- 分配行为（能否睡眠、能否访问高端内存等）
- 内存区域（DMA、常规、高端内存等）
在原子上下文中（如中断处理程序）必须使用GFP_ATOMIC标志
分配失败是可能的，必须检查返回值
分配后应尽快释放，避免内存泄漏

Linux内核提供了丰富的页分配API，选择哪种方法取决于具体的需求和上下文环境。

gfp_mask

Linux内存分配中的gfp_mask详解

gfp_mask（Get Free Page mask）是Linux内核内存分配函数中最重要的参数之一，它控制着内存分配的行为和特性。这个标志位掩码决定了内存分配器如何寻找和分配内存页。

gfp_mask的基本组成

gfp_mask由三部分组成：

行为修饰符：控制分配行为（如能否睡眠）
区域修饰符：指定从哪个内存区域分配
类型标志：预定义的常用组合

主要标志分类

2.1 行为修饰符 (Allocation Behavior)

标志	描述
`__GFP_WAIT`	允许分配器睡眠（已弃用，用`GFP_KERNEL`代替）
`__GFP_HIGH`	高优先级分配，可以使用紧急内存池
`__GFP_IO`	允许启动I/O操作（如换出页面）
`__GFP_FS`	允许调用文件系统相关操作
`__GFP_COLD`	请求缓存冷页（不常访问的页）
`__GFP_NOWARN`	分配失败时不产生警告
`__GFP_REPEAT`	失败后重试几次
`__GFP_NOFAIL`	无限重试直到成功（慎用）
`__GFP_NORETRY`	失败后不再重试
`__GFP_ZERO`	分配后将内存清零

2.2 区域修饰符 (Zone Modifiers)

标志	描述
`__GFP_DMA`	从DMA区域分配（<16MB）
`__GFP_DMA32`	从DMA32区域分配（<4GB）
`__GFP_HIGHMEM`	从高端内存区域分配

2.3 类型标志 (Type Flags)

这些是预定义的常用组合：

标志	组成	使用场景
`GFP_ATOMIC`	`__GFP_HIGH`	原子上下文，不能睡眠
`GFP_KERNEL`	`__GFP_WAIT \| __GFP_IO \| __GFP_FS`	常规内核分配，可睡眠
`GFP_USER`	`__GFP_WAIT \| __GFP_IO \| __GFP_FS`	用户空间分配
`GFP_HIGHUSER`	`GFP_USER \| __GFP_HIGHMEM`	用户空间高端内存分配
`GFP_NOIO`	`__GFP_WAIT`	禁止I/O操作
`GFP_NOFS`	`__GFP_WAIT \| __GFP_IO`	禁止文件系统操作
`GFP_NOWAIT`	`0`	不等待，快速失败

使用场景示例

3.1 常规内核分配（可睡眠）

1	ptr = kmalloc(size, GFP_KERNEL);

可以睡眠等待内存释放
可以启动I/O操作（如换出页面）
可以调用文件系统操作

3.2 原子上下文分配（不可睡眠）

1	ptr = kmalloc(size, GFP_ATOMIC);

用于中断上下文、自旋锁保护区域等不能睡眠的地方
分配失败概率较高

3.3 DMA内存分配

1	page = alloc_pages(GFP_DMA, order);

用于需要DMA访问的设备
从物理内存的前16MB分配

3.4 高端内存分配

1	page = alloc_pages(GFP_HIGHUSER, order);

用于用户空间映射
可能来自高端内存区域(>896MB)

标志组合规则
不能混合类型标志：不能同时使用GFP_KERNEL和GFP_ATOMIC

可以添加修饰符：

1	alloc_pages(GFP_KERNEL \| __GFP_ZERO, order); // 分配并清零

区域修饰符优先级：
- __GFP_DMA > __GFP_DMA32 > 普通区域 > __GFP_HIGHMEM
实际开发建议
优先使用预定义类型标志：除非有特殊需求，否则使用GFP_KERNEL或GFP_ATOMIC
原子上下文必须使用GFP_ATOMIC：在中断处理、自旋锁保护区域等
谨慎使用__GFP_NOFAIL：可能导致死锁
清零分配考虑性能：__GFP_ZERO会增加开销
DMA内存要明确指定：设备驱动需要DMA内存时必须使用__GFP_DMA
内核版本变化

不同内核版本的gfp_mask标志可能有变化：

新版内核中__GFP_WAIT被移除
新增了一些特殊用途的标志
具体定义见<linux/gfp.h>

理解gfp_mask对于Linux内核开发至关重要，它直接影响内存分配的成功率和系统性能。正确使用这些标志可以避免内存分配失败和系统不稳定问题。

kmalloc和vmalloc区别

在 Linux 内核里，kmalloc 和 vmalloc 都是用于分配内存的函数，但它们的实现方式和适用场景存在明显差异，下面为你详细介绍：

分配区域与连续性

kmalloc：主要用于分配物理地址连续的内存块。这些内存位于物理内存的低端区域，也就是所谓的 ZONE_DMA 和 ZONE_NORMAL 区域。由于物理地址是连续的，所以对应的虚拟地址自然也是连续的。
vmalloc：分配的是虚拟地址连续但物理地址不一定连续的内存块。这些内存一般来自于高端内存区域（ZONE_HIGHMEM）。为了让虚拟地址连续，内核会建立专门的页表来映射这些不连续的物理页。

分配大小与效率

kmalloc：比较适合分配小内存块，通常分配的内存大小不超过一页（在 32 位系统中一般是 4KB）。它的分配效率很高，这得益于采用了 slab 分配器，能够快速地分配和释放内存。
vmalloc：适用于分配大内存块，例如几 MB 的连续虚拟地址空间。不过，它的分配效率相对较低，因为在分配过程中需要建立新的页表，会带来一定的开销。

分配成功率

kmalloc：由于是从物理内存的低端区域分配，当系统内存碎片化严重时，分配大内存块可能会失败。
vmalloc：因为可以使用不连续的物理页，所以在系统内存碎片化的情况下，分配大内存块的成功率要比 kmalloc 高。

缓存属性

kmalloc：默认分配的是可缓存的内存，这对于需要高速访问的场景非常有利，比如作为硬件缓冲区。
vmalloc：分配的内存同样默认是可缓存的，但也可以通过特定的标志（如 GFP_DMA）分配不可缓存的内存。

使用场景

kmalloc：在需要物理地址连续的场景中经常会用到，像为硬件设备分配 DMA 缓冲区，或者在中断处理程序中分配内存，因为中断处理程序要求快速执行，而 kmalloc 的高效率正好满足这一需求。
vmalloc：主要用于分配大内存块的情况，比如模块加载时分配内存，或者在不需要物理地址连续的情况下分配内存，像内核线程的堆栈分配。

总结

特性	kmalloc	vmalloc
物理连续性	连续	不连续
虚拟连续性	连续	连续
分配大小	小内存块（通常 ≤ 1 页）	大内存块（可达几 MB）
效率	高（slab 分配器）	低（需要建立页表）
成功率	低（碎片化时）	高（可使用不连续物理页）
典型场景	DMA 缓冲区、中断处理程序	模块加载、大内存分配

代码示例

下面是一个简单的代码示例，展示了 kmalloc 和 vmalloc 的基本用法：

#include <linux/init.h>
#include <linux/module.h>
#include <linux/slab.h>
#include <linux/vmalloc.h>

static int __init mem_alloc_init(void) {
    char *kmalloc_ptr, *vmalloc_ptr;
    
    // 使用 kmalloc 分配 1024 字节内存，标志为 GFP_KERNEL
    kmalloc_ptr = kmalloc(1024, GFP_KERNEL);
    if (!kmalloc_ptr) {
        printk(KERN_ERR "kmalloc failed\n");
        return -ENOMEM;
    }
    printk(KERN_INFO "kmalloc address: %p\n", kmalloc_ptr);
    
    // 使用 vmalloc 分配 1MB 内存
    vmalloc_ptr = vmalloc(1024 * 1024);  // 1MB
    if (!vmalloc_ptr) {
        printk(KERN_ERR "vmalloc failed\n");
        kfree(kmalloc_ptr);
        return -ENOMEM;
    }
    printk(KERN_INFO "vmalloc address: %p\n", vmalloc_ptr);
    
    // 使用内存...
    
    // 释放内存
    vfree(vmalloc_ptr);
    kfree(kmalloc_ptr);
    
    return 0;
}

static void __exit mem_alloc_exit(void) {
    printk(KERN_INFO "Memory allocation module exited\n");
}

module_init(mem_alloc_init);
module_exit(mem_alloc_exit);

MODULE_LICENSE("GPL");

在这个示例中，我们可以看到：

kmalloc 用于分配 1024 字节的小内存块。
vmalloc 用于分配 1MB 的大内存块。
使用完内存后，分别用 kfree 和 vfree 释放对应的内存。

区

在ARM Linux系统中，内存管理的“区”（Zone）是对物理内存进行分类管理的逻辑概念，用于区分不同特性的内存区域，以便内核更高效地分配和管理内存。以下是关于ARM Linux内存管理中区的详细介绍：

一、内存区的分类及作用

Linux内核根据物理内存的属性（如是否可直接映射到内核地址空间、是否支持DMA等），将内存划分为多个区。在ARM架构中，常见的内存区包括：

1. ZONE_DMA（DMA区）

特点：
该区域的内存用于支持直接内存访问（DMA）操作，主要供外设（如网卡、硬盘控制器等）使用。这些外设通常只能访问低端内存地址，因此DMA区通常位于物理内存的低端（如ARM 32位系统中通常为前16MB）。
作用：
确保外设通过DMA传输数据时能正确访问内存，避免因地址空间限制导致的兼容性问题。

2. ZONE_NORMAL（常规区）

特点：
该区域是内核直接管理的常规内存，可直接映射到内核虚拟地址空间（即“线性映射”），内核可以高效地访问该区域的内存。
- 在32位ARM系统中，ZONE_NORMAL通常对应物理内存中高于DMA区且小于896MB的部分（受内核虚拟地址空间限制）。
- 在64位ARM系统（如ARM64）中，由于虚拟地址空间足够大，ZONE_NORMAL可覆盖更大范围的内存。
作用：
是内核分配内存的主要区域，用于普通进程的内存分配、内核数据结构等。

3. ZONE_HIGHMEM（高端内存区，可选）

特点：
该区域的内存无法被内核直接线性映射到虚拟地址空间，需要通过动态映射（如临时映射或页表切换）才能访问。
- 在32位ARM系统中，当物理内存超过896MB时，超出部分会被划入ZONE_HIGHMEM（因32位内核虚拟地址空间有限，仅能线性映射前896MB）。
- 在64位ARM系统中，由于虚拟地址空间足够大（如48位或更多），通常不需要ZONE_HIGHMEM（或该区域可能不存在）。
作用：
允许系统使用超过内核线性映射范围的内存，提高大内存系统的利用率（常见于32位系统）。

二、ARM架构下的内存管理特点

1. 32位ARM系统（如ARMv7）

地址空间限制：
内核虚拟地址空间通常为3GB（用户空间1GB，内核空间3GB），其中线性映射的物理内存上限约为896MB（剩余空间用于内核代码、页表等）。
分区逻辑：
- ZONE_DMA：前16MB（典型值，可通过内核配置调整）。
- ZONE_NORMAL：16MB ~ 896MB。
- ZONE_HIGHMEM：896MB以上（若物理内存超过该值）。

2. 64位ARM系统（如ARM64/ARMv8）

地址空间优势：
内核虚拟地址空间可达48位（如Linux内核在ARM64上使用48位虚拟地址），可直接映射更大范围的物理内存（如1TB），因此ZONE_HIGHMEM通常不再需要，内存主要分为：
- ZONE_DMA：若外设支持64位DMA地址，可能需要更大的DMA区（如全部内存均可用于DMA，具体取决于硬件支持）。
- ZONE_NORMAL：覆盖几乎所有物理内存，内核可直接线性映射。

三、内存区的管理机制

1. 伙伴系统（Buddy System）

每个区独立使用伙伴系统管理空闲内存块，以页（通常为4KB）为单位进行分配和回收，避免内存碎片。
内核根据分配请求的大小（如申请多个页），在对应的区中查找合适的空闲块。

2. 页分配器（Page Allocator）

内核通过alloc_pages()等接口从指定区分配内存，可指定分配策略（如是否允许从高端内存分配、是否使用DMA等）。
例如，外设驱动申请DMA内存时，会明确要求从ZONE_DMA分配。

3. 高端内存的映射机制（仅32位系统）

对于ZONE_HIGHMEM中的页，内核通过以下方式访问：
- 永久映射：使用固定的虚拟地址范围动态映射高端内存页。
- 临时映射：使用临时虚拟地址（如kmap_atomic()）短期映射页，适用于中断处理等场景。

四、查看内存区信息

在ARM Linux系统中，可通过以下命令查看内存区划分和使用情况：

# 查看系统内存区的总体信息
cat /proc/zoneinfo

# 示例输出（部分字段）：
Node 0, zone      DMA
  pages free     1234
  pages total    16384  # DMA区总页数（如16MB = 16*1024KB / 4KB = 4096页，示例中可能为不同配置）
  ...

Node 0, zone    Normal
  pages free     56789
  pages total    2097152  # 常规区总页数（如896MB = 896*1024KB /4KB = 229376页，示例中可能为更大内存）
  ...

五、总结

分区目的：通过将内存按特性分区，Linux内核可针对不同场景（如DMA、常规访问、大内存支持）优化内存分配，提高系统稳定性和效率。
ARM架构差异：32位系统受地址空间限制，需通过ZONE_HIGHMEM利用大内存；64位系统因虚拟地址空间充足，分区逻辑更简单。
核心概念：伙伴系统、页分配策略、DMA兼容性是理解内存区管理的关键。

内存管理

slab层

在Linux内核里，slab层（也被叫做slab分配器）是内存管理系统的重要组成部分。它的主要作用是高效地分配和释放内核对象，像task_struct、file_struct这类经常使用的结构体实例都能通过它来管理。下面详细介绍slab层的相关内容：

基本概念与设计目标

解决内存碎片问题：当系统频繁地分配和释放小块内存时，容易产生内存碎片。slab分配器通过缓存机制，将这些小块内存进行复用，从而避免了碎片的产生。
提升分配效率：传统的内存分配方式，比如直接使用页分配器，会带来较大的开销。而slab分配器会预先分配一组对象，并将它们缓存起来。这样在需要的时候，就能快速地分配和释放内存，大大提高了效率。
减少初始化开销：对于一些需要复杂初始化的对象，slab分配器会提前完成初始化，然后进行缓存。当用户请求分配内存时，直接使用这些已经初始化好的对象，减少了重复初始化的开销。

核心组件与工作原理

slab层的架构主要包含以下几个核心组件：

Cache（缓存）：每一种内核对象类型，比如inode、file等，都有对应的cache。每个cache负责管理特定类型对象的分配和释放。
Slab（ slabs ）：Cache由一个或多个slab组成，slab实际上就是一组物理页面。它存在三种状态：满（所有对象都已被分配）、部分满（还有部分对象未被分配）和空（所有对象都未被分配）。
对象（Objects）：内核所使用的实际数据结构，它们被分配在slab中。

工作流程

缓存初始化：在内核启动或者模块加载的时候，会为特定类型的对象创建缓存。
对象分配：当需要分配一个对象时，slab分配器会先查看部分满的slab中是否有空闲对象。如果有，就直接分配；如果没有，再去空的slab中查找；若还是没有，就会从页分配器中获取新的内存页，创建一个新的slab。
对象释放：当释放一个对象时，该对象会被标记为空闲，但不会立即返回给系统，而是留在缓存中，等待下次分配使用。
缓存收缩：在内存紧张的情况下，slab分配器会回收一些空的slab，将内存归还给系统。

优势

避免内部碎片：slab分配器会根据对象的实际大小来调整分配策略，从而减少了内部碎片的产生。
快速分配与释放：由于使用了缓存机制，避免了频繁调用页分配器，使得内存的分配和释放速度大幅提升。
减少初始化开销：对于一些需要复杂初始化的对象，slab分配器通过预先初始化并缓存这些对象，减少了重复初始化的开销。

与其他内存分配器的关系

slab层位于Linux内存管理架构的中间层，它的上层是各种内核组件，下层是页分配器（如伙伴系统）和vmalloc机制。具体关系如下：

页分配器：负责管理物理内存页，为slab分配器提供内存页。
Slab分配器：基于页分配器提供的内存页，管理小块内存的分配和释放。
Vmalloc：用于分配大块的虚拟地址空间，这些空间对应的物理页可能是不连续的。

代码示例

下面通过一个简单的代码示例，展示如何在内核模块中使用slab分配器：

#include <linux/init.h>
#include <linux/module.h>
#include <linux/slab.h>

// 定义一个简单的结构体
struct my_object {
    int data;
    char name[32];
};

// 创建一个kmem_cache对象
static struct kmem_cache *my_cache;

static int __init my_module_init(void) {
    // 创建一个新的缓存
    my_cache = kmem_cache_create("my_cache", 
                                sizeof(struct my_object),
                                0,
                                SLAB_HWCACHE_ALIGN,
                                NULL);
    if (!my_cache) {
        printk(KERN_ERR "Failed to create cache\n");
        return -ENOMEM;
    }
    
    // 从缓存中分配一个对象
    struct my_object *obj = kmem_cache_alloc(my_cache, GFP_KERNEL);
    if (obj) {
        // 初始化对象
        obj->data = 42;
        strcpy(obj->name, "example");
        printk(KERN_INFO "Allocated object: data=%d, name=%s\n", obj->data, obj->name);
        
        // 释放对象
        kmem_cache_free(my_cache, obj);
    }
    
    return 0;
}

static void __exit my_module_exit(void) {
    // 销毁缓存
    kmem_cache_destroy(my_cache);
    printk(KERN_INFO "Module exited\n");
}

module_init(my_module_init);
module_exit(my_module_exit);
MODULE_LICENSE("GPL");

总结

slab层是Linux内核内存管理的关键技术，它通过缓存机制高效地管理小块内存，避免了内存碎片，提高了系统性能。在现代Linux系统中，虽然slab分配器已经演变成了slub分配器，但基本的设计理念仍然保持不变。

用户在函数栈上进行static

基本概念

栈内存分配：由操作系统自动管理，函数的局部变量、参数以及返回地址等都存放在这里。它的分配和释放遵循后进先出（LIFO）的原则，效率很高。栈内存的空间是有限的，通常只有几MB到几GB。
静态内存分配：程序在编译时就确定了所需的内存空间，这些内存会被分配到数据段（已初始化的静态变量和全局变量）或BSS段（未初始化的静态变量和全局变量）。静态分配的内存，其生命周期贯穿整个程序运行期间。
堆内存分配：这是一种动态内存分配方式，程序在运行时通过系统调用（如malloc、new）来申请内存。堆内存的空间较大，但管理起来比较复杂，容易出现内存泄漏和碎片问题。

关键区别

特性	栈分配	静态分配	堆分配
分配时间	程序运行时	编译时	程序运行时
释放时间	函数返回时	程序结束时	手动释放（如free、delete）
内存区域	栈	数据段/BSS段	堆
生命周期	函数调用期间	整个程序运行期间	从分配到释放
效率	高（硬件支持）	高（编译时确定）	低（需要系统调用）
灵活性	低（大小固定）	低（大小固定）	高（动态调整）

常见混淆点

用户提到的“在栈上进行静态分配”可能是以下几种情况：

栈上的自动变量：这是最常见的栈内存使用方式，函数内的局部变量（非static）都属于此类。例如：

void func() {
    int a = 10;  // 在栈上分配
    char buffer[256];  // 在栈上分配
}  // 函数返回时，这些变量自动释放

静态局部变量：虽然使用了static关键字，但实际上是在静态存储区分配内存，而不是在栈上。例如：

void func() {
    static int count = 0;  // 在数据段分配，只初始化一次
    count++;
}  // 函数返回后，count的值仍然保留

静态数组：同样是在静态存储区分配内存，而不是在栈上。例如：

1	static char buffer[1024]; // 静态存储区，全局可见（如果是文件作用域）

栈分配的特点

优点：分配和释放速度快，由硬件（栈指针）直接管理；不会产生内存碎片。
缺点：栈空间有限，分配过大的数组或递归过深可能会导致栈溢出（Stack Overflow）。
适用场景：局部变量、函数调用上下文、小型临时数据存储。

静态分配的特点

优点：无需运行时开销，访问速度快；数据持久性强（整个程序运行期间都存在）。
缺点：内存使用不灵活，一旦分配就无法调整大小；可能导致全局变量滥用，影响代码的可维护性。
适用场景：配置参数、全局状态、需要持久保存的数据。

动态分配（堆）的特点

优点：灵活，可以在运行时根据需要分配和释放内存；适用于存储大小不确定或生命周期复杂的数据。
缺点：分配和释放开销大；容易出现内存泄漏和碎片问题；需要手动管理内存。
适用场景：动态数据结构（如链表、树）、大型对象、需要跨函数共享的数据。

总结

在实际编程中，应该根据数据的生命周期、大小和使用方式来选择合适的内存分配方式：

如果数据是局部的、短期使用的，并且大小固定，那么选择栈分配。
如果数据需要在整个程序运行期间存在，或者需要跨函数共享，那么选择静态分配。
如果数据的大小不确定，或者需要动态调整，那么选择堆分配。

要避免“在栈上进行静态分配”这种错误的概念，正确理解栈、静态存储区和堆的工作原理，是写出高效、安全代码的关键。

单页内核栈

在 Linux 内核中，单页内核栈（Single Page Kernel Stack） 是一种内核栈内存分配优化技术，主要用于减少每个进程/线程的内核栈内存占用。传统内核栈通常使用两个物理页面（例如在 x86_64 架构上为 8KB），而单页内核栈将其压缩到一个页面（通常为 4KB），从而显著节省内存资源。

背景与动机

内存效率问题：传统的双页内核栈（如 8KB）在现代服务器环境中会造成大量内存浪费。例如，一个拥有 10 万个进程的系统会额外占用约 781MB 内存。
内核栈溢出风险：虽然栈空间减小，但现代内核通过更严格的栈检查和优化（如WARN_ON()机制）降低了溢出风险。
嵌入式系统需求：在资源受限的设备（如 IoT、嵌入式系统）中，单页内核栈能有效减少内存使用。

单页内核栈的实现

配置选项：
内核需启用 CONFIG_THREAD_INFO_IN_TASK 和 CONFIG_SINGLE_THREAD_INFO 选项，将线程信息嵌入进程描述符（task_struct），而非单独分配空间。

内存布局：
单页内核栈通常与 thread_info 结构共享一个页面，布局如下：

+-------------------+  <- 栈顶（高地址）
|      内核栈       |
+-------------------+
|                   |
|                   |
+-------------------+
|    thread_info    |
+-------------------+  <- 栈底（低地址）

栈溢出检测：
内核通过以下机制避免溢出：
- 金丝雀值（Stack Canary）：在栈底放置特殊值，函数返回时检查其完整性。
- 动态栈扩展：当栈接近耗尽时，通过 expand_stack() 动态分配额外空间（需内核支持）。

优缺点分析

优点	缺点
减少内存占用（每个进程节省 4KB）	栈空间更小，可能触发溢出
提高缓存利用率	需更严格的栈使用规范
适合嵌入式系统和内存紧张的环境	部分内核特性可能受限（如深度递归）

适用场景

内存受限系统：如嵌入式设备、容器环境（cgroups）。
高并发服务器：减少每个线程的内存开销，提升系统吞吐量。
内核开发：通过 CONFIG_DEBUG_STACK_USAGE 选项监控栈使用情况。

如何启用单页内核栈

在编译内核时，配置以下选项：

1
2
3

CONFIG_THREAD_INFO_IN_TASK=y
CONFIG_SINGLE_THREAD_INFO=y
CONFIG_PAGE_OFFSET_IS_BASE=y

验证内核是否启用：

1	zgrep CONFIG_THREAD_INFO_IN_TASK /proc/config.gz

总结

单页内核栈是一种通过压缩内核栈空间来优化内存使用的技术，适用于对内存敏感的场景。虽然它减少了每个进程的内存占用，但需要内核更严格地控制栈使用，并依赖溢出检测机制确保安全。在实际应用中，需根据系统需求权衡内存节省与潜在风险。

页

概念

一、处理器寻址的基本概念

二、ARMv7的寻址与分页流程

1. 虚拟地址的结构（以32位ARMv7为例）

gfp_mask

kmalloc和vmalloc区别

分配区域与连续性

分配大小与效率

分配成功率

缓存属性

使用场景

总结

代码示例

区

一、内存区的分类及作用

1. ZONE_DMA（DMA区）

2. ZONE_NORMAL（常规区）

3. ZONE_HIGHMEM（高端内存区，可选）

二、ARM架构下的内存管理特点

1. 32位ARM系统（如ARMv7）

2. 64位ARM系统（如ARM64/ARMv8）

三、内存区的管理机制

1. 伙伴系统（Buddy System）

2. 页分配器（Page Allocator）

3. 高端内存的映射机制（仅32位系统）

四、查看内存区信息

五、总结

内存管理

slab层

基本概念与设计目标

核心组件与工作原理

工作流程

优势

相关技术

与其他内存分配器的关系

代码示例

总结

用户在函数栈上进行static

基本概念

关键区别

常见混淆点

栈分配的特点

静态分配的特点

动态分配（堆）的特点

总结

单页内核栈

背景与动机

单页内核栈的实现

优缺点分析

适用场景

如何启用单页内核栈

相关内核代码

总结