Linux电源管理(5)_Hibernate和Sleep功能介绍
作者:wowo 发布于:2014-6-10 16:11 分类:电源管理子系统
1. 前言
Hibernate和Sleep两个功能是Linux Generic PM的核心功能,它们的目的是类似的:暂停使用——>保存上下文——>关闭系统以节电········>恢复系统——>恢复上下文——>继续使用。
本文以内核向用户空间提供的接口为突破口,从整体上对这两个功能进行介绍,并会在后续的文章中,分析它们的实现逻辑和执行动作。
顺便感概一下,虽然这些机制在Linux系统中存在很久了(类似的概念也存在于Windows系统中),但以蜗蜗的观察,它们被使用的频率并不是很高,特别是在PC上,大多数人在大多数时候选择直接关闭系统。阴错阳差的是,在很多嵌入式设备中,设计者会利用Sleep机制实现热关机功能,以此减少开机的时间。
2. Hibernate和Sleep相关的术语梳理
蜗蜗在“Generic PM之基本概念和软件架构”中提到了Linux Generic PM有关的多个词汇,如Hibernate、Sleep、Suspend、Standby等等,听起来有些乱,因此在介绍Hibernate和Sleep之前,先来理一下这些词汇的关系。
▆ Hibernate(冬眠)和Sleep(睡眠)
是Linux电源管理在用户角度的抽象,是用户可以看到的实实在在的东西。它们的共同点,是保存系统运行的上下文后挂起(suspend)系统,并在系统恢复后接着运行,就像什么事情都没有发生一样。它们的不同点,是上下文保存的位置、系统恢复的触发方式以及具体的实现机制。
▆ Suspend
有两个层次的含义。一是Hibernate和Sleep功能在底层实现上的统称,都是指挂起(Suspend)系统,根据上下文的保存位置,可以分为Suspend to Disk(STD,即Hibernate,上下文保存在硬盘/磁盘中)和Suspend to RAM(STR,为Sleep的一种,上下文保存在RAM中);二是Sleep功能在代码级的实现,表现为“kernel/power/suspend.c”文件。
▆ Standby,是Sleep功能的一个特例,可以翻译为“打盹”。
正常的Sleep(STR),会在处理完上下文后,由arch-dependent代码将CPU置为低功耗状态(通常为Sleep)。而现实中,根据对功耗和睡眠唤醒时间的不同需求,CPU可能会提供多种低功耗状态,如除Sleep之外,会提供Standby状态,该状态下,CPU处于浅睡眠模式,有任何的风吹草动,就会立即醒来。
▆ Wakeup
这是我们第一次正式的提出Wakeup的概念。我们多次提到恢复系统,其实在内核中称为Wakeup。表面上,wakeup很简单,无论是冬眠、睡眠还是打盹,总得有一个刺激让我们回到正常状态。但复杂的就是,什么样的刺激才能让我们醒来?
动物界,温度回升可能是唯一可以让动物从冬眠状态醒来的刺激。而踢一脚、闹钟响等刺激,则可以让我们从睡眠状态唤醒。对于打盹来说,则任何的风吹草动,都可以唤醒。
而在计算机界,冬眠(Hibernate)时,会关闭整个系统的供电,因此想醒来,唯有Power按钮可用。而睡眠时,为了缩短Wakeup时间,并不会关闭所有的供电,另外,为了较好的用户体验,通常会保留某些重要设备的供电(如键盘),那样这些设备就可以唤醒系统。
这些刻意保留下来的、可以唤醒系统的设备,统称为唤醒源(Wakeup source)。而Wakeup source的选择,则是PM设计工作(特别是Sleep、Standby等功能)的重点。
经过上面的解释后,为了统一,蜗蜗会把表述从用户角度(Hibernate和Sleep)切换为底层实现上(STD、STR和Standby)。
3. 软件架构及模块汇整
3.1 软件架构
内核中该部分的软件架构大概可以分为三个层次,如下图:
1)API Layer,描述用户空间API的一个抽象层。
这里的API有两类,一类涉及Hibernate和Sleep两个功能(global APIs),包括实际功能、测试用功能、Debug用功能等,通过sysfs和debugfs两种形式提供;另一类是Hibernate特有的(STD APIs),通过sysfs和字符设备两种形式提供。
2)PM Core,电源管理的核心逻辑层,位于kernel/power/目录下,包括主功能(main)、STD、STR&Standby以及辅助功能(assistant)等多个子模块。
主功能,主要负责实现global APIs相关的逻辑,为用户空间提供相应的API;
STD,包括hibernate、snapshot、swap、block_io等子模块,负责实现STD功能和硬件无关的逻辑;
STR&Stanby,包括suspend和suspend_test两个子模块,负责实现STR、Standby等功能和硬件无关的逻辑。
3)PM Driver,电源管理驱动层,涉及体系结构无关驱动、体系结构有关驱动、设备模型以及各个设备驱动等多个软件模块。
3.2 用户空间接口
3.2.1 /sys/power/state
state是sysfs中一个文件,为Generic PM的核心接口,在“kernel/power/main.c”中实现,用于将系统置于指定的Power State(供电模式,如Hibernate、Sleep、Standby等)。不同的电源管理功能,在底层的实现,就是在不同Power State之间切换。
读取该文件,返回当前系统支持的Power State,形式为字符串。在内核中,有两种类型的Power State,一种是Hibernate相关的,名称为“disk”,除“disk”之外,内核在"kernel/power/suspend.c"中通过数组的形式定义了另外3个state,如下:
1: const char *const pm_states[PM_SUSPEND_MAX] = {
2: [PM_SUSPEND_FREEZE] = "freeze",
3: [PM_SUSPEND_STANDBY] = "standby",
4: [PM_SUSPEND_MEM] = "mem",
5: };
这些Power State的解释如下:
▆ freeze
这种Power State,并不涉及具体的Hardware或Driver,只是冻结所有的进程,包括用户空间进程及内核线程。和我们熟知的“冬眠”和“睡眠”相比,就称为“闭目养神”吧(可想而知,能节省的能量是有限的)。
【注:我们在之前的描述中,并没有特别描述该State,因为它在较早的内核中,只是Sleep、Hibernate等功能的一部分,只是在近期才独立出来。另外一个原因是,该state的省电效果不是很理想,所以其引用场景也是有限的。】
▆ standby,即第2章所描述的Standby状态。
▆ mem,即通常所讲的Sleep功能,也是第2章所描述的STR,Suspend to RAM。
▆ disk,即Hibernate功能,也是第2章所描述的STD,Suspend to Disk。
写入特定的Power State字符串,将会把系统置为该模式。
3.2.2 /sys/power/pm_trace
PM Trace用于提供电源管理过程中的Trace记录,由“CONFIG_PM_TRACE”宏定义(kernel/power/Kconfig)控制是否编译进内核,并由“/sys/power/pm_trace”文件在运行时控制是否使能该功能。
该功能的具体实现是“平台相关”的,我们这里暂不描述。
3.2.3 /sys/power/pm_test
PM test用于对电源管理功能的测试,由“CONFIG_PM_DEBUG”宏定义(kernel/power/Kconfig)控制是否编译进内核。其核心思想是:
▆ 将电源管理过程按照先后顺序,划分为多个步骤,如core、platform、devices等。这些步骤称作PM Test Level。
▆ 系统通过一个全局变量(pm_test_level),保存系统当前的PM Test Level。该变量的值可以通过”/sys/power/pm_test“文件获取及修改。
▆ 在每一个电源管理步骤结束后,插入PM test代码,该代码以当前执行步骤为参数,会判断当前的PM Test Level和执行步骤是否一致,如果一致,则说明该步骤执行成功。出于Test考量,执行成功后,系统会打印Test信息,并在等待一段时间后,退出PM过程。
▆ 开发人员可以通过修改全局的Test Level,有目的测试所关心的步骤是否执行成功。
上面已经讲了,该文件用于获取及修改PM Test Level,具体的Level信息在“kernel/power/main.c”中定义,格式如下(具体的意义,比较简单,对着相关的代码看,非常清晰,这里就不啰嗦了):
1: static const char * const pm_tests[__TEST_AFTER_LAST] = {
2: [TEST_NONE] = "none",
3: [TEST_CORE] = "core",
4: [TEST_CPUS] = "processors",
5: [TEST_PLATFORM] = "platform",
6: [TEST_DEVICES] = "devices",
7: [TEST_FREEZER] = "freezer",
8: };
3.2.4 /sys/power/wakeup_count
该接口只和Sleep功能有关,因此由“CONFIG_PM_SLEEP”宏定义(kernel/power/Kconfig)控制。它的存在,是为了解决Sleep和Wakeup之间的同步问题。
我们知道,系统睡眠后,可以通过保留的Wakeup source唤醒系统。而在当今的CPU体系中,唤醒系统就是唤醒CPU,而唤醒CPU的唯一途径,就是Wakeup source产生中断(内核称作Wakeup event)。而内核要保证在多种状态下,Sleep/Wakeup的行为都能正常,如下:
▆ 系统处于sleep状态时,产生了Wakeup event。此时应该直接唤醒系统。这一点没有问题。
▆ 系统在进入sleep的过程中,产生了Wakeup event。此时应该放弃进入sleep。
这一点就不那么容易做到了。例如,当Wakeup event发生在“/sys/power/state”被写之后、内核执行freeze操作之前。此时用户空间程序依旧可以处理Wakeup event,或者只是部分处理。而内核却以为该Event已经被处理,因此并不会放弃此次sleep动作。
这就会造成,Wakeup event发生后,用户空间程序已经后悔了,不想睡了,但最终还是睡下去了。直到下一个Wakeup event到来。
为了解决上面的问题,内核提供wkaeup_count机制,配合“/sys/power/state”,以实现Sleep过程中的同步。该机制的操作行为如下:
▆ wakeup_count是内核用来保存当前wakeup event发生的计数。
▆ 用户空间程序在写入state切换状态之前,应先读取wakeup_count并把获得的count写回给wakeup_count。
▆ 内核会比对写回的count和当前的count是否一致,如果不一致,说明在读取/写回操作之间,产生了新的的wakeup event,内核就会返回错误。
▆ 用户空间程序检测到写入错误之后,不能继续后的动作,需要处理响应的event并伺机再次读取/写回wakeup_count。
▆ 如果内核比对一致,会记录write wakeup_count成功时的event快照,后面继续suspend动作时,会检查是否和快照相符,如果不符,会终止suspend。
▆ 用户空间程序检测到写入正确后,可以继续对state的写入,以便发起一次状态切换。而此时是安全的。
蜗蜗会在后续的文章中,详细描述该机制在内核中的实现逻辑,这里暂不做进一步说明。
3.2.5 /sys/power/disk
该接口是STD特有的。用于设置或获取STD的类型。当前内核支持的STD类型包括:
1: static const char * const hibernation_modes[] = {
2: [HIBERNATION_PLATFORM] = "platform",
3: [HIBERNATION_SHUTDOWN] = "shutdown",
4: [HIBERNATION_REBOOT] = "reboot",
5: #ifdef CONFIG_SUSPEND
6: [HIBERNATION_SUSPEND] = "suspend",
7: #endif
8: };
▆ platform,表示使用平台特有的机制,处理STD操作,如使用hibernation_ops等。
▆ shutdown,通过关闭系统实现STD,内核会调用kernel_power_off接口。
▆ reboot,通过重启系统实现STD,内核会调用kernel_restart接口。
【注:以上两个kernel_xxx接口的实现,可参考“Generic PM之Reboot过程”。】
▆ suspend,利用STR功能,实现STD。该类型下,STD和STR底层的处理逻辑类似。
3.2.6 /sys/power/image_size
该接口也是STD特有的。我们知道,STD的原理是将当前的运行上下文保存在系统的disk(如NAND Flash,如硬盘),然后选择合适的方式关闭或重启系统。保存上下文是需要存储空间的,不光是disk中的存储空间,也包括位于内存的用于交换或缓冲的空间。
而该接口,就是设置或者获取当前内存中需要分配多少空间,用于缓冲需要写入到disk的数据。单位为byte。
3.2.6 /sys/power/reserverd_size
reserverd_size用于指示预留多少内存空间,用于在->freeze() 和 ->freeze_noirq()过程中保存设备驱动分配的空间。以免在STD的过程中丢失。
3.2.7 /sys/power/resume
该接口也是STD特有的。正常情况下,在重新开机后,内核会在后期的初始化过程中,读取保存在disk中的image,并恢复系统。而该接口,提供了一种在用户空间手动的读取image并恢复系统的方法。
通常情况下,该操作出现在系统正常运行的过程中,需要加载并执行另外的image。
3.2.8 debugfs/suspend_status
该接口是以debugfs的形式,向用户空间提供suspend过程的统计信息,包括:成功的次数、失败的次数、freeze失败的次数等等。
3.2.9 /dev/snapshot
该接口也是STD特有的。它通过字符设备的形式,向用户空间提供software的STD操作。我们会在后续的文章中详细描述。
原创文章,转发请注明出处。蜗窝科技,www.wowotech.net。
标签: Linux PM STD STR wakeup_count

评论:
2017-02-24 16:24
2016-07-14 09:51
这个是我用的linux版本,休眠机制我也不清楚,我是做应用层的,但是得把系统的待机和睡眠关掉。
我现在遇到的问题是xset dpms 0 0 300,系统黑屏后长时间(一晚上)不操作,屏幕无法点亮。不知道什么原因
2016-07-14 10:10
ls /sys/power
把它们的值cat出来看一下。
不过Ubuntu的休眠,通常是电源管理进程自行处理的,不一定能通过命令行关掉。
不知道休眠机制,靠猜的话,效率不高。
2016-07-14 13:38
pm_async pm_freeze_timeout state wake_lock wake_unlock wakeup_count
root@linaro-ubuntu-desktop:/sys/power# cat pm_async
1
root@linaro-ubuntu-desktop:/sys/power# cat pm_freeze_timeout
20000
root@linaro-ubuntu-desktop:/sys/power# cat state
freeze mem
root@linaro-ubuntu-desktop:/sys/power# cat wake_lock
root@linaro-ubuntu-desktop:/sys/power# cat wake_unlock
root@linaro-ubuntu-desktop:/sys/power# cat wake
wake_lock wake_unlock wakeup_count
root@linaro-ubuntu-desktop:/sys/power# cat wakeup_count
7021
root@linaro-ubuntu-desktop:/sys/power#
这个是power下的文件,没有别的了,是不是可以向wake_lock里面写个字符串阻止休眠呢,我现在把通过xset dpms 0 0 0设置的,然后把屏幕背光设置为0,过一段时间再设置为50,设置成功,cat值为0,但是屏幕亮度还是为没有变化,和之前的0时一样,这个是因为系统进入休眠了吗?
2015-06-30 16:04
如果内核比对一致,则会暂时屏蔽wakeup event上报给用户空间,并返回write正确。
----请问为什么要暂时wakeup event上报给用户空间?屏蔽的动作在哪儿实现的?什么时候解除?
2015-06-28 16:21
有个小问题,是关于内核空间和用户空间的。假设我在内核空间直接访问一个用户空间的地址(不通过copy_from_user等接口函数),并且该地址已经做了映射,这个时候访问这个地址会出错吗?如果出错,访问用户空间的错误是内核检测到的,还是MMU发现你访问的地址权限是用户空间地址而产生的错误。
2015-06-28 16:31
2015-06-29 09:05
但具体原因,我也没有深究过,因此也无法回答你。不过我觉得你的解释很合理,应该就是那个样子。
2016-06-23 16:21
2016-06-23 21:30
2020-10-13 09:56
kernel确实可以访问user space的虚拟地址,因为这段页表权限是open给kernel的,其实copy_from_user也是简单封装了一下,加了很多判断然后直接访问user space了。
但是user就不能访问kernel space了,因为页表权限是限制user的,可以参考arm的手册。
2015-06-27 16:45
---后面的解释还是基于"用户空间程序在写入state切换状态之前,应先读取wakeup_count" 对当前count和读取的count对比,可以理解是写state之前的一个检查/检测。
但是,当wakeup interrupt真正是发生在写state之后,freeze之前怎,会出现什么情况呢?
2015-04-15 18:13
3.2.6 /sys/power/reserverd_size
一面在STD的过程中丢失。 --> 以免 ??
2015-04-15 18:24
提供了一种在用空间手动的读取image并恢复系统的方法。 --> 用户空间?
功能
最新评论
- wangjing
写得太好了 - wangjing
写得太好了! - DRAM
圖面都沒辦法顯示出來好像掛點了。 - Simbr
bus至少是不是还有个subsystem? - troy
@testtest:只要ldrex-modify-strex... - gh
Linux 内核在 sparse 内存模型基础上实现了vme...
文章分类
随机文章
文章存档
- 2025年4月(5)
- 2024年2月(1)
- 2023年5月(1)
- 2022年10月(1)
- 2022年8月(1)
- 2022年6月(1)
- 2022年5月(1)
- 2022年4月(2)
- 2022年2月(2)
- 2021年12月(1)
- 2021年11月(5)
- 2021年7月(1)
- 2021年6月(1)
- 2021年5月(3)
- 2020年3月(3)
- 2020年2月(2)
- 2020年1月(3)
- 2019年12月(3)
- 2019年5月(4)
- 2019年3月(1)
- 2019年1月(3)
- 2018年12月(2)
- 2018年11月(1)
- 2018年10月(2)
- 2018年8月(1)
- 2018年6月(1)
- 2018年5月(1)
- 2018年4月(7)
- 2018年2月(4)
- 2018年1月(5)
- 2017年12月(2)
- 2017年11月(2)
- 2017年10月(1)
- 2017年9月(5)
- 2017年8月(4)
- 2017年7月(4)
- 2017年6月(3)
- 2017年5月(3)
- 2017年4月(1)
- 2017年3月(8)
- 2017年2月(6)
- 2017年1月(5)
- 2016年12月(6)
- 2016年11月(11)
- 2016年10月(9)
- 2016年9月(6)
- 2016年8月(9)
- 2016年7月(5)
- 2016年6月(8)
- 2016年5月(8)
- 2016年4月(7)
- 2016年3月(5)
- 2016年2月(5)
- 2016年1月(6)
- 2015年12月(6)
- 2015年11月(9)
- 2015年10月(9)
- 2015年9月(4)
- 2015年8月(3)
- 2015年7月(7)
- 2015年6月(3)
- 2015年5月(6)
- 2015年4月(9)
- 2015年3月(9)
- 2015年2月(6)
- 2015年1月(6)
- 2014年12月(17)
- 2014年11月(8)
- 2014年10月(9)
- 2014年9月(7)
- 2014年8月(12)
- 2014年7月(6)
- 2014年6月(6)
- 2014年5月(9)
- 2014年4月(9)
- 2014年3月(7)
- 2014年2月(3)
- 2014年1月(4)
2020-07-23 07:17