Linux功耗管理(25_Linux电源管理(14)_从设备驱动的角度看电源管理)

2019-07-13 21:34发布

1. 前言

相信工作稍微久一点的linux驱动工程师都深有体会: 在旧时光里,实现某一个设备的电源管理功能,是非常简单的一件事情。大多数设备都被抽象为platform设备,driver只需要提供suspend/resume/shutdown等回调函数,并注册到kernel即可。kernel会在系统电源状态切换的过程中,调用driver提供的回调函数,切换设备的电源状态。 但是在新时代中,设备电源管理有关的操作,被统一封装在struct dev_pm_ops结构中了。该结构包含20多个回调函数,再加上复杂的电源管理机制(常规的suspend/resume、runtime PM等等),使设备驱动的电源管理工作不再那么单纯,工程师(如蜗蜗自己)的思路也不再特别清晰。 因此本文希望能以单一设备的电源管理为出发点,结合kernel的电源管理机制,介绍怎样在设备驱动中添加电源管理功能,并分析设备电源状态切换和系统电源状态切换的关系。 另外,我们在电源管理系列文章中,介绍了很多的电源管理机制,如generic PM、wakeup event framework、wakelock、autosleep、runtime PM、PM domain、等等,本文也算是对它们的梳理和总结。

2. 功能描述

设备的电源状态切换,和系统电源状态切换基本保持一致(runtime PM除外),切换的场景如下: 1)系统reboot的过程,包括halt、power off、restart等(可参考“Linux电源管理(3)_Generic PM之Reboot过程”),要求设备进入shutdown状态,以避免意外产生。 2)系统suspend/resume的过程(可参考“Linux电源管理(6)_Generic PM之Suspend功能”),要求设备也同步suspend/resume。 3)系统hibernate及恢复的过程,要求设备在suspend/resume的基础上,增加poweroff的动作。 4)runtime PM过程(可参考“Linux电源管理(11)_Runtime PM之功能描述”),要求设备在引用计数为0时suspend甚至power off,并在引用计数大于0时power on以及resume。 旧有的电源管理框架中,通过bus、class、device_driver等结构体中的shutdown、suspend、resume三个回调函数,就可以实现上面处runtime PM之外的所有功能。但是在新框架中,特别是引入struct dev_pm_ops结构之后,其中的suspend/resume就不再推荐使用了。 不过,对有些设备来说,例如platform device,如果电源管理需求不是很复杂,driver工程师仍然可以使用旧的方法实现,kernel会自动帮忙转换为新的方式。但是,如果有更多需求,就不得不面对struct dev_pm_ops了。下面将会详细说明。

3. 数据结构回顾

正式开始之前,我们先回顾一下设备电源管理有关的数据结构。它们大多都在之前的文章中介绍过了,本文放在一起,权当一个总结。 3.1 .shutdown回调函数以及使用方法 由于reboot过程是相对独立和稳定的,且该过程依赖于设备的.shutdown回调函数,这里把它独立出来,单独描述,后面就不再涉及了。 .shutdown回调函数存在于两个数据结构中:struct device_driver和struct bus_type,在系统reboot的过程中被调用,负责关闭设备。设备驱动可以根据需要,实现其中的一个。我们以一个普通的platform设备为例,介绍这个过程。 1)定义一个platform_driver,并实现其.shutdown回调,然后调用platform_driver_register将它注册到kernel中 1: static void foo_shutdown(struct platform_device *pdev) 2: { 3: ... 4: } 5: static platform_driver foo_pdrv = 6: { 7: .shutdown = foo_shutdown, 8: ... 9: }; 2)platform_driver_register时,会把struct device_driver变量的shutdown函数,替换为platform设备特有的shutdown函数(platform_drv_shutdown),并调用driver_register将device_driver注册到kernel 1: int __platform_driver_register(struct platform_driver *drv, 2: struct module *owner) 3: { 4: 5:  6: if (drv->shutdown) 7: drv->driver.shutdown = platform_drv_shutdown; 8:  9: return driver_register(&drv->driver); 10: } 3)系统reboot的过程中,会调用每个设备的shutdown函数。对这里的foo_pdrv而言,会先调用platform_drv_shutdown,它继续调用foo_shutdown。 3.2 legacy的不再使用的.suspend/.resume 旧的suspend/resume操作,主要依赖struct device_driver、struct class、struct bus_type等结构中的suspend和resume回调函数,其使用方式和上面的.shutdown几乎完全一样。以platform设备为例,只需多定义两个函数即可,如下: 1: static int foo_suspend(struct platform_device *pdev, pm_message_t state) 2: { 3: ... 4: } 5:  6: static int foo_resume(struct platform_device *pdev) 7: { 8: ... 9: } 10:  11: static void foo_shutdown(struct platform_device *pdev) 12: { 13: ... 14: } 15:  16: static platform_driver foo_pdrv = { 17: .suspend = foo_suspend, 18: .resume = foo_resume, 19: .shutdown = foo_shutdown, 20: ... 21: };
在较新的kernel中,已经不再建议使用这些回调函数了,但对platform设备来说,如果场景比较简单,可以照旧使用上面的实现方法,platform.c会自动帮忙转换为struct dev_pm_ops回调,具体请参考后面描述。
3.3 struct dev_pm_ops结构 struct dev_pm_ops是设备电源管理的核心数据结构,用于封装和设备电源管理有关的所有操作 1: struct dev_pm_ops { 2: int (*prepare)(struct device *dev); 3: void (*complete)(struct device *dev); 4: int (*suspend)(struct device *dev); 5: int (*resume)(struct device *dev); 6: int (*freeze)(struct device *dev); 7: int (*thaw)(struct device *dev); 8: int (*poweroff)(struct device *dev); 9: int (*restore)(struct device *dev); 10: int (*suspend_late)(struct device *dev); 11: int (*resume_early)(struct device *dev); 12: int (*freeze_late)(struct device *dev); 13: int (*thaw_early)(struct device *dev); 14: int (*poweroff_late)(struct device *dev); 15: int (*restore_early)(struct device *dev); 16: int (*suspend_noirq)(struct device *dev); 17: int (*resume_noirq)(struct device *dev); 18: int (*freeze_noirq)(struct device *dev); 19: int (*thaw_noirq)(struct device *dev); 20: int (*poweroff_noirq)(struct device *dev); 21: int (*restore_noirq)(struct device *dev); 22: int (*runtime_suspend)(struct device *dev); 23: int (*runtime_resume)(struct device *dev); 24: int (*runtime_idle)(struct device *dev); 25: };
该结构基本上是个大杀器了,该有的东西都有,主要分为几类: 传统suspend的常规路径,prepare/complete、suspend/resume、freeze/thaw、poweroff、restore; 传统suspend的特殊路径,early/late、noirq; runtime PM,suspend/resume/idle。
各类driver需要做的事情很单纯,实现这些回调函数,并保存在合适的位置,我们接着往下看。 3.4 struct dev_pm_ops的位置 1: struct device { 2: ... 3: struct dev_pm_domain *pm_domain; 4: const struct device_type *type; 5: struct class *class; 6: struct bus_type *bus; 7: struct device_driver *driver; 8: ... 9: }; 10:  11:  12:  13: struct dev_pm_domain { 14: struct dev_pm_ops ops; 15: ... 16: }; 17:  18: struct device_type { 19: ... 20: const struct dev_pm_ops *pm; 21: }; 22:  23: struct class { 24: ... 25: const struct dev_pm_ops *pm; 26: ... 27: }; 28:  29: struct bus_type { 30: ... 31: const struct dev_pm_ops *pm; 32: ... 33: }; 34:  35: struct device_driver { 36: ... 37: const struct dev_pm_ops *pm; 38: ... 39: };
可谓是狡兔多窟,struct dev_pm_ops存在于struct device、struct device_type、struct class、struct bus_type、struct device_driver等所有和设备模型有关的实体中 由之前的文章可知,kernel在电源管理的过程中,会按照如下优先级调用dev_pm_ops中的回调函数,以命令设备实现相应的状态切换 dev->pm_domain->ops、dev->type->pm、dev->class->pm、dev->bus->pm、dev->driver->pm。 因此,设备driver需要做的事情也很单纯,实现这些回调函数,并保存在合适的位置。但这么多位置,到底怎么实现呢?我们接着分析。

4. struct dev_pm_ops的实现

由之前的描述可知,系统在电源状态切换时,会按照一定的优先顺序,调用设备的pm ops。所谓的优先顺序,是指:只要存在优先级高的ops(如dev->pm_domain->ops),则调用该ops,否则继续查找下一个优先级。因此,设备驱动可以根据该设备的实际情况,在指定层次上,实现dev pm ops,以达到电源管理的目的。 dev pm ops可以存在于pm domain、device type、class、bus、device driver任何一个地方,本章以pm domain、bus和device driver三个典型场景为例,介绍设备电源管理的实现思路。 注1:为了方便,我会以struct dev_pm_ops中的.suspend函数为例,其它类似。 4.1 pm domain 当一个设备属于某个pm domain时(具体可参考“Linux PM domain framework(1)_概述和使用流程”),系统suspend的过程中,会直接调用pm_domain->ops.suspend。而由pm_genpd_init可知,pm_domain->ops.suspend由pm_genpd_suspend实现:
genpd->domain.ops.suspend = pm_genpd_suspend;
该接口的实现为: 1: static int pm_genpd_suspend(struct device *dev) 2: { 3: struct generic_pm_domain *genpd; 4:  5: dev_dbg(dev, "%s() ", __func__); 6:  7: genpd = dev_to_genpd(dev); 8: if (IS_ERR(genpd)) 9: return -EINVAL; 10:  11: return genpd->suspend_power_off ? 0 : pm_generic_suspend(dev); 12: }
最终会调用pm_generic_suspend,由“Linux电源管理(4)_Power Management Interface”的描述可知,该接口最终会调用该设备驱动的suspend接口(如果有的话),即:dev->driver->pm->suspend。
看来是空欢喜一场,本以为pm domain帮忙做了,设备驱动就可以偷一点懒,谁知道绕来绕去,又把球踢给了设备驱动!让我们思考一下其中的原因: 1)suspend时,设备的动作到底是什么,只有设备驱动最清楚,所以,把事情交给driver做,是合理的。 2)那么,为什么要经过pm domain这一层呢?直接调用driver的suspend不就可以了吗?因为需要在suspend前,由pm domain做一些处理,例如判断该设备是否已经掉电(如果掉电了,就不能再suspend了,否则可能有非预期的结果),等等。 4.2 dev->bus->pm 来看另一个例子,如果该设备所在的bus提供了dev_pm_ops呢?开始之前,我们再强调一下这个事实:suspend时,设备的动作到底是什么,只有设备驱动最清楚,所以,把事情交给driver做,是合理的。所以相信大家猜到了,就算bus有suspend回调,最终还是要绕到设备驱动的suspend接口上。 我们以platform bus为例,原因是这个bus很简单,而且我们平时需要面对的大多数设备都是platform设备。 在drivers/base/platform.c中,platform bus是这样定义的: 1: struct bus_type platform_bus_type = { 2: .name = "platform", 3: .dev_groups = platform_dev_groups, 4: .match = platform_match, 5: .uevent = platform_uevent, 6: .pm = &platform_dev_pm_ops, 7: }; 接着看一下platform_dev_pm_ops: 1: static const struct dev_pm_ops platform_dev_pm_ops = { 2: .runtime_suspend = pm_generic_runtime_suspend, 3: .runtime_resume = pm_generic_runtime_resume, 4: USE_PLATFORM_PM_SLEEP_OPS 5: };
哦,有runtime PM相关的两个回调,有一个宏定义:USE_PLATFORM_PM_SLEEP_OPS,该宏定义指定了dev_pm_ops的suspend回调为platform_pm_suspend(其它的类似)。该接口的实现如下:
1: int platform_pm_suspend(struct device *dev) 2: { 3: struct device_driver *drv = dev->driver; 4: int ret = 0; 5:  6: if (!drv) 7: return 0; 8:  9: if (drv->pm) { 10: if (drv->pm->suspend) 11: ret = drv->pm->suspend(dev); 12: } else { 13: ret = platform_legacy_suspend(dev, PMSG_SUSPEND); 14: } 15:  16: return ret; 17: }
原来如此,如果该设备的驱动提供了dev_pm_ops指针,调用相应的suspend接口。否则,调用legacy的接口(即pdrv->suspend)。再对比3.1,3.2小节的描述,是不是豁然开朗了? 另外,由于platform bus是一个虚拟的bus,不需要其它的动作。对于一些物理bus,可以在bus的suspend接口中,实现bus有关的suspend操作。这就是设备模型的魅力所在
4.3 dev->driver->pm 无论怎样,如果一个设备需要在suspend时有一些动作,就一定要在设备驱动中实现suspend,那样怎么实现呢?定义一个struct dev_pm_ops变量,并实现设备所需的回调函数,在driver注册之前,保存在driver->pm指针中即可。 那有什么变化?大多数的设备是platform设备,我们也可以用旧的方式(3.1,3.2小节),实现platform driver的suspend/resume。但是,在新时代,不建议这样做了,注意platform_legacy_suspend中的legacy字样哦,遗产、遗留下来的,只是为了兼容。如果我们新写driver,就用新的方式好了。

5. 设备电源状态的切换过程

本来还想梳理一下系统电源切换的过程中,driver是怎么处理的。但经过上面的分析,传统的suspend/resume已经很明确了,无非是按照pm_domain—>device driver或者class—>device driver或者bus—>device driver的顺序,调用相应的回调函数。而runtime PM,还是放到runtime PM的分析文章里比较好。所以本文就结束好了。   原创文章,转发请注明出处。蜗窝科技www.wowotech.net