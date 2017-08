前言:蜗窝微信群开张了,这个群是为那些愿意慢下来,仔细研究内核技术、愿意为了搞清楚内核代码逻辑而废寝忘食的工程师准备的,在这个群里,大家讨论了一些技术问题,当然,也有一些问题没有解决和答案。鉴于微信群的特点,我还是把大家讨论的技术整理了一下,分享出来,希望能够对其他工程师有所帮助。

问题一:请问sysconf(_SC_CLK_TCK)拿到的HZ是不是jiffies的频率呢?如果是为何我内核配置的HZ是250,但是这个函数返回的是100?这是为什么?

1、userspace需要知道内核中的HZ的配置吗?

其实用户空间应该不需要关心内核HZ的设定,所以那个接口其实是没意义,毕竟这是内核的特性,也许内核是tickless的呢?。用户空间和时间相关接口用纳秒就好,不要用tick值表示时间,否则用户空间还要转换成纳秒,而且需要知道内核HZ,封装性不好。

2、既然不需要,那么这个接口是干什么的?

这个函数返回的是USER_TICK而不是真是内核的HZ,因此虽然你的内核配置是250,但是sysconf(_SC_CLK_TCK)依然返回100。

虽然新的程序不建议使用这个接口,但是市面上还有众多的老的程序还是依赖这些接口的,因此,为了兼容的原因,userspace和kernel还是还是需要交互tick的,内核采用的办法是这样的:HZ是内核自己使用,定义USER_TICK用于和userspace接口,内核在返回用户空间的时候会转换成USER_TICK。

3、怎么实现的?

用户空间和内核空间有很多交互的形态,例如大家最熟悉的就是系统调用。不过我们这里sysconf(_SC_CLK_TCK)函数并没有引发系统调用,她使用的是auxiliary vector。

一个程序的二进制文件在被加载的过程中(代码位于linux/fs/binfmt_elf.c), 会通过若干NEW_AUX_ENT来定义auxiliary vector table,具体和这个场景的代码如下:

NEW_AUX_ENT(AT_CLKTCK, CLOCKS_PER_SEC);

# define USER_HZ 100 /* some user interfaces are */

# define CLOCKS_PER_SEC (USER_HZ) /* in "ticks" like times() */