开源鸿蒙内核源码分析系列 | 多核管理 | 并发真正的基础
本篇说清楚CPU
指令是稳定的,但指令序列是变化的,只有这样计算机才能够实现用计算来解决一切问题这个目标。计算是稳定的,但计算的数据是多变的,多态的,地址是数据,控制信号也是数据。指令集本身也是数据(固定的数据)。只有这样才能够让计算机不必修改基础架构却可以适应不断发展变化的技术革命。
cpu是负责执行指令的,谁能给它指令?是线程(也叫任务), 任务是内核的调度单元,调度到哪个任务CPU就去执行哪个任务的指令。要执行指令就要有个取指令的开始地址。开始地址就是大家所熟知的main函数。一个程序被加载解析后内核会在ELF中找到main函数的位置,并自动创建一个线程,指定线程的入口地址为main函数的地址,由此开始了取指,译指,执指之路。
多线程内核是怎么处理的?一样的, 以JAVA举例,对内核来说 new thread中的run() 函数 和 main() 并没有区别。都是一个线程(任务)的执行入口。注意在系列篇中反复的说任务就是线程,线程就是任务,它们是一个东西在不同层面上的描述。对应用层说线程,对内核层说任务。有多少个线程就会有多少个入口,它们统一接受调度算法的调度, 调度算法只认优先级的高低,不会管你是main() 还是 run() 而区别对待。
定时器的实现也是通过任务实现的,只不过是个系统任务OsSwtmrTaskCreate,优先级最高,和入口地址OsSwtmrTask由系统指定。
所以理解CPU就要先理解任务,任务是理解内核的主线,把它搞明白了分析内核就轻轻松松,事半功倍了。看似高深的CPU只不过是搂草打兔子。不相信?那就看看内核对CPU是怎么描述的吧。本篇就围绕这个结构体展开说。
Percpu
percpu变量,顾名思义,就是对于同一个变量,每个cpu都有自己的一份,它可以被用来存放一些cpu独有的数据,比如cpu的id,cpu上正在运行的任务等等。
Percpu g_percpu[LOSCFG_KERNEL_CORE_NUM];//CPU核描述符,描述每个CPU的信息。
typedef struct {//内核对cpu的描述
SortLinkAttribute taskSortLink; /* task sort link */ //挂等待和延时的任务
SortLinkAttribute swtmrSortLink; /* swtmr sort link */ //挂定时器
UINT32 idleTaskID; /* idle task id */ //空闲任务ID 见于 OsIdleTaskCreate
UINT32 taskLockCnt; /* task lock flag */ //任务锁的数量,当 > 0 的时候,需要重新调度了
UINT32 swtmrHandlerQueue; /* software timer timeout queue id */ //软时钟超时队列句柄
UINT32 swtmrTaskID; /* software timer task id */ //软时钟任务ID
UINT32 schedFlag; /* pending scheduler flag */ //调度标识 INT_NO_RESCH INT_PEND_RESCH
#if (LOSCFG_KERNEL_SMP == YES)
UINT32 excFlag; /* cpu halt or exc flag */ //CPU处于停止或运行的标识
#endif
} Percpu;
至于 g_percpu的值怎么来的,因和编译过程相关,将在后续编译篇中说明。Percpu结构体不复杂,但很重要,一个一个掰开了说。
- taskSortLink是干什么用的?一个任务在运行过程中,经常会主动或被动停止,而进入等待状态。
- 主动停止情况, 例如:主动delay300毫秒,这是应用层很常见的操作。
- 被动停止情况, 例如:申请互斥锁失败,等待某个事件发生。发生这些情况时任务将被挂到taskSortLink上。这些任务可能来自不同的进程,但都是因为在被这个CPU执行时停下来了,等着再次被它执行。下图很清晰的看出在哪种情况下会被记录在案。
UINT32 OsTaskWait(LOS_DL_LIST *list, UINT32 timeout, BOOL needSched)
{
LosTaskCB *runTask = NULL;
LOS_DL_LIST *pendObj = NULL;
runTask = OsCurrTaskGet();//获取当前任务
OS_TASK_SCHED_QUEUE_DEQUEUE(runTask, OS_PROCESS_STATUS_PEND);//将任务从就绪队列摘除,并变成阻塞状态
pendObj = &runTask->pendList;
runTask->taskStatus |= OS_TASK_STATUS_PEND;//给任务贴上阻塞任务标签
LOS_ListTailInsert(list, pendObj);//将阻塞任务挂到list上,,这步很关键,很重要!
if (timeout != LOS_WAIT_FOREVER) {//非永远等待的时候
runTask->taskStatus |= OS_TASK_STATUS_PEND_TIME;//阻塞任务再贴上在一段时间内阻塞的标签
OsAdd2TimerList(runTask, timeout);//把任务加到定时器链表中
}
if (needSched == TRUE) {//是否需要调度
OsSchedResched();//申请调度,里面直接切换了任务上下文,至此任务不再往下执行了。
if (runTask->taskStatus & OS_TASK_STATUS_TIMEOUT) {//这条语句是被调度再次选中时执行的,和上面的语句可能隔了很长时间,所以很可能已经超时了
runTask->taskStatus &= ~OS_TASK_STATUS_TIMEOUT;//如果任务有timeout的标签,那么就去掉那个标签
return LOS_ERRNO_TSK_TIMEOUT;
}
}
return LOS_OK;
}
LITE_OS_SEC_TEXT STATIC INLINE VOID OsAdd2TimerList(LosTaskCB *taskCB, UINT32 timeOut)
{
SET_SORTLIST_VALUE(&taskCB->sortList, timeOut);//设置idxRollNum的值为timeOut
OsAdd2SortLink(&OsPercpuGet()->taskSortLink, &taskCB->sortList);//将任务挂到定时器排序链表上
#if (LOSCFG_KERNEL_SMP == YES)//注意:这里的排序不是传统意义上12345的排序,而是根据timeOut的值来决定放到CPU core哪个taskSortLink[0:7]链表上
taskCB->timerCpu = ArchCurrCpuid();
#endif
}
- OsAdd2SortLink,将任务挂到排序链表上,因等待时间不一样,所以内核会对这些任务按时间长短排序。
定时器相关三个变量,在系列篇《软件定时器 | 内核最高级任务竟是它》中已有对定时器的详细描述,可前往查看,就不难理解以下三个的作用了。
SortLinkAttribute swtmrSortLink;//CPU要处理的定时器链表
UINT32 swtmrHandlerQueue; //队列中放各个定时器的响应函数
UINT32 swtmrTaskID; // 其实就是 OsSwtmrTaskCreate
搞明白定时器的机制只需搞明白: 定时器(SWTMR_CTRL_S),定时任务(swtmrTaskID),定时器响应函数(SwtmrHandlerItem),定时器处理队列swtmrHandlerQueue 四者的关系就可以了。 一句话概括:定时任务swtmrTaskID是个系统任务,优先级最高,它循环读取队列swtmrHandlerQueue中的已到时间的定时器(SWTMR_CTRL_S),并执行定时器对应的响应函数SwtmrHandlerItem。
idleTaskID空闲任务,注意这又是个任务,每个cpu核都有属于自己的空闲任务,cpu没事干的时候就待在里面。空闲任务长什么样? Look!
//创建一个空闲任务
LITE_OS_SEC_TEXT_INIT UINT32 OsIdleTaskCreate(VOID)
{
UINT32 ret;
TSK_INIT_PARAM_S taskInitParam;
Percpu *perCpu = OsPercpuGet();//获取CPU信息
UINT32 *idleTaskID = &perCpu->idleTaskID;//每个CPU都有一个空闲任务
(VOID)memset_s((VOID *)(&taskInitParam), sizeof(TSK_INIT_PARAM_S), 0, sizeof(TSK_INIT_PARAM_S));//任务初始参数清0
taskInitParam.pfnTaskEntry = (TSK_ENTRY_FUNC)OsIdleTask;//入口函数
taskInitParam.uwStackSize = LOSCFG_BASE_CORE_TSK_IDLE_STACK_SIZE;//任务栈大小 2K
taskInitParam.pcName = "Idle";//任务名称 叫pcName有点怪怪的,不能换个撒
taskInitParam.usTaskPrio = OS_TASK_PRIORITY_LOWEST;//默认最低优先级 31
taskInitParam.uwResved = OS_TASK_FLAG_IDLEFLAG;//默认idle flag
#if (LOSCFG_KERNEL_SMP == YES)//CPU多核情况
taskInitParam.usCpuAffiMask = CPUID_TO_AFFI_MASK(ArchCurrCpuid());//每个idle任务只在单独的cpu上运行
#endif
ret = LOS_TaskCreate(idleTaskID, &taskInitParam);//创建task并申请调度,
OS_TCB_FROM_TID(*idleTaskID)->taskStatus |= OS_TASK_FLAG_SYSTEM_TASK;//设置task状态为系统任务,系统任务运行在内核态。
//这里说下系统任务有哪些?比如: idle,swtmr(软时钟),资源回收等等
return ret;
}
LITE_OS_SEC_TEXT WEAK VOID OsIdleTask(VOID)
{
while (1) {//只有一个死循环
#ifdef LOSCFG_KERNEL_TICKLESS //低功耗模式开关, idle task 中关闭tick
if (OsTickIrqFlagGet()) {
OsTickIrqFlagSet(0);
OsTicklessStart();
}
#endif
Wfi();//WFI指令:arm core 立即进入low-power standby state,等待中断,进入休眠模式。
}
}
OsIdleTask是一个死循环,只有一条汇编指令Wfi。 啥意思? WFI(Wait for interrupt):等待中断到来指令。 WFI一般用于cpuidle,WFI 指令是在处理器发生中断或类似异常之前不需要做任何事情。具体在 自旋锁篇 中有详细描述,可前往查看。说到死循环,这里多说一句,从宏观尺度上来理解,整个内核就是一个死循环。因为有 软硬中断/异常 使得内核能活跃起来,能跳到不同的地方去执行,执行完了又会沉寂下去,等待新的触发到来。
taskLockCnt 这个简单,记录等锁的任务数量。任务在运行过程中优先级是会不断地变化的, 例如 高优先级的A任务在等某锁,但持有锁的一方B任务优先级低,这时就会调高B的优先级至少到A的等级,提高B被调度算法命中的概率,如此就能快速的释放锁交给A运行。 taskLockCnt记录被CPU运行过的正在等锁的任务数量。
schedFlag 调度的标签。
typedef enum {
INT_NO_RESCH = 0, /* no needs to schedule *///不需要调度
INT_PEND_RESCH, /* pending schedule flag *///阻止调度
} SchedFlag;
调度并不是每次都能成功的,在某些情况下内核会阻止调度进行。例如:OS_INT_ACTIVE硬中断发生的时候。
STATIC INLINE VOID LOS_Schedule(VOID)
{
if (OS_INT_ACTIVE) {//发生硬件中断,调度被阻塞
OsPercpuGet()->schedFlag = INT_PEND_RESCH;//
return;
}
OsSchedPreempt();//抢占式调度
}
excFlag标识CPU的运行状态,只在多核CPU下可见。
#if (LOSCFG_KERNEL_SMP == YES)
typedef enum {
CPU_RUNNING = 0, ///< cpu is running | CPU正在运行状态
CPU_HALT, ///< cpu in the halt | CPU处于暂停状态
CPU_EXC ///< cpu in the exc | CPU处于异常状态
} ExcFlag;
#endif
以上为内核对CPU描述的全貌,不是很复杂。多CPU的协同工作部分在后续篇中介绍。
complicated chipset on circut board by cornerstoneman
百文说内核 | 抓住主脉络
子曰:“诗三百,一言以蔽之,曰‘思无邪’。”——《论语》:为政篇。百文相当于摸出内核的肌肉和器官系统,让人开始丰满有立体感,因是直接从注释源码起步,在开源鸿蒙内核源码加注释过程中,每每有心得处就整理,慢慢形成了以下文章。内容立足源码,常以生活场景打比方尽可能多的将内核知识点置入某种场景,具有画面感,容易理解记忆。说别人能听得懂的话很重要! 百篇博客绝不是百度教条式的在说一堆诘屈聱牙的概念,那没什么意思。更希望让内核变得栩栩如生,倍感亲切.确实有难度,自不量力,但已经出发,回头已是不可能的了。
百万汉字注解内核目的是要看清楚其毛细血管,细胞结构,等于在拿放大镜看内核。内核并不神秘,带着问题去源码中找答案是很容易上瘾的,你会发现很多文章对一些问题的解读是错误的,或者说不深刻难以自圆其说,你会慢慢形成自己新的解读,而新的解读又会碰到新的问题,如此层层递进,滚滚向前,拿着放大镜根本不愿意放手。与代码有bug需不断debug一样,文章和注解内容会存在不少错漏之处,请多包涵,但会反复修正,持续更新,v**.xx 代表文章序号和修改的次数,精雕细琢,言简意赅,力求打造精品内容。百篇博客系列思维导图结构如下:
根据上图的思维导图,我们未来将要和大家一一分享以上大部分关键技术点的博客文章。
百万汉字注解.精读内核源码
如果大家觉得看文章不过瘾,想直接撸代码的话,可以去下面四大码仓围观同步注释内核源码:
gitee仓:
https://gitee.com/weharmony/kernel_liteos_a_note
github仓 :
https://github.com/kuangyufei/kernel_liteos_a_note
codechina仓:
https://codechina.csdn.net/kuangyufei/kernel_liteos_a_note
coding仓:
https://weharmony.coding.net/public/harmony/kernel_liteos_a_note/git/files
写在最后
我们最近正带着大家玩嗨OpenHarmony。如果你有用OpenHarmony开发的好玩的东东,或者有对OpenHarmony的深度技术剖析,想通过我们平台让更多的小伙伴知道和分享的,欢迎投稿,让我们一起嗨起来!有点子,有想法,有Demo,立刻联系我们:
合作邮箱:zzliang@atomsource.org