UNIX v6 fork()源码分析

2019-07-14 12:20发布

进程创建时机

 进程创建,是指操作系统创建一个新的进程。UNIX系统用fork()系统调用,而windows系统用CreatProcess()。进程创建的时机有:    (1)系统初始化。系统的调度进程创建init进程。    (2)执行中的进程调用了fork()系统函数。程序中有fork()函数。    (3)用户登录,用户命令请求创建进程。例如:用户双击一个图标。    (4)一个批处理作业初始化。大型机、高性能计算机用户提交一个课题,则系统建立作业控制块,在作业调度后在系统内存中创建进程。

进程创建原语

进程借助创建原语实现创建一个新进程。首先为被创建进程在进程表集中区建立一个PCB--UNIX系统还要为进程创建U区和内存映像,从进程表索取一个空白PCB表目,记录它的下标;然后,把调用者提供的所有参数(见PCB块的内容),操作系统分配给新进程的PID和调用者的PID,就绪状态和CPU记账数据填入该PCB块;最后,把此PCB块分别列置到就绪队列RQ和进程隶属关系族群中。
UNIX系统使用fork()函数创建新进程时,为子进程复制EP进程的内存映像并不是主要目标。这时,若用exec()执行一个新程序,则子进程的正文段将全部更换,而数据段也将更新。
创建原语可描述如下[1]:
Procedure create(n,S0,K0,M0,R0,acc)
  begin
     i:=getinternal name(n);//进程表下标
     i.id:=n;i.priority:=K0; //进程PID,进程优先级
i.CPU state=S0; i.mainstore:=M0;//初始CPU状态,内存地址
i.resources:=R0;i.status:=readys;//资源清单,就绪状态
     j:=EP;i.parent:=j;i.progeny:=φ;//父进程是EP进程,子进程空
     j.progeny:=i;//进程隶属关系
     i.sdata=RQ;insert(RQ,i);//到就绪进程队列排队
     continue
end

fork函数的程序设计方法

1.fork()系统调用格式

系统调用1:fork
#include
#include
pid_t  fork() 返回值:子进程返回0,父进程返回子进程ID,出错返回-1。 功能:创建一个进程。   fork的三个返回值fork的三个返回值  

2.fork程序设计

  源程序
#include
#include
#include
int main(int argc,char *argv[])
{
 int value=5;
 pid_t pid;
 pid=fork(); //fork一个子进程
 if (pid<0){  //返回值小于0
     printf(“fork failed ”);
     exit(-1);
}
else if (pid==0){ //子进程
value+=15;
printf(“ child process pid=%d”,getpid());
printf(“ value=%d”,value);
exit(0);
}
else if(pid>0){ //EP进程(parent process)
      value+=5;
      pirntf(“ value=%d”,value);
      printf(“EP process pid=%d”,getpid());
      printf(“ value=%d”,value);
      exit(0);
}
}
在程序设计中,fork()的应用最重要的是:掌握利用对子进程和EP进程的两个不同返回值的方法。经典方式是使用  if语句,if((pid=fork())==0)是子进程完成任务的编程范围,应编写与子进程功能相关的语句;而else if (pid>0)则是EP进程(parent process)完成任务的语句范围。在以上程序中,两个进程完成的功能相同,然而在大多数情况,它们的功能不同,这也是使用fork()的原因之一。应注意一个函数同时有不同返回值的问题,这是和以前的编程经验不同的地方。
为了避免操作系统崩溃,pid<0是必须考虑的情况,创建进程失败称为异常。在UNIX系统程序中,不能有考虑不到的异常情况,这是编程能力的高低区别。
新创建的子进程和EP进程有各相互独立的数据段,EP进程和子进程对同一个变量所做的任何改变都是独立的,不会放映到另一个进程的存储器中。因此,value在子进程中的值为20,而在EP进程中的值则为10。变量value在不同的进程中有不同的值,充分说明尽管子进程是复制EP进程而来,有相同的正文段,然而,它们的数据段各自独立。EP进程不能访问子进程的数据段,所以它的第一个printf()语句输出的value值为5。

UNIX V6 fork()源代码剖析

1. 数据结构proc和user

UNIX V6采用进程控制块PCB和U区管理和表示一个进程控制信息。PCB块使用结构proc表示,称为进程基本控制块,而U区使用结构user表示称为进程扩充控制块。进程控制信息分为两部分的原因是:结构proc常驻内存,管理经常被操作系统内核访问的那部分信息;而结构user管理进程分配的资源,包括打开的文件或目录等信息,有可能被移至外存交换空间。由于操作系统内核只需要当前执行进程的user,因此当某一进程被换出至外存时,对应的U区被移至交换空间。这是早年计算机内存容量紧张造成的。
PCB块原本是进程控制块的统称,但是常用来表示proc,所以今后PCB块都表示进程基本控制块。
一.PCB块
#include 
#define NPROC 50
struct proc
{
char p_stat;//状态。CPU相关
             SRUN:可执行。执行和就绪  
SIDL:进程生成中。fork()      
                 SSLEEP:高阻塞 
SWAIT:低阻塞
               SSTOP:trace   
               SZOME:终止还没回收
char  p_flag;  //标志。内存相关(是否调到外存)
SSYS:系统进程。proc[0]   pid=0                                                             
init进程是proc[1],并不是系统进程
        SLOAD:在内存中(可执行)
        SLOCK:进程上锁不被调出
        SSWAP:进程在外存
                               r5,r6
        STRC:跟踪状态
        SWTED:在被跟踪时使用
char p_pri;//进程优先级。可变。
char p_sig;//进程接收到的信号,软中断信号。
         //记录其它进程发来的信号
char p_uid;//进程所属用户UID。哪一个用户登录。
char p_time;//进程的存在时间。
//给出进程的执行时间和对资源的利用情况。
当刚交换到内存或外存交换区时,p_time=0。
char p_cpu;//CPU累计时间,在CPU上运行的时间。
char p_nice;//用户调整优先级的值
            //偏置值nice,固定值。用户的权限。
int  p_ttyp://发出进程的终端号,uid所在终端。与信号相关。
int p_pid;//进程PID
int P_ppid;//父进程PID,创建进程的PID。
//当父进程退出,则子进程的父进程可为init进程。
int p_addr;//数据段的物理地址。进程PPDA和U区的地址
int p_size;//数据段长度。可交换映像大小
int p_wchan;//阻塞原因。
//事件描述符,记录使进程进入阻塞状态的原因。
可为系统资源,例如:内存缓冲区。
int *p_textp;//代码段。源程序编译的可执行文件在text[]中的地址。
}proc[NPROC];
proc[NPROC]数组是进程表,NPROC规定了UNIX操作系统允许拥有的最多进程数。结构proc包含15个成员。PCB块的proc.p_stat和proc.p_flag常组合使用。根据PCB块的描述,它们分为七类:
1.进程标识符proc.p_pid  它等于全局变量mpid。mpid的变化范围是0~(215-1)。尽管很长时间不会重复,然而当mpid是最大值是,它将又一次从0开始计数。应注意mpid与NPROC不同。
2.进程状态proc.p_stat和进程标志proc.p_flag   
与进程能否被调度在CPU上运行密切相关,因此进程状态又称为进程调度状态。进程的各种调度状态可依据一定的原因和条件变化。一个已存在系统中的进程不断在这些状态中变化。
UNIX V6使用进程调入调出系统,并不是现在的虚拟内存管理系统。进程调入调出是完整的内存映像调出,包括PPDA。进程调出的标志并不是代码段调出到外存,而是PPDA调出到外存。Per process data area(PPDA)由进程的 U区和内核栈区域构成,在数据段的首部,有1kB长度。
当EP进程生成子进程时,状态proc.p_stat= SIDL,而且当时它不可能被调出内存,所以标志proc.p_flag= SLOCK。因此,=。就绪进程很少被调出内存,因此大多数情况=
3.CPU 运行信息和进程优先数  进程优先数动态变化,相关参数有三项。第一项proc.p_pri,值越小优先权越高。它是处理机调度的主要依据。数值变化范围-100~127,进程调度的优先权不能有很丰富的变动。第二项proc.p_cpu反映了进程使用处理机的程度。proc.p_cpu值越大表示进程使用CPU的时间越长,因此被调度的可能性就越小。它是UNIX操作系统计算p_pri的一个主要参考数据。第三项是proc.p_nice计算进程优先数时所用的一个偏置值。在三项中,是用户唯一能设置的一个值。
UNIX操作系统的优先级调度算法见第1.4节。
4.进程的内存映像地址    表示进程图像最近一次调入调出后,在内存或外存交换区的时间。这是0#进程在内、外存之间传送继承的一个主要依据。proc.p_addr不仅是数据段,而且是栈区域和PPDA的物理地址。它们同在数据段中,根据APR页表和它们的区域长度,能计算出实际的物理地址。因此,不能说PCB块中没有给出栈区域的物理地址。proc.p_size=数据区域长度+栈区域长度+PPDA长度。根据proc.p_addr,proc.p_textp,proc.p_size能找到进程的内存图像,若进程被调出到外存则proc.p_addr是进程数据段在外存的地址。
7.进程的组织隶属关系    用户标识符proc.p_uid保存在一份用户花名册文件中/etc/passwd,每一个合法用户在该文件中都有一个记录,格式为:
login name:password:uid:gid::login working dir:shell  
login name是用户进入系统时使用的登录名;password是密码形式的用户口令;uid、gid是高级用户或者系统管理员分配给该用户的标识符和所在组号(0~255);最后两项分别是用户工作目录和操作系统提供给用户的命令程序。系统管理员的proc.p_uid=0。
proc.p_ppid是进程的父进程标识符,在进程树中,除了0#进程以外,其它进程都是父进程要求生成的,因此都不是系统进程。
二、U区
#include
struct user
{
int u_rsav[2];//进程切换时保存寄存器r5,r6的值(数据段)
int u_fsav[25];//处理器为PDP-11/40时不用
char u_segflg; //读写文件时使用的标志变量
char u_error; //出错时用来保存错误代码
char u_uid; //实效用户标识符
char u_gid; //实效组
char u_ruid;  //实效用户
char u_rgid;  //实际组
int *u_procp; //U区对应的PCB块
char *u_base;  //读写文件时用于传递参数,起始地址
char *u_count;  //读写文件时传递参数,长度
char *u_offset[2];//读写文件时传递参数,活动偏移量
int *u_cdir;  //当前目录对应的数组inode[]的元素
char u_dbuf[DIRSIZ];//  namei()
char *u_dirp;
struct {
    int     u_ino;
    char    u_name[DIRSIZ];
}u_dent;
int *u_pdir;
int u_uisa[16];
  int u_uisd[16];
int u_ofile[NOFILE];//进程打开的文件。外部设备是设备文件/dev
int u_arg[5];
int u_tsize;//代码段长度
int u_dsize;//数据区域长度
int u_ssize;//栈区域长度
int u_sep;
int u_qsav[2];//处理信号时保存r5,r6当前值
int u_ssav[2];//进程调出时保存r5,r6当前值
int u_signal[NSIG];
int u_utime;
int u_stime;
int u_cutime[2];
int u_cstime[2];
int u_ar0;//系统调用,操作通用寄存器或PSW时使用
  int u_prof[4];
  char u_intflg;
} u;
.globl –u
-u=140000 
操作系统通过全局变量u访问执行进程的数据段。全局变量u的地址0140000是八进制数,高3位是110,为6。所以APR页表的第6页面被选择,而低位全部是0,所以u指向操作系统内核空间第6页的起始地址。所以操作系统通过内核空间第6页的起始地址找到执行进程数据段的位置,用proc.p_addr标识。

2. fork()源程序分析

#include
#include
fork()
{
register struct proc *p1,*p2;
 p1=u.u_procp;    //执行进程u是全局变量
for(p2=&proc[0];p2<&proc[NPROC];p2++)  //proc[]={NULL,proc[i]}
     if(p2->p_stat==NULL)
          goto  found
u.u_error=EAGAID;  //进程数量超过系统规定
goto out;
found:   //若进程表有空白PCB块
   if(newproc()){  //newproc()向EP进程返回0,向新进程返回1
     u.u_ar0[R0]=p1->p_pid; //EP进程进程号
     u.u_cstime[0]=0;  u.u_cstime[1]=0;//设置CPU时间
      u.u_stime=0;
      u.u_cutime[0]=0;  u.u_cutime[1]=0;
      u.u_utime=0;
return;
}
    u.u_ar0[R0]=p2->p_pid; 
   //fork()对EP进程的返回值是新进程的PID,存放在u.u_ar0[R0]
out:
    u.u_ar0[R7]=+2;      //指向EP进程的下一条指令地址
}
newproc()//创建新进程的函数
{
   int a1,a2;
   struct proc *p;*up;
   register struct proc *rpp;
   register *rip,n;
  p=NULL;
retry:
    mpid++;  //mpid的值mpid={<0,=0,>0}
    if(mpid<0){//若mpid分配结束,则从0开始分配
         mpid=0;
         goto retry;
}
for(rpp=&proc[0];rpp<&proc[NPROC];rpp++)
       if(rpp->p_stat==NULL&p=NULL) //p_stat={NULL,pid}
                    p=rpp;//若有空白PCB块,记录在p中
       if(rpp->p_pid==mpid)//若mpid已经分配 
             goto  retry;   //重新分配mpid
}//总结进程表的三种情况 proc[]={full,,null*}
If((rpp=p)==NULL)
    panic(“no procs”);

rip=u.u_procp;  //赋值新进程的proc。Rip执行进程
up=rip;       //保存EP进程的PCB块
rpp->p_stat=SRUN;  //新进程的状态SRUN就绪
rpp->p_flag=SLOAD;//新进程在内存中SLOAD
rpp->p_uid=rip->p_uid;//复制EP进程PCB块中的值
rpp->p_ttyp=rip->p_ttyp;
rpp->p_nice=rip->p_nice; rpp->p_textp=rip->p_textp;//新的进程复制EP进程正文段
rpp->p_pid=mpid;//新进程PID=mpid
rpp->p_ppid=rip->p_pid;//新进程的父进程是EP进程
rpp->p_time=0; //CPU执行时间为0
for(rip=&u.u_ofile[0];rip<&ofile [NOFILE];rip++)    
     //新进程复制EP进程分配的系统资源,是特殊文件。
       if((rpp=*rip++)!=NULL)  
             rpp->f_count++;
if((rpp=up->p_textp)!=NULL){ //复制共享代码段
         rpp->x_count++;     //text[]计数器增加1
         rpp->x_ccount++;
  }
u.u_cdir->i_count++;        //目录inode节点计算器增加1                                 
   savu(u.u_rsav); //执行进程切换时,保存EP进程的r5,r6到U区
   rpp=p;
   u.u_procp=rpp;   //执行继承u是新的进程newproc
   rip=up;
n=rip->p_size; //复制数据段长度
a1=rip->p_addr; //”原”EP进程数据段地址
rpp->p_size=n;
a2=malloc(coremap,n);//为新进程申请内存区域
if(a2==NULL){   //若申请的内存区域为空,a2={null,address}
        rip->p_stat=SIDL;//EP进程状态为SIDL:创建进程中        rpp->p.addr=a1;//新进程数据段地址=EP进程数据段地址
        savu(u.u_ssav); //新的进程调出到外存时保存r5,r6到U区
       xswap(rpp,0,0);  //复制新进程的数据段到外存交换空间    
        rpp->p_flag=|SSWAP;//新进程标志:在外存
        rip->p_stat=SRUN;  //EP进程状态还原为SRUN      
 }else{//申请的内存区域不为空,在内存复制数据段  
       rpp->p_addr=a2;//新进程的数据段地址是申请到的内存地址
       while(n--)  copyseg(a1++,a2--);//复制EP进程的数据段
}
u.u_procp=rip;       //执行进程u是EP进程
return(0);       //向fork()返回0
}
注意:newproc通过swtch()切换执行,swtch()返回值为1,newproc获得返回值1。 转载地址:http://www.baike.com/wiki/%E8%BF%9B%E7%A8%8B%E5%88%9B%E5%BB%BA 【诗词曲赋】                                               青松                                                        陈毅                                       大雪压青松,青松挺且直。
                                      要知松高洁,待到雪化时。                                               冬夜杂咏                                                        陈毅                                                   红梅                                              隆冬到来时,                                              百花迹已绝。                                              红梅不屈服,                                              树树立风雪。

                                        幽兰

                                          幽兰在山谷                                           本自无人识。                                           只为馨香重,                                           求者遍山隅。

                                       秋菊

                                         秋菊能傲霜,                                          风霜重重恶。                                          本性能耐寒,                                          风霜其奈何?

                                     含羞草

                                        有草名含羞,                                        人岂能无耻。                                         鲁连不帝秦,                                         田横刎颈死。

                                     亡羊

                                       亡羊惧岐路,                                        染丝悲墨子。                                        我亦厌淡红,                                        恶其乱朱紫。

                                     长江

                                      有人雄今古,                                       游泳渡长江。                                       云此得宽余,                                       宇宙莽苍苍。

                                     故乡

                                      公社遍故乡,                                      到处是桑园。                                      蚕娘两万人,                                      一年八季蚕。

                                   吾读

                                     吾读长短句,                                      最喜是苏辛。[2]                                      东坡胸次广,                                      稼轩力如虎。

                                  一闲

                                      志士嗟日短,[3]                                       愁人知夜长。                                       我则异其趣,                                       一闲对百忙。 注释[2]:苏轼,辛弃疾        [3]:为国操劳的仁人志士 从2016.11开始写作《计算机操作系统源码分析.编程.并行计算》教材。