IO多路复用总结
1. 基本概念
IO多路复用是指一旦发现进程指定的一个或者多个描述符可进行无阻塞IO访问时,它就通知该进程。IO多路复用适用以下场合:
(1) 当客户处理多个描述字时(一般是交互式输入和网络套接口),必须使用I/O复用。
(2) 当一个客户同时处理多个套接口时,而这种情况是可能的,但很少出现。
(3) 如果一个TCP服务器既要处理监听套接口,又要处理已连接套接口,一般也要用到I/O复用。
(4) 如果一个服务器既要处理TCP,又要处理UDP,一般要使用I/O复用。
(5) 如果一个服务器要处理多个服务或多个协议,一般要使用I/O复用。
与多进程和多线程技术相比,I/O多路复用技术的大优势是系统开销小,系统不必创建进程/线程,也不必维护这些进程/线程,从而大大减少了系统的开销。
对于应用层来说,使用非阻塞I/O的应用程序通常会使用select()和poll()系统调用查询是否可对设备进行无阻塞的访问。
(1) select函数
select()函数是BSD UNIX中引入的系统调用,其原型为:
int select(int numfds, fd_set *readfds, fd_set *writefds, fd_set *exceptfds, struct timeval *timeout);
其中readfds/writefds/exceptfds分别是select()监听的读/写和异常处理的文件描述符集合,numfds的值是需要检查的大的文件描述符加1。timeout参数是一个指向struct timeval类型的指针,它可以使select()在等待timeout时间后若没有文件描述符准备好则返回。
对于后四个参数来说如果不需要设置相关内容,传递NULL即可。
内核提供了以下宏用于监听描述符集合的设置与检查
FD_ZERO(fd_set *fdset)//清楚文件描述符集合
FD_SET(int fd, fd_set *fdset)//将一个文件描述符添加到文件描述符集合中
FD_CLR(int fd, fd_set *fdset)//将一个文件描述符从文件描述符集合中移除
FD_ISSET(int fd, fd_set *set)//判断文件描述符是否被置位
当应用程序使用FD_ZERO/FD_SET/FD_CLR宏设置好要监听的文件描述符集合后,调用select()函数执行监听,如果没有一个描述符准备好IO并且没有指定超时时间,那么select()函数会一直等待下去不会返回。
当函数正常返回后,监听的文件描述符集合中没有准备好的文件描述符会被删除,只剩下已经准备好的文件描述符,之后可以使用FD_ISSET(fd, set);宏来判断set集合中是否有fd文件描述符来判断fd是否准备好IO。
(2)poll函数
poll()函数是System V中引入的系统调用,其原型为:
int poll(struct pollfd *fds, unsigned int nfds, int timeout);
pollfd结构体定义如下:
sruct pollfd {
int fd;//文件描述符
short events;//等待的事件
short revents;//实际发生了的事件
};
每一个pollfd结构体指定了一个被监视的文件描述符,可以传递多个结构体,指示poll()监视多个文件描述符。每个结构体的events域是监视该文件描述符的事件掩码,由用户来设置这个域。revents域是文件描述符的操作结果事件掩码,内核在调用返回时设置这个域。
events域中请求的任何事件都可能在revents域中返回。合法的事件如下:
POLLIN 有数据可读。
POLLRDNORM 有普通数据可读。
POLLRDBAND 有优先数据可读。
POLLPRI 有紧迫数据可读。
POLLOUT 写数据不会导致阻塞。
POLLWRNORM 写普通数据不会导致阻塞。
POLLWRBAND 写优先数据不会导致阻塞。
POLLMSGSIGPOLL 消息可用。
此外,revents域中还可能返回下列事件:
POLLER 指定的文件描述符发生错误。
POLLHUP 指定的文件描述符挂起事件。
POLLNVAL 指定的文件描述符非法。
这些事件在events域中无意义,因为它们在合适的时候总是会从revents中返回。
使用poll()和select()不一样,你不需要显式地请求异常情况报告。
POLLIN | POLLPRI等价于select()的读事件,POLLOUT |POLLWRBAND等价于select()的写事件。
POLLIN等价于POLLRDNORM |POLLRDBAND,而POLLOUT则等价于POLLWRNORM。例如,要同时监视一个文件描述符是否可读和可写,我们可以设置 events为POLLIN |POLLOUT。在poll返回时,我们可以检查revents中的标志,对应于文件描述符请求的events结构体。如果POLLIN事件被设置,则文件描述符可以被读取而不阻塞。如果POLLOUT被设置,则文件描述符可以写入而不导致阻塞。这些标志并不是互斥的:它们可能被同时设置,表示这个文件描述符的读取和写入操作都会正常返回而不阻塞。
timeout参数指定等待的毫秒数,无论I/O是否准备好,poll都会返回。timeout指定为负数值表示无限超时,使poll()一直挂起直到一个指定事件发生;timeout为0指示poll调用立即返回并列出准备好I/O的文件描述符,但并不等待其它的事件。这种情况下,poll()就像它的名字那样,一旦选举出来,立即返回。
返回值和错误代码
成功时,poll()返回结构体中revents域不为0的文件描述符个数;如果在超时前没有任何事件发生,poll()返回0;失败时,poll()返回-1,并设置errno为下列值之一:
EBADF 一个或多个结构体中指定的文件描述符无效。
EFAULTfds 指针指向的地址超出进程的地址空间。
EINTR 请求的事件之前产生一个信号,调用可以重新发起。
EINVALnfds 参数超出PLIMIT_NOFILE值。
ENOMEM 可用内存不足,无法完成请求。
select()和poll()函数本质上没有多大差别,管理多个描述符也是进行轮询,根据描述符的状态进行处理,但是poll没有大文件描述符数量的限制。并且select()返回后,之前没有准备好的文件描述符会从集合当中删除,这样如果下次需要再次添加所有文件描述符或者使用两个相同的文件描述符集合,一个用于备份,一个用于监听,比较复杂。poll不需要这个复杂的操作。poll和select同样存在一个缺点就是包含大量文件描述符的数组被整体复制于用户态和内核的地址空间之间,而无论这些文件描述符是否就绪。它的开销随着文件描述符数量的增加而线性增加。
所以之后又出现了一个select和poll的增强版本epoll,此处就不做过多的介绍。技术交流资料下载群 716101708
这有个视频
http://www.makeru.com.cn/video/182.html?s=45051
一周热门 更多>