socket方法
1 | int socket(int protofamily, int type, int protocol); |
sockfd是描述符。
socket函数对应于普通文件的打开操作。普通文件的打开操作返回一个文件描述字,而socket()用于创建一个socket描述符(socket descriptor),它唯一标识一个socket。这个socket描述字跟文件描述字一样,后续的操作都有用到它,把它作为参数,通过它来进行一些读写操作。
返回值:
- 套接字描述符
正如可以给fopen的传入不同参数值,以打开不同的文件。创建socket的时候,也可以指定不同的参数创建不同的socket描述符,socket函数的三个参数分别为:
- protofamily:即协议域,又称为协议族(family)。常用的协议族有,AF_INET(IPV4)、AF_INET6(IPV6)、AF_LOCAL(或称AF_UNIX,Unix域socket)、AF_ROUTE等等。协议族决定了socket的地址类型,在通信中必须采用对应的地址,如AF_INET决定了要用ipv4地址(32位的)与端口号(16位的)的组合、AF_UNIX决定了要用一个绝对路径名作为地址。
- type:指定socket类型。常用的socket类型有,SOCK_STREAM、SOCK_DGRAM、SOCK_RAW、SOCK_PACKET、SOCK_SEQPACKET等等(socket的类型有哪些?)。
- protocol:故名思意,就是指定协议。常用的协议有,IPPROTO_TCP、IPPTOTO_UDP、IPPROTO_SCTP、IPPROTO_TIPC等,它们分别对应TCP传输协议、UDP传输协议、STCP传输协议、TIPC传输协议(这个协议我将会单独开篇讨论!)。
当我们调用socket创建一个socket时,返回的socket描述字它存在于协议族(address family,AF_XXX)空间中,但没有一个具体的地址。如果想要给它赋值一个地址,就必须调用bind()函数,否则就当调用connect()、listen()时系统会自动随机分配一个端口。
bind方法
1 | int bind(int sockfd, const struct sockaddr *addr, socklen_t addrlen); |
返回值:
- 若成功,返回0;若失败,返回-1
参数:
- sockfd:socket描述字
- addr:一个const struct sockaddr *指针,指向要绑定给sockfd的协议地址。
- addrlen : 地址的长度
通常服务器在启动的时候都会绑定一个众所周知的地址(如ip地址+端口号),用于提供服务,客户就可以通过它来接连服务器;而客户端就不用指定,有系统自动分配一个端口号和自身的ip地址组合。这就是为什么通常服务器端在listen之前会调用bind(),而客户端就不会调用,而是在connect()时由系统随机生成一个。
listen方法
1 | int listen(int sockfd, int backlog); |
服务器调用listen函数来宣告他愿意接受连接请求。
返回值:
- 若成功,返回0;若失败,返回-1
参数:
- sockfd:套接字描述符
- backlog:要进入队列的未完成连接请求数量。一旦队列满,系统就会拒绝多余的连接请求。
accept方法
accept()
函数:
1 | int accept(int sockfd, struct sockaddr *addr, socklen_t *addrlen); |
- 返回值:返回的文件描述符是套接字描述符
- 参数:
- sockfd为socket描述符
- addr是一个结果参数,它用来接受一个返回值,这返回值指定客户端的地址,当然这个地址是通过某个地址结构来描述的,用户应该知道这一个什么样的地址结构。如果对客户的地址不感兴趣,那么可以把这个值设置为NULL
- len也是结果的参数,用来接受上述addr的结构的大小的,它指明addr结构所占有的字节个数。同样的,它也可以被设置为NULL
accept默认会阻塞进程,直到有一个客户连接建立后返回,它返回的是一个新可用的套接字,这个套接字是连接套接字。
#connect方法#
1 | int connect(int sockfd, const struct sockaddr *addr, socklen_t addrlen); |
返回值:
- 若成功,返回0;若失败,返回-1
参数:
- sockfd为socket描述符
- addr为我们想与之通信的服务器的地址
- len为地址长度
connect一般由客户端调用,客户端通过调用connect函数来建立与TCP服务器的连接。
监听socket和连接socket
- 在服务器调用
int listen(int sockfd,int backlog)
方法后,参数中sockfd相应的socket被称为监听socket。 - 在服务器调用
int accept(int sockfd, struct sockaddr *addr, socklen_t *addrlen)
方法后返回的套接字描述符所对应的socket被称为连接socket。
一般来说,监听socket被绑定在80端口,连接socket使用的也是80端口,而连接socket记录了客户端的地址和端口,系统因此可以由此识别连接socket和监听socket,或者数个不同的连接socket。
三次握手与socket
既然套接字是通信端口的抽象,而TCP/IP协议在网络通讯中被大规模应用,那么在我们使用和socket相关的方法的时候,究竟什么时候体现了TCP/IP协议呢,例如,三次握手在抽象的socket中是怎样被实现的呢?
上面这张图介绍了Unix下各个相关的方法在三次握手时的作用。
流程
- 服务器调用
listen
方法,调用后监听socket的状态变为LISTEN
。 - 服务器调用
accept
方法,之后accept方法会休眠,直到协议层(protocol layer)将其唤醒。 - 客户端调用
connect
方法,在此方法中传输SYN
数据包,调用后客户端的socket状态变为SYN_SENT
,之后connect方法会休眠,直到协议层将其唤醒。 - 服务器收到
SYN
数据包后会引发一个软中断,经过一系列系统调用后,服务器端的socket状态变为SYN_RCVD
,该 SYN 连接信息保存在相应监听socket的半连接队列里。之后发送SYN ACK
数据包。此时accept
函数仍未返回。 - 客户端收到
SYN ACK
数据包,引起软中断,connect
方法终止休眠,客户端的socket状态变为established
,并向服务器发送ACK
数据包。
6.服务器收到ACK
数据包,服务器的socket状态变为established
,accept
方法返回。
由此可见,TCP/IP协议的三次握手就隐藏在客户端和服务端的各个调用中。
参考资料
- Linux的SOCKET编程详解
- Know your TCP system call sequences
- 《UNIX环境高级编程》