模拟请求
顾名思义就是通过程序达到模拟人点击按钮触发生的情况。
模拟请求有几点比较关键。
登录获取cookie
一个网站在跳转后能够判断你是否处于登录状态就在于cookie判断。因为http是无状态协议,所以在使用了cookie来标志你是否登录。在登录时通过观察正常的登录需要什么信息。
当然在登录中有些网站需要识别图片等功能,尽可能找网上资料,不在阐述范围内。
- http method类型。有GET POST方法之分。
- URL。
- 参数携带是form还是json也需要在Header标志。
还有的网站对http头内容可能加了限制,所以为了完全模仿。最好是把header的内容也一并的copy下来。
发送请求后当然需要一个判断成功的标准,这样子才能够知道是否登录成功。对比response内容得知。
在这里可以先用postman工具成功的模拟后再编写代码。
页面跳转
获取到cookie之后,就是需要跳转到制定的页面了。只要把cookie设置在内,就可以完成对应的页面跳转功能。其他细节和登录无二。
获取信息
当页面跳转到我们所需要的页面时,接下来便是要获取相关有用的信息了。对于html文件,go语言中常用的是goquery包,对整个html进行解析。后面将对该包进行浅显介绍。