psrheartache
blog
编程
标签
归档
Github
psrheartache
blog
编程
标签
归档
Github
Miracles sometimes occur,
but one has to work terribly for them.
人生除了眼前的苟且,还有未知的
bug
和看不懂的
code
Scroll
什么是爬虫 可以把互联网比做成一张“大网”,爬虫就是在这张大网上不断爬取信息的程序 所以一句话总结:爬虫是请求网站并提取数据的自动化程序 爬虫的基本工作流程如下: 向指定的URL发送http请求 获取响应(HTML、XML、JSON、二进制等数据) 处理数据(解析DOM、解析JSON等) 将处理好的数据进行存储 ![img](https://pi ...
网络爬虫开发
2018-10-07
psrheartache
#nodejs
#http
#cheerio