psrheartache blog
  • 编程
  • 标签
  • 归档
  • Github
 
psrheartache blog

  • 编程
  • 标签
  • 归档
  • Github

Miracles sometimes occur,

but one has to work terribly for them.

人生除了眼前的苟且,还有未知的 bug 和看不懂的 code

Scroll
什么是爬虫 可以把互联网比做成一张“大网”,爬虫就是在这张大网上不断爬取信息的程序 所以一句话总结:爬虫是请求网站并提取数据的自动化程序 爬虫的基本工作流程如下: 向指定的URL发送http请求 获取响应(HTML、XML、JSON、二进制等数据) 处理数据(解析DOM、解析JSON等) 将处理好的数据进行存储 ![img](https://pi ...
网络爬虫开发
 2018-10-07
 psrheartache
#nodejs
#http
#cheerio
     

©psrheartache -2019-2023