《Python从小白到大牛》(第2版)23.2 爬取数据。爬取数据是网络爬虫工作的第一步。互联网中提供的数据形式多种多样,虽然也会有XML和JSON等结构化的数据,但访问这些数据的API一般很少对外开放,只是内部使用。容易得到的数据往往都裹挟在HTML代码中,需要进行烦琐的解析和提取。