今天用scrapy爬取腾讯招聘的内容时,在第9页的时候有一个内容为空,而我在写爬虫的时候是用xpath获得数据,xpath获得的是一个集合,所以我用索引[0]来取得集合的值,但是这样会报错,网上查到有个方法extract_first()可以取得值,我试了一下,发觉就算值为空也不会报错,继续爬,哈哈。
转载自原文链接, 如需删除请联系管理员。
原文链接:scrapy爬虫提示 list index out of range,转载请注明来源!
今天用scrapy爬取腾讯招聘的内容时,在第9页的时候有一个内容为空,而我在写爬虫的时候是用xpath获得数据,xpath获得的是一个集合,所以我用索引[0]来取得集合的值,但是这样会报错,网上查到有个方法extract_first()可以取得值,我试了一下,发觉就算值为空也不会报错,继续爬,哈哈。
转载自原文链接, 如需删除请联系管理员。
原文链接:scrapy爬虫提示 list index out of range,转载请注明来源!