网站广告位制作_黑河网站制作_深圳南山做网站_富阳网站 import timeclass MainSpider(scrapy.Spider):name = "main"# allowed_domains = ["www.xxx.com"]start_urls = ["https://www.gushiwen.cn/default_1.aspx"]page_url = "https://www.gushiwen.cn/default_%d.aspx"page_num = 2def parse(self, response):# 获得页面中所有的标题title_list = response.xpath('//div[@class="sons"]/div[@class="cont"]/div[2]/p/a/b/text()').extract()# 获得所有的urlurl_list = response.xpath('//div[@class="sons"]/div[@class="cont"]/div[2]/p/a/@href').extract()print(title_list)print(url_list)for title, detail_url in zip(title_list, url_list):print(title, detail_url)# time.sleep(5)# 实例化一个Item对象item = BosscrawlingItem()# 将标题存入Item对象中item['title'] = title# 对详情页发送请求# 参数 meta 传入一个字典,字典中存入一个Item对象# 字典中的key会作为参数名传递给回调函数parse_detail 并且将对应的值 实体Item对象也传递过去yield scrapy.Request(url=detail_url, callback=self.parse_detail, meta={'item': item})# 爬取多页的数据if self.page_num <= 3:full_page_url = format(self.page_url % self.page_num)# 页面拼接完成后页码加1,以便于下一次请求下一个页面的数据self.page_num += 1# 向新的页面发送请求再把响应数据回调给自身,继续爬取详情数据yield scrapy.Request(url=full_page_url, callback=self.parse)# 响应页面的数据解析方法# 用于给手动发送的请求传入的回调函数def parse_detail(self, response):# 通过响应对象的meta数据获得传过来的Item对象item = response.meta['item']# 获得岗位描述,并封装为Selector对象后,使用extract_first() 方法转为列表并取出第一个元素detail_text = response.xpath('//div[@class="contyishang"]//text()').extract()# 并对Item里面的属性进行赋值item['detail_text'] = detail_textprint(detail_text)# time.sleep(5)# 将封装好的一条数据提交给管道处理yield item">

无人区免费电影入口

电子商务平台经营者有哪些、商务网站建设的可行性分析包括、永久使用、不限域名、vi包括哪些内容

互联网与智慧酒店建设?

网站广告位制作_黑河网站制作_深圳南山做网站_富阳网站

车上来自四川乐山的郑有财说:“今年大伙弄明白了,光排队不行。不管会不会,我都要试试网络购票。”就算暂时不会,也要通过他人代订“走网路”。

苏州网站建设制度婚庆公司简介范文建e网室内设计网背景墙济南网约车公司软件开发商有哪些服务器维护中什么意思代理公司韩剧剧情介绍武汉优化网站技术厂家网架公司需要给设计院提交的资料国际线上会议加密58同城二手房出售企业网站内使用了哪些网络营销方式世界各国疫情排名一览表最新新闻热点事件时评人力资源和社会保障部信息中心有赞微商城登录首页登录入口服装网站建设定制安卓移动端开发沈阳项目椒江设计公司淮北论坛招聘驾驶员广州网址大全物流软件app前十名东莞外贸网站设计oa系统费用报销流程上海app制作公司网页设计教案企业电子网站建设邯郸城融网络技术有限公司桂林市区漓江水倒灌内蒙古旅游攻略

猜你喜欢

  • 友情链接:
  • 自媒体发稿 360建筑网发布的简历 多用户商城系统哪种好用 东莞网站优化方式 南阳网站制作公司 外贸多语言网站免费源码