vscode 断点调试scrapy的设置

7年前 高效码农

vscode创建scrapy项目请点击 一、设置launch.json 点击DEBUG按钮,再点击设置图标,会自动弹出launch.json设置文件。如下图: 点击 Add Configuration …

Python爬虫实战:爬取糗事百科段子

7年前 高效码农

Python爬虫实战:爬取糗事百科段子 1. 抓取页面代码并提取所有段子 from urllib import request, error import ssl import re content …

Python爬虫:Ptyhon中RE模块的使用

7年前 高效码农

Ptyhon中RE模块的使用 1. 正则表达式 参考:廖雪峰的官方网站 2. Python Re模块 Python提供re模块,包含所有正则表达式的功能。由于Python的字符串本身也用转义,因此我们 …

Python爬虫:UrlLib库的高级使用

7年前 高效码农

UrlLib库的高级使用 1. Headers设置 有很多网站为了防止程序爬虫爬网站造成网站瘫痪,会需要携带一些headers头部信息才能访问,最长见的有user-agent参数 # -*- codi …

Python爬虫:Urllib库的基本使用

7年前 高效码农

1.抓取一个网页 抓取网页就是根据URL来获取它的网页信息: # -*- coding:utf-8 -*- import urllib # urllib.request 请求模块 response = …

Python从零单排(一):Python数据类型

7年前 高效码农

1.字符串 1.1 使用单引号 用单引号括起来表示字符串,例如: str = ‘this is python-note’ 1.2 使用双引号 双引号中的字符串与单引号中的字符串用法完全相同,例如: s …