高效码农

撰写、分享国内外先进的IT技术

2019年3月

March 13, 2019

Python爬虫实战:爬取糗事百科段子

Python爬虫实战:爬取糗事百科段子1. 抓取页面代码并提取所有段子from urllib import request, error import ssl import re content = ssl._create_unverified_context() page = 1 url = 'https://www.qiushibaike.com/hot/page/' + str(p...
March 12, 2019

Python爬虫:Ptyhon中RE模块的使用

Ptyhon中RE模块的使用1. 正则表达式参考:廖雪峰的官方网站2. Python Re模块Python提供re模块,包含所有正则表达式的功能。由于Python的字符串本身也用转义,因此我们强烈建议使用Python的r前缀,就不用考虑转义的问题了2.1   re.match(pattern, string[, flags])如果字符串开头的零个或多个字符与正则表达式模式...
March 12, 2019

Python爬虫:UrlLib库的高级使用

UrlLib库的高级使用1. Headers设置有很多网站为了防止程序爬虫爬网站造成网站瘫痪,会需要携带一些headers头部信息才能访问,最长见的有user-agent参数# -*- coding:UTF-8 -*- # urllib.request 请求模块 # import urllib.request # import urllib.parse # 以上2个导入可以合并为 from...
March 12, 2019

Python爬虫:Urllib库的基本使用

1.抓取一个网页抓取网页就是根据URL来获取它的网页信息:# -*- coding:utf-8 -*- import urllib # urllib.request 请求模块 response = urllib.request.urlopen("http://www.baidu.com") print(response.read())在vscode中按F5执行后结果如图...
March 11, 2019

常用phpstorm后缀补全功能

PHPStorm有个很牛逼的功能,那就是后缀补全(不是自动补全)。这个功能可以使用代码补全来模板式地补全语句,如遍历循环语句(for、foreach)、使用 String.format() 包裹一个字符串、使用类型转化包裹一个表达式、根据判(非)空或者其它判别语句生成 if 语句、用 instanceOf 生成分支判断语句等。使用的方式也很简单,就是在一个表达式后按下点号 . ,然后输入一些...
March 10, 2019

Liunx下git无法添加跟踪子文件夹

git管理的项目中添加了另一个远程仓库的项目,导致无法提交子文件夹删除.git:rm -rm .git清除缓存:git rm --cached directory添加git跟踪:git add directory注:directory为子文件夹的路径。
March 9, 2019

PHP实现简单的进度条

效果展示前端Html代码 progress.html<html> <head> <meta charset="gb2312"> <title>进度条测试</title> <link href="https://cdn.bootcss.com/twitter-bootstra...
March 9, 2019

vi常用命令总结

一:跳到文件第一行输入:0或:1,然后回车;在键盘按下小写gg;二:跳到文件最后一行输入:$,然后回车;在键盘按下大写G ;在键盘按Shift + g;三:查找字符串输入:/要查找的字符串小写的n,向下查找大写的N,向上查找

Python从零单排(一):Python数据类型

1.字符串1.1 使用单引号用单引号括起来表示字符串,例如: str = 'this is python-note' 1.2 使用双引号双引号中的字符串与单引号中的字符串用法完全相同,例如: str = "this is python-note" 1.3 使用三引号利用三引号,表示多行的字符串,可以在三引号中自由的使用单引号和双引号,例如:str='''this is s...