最新消息:20210917 已从crifan.com换到crifan.org

标签:python

【记录】Python中尝试用lxml去解析html
Python

【记录】Python中尝试用lxml去解析html

crifan 11年前 (2013-05-27) 10131浏览 0评论

【背景】 Python中,之前一直用BeautifulSoup去解析html的: 【教程】Python中第三方的用于解析HTML的库:BeautifulSoup 后来听说BeautifulSoup很慢,而lxml解析html速度很快,所以打算去试试...

【记录】用Scrapy抓取manta.com
Python

【记录】用Scrapy抓取manta.com

crifan 11年前 (2013-05-24) 3183浏览 0评论

【问题】 手上有个Scrapy的项目,是要抓取和 http://www.manta.com/ 相关的站点的内容。 已有源码为:   bs.py: import requests from bs4 import BeautifulSoup ...

【详解】python中的文件操作模式
Python

【详解】python中的文件操作模式

crifan 11年前 (2013-05-08) 3515浏览 0评论

待完成,最新更新:2013-05-08   把之前的: 【详解】Python中的文件操作,readline读取单行,readlines读取全部行,文件打开模式 中的部分内容整理过来,再加上更多的解释。   关于文件的基本知识 &...

【整理】详解Python中re.sub
Python re

【整理】详解Python中re.sub

crifan 11年前 (2013-05-02) 44811浏览 10评论

待完成,最近更新:2013-05-08   【背景】 Python中的正则表达式方面的功能,很强大。 其中就包括re.sub,实现正则的替换。 功能很强大,所以导致用法稍微有点复杂。 所以当遇到稍微复杂的用法时候,就容易犯错。 所以此处,总...

81 queries in 0.193 seconds, using 23.29MB memory