【教程】以抓取新浪财经的创业板的信息为例,解释如何分析并模拟动态网页抓取
crifan 12年前 (2013-04-30) 4624浏览 1评论
【背景】 之前写过很多网页抓取方面的教程了。全都整理到这里了: 详解抓取网站,模拟登陆,抓取动态网页的原理和实现(Python,C#等) 现遇到别人问的问题: python 抓取动态网页的问题 即,如何分析和抓取: http://vip.stock....
crifan 12年前 (2013-04-30) 4624浏览 1评论
【背景】 之前写过很多网页抓取方面的教程了。全都整理到这里了: 详解抓取网站,模拟登陆,抓取动态网页的原理和实现(Python,C#等) 现遇到别人问的问题: python 抓取动态网页的问题 即,如何分析和抓取: http://vip.stock....
crifan 12年前 (2013-04-26) 3569浏览 2评论
【背景】 之前用google搜一点技术贴,都经常被禁,搞得很烦,想问候党的八代祖宗。 后来发现,之前就知道的那个goagent,同事正使用中,效果还是很好的。 可以很正常的浏览google,youtube等网站。 所以,打算花点时间,自己也去弄个。 ...
crifan 12年前 (2013-04-26) 3734浏览 0评论
【背景】 折腾: 【记录】折腾goagent代理 期间,已经申请好了gae了: 【记录】申请并创建GAE(Google App Engine) 且已经: 【记录】上传app(goagent)到gae上 然后接着就是去配置本地的浏览器中的代理设置了。 ...
crifan 12年前 (2013-04-26) 2880浏览 0评论
【背景】 折腾: 【记录】折腾goagent代理 期间,已经申请好了gae了: 【记录】申请并创建GAE(Google App Engine) 接下来,就是参考: https://code.google.com/p/goagent/wiki/Inst...
crifan 12年前 (2013-04-26) 2837浏览 0评论
【背景】 折腾: 【记录】折腾goagent代理 期间,需要参考: https://code.google.com/p/goagent/wiki/InstallGuide 去创建GAE. [折腾过程] 1.进入: https://appengine....
crifan 12年前 (2013-04-22) 1850浏览 0评论
听见别人说这个Google Search API,去查了下,结果发现,其实现在已经废弃了: Google Web Search API (Deprecated) 具体技术的解释在这里: Developer’s Guide 总...
crifan 12年前 (2013-04-19) 3230浏览 3评论
【背景】 之前打算换用bluehost的。 结果其是和hostmonster一家的,速度,对于目前我这里,苏州电信+苏州网通,速度都是奇慢无比,根本连不上。 所以需要找个,无需备案的,美国的虚拟主机,需要速度快的。 【折腾过程】 1. 参考: 十大美...
crifan 12年前 (2013-04-19) 5894浏览 5评论
【背景】 虽然刚买了Bluehost的虚拟主机,还没来得及用。 但是发现其速度和hostmonster一样的慢。 (后来才知道: Bluehost, Hostmonster,Fastdomain 是同一家母公司下面的子公司, 所以,bluehost的...
crifan 12年前 (2013-04-19) 2088浏览 0评论
比如: 你去查alexa排名: http://answers.yahoo.com 其实返回的结果,是针对于: http://yahoo.com 而得到的排名。 即: alexa排名,是不支持二级域名的。 【参考资料】 1....
crifan 12年前 (2013-04-05) 2405浏览 0评论
【背景】 折腾: 【记录】把crifan.org的虚拟主机从HostMonster换到BlueHost的过程 的过程中,需要去购买BlueHost主机。 下面记录过程。 1.点击Sign Up Now: 2. 3.不过继续折腾之前...