【todo】将docbook转换为wiki
crifan 12年前 (2013-09-22) 2172浏览 0评论
【背景】 之前写了很多docbook。 已发布至: https://www.crifan.org/files/doc/docbook/ 现在,想要: 如果可以实现,把现有的docbook 即一堆的xml(和相关的xls和其他配置) 转换为wiki格式的...
工作相关的技术文章
crifan 12年前 (2013-09-22) 2172浏览 0评论
【背景】 之前写了很多docbook。 已发布至: https://www.crifan.org/files/doc/docbook/ 现在,想要: 如果可以实现,把现有的docbook 即一堆的xml(和相关的xls和其他配置) 转换为wiki格式的...
crifan 12年前 (2013-09-22) 4162浏览 3评论
【背景】 之前的 BlogsToWordpress 不支持网易的心情随笔。 现在去添加此功能。 【解决过程】 1.结果使用: BlogsToWordpress.py -s http://blog.163.com/ni_chen 竟然结果连...
crifan 12年前 (2013-09-22) 8353浏览 9评论
背景 前面已经通过: 【教程】如何抓取动态网页内容 介绍了,关于抓取动态网页中的内容的逻辑过程。 下面通过具体的例子,来说明是如何实现此过程的。 前提知识 1.了解网页抓取等的基本背景知识 不了解的去参考: 【整理】关于抓取网页,分析网页内容,模拟登...
crifan 12年前 (2013-09-22) 3216浏览 0评论
【背景】 之前折腾了一些一些关于antlr的异常处理了: 【记录】尝试折腾antlr v3的异常处理和错误恢复:VARIABLE的CLASS的值INPUT故意写错为INPUT1 【记录】折腾antlr的异常处理:使得当初错时,输出更详细的错误信息,包...
crifan 12年前 (2013-09-22) 32799浏览 79评论
重要提示: 1.此贴,以后不再更新; 2.想要看更新的内容,请移至: 详解抓取网站,模拟登陆,抓取动态网页的原理和实现(Python,C#等) 【前提】 想要实现使用某种语言,比如Python,C#等,去实现模拟登陆网站的话,首先要做...
crifan 12年前 (2013-09-22) 24635浏览 3评论
【背景】 问题参见: python2.7 urllib2 抓取新浪乱码 中的: 报错的异常是 UnicodeDecodeError: ‘gbk’ codec can’t decode...
crifan 12年前 (2013-09-22) 2682浏览 0评论
【问题】 折腾antlr的异常恢复。 参考: The Definitive ANTLR Reference.pdf 中,添加上对应的代码: @members { protected void mismatch(IntStream input,...
crifan 12年前 (2013-09-21) 2996浏览 0评论
【背景】 折腾完毕: 【记录】用go语言实现模拟登陆百度 后,接着,就是去把已经写的,通用函数,整理至自己的库函数crifanLib.go中了。 【折腾过程】 1.继续去参考,之前在: 【记录】学习如何写go语言代码 中就学习的: Your firs...
crifan 12年前 (2013-09-21) 9969浏览 0评论
【问题】 折腾: 【记录】在用go语言成功模拟登陆百度后把相关函数整理至自己的go语言的库函数:crifanLib.go 期间,去整理和build,然后install了自己的crifanLib: E:\Dev_Root\go\src\code.goo...
crifan 12年前 (2013-09-21) 8054浏览 0评论
【背景】 折腾: 【记录】用go语言实现模拟登陆百度 期间,需要去发送POST操作,去模拟登陆百度,且post时要传递对应的post数据。 【折腾过程】 1.自己参考官网: http://golang.org/pkg/net/http/ 去看看,PO...