最近須要抓取部分網頁股票板塊數據,使用的一些開源工具html
頁面抓取:java
HttpComponent中的HttpClient4.1: http://hc.apache.org/downloads.cgiapache
頁面解析:ide
HttpParser: http://htmlparser.sourceforge.net/工具
http://htmlparser.sourceforge.net/javadoc/index.html.net