2013年10月30-10月31日,Vmare召開了vforum2013虛擬大會,在虛擬大會中本身標記收藏的資料會以郵件的方式提供,收到郵件後,看到的是這樣的內容。web
好吧,我實在不想一個個點擊鏈接去下載資料,因此看了下郵件中的資料鏈接,是有規律性的http://vforum2013.cloud-expo.com.cn/?mod=down_doc&id=247,這種鏈接使用迅雷批量下載,結果嘗試了下,結果下載的全是index.htm等文件,文件大小爲1kbshell
看來仍是得靠本身想辦法了,以前瞭解過powershellv3中多了個命令invoke-webrequest,彷佛能夠用來下載文件,測試了,因而有了下面的代碼。ide
$a="http://vforum2013.cloud-expo.com.cn/?mod=down_doc&id={0}"
$parentPath="d:\vforum"
function download-file{
param(
$id
)
$b=Invoke-WebRequest ($a -f $id)
if($b.RawContentLength -gt 0){
$ext=$b.Headers.Item("content-type").split("/")[1]
$filename="$parentPath\$id.$ext"
Set-Content -Encoding Byte -Value $b.Content -Path $filename
$filename
}
}
220..600|%{download-file $_}
下面是下載結果,哈哈,固然也有不完美的地方,PDF標題都是數字,下一步我將嘗試使用Python中的pdf模組抓取PDf標題或者關鍵信息,來爲PDF更名字。測試