油管視頻目錄正則整理

正在學習Qt,從油管的playlist?list=PLPeSWEML8bFV8lzTJ_oORLUlfugzuQ5yF下載了17個視頻,還有配套的文字資料(http://tutorialcoding.com/qt/index.html),很是適合入門!html

須要將視頻目錄內容整理一下。ide

視頻列表文件內容學習

觀察每條內容的格式視頻

1htm


6:31
Qt Tutorial, Introduction
Progenitor Softworks
2
blog


10:34
Qt Tutorial: Unit 1, Hello World!
Progenitor Softworks
3
get


6:15
Qt Tutorial: Unit 2, PushMe!
Progenitor Softworks
qt

序號it

空行io

視頻時長

視頻文件名

出品人

但願最終獲取的內容格式是:

序號    視頻文件名   視頻時長


使用NotePad++ 正則:

image

解釋:

查找目標:^([\d]{1,2})(\r\n\r\n)(\d{1,2}:\d{1,2})(\r\n)(.*)(\r\n)(.*)$

^表明行開始,後接7組內容(1)(2)(3)(4)(5)(6)(7),每組要查找的內容都以(、)包含。

其中(2)、(4)、(6)組內容爲(\r\n\r\n)、(\r\n),意爲查找回車(\r)換行(\n)。

(1)組內容爲([\d]{1,2}),意爲匹配最多兩位數字(.*),且(1)組後接兩個回車換行符號(2)。

(3)組內容爲(\d{1,2}:\d{1,2}),意爲匹配mm:ss的時間格式,(3)組後接1個回車換行符(4)。

(5)組內容爲(.*),意爲任意長度的字符,匹配視頻文件名(包含空格),(5)組後接1個回車換行符(6)。

(7)組內容爲(.*),意爲任意長度的字符,匹配Progenitor Softworks,(7)組後接$,表明行結束,實際就是行尾的回車換行符。

替換爲:$1\t$5\t$3

保留匹配內容的3組內容:(1)序號、(5)視頻文件名、(3)視頻時長,並按指定順序顯示,並且內容之間使用tab(\t)分隔。


先後結果以下(左側是原始內容,右側是處理事後內容):

image

相關文章
相關標籤/搜索