序:優酷以前更新了次算法(好久以前了,呵呵。。。),故此不少博客的解析算法已經沒法使用。不少大牛也已經更新了新的解析方法。(本文使用語言爲C#)html
因爲優酷視頻地址時間限制,在你訪問本篇文章時,下面所屬連接有可能已經失效,望見諒。正則表達式
例:http://v.youku.com/v_show/id_XNzk2NTI0MzMy.html算法
在視頻url中標紅部分。一個正則表達式便可獲取。json
string getVid(string url) { string strRegex = "(?<=id_)(\\w+)"; Regex reg = new Regex(strRegex); Match match = reg.Match(url); return match.ToString(); }
http://v.youku.com/player/getPlayList/VideoIDS/XNzk2NTI0MzMy/Pf/4/ctype/12/ev/1c#
將前述vid嵌入到上面url中訪問便可獲得視頻信息文件。因爲視頻信息過長不在此貼出所有內容。下面是部分重要內容的展現。(獲取文件爲json文件,可直接解析)ide
{ "data": [ { "ip": 996949050, "ep": "NQXRTAodIbrd1vnC8+JxB4emuRs41w7DWho=", "segs": { "hd2": [ { "no": "0", "size": "34602810", "seconds": 205, "k": "248fe14b4c1b37302411f67a", "k2": "1c8e113cecad924c5" }, { "no": "1", },] }, } ],}
上面顯示的內容後面都會使用到。其中segs包含hd3,hd2,flv,mp4,3gp等各類格式,而且每種格式下均分爲若干段。本次選用清晰度較高的hd2(視頻格式爲flv)函數
以上共有6個參數,其中vid和oip已經獲得,分別以前的vid和json文件中的ip字段,即(XNzk2NTI0MzMy和1991941296),可是ep,sid,token須要從新計算(json文件中的ep值不能直接使用)。type即爲以前選擇的segs。url
計算方法單純的爲數學計算,下面給出計算的函數。三個參數可一次性計算獲得。其中涉及到Base64編碼解碼知識,點擊查看。spa
private static string myEncoder(string a, byte[] c, bool isToBase64) { string result = ""; List<Byte> bytesR = new List<byte>(); int f = 0, h = 0, q = 0; int[] b = new int[256]; for (int i = 0; i < 256; i++) b[i] = i; while (h < 256) { f = (f + b[h] + a[h % a.Length]) % 256; int temp = b[h]; b[h] = b[f]; b[f] = temp; h++; } f = 0; h = 0; q = 0; while (q < c.Length) { h = (h + 1) % 256; f = (f + b[h]) % 256; int temp = b[h]; b[h] = b[f]; b[f] = temp; byte[] bytes = new byte[] { (byte)(c[q] ^ b[(b[h] + b[f]) % 256]) }; bytesR.Add(bytes[0]); result += System.Text.ASCIIEncoding.ASCII.GetString(bytes); q++; } if (isToBase64) { Byte[] byteR = bytesR.ToArray(); result = Convert.ToBase64String(byteR); } return result; } public static void getEp(string vid, string ep, ref string pNew, ref string token, ref string sid) { string template1 = "becaf9be"; string template2 = "bf7e5f01"; byte[] bytes = Convert.FromBase64String(ep); ep = System.Text.ASCIIEncoding.ASCII.GetString(bytes); string temp = myEncoder(template1, bytes, false); string[] part = temp.Split('_'); sid = part[0]; token = part[1]; string whole = string.Format("{0}_{1}_{2}", sid, vid, token); byte[] newbytes = System.Text.ASCIIEncoding.ASCII.GetBytes(whole); epNew = myEncoder(template2, newbytes, true); }
計算獲得ep,token,sid分別爲cCaVGE6OUc8H4ircjj8bMiuwdH8KXJZ0vESH/7YbAMZuNaHQmjbTwg==, 3825, 241273717793612e7b085。注意,此時ep並不能直接拼接到url中,須要對此作一下url編碼ToUrlEncode(ep)。最終ep爲cCaVGE6OUc8H4ircjj8bMiuwdH8KXJZ0vESH%2f7YbAMZuNaHQmjbTwg%3d%3d
視頻格式和選擇的segs有密切關係。如本文選擇的hd2,格式即爲flv,下面是segs,視頻格式和清晰度的對照。以前對此部分理解有些誤差,多謝削着蘋果走路提醒。
「segs」,」視頻格式」,」清晰度」 "hd3", "flv", "1080P" "hd2", "flv", "超清" "mp4", "mp4", "高清" "flvhd", "flv", "高清" "flv", "flv", "標清" "3gphd", "3gp", "高清"
最後的m3u8地址爲
將上述m3u8文件下載後,其中內容即爲真實地址,不過還須要稍微處理一下。部份內容以下:
#EXTM3U #EXT-X-TARGETDURATION:12 #EXT-X-VERSION:3 #EXTINF:6.006, http://59.108.137.14/65666E0ED34581E6B96293A18/0300010F005430BCBA49631468DEFEC61C5678-3A78-37BA-1971-21A0D4EEA0E7.flv?ts_start=0&ts_end=5.906&ts_seg_no=0&ts_keyframe=1 #EXTINF:5.464, http://59.108.137.14/65666E0ED34581E6B96293A18/0300010F005430BCBA49631468DEFEC61C5678-3A78-37BA-1971-21A0D4EEA0E7.flv?ts_start=5.906&ts_end=11.37&ts_seg_no=1&ts_keyframe=1 #EXTINF:5.505, http://59.108.137.14/65666E0ED34581E6B96293A18/0300010F005430BCBA49631468DEFEC61C5678-3A78-37BA-1971-21A0D4EEA0E7.flv?ts_start=11.37&ts_end=16.875&ts_seg_no=2&ts_keyframe=1 #EXTINF:9.26, http://59.108.137.14/65666E0ED34581E6B96293A18/0300010F005430BCBA49631468DEFEC61C5678-3A78-37BA-1971-21A0D4EEA0E7.flv?ts_start=16.875&ts_end=26.135&ts_seg_no=3&ts_keyframe=1 #EXTINF:11.136, http://59.108.137.14/65666E0ED34581E6B96293A18/0300010F005430BCBA49631468DEFEC61C5678-3A78-37BA-1971-21A0D4EEA0E7.flv?ts_start=26.135&ts_end=37.271&ts_seg_no=4&ts_keyframe=1 #EXTINF:8.258, http://59.108.137.14/65666E0ED34581E6B96293A18/0300010F005430BCBA49631468DEFEC61C5678-3A78-37BA-1971-21A0D4EEA0E7.flv?ts_start=37.271&ts_end=45.529&ts_seg_no=5&ts_keyframe=1 #EXTINF:9.843, http://59.108.137.14/65666E0ED34581E6B96293A18/0300010F005430BCBA49631468DEFEC61C5678-3A78-37BA-1971-21A0D4EEA0E7.flv?ts_start=45.529&ts_end=55.372&ts_seg_no=6&ts_keyframe=1 #EXTINF:10.26, http://59.108.137.14/65666E0ED34581E6B96293A18/0300010F005430BCBA49631468DEFEC61C5678-3A78-37BA-1971-21A0D4EEA0E7.flv?ts_start=55.372&ts_end=65.632&ts_seg_no=7&ts_keyframe=1
其中每條url只包含6s左右視頻,可是可將url中參數部分去掉便可獲得實際的長度。可是每條去掉後需合併一下相同的url,如上述列表可獲得url片斷
將m3u8中全部的url片斷所有下載便可大功告成。
http://v.youku.com/player/getPlayList/VideoIDS/XNzk2NTI0MzMy/Pf/4/ctype/12/ev/1
這個是怎麼獲得的?
固定接口。直接替換vid的值就行了。
你若是要問這個接口哪來的。youku播放頁的js文件(http://static.youku.com/v1.0.0987/v/js/v5/v.js)裏有個函數爲getRequestUrl,你能夠研究研究。若是優酷後門接口改了 就得研究他們的.js了