2011年5月23日星期一

8種網站防止盜鏈的方法

作為普通的線民來說,一般不需要知道也不用關心什麼是盜鏈,不過如果你是網站的開發者或維護者,就不得不重視盜鏈的問題了。如果你剛剛開發完一個沒有防盜鏈的帶有檔下載功能的網站,掛上internet,然後上傳幾個時下非常熱門的軟體或電影並在網站內公佈下載地址,讓MSN上的所有好友都來體驗一下你的傑作。不用多久就會發現網速出奇地變慢,甚至伺服器託管中心的服務員會熱情地打電話告訴你的網站流量很大,估計是網站受歡迎起來了,問你是不是該考慮加錢租用頻寬更寬但價格更貴的網線了。在這個值得慶祝的時候趕快打開Google Analytics看看有多少人來光顧你的網站了吧,如果發現訪客每天才十來個人,很遺憾地告訴你:你的網站資源不幸地被人盜鏈了。而且更糟糕的是,當你把網站上的檔和電影通通刪光之後,網站仍然沒有變快多少,從web伺服器的訪問日誌裡會發現瘋狂的訪問請求正從四面八方湧過來,web伺服器為了迎接這批訪客而沒有時間處理正常的頁面,這種狀況可能會一直持續好幾個周時間。
網站資源被盜鏈簡單來說就是別人不是從你的網站通過下載資源,被盜鏈的幾種可能情況:
1、在人氣非常旺的網站、論壇、社區的網頁裡直接引用了(使用標記)你網站上的圖片,或者直接在其他網頁(使用flash或媒體播放外掛程式)裡嵌入了你網站上的mp3。
2、在人氣非常旺的網站、論壇、社區裡提供了你的資源的下載地址。
3、你網站的資源可能被一些下載軟體列入了“資源候選名單”,當其他人用下載工具下載相同的檔時,下載軟體會自動找上門並且從你的伺服器下載。
既然被盜鏈的後果這麼可怕,那有哪些方法可以防止盜鏈呢下面從簡到繁總結一下常見的以及自己實踐過的一些方法,並簡單分析一下。不過很遺憾地,這些方法都沒法完全杜絕被盜鏈,並且防盜鏈的目的應該是從一定的程度上減少被盜鏈所產生的影響,同時能讓合法的使用者能夠以自然的方式、順暢地從你的網站下載資源。
方法1:判斷引用地址
這個方法是最早及最常見的方法。所謂判斷引用位址,就是判斷流覽器請求時HTTP頭的Referer欄位的值,這個值在asp.net裡面可以用 Request.UrlReferrer屬性取得。幾個例子來說,在正常情況下當使用者在流覽 http://uushare.com/abc.html 時點擊一個連結去到 http://uushare.com/jacky.mp3 檔時,流覽器在發出請求jacky.mp3 資源時還會附帶當刻流覽器所處的頁面位址(即http://uushare.com/abc.html),所以當你的網站程式接收到下載 jacky.mp3 資源請求的時候,先判斷http的referer欄位的值,如果是從 自己的功能變數名稱(uushare.com)過來的,則可以認為是合法的連接請求,否則就返回一個錯誤的提示資訊。
這種方法通常用於圖片、 mp3這種容易被人用html“嵌入”到其他網站的資源,使用這種方法可以防止你的圖片直接出現在別人的網頁裡(或者防止mp3直接被其他網站嵌入到 flash播放機裡),不過訪客使用下載工具還是可以輕鬆下載,因為現在的下載工具一般會自動用你的功能變數名稱構造一個引用位址,所以如果想再進一步防範的話,可以使用一個對應表限制每個資源的引用位址,例如將 jacky.mp3 的引用地址限制為 http://uushare.com/abc.htmlid=12345,這樣下載工具就不太可能構造一個“正確”的引用位址了。
方法2:使用登錄驗證
這個方法常見於論壇、社區。當訪客請求網站上的一個資源時,先判斷此請求是否通過登錄驗證(在asp.net裡常用session或form驗證來記錄登錄狀態),如果尚未登錄則返回一個錯誤提示資訊。使用這個方法還可以進一步判斷登錄的用戶的許可權是否足夠,以實現帶“許可權”的下載。
不過因為登錄狀態依賴於會話id,而會話id往往儲存於http請求的cookie欄位裡,下載工具一般沒法獲得流覽器的cookie欄位,所以這些資源往往無法使用下載工具來下載,給正常合法用戶帶來諸多不便(因為大部分線民的系統都安裝了下載工具,一點擊下載連結一般會被下載工具攔截,導致無法使用流覽器本身的下載功能)。簡單的解決方法是將這個session id放到URL中。
這種方法的另外一個缺點是訪客無法匿名下載,所以這個方法一般只用於論壇和社區網站。
方法3:使用cookie
其實這種方法原理上跟方法2差不多。就是在顯示“下載”連結的頁面裡產生一個動態值的cookie,然後在處理資源下載請求時先判斷cookie裡有沒有正確的cookie,如果沒有則返回錯誤提示資訊。至於這個動態值如何產生,只要能逆向判斷動態值是否合法的都可以,例如將當前的時間去除秒數取雜湊值(也叫散列值)。如果網頁程式是asp.net則更簡單,可以往Session裡隨便存一個字串或數位,然後在處理下載請求時先檢查Session 裡是否存在這個字串或數位。使用這個方法的缺點跟方法2一樣。
方法4:使用POST下載
用戶端流覽器請求資源都是使用HTTP的GET方法的,其實使用POST方法也可以往用戶端返回資料。所以可以將下載連結換成一個表單(Form)和一個按鈕(Submit),將待下載的檔的名稱或id放到表單的一個隱藏文字方塊(Input)裡,當使用者點擊提交按鈕時,服務程式先判斷請求是否為 POST方式,如果是則讀取目標資源的二進位資料並寫入響應物件(在asp.net裡是respone.BinaryWrite方法)。
使用這個方法的缺點同樣是無法使用下載工具,更沒法實現中斷點續傳。 不過比方法2,3好一點的是,下載工具不會攔截你的下載動作,所以正常用戶還是比較順暢地下載到檔。這個方法比較適合小檔的下載。
方法5:使用圖形驗證碼
使用這個方法可以保證每次下載都是“人”在你的網站上下載,而不是下載工具。因為網上很多介紹使用圖形驗證碼的方法,所以這裡就不再重複了。這個方法的缺點是比較容易讓正常的用戶感到麻煩。
方法6:使用動態檔案名
也叫動態鑰匙法,當使用者點擊一個下載連結時,先在程式端計算一個Key(使用一定規律產生的Key,最好不要使用隨機字串例如GUID,並且這個 Key必須有一定時效的),然後在資料庫或Cache裡記錄這個Key以及它所對應的資源ID或檔案名,最後讓網頁重定向一個新的URL位址,這個新 URL位址裡需要包含這個Key。當流覽器或下載工具發出下載請求時,程式先檢測這個Key是否存在,如果存在則返回對應的資來源資料。
使用這個方法的好處是下載工具也可以下載,並且在Key失效前可以中斷點續傳,並且可以通過Key來控制下載的執行緒數。
使用這個方法(包括以上所有支持下載工具的方法)的缺點是:當任意一個用戶下載成功之後,你的資源就會被一些下載工具列入“資源候選名單”,以後其他人在其他地方下載同樣的檔時,下載工具會不斷連接你的伺服器,即使你的檔已經刪除或者Key已經失效了,這樣會造成類DDos攻擊的後果,下面再介紹兩個即可以讓下載工具下載,又可以防止盜鏈的方法。
方法7:擅改資源的內容
一般熱門的資源都是電影、mp3、較大的壓縮包等,這些檔都是有很多可以插入資料的地方的,例如mp3有一個tag區,rar/zip有一個備註區,電影的內容隨便一個地方,只要在下載過程當中,動態地往這些地方注入一些隨機的位元組(幾個位元組即可),就可以達到讓整個檔的雜湊值(即散列值、指紋值)發生改變,讓從你網站下載的檔的雜湊值跟別人的不一樣,就可以防止下載工具主動找上門了。用這個方法配合方法6,可以達到較好的防盜鏈的效果。缺點是,雖然檔被修改的部分不會被“看”、“聽”出來,不過多多少少讓知道的人覺得不爽。另外就是如果別人把從你網站下載的檔放到其他網站,那麼仍然存在下載工具主動找上門的情況(雖然實際上它下載不了內容)。
方法8:打包下載
這個方法跟方法7的道理是一樣的,只不過這次不是往原始檔裡修改,而是在原始的檔基礎上再加個“外殼”,讓資源的雜湊值跟別人的不一樣。使用這個方法可以在不擅改資源原始的內容基礎上實現方法6同樣的效果,並且狠一點的話,甚至可以在打包的時候放入自己的一些廣告。缺點是使用者每次下載都得加壓縮,不過目前大部分人都懂得解壓,所以這個缺點有時可以忽略不計。