昨天在上廁所的時候突發奇想,當你把usb插進去的時候,能不能自動執行usb上的程序。查了一下,發現只有windows上能夠,具體的你們也能夠搜索(搜索關鍵詞usb autorun)到。可是,若是我想,好比,當一個usb插入時,在後臺自動把usb裏的重要文件神不知鬼不覺地拷貝到本地或者上傳到某個服務器,就須要特殊的軟件輔助。html
因而我心想,能不能用python寫一個程序,讓它在後臺運行。每當有u盤插入的時候,就自動拷貝其中重要文件。python
首先咱們打開電腦終端,進入/Volumes目錄,這時候插入U盤,能夠發現它被掛載在了這個目錄之下,也就是說,咱們只要在固定時間掃描這個目錄,當這個目錄有新文件夾出現的時候,極可能有U盤被插入了。linux
個人設計是這樣的,用time.sleep(3)函數,讓程序保持運行狀態,而且每隔三秒查看一下/Volumes/目錄,若是多出來文件夾,就將其拷貝到另外的文件夾。正則表達式
# encoding=utf-8 from time import sleep import os, shutil usb_path = "/Volumes/" content = os.listdir(usb_path) # os.listdir(路徑)返回路徑下全部文件以及文件夾的名稱 while True: new_content = os.listdir(usb_path) #每隔三秒掃描一次/Volumes/ if new_content != content: # 若是發現異常,即多出一個文件夾,則退出 break; sleep(3) x = [item for item in new_content if item not in content] # 找到那個新文件夾,返回包括新文件夾string類型名稱的列表,這個表達方法很pythonic shutil.copytree(os.path.join(usb_path, x[0]), '/Users/home/usb_copy') # shutil.copytree 把目錄下全部東西一股腦複製進/Users/home/usb_copy, # 放進了本身的home目錄下
就像標題所示,咱們真的只用了10行(實際上是11行,湊個整:)完成了這個「病毒」。咱們能夠發現usb中的目錄,在插入半分鐘後所有躺在了home目錄下了。express
剛剛咱們寫了一個很簡易的腳本測試了一下這個想法的可行性,可是仍是有問題。剛纔之因此能把U盤中全部文件很快複製進去,是由於U盤中只有兩三個文件,大小不超過15M。若是目標U盤中有不少電影,音樂,這些咱們並不須要的文件,咱們的程序就應該能跳過它們,僅僅選擇一些重要的好比.docx好比.ppt文件,或者僅僅複製最近修改過的那些文件,或者排除全部大小大於5M的文件。咱們能夠用python作到嗎?固然!macos
Python os.walk() 的使用方法能夠諮詢我來獲取編程
仍是舉個例子吧。小程序
我在某目錄下建立了testwalk文件夾,裏面有file123.txt三個文件,folder123三個文件夾,其中folder1中有文件file4.txt以及folder4windows
➜ testwalk touch file1.txt file2.txt file3.txt ➜ testwalk mkdir folder1 folder2 folder3 ➜ testwalk cd folder1 ➜ folder1 touch file4.txt && mkdir folder4 ➜ folder1 cd .. # 上面建立了這些文件以及文件夾,你也能夠在圖形界面上建立 # tree 是個很好玩的命令,能夠直觀地顯示文件路徑 ➜ testwalk tree ./ testwalk/ ├── file1.txt ├── file2.txt ├── file3.txt ├── folder1 │ ├── file4.txt │ └── folder4 ├── folder2 └── folder3 4 directories, 4 files
如今咱們來測試一下服務器
import os for root, dirs, files in os.walk("./testwalk/"): for name in files: print(os.path.join(root, name)) for name in dirs: print(os.path.join(root, name)) ----------------------------------------------------------------------------- 運行結果: ./testwalk/folder1/file4.txt ./testwalk/folder1/folder4 ./testwalk/file2.txt ./testwalk/file3.txt ./testwalk/file1.txt ./testwalk/folder2 ./testwalk/folder3 ./testwalk/folder1
root存放的是當前位置,它會把./testwalk/下全部的文件夾做爲根目錄,往下搜索
for root, dirs, files in os.walk("./testwalk/", topdown=False): print(root) ./testwalk/folder2 ./testwalk/folder3 ./testwalk/folder1/folder4 ./testwalk/folder1 ./testwalk/
單獨查看 dirs
for root, dirs, files in os.walk("./testwalk/"): for name in dirs: print(os.path.join(root, name)) ./testwalk/folder2 ./testwalk/folder3 ./testwalk/folder1 ./testwalk/folder1/folder4
單獨查看 files
for root, dirs, files in os.walk("./testwalk/", topdown=False): for name in files: print(os.path.join(root, name)) ./testwalk/file2.txt ./testwalk/file3.txt ./testwalk/file1.txt ./testwalk/folder1/file4.txt
好了,咱們如今須要遞歸usb文件夾,找到全部的file,查看大小,若是小於,好比3M,就拷貝進home,大於就捨去。
在這裏仍是要推薦下我本身建的Python開發學習羣:725479218,羣裏都是學Python開發的,若是你正在學習Python ,小編歡迎你加入,你們都是軟件開發黨,不按期分享乾貨(只有Python軟件開發相關的),包括我本身整理的一份2018最新的Python進階資料和高級開發教程,歡迎進階中和進想深刻Python的小夥伴
import shutil >>> help(shutil) >>> dir(shutil) ['Error', 'ExecError', 'SpecialFileError', 'WindowsError', '_ARCHIVE_FORMATS', '_BZ2_SUPPORTED', '_ZLIB_SUPPORTED', '__all__', '__builtins__', '__doc__', '__file__', '__name__', '__package__', '_basename', '_call_external_zip', '_destinsrc', '_get_gid', '_get_uid', '_make_tarball', '_make_zipfile', '_samefile', 'abspath', 'collections', 'copy', 'copy2', 'copyfile', 'copyfileobj', 'copymode', 'copystat', 'copytree', 'errno', 'fnmatch', 'get_archive_formats', 'getgrnam', 'getpwnam', 'ignore_patterns', 'make_archive', 'move', 'os', 'register_archive_format', 'rmtree', 'stat', 'sys', 'unregister_archive_format']
好吧,看不懂,仍是得看官方文檔。
如今咱們拿剛纔的文件夾舉例子,若是想把file1.txt拷貝到folder2:
>>> shutil.copy2('./file1.txt', './folder2') ------------------------------------------------我是分割線----------- ➜ folder2 ls file1.txt
還有許多使用工具在shutil裏面這裏就不詳述了。
os.path.getsize()判斷大小 os.path.getsize(文件名)返回的是一個單位爲byte的數值,若是用來查看文件大小,咱們則須要手動寫一個函數,將其換算成容易閱讀的形式。
movie = /Users/home/somemovie.rmvb def convert_bytes(num): # this function will convert bytes to MB.... GB... etc for x in ['bytes', 'KB', 'MB', 'GB', 'TB']: if num < 1024.0: return "%3.1f %s" % (num, x) num /= 1024.0 def getDocSize(path): try: size = os.path.getsize(path) return size except Exception as err: print(err) print(convert_bytes(getDocSize(movie)))
結果: 1.3 GB [Finished in 0.1s]
這裏咱們只要選擇文件大小小於3M的便可,3M = 3 * 1024kB = 3 * 1024*1024byte
for root, dirs, files in os.walk(os.path.join(usb_path, x[0])): #MyUSB location for name in files: file = os.path.join(root, name) if os.path.getsize(file) < 3*1024*1024: shutil.copy2(file, target_folder)
結合shutil.copy2就能夠把選定大小的文件複製進咱們的目標文件夾了
這裏就須要正則表達式來幫助咱們了。
正則表達式內容不少,《python核心編程》中用了整整一章來說,因此咱們也不深刻了。下面是官方文檔,感興趣的能夠看一下。
7.2. re - Regular expression operations - Python 2.7.14 documentation
以下,咱們讓指定文件後綴以及指定文件大小能夠複製進咱們的目標文件:
別忘了導入 re
import re ... regex_filename = re.compile('(.*zip$)|(.*rar$)|(.*docx$)|(.*ppt$)|(.*xls$)') for root, dirs, files in os.walk(os.path.join(usb_path, x[0])): #MyUSB location for name in files: file = os.path.join(root, name) if regex_filename.match(file) and os.path.getsize(file) < 1024*1024: shutil.copy2(file, target_folder)
用更加複雜的正則表達式能夠更好地指定文件類型
>>> from os.path import * >>> help(getmtime) getmtime(filename) Return the last modification time of a file, reported by os.stat(). >>> help(getctime) getctime(filename) Return the metadata change time of a file, reported by os.stat().
這時候我在目錄下建立了一個文件叫作newfile
>>> getctime("newfile") 1522746383.716875 # 咱們能夠看到返回的time是從某個時間到如今的秒數,如需閱讀,咱們須要time.ctime來轉換 >>> import time >>> time.ctime(1522746383.716875) 'Tue Apr 3 17:06:23 2018' # 這就是剛纔建立的時間啦 >>> help(time.ctime)ctime(...) # 查看文檔 ctime(seconds) -> string Convert a time in seconds since the Epoch to a string in local time. This is equivalent to asctime(localtime(seconds)). When the time tuple is not present, current time as returned by localtime() is used.
總之,對每個文件進行修改時間的篩選能夠只複製那些近期,或者特定時期修改或者添加過的文件,這個功能在特定狀況下頗有用。
其實,標題這麼起只是爲了吸引你們注意,這就是一個小程序,也談不上病毒。我更想經過這個例子,展現python對於文件處理的強大能力,引起你們的學習熱情。以上實現都是基於macos,linux應該同樣,windows稍加修改也能夠成功。