十行代碼--用python寫一個USB病毒 (知乎 DeepWeaver)

昨天在上廁所的時候突發奇想,當你把usb插進去的時候,能不能自動執行usb上的程序。查了一下,發現只有windows上能夠,具體的你們也能夠搜索(搜索關鍵詞usb autorun)到。可是,若是我想,好比,當一個usb插入時,在後臺自動把usb裏的重要文件神不知鬼不覺地拷貝到本地或者上傳到某個服務器,就須要特殊的軟件輔助。html

因而我心想,能不能用python寫一個程序,讓它在後臺運行。每當有u盤插入的時候,就自動拷貝其中重要文件。python

如何判斷U盤的插入與否?

首先咱們打開電腦終端,進入/Volumes目錄,這時候插入U盤,能夠發現它被掛載在了這個目錄之下,也就是說,咱們只要在固定時間掃描這個目錄,當這個目錄有新文件夾出現的時候,極可能有U盤被插入了。linux

個人設計是這樣的,用time.sleep(3)函數,讓程序保持運行狀態,而且每隔三秒查看一下/Volumes/目錄,若是多出來文件夾,就將其拷貝到另外的文件夾。正則表達式

# encoding=utf-8
from time import sleep
import os, shutil
usb_path = "/Volumes/"
content = os.listdir(usb_path) # os.listdir(路徑)返回路徑下全部文件以及文件夾的名稱
while True:
    new_content = os.listdir(usb_path) #每隔三秒掃描一次/Volumes/
    if new_content != content: # 若是發現異常,即多出一個文件夾,則退出
        break;
    sleep(3)
x = [item for item in new_content if item not in content]
# 找到那個新文件夾,返回包括新文件夾string類型名稱的列表,這個表達方法很pythonic
shutil.copytree(os.path.join(usb_path, x[0]), '/Users/home/usb_copy')
# shutil.copytree 把目錄下全部東西一股腦複製進/Users/home/usb_copy, 
# 放進了本身的home目錄下

就像標題所示,咱們真的只用了10行(實際上是11行,湊個整:)完成了這個「病毒」。咱們能夠發現usb中的目錄,在插入半分鐘後所有躺在了home目錄下了。express

如何選擇性的複製文件?

剛剛咱們寫了一個很簡易的腳本測試了一下這個想法的可行性,可是仍是有問題。剛纔之因此能把U盤中全部文件很快複製進去,是由於U盤中只有兩三個文件,大小不超過15M。若是目標U盤中有不少電影,音樂,這些咱們並不須要的文件,咱們的程序就應該能跳過它們,僅僅選擇一些重要的好比.docx好比.ppt文件,或者僅僅複製最近修改過的那些文件,或者排除全部大小大於5M的文件。咱們能夠用python作到嗎?固然!macos

os.walk 遞歸文件夾中全部文件

Python os.walk() 的使用方法能夠諮詢我來獲取編程

仍是舉個例子吧。小程序

我在某目錄下建立了testwalk文件夾,裏面有file123.txt三個文件,folder123三個文件夾,其中folder1中有文件file4.txt以及folder4windows

➜  testwalk touch file1.txt file2.txt file3.txt
➜  testwalk mkdir folder1 folder2 folder3
➜  testwalk cd folder1
➜  folder1 touch file4.txt && mkdir folder4
➜  folder1 cd ..
# 上面建立了這些文件以及文件夾,你也能夠在圖形界面上建立
# tree 是個很好玩的命令,能夠直觀地顯示文件路徑
➜  testwalk tree ./
testwalk/
├── file1.txt
├── file2.txt
├── file3.txt
├── folder1
│   ├── file4.txt
│   └── folder4
├── folder2
└── folder3

4 directories, 4 files

如今咱們來測試一下服務器

import os
for root, dirs, files in os.walk("./testwalk/"):
    for name in files:
        print(os.path.join(root, name))
    for name in dirs:
        print(os.path.join(root, name))
-----------------------------------------------------------------------------
運行結果:
./testwalk/folder1/file4.txt
./testwalk/folder1/folder4
./testwalk/file2.txt
./testwalk/file3.txt
./testwalk/file1.txt
./testwalk/folder2
./testwalk/folder3
./testwalk/folder1

root存放的是當前位置,它會把./testwalk/下全部的文件夾做爲根目錄,往下搜索

for root, dirs, files in os.walk("./testwalk/", topdown=False):
    print(root)
./testwalk/folder2
./testwalk/folder3
./testwalk/folder1/folder4
./testwalk/folder1
./testwalk/

單獨查看 dirs

for root, dirs, files in os.walk("./testwalk/"):
    for name in dirs:
        print(os.path.join(root, name))

./testwalk/folder2
./testwalk/folder3
./testwalk/folder1
./testwalk/folder1/folder4

單獨查看 files

for root, dirs, files in os.walk("./testwalk/", topdown=False):
    for name in files:
        print(os.path.join(root, name))

./testwalk/file2.txt
./testwalk/file3.txt
./testwalk/file1.txt
./testwalk/folder1/file4.txt

好了,咱們如今須要遞歸usb文件夾,找到全部的file,查看大小,若是小於,好比3M,就拷貝進home,大於就捨去。


  在這裏仍是要推薦下我本身建的Python開發學習羣:725479218,羣裏都是學Python開發的,若是你正在學習Python ,小編歡迎你加入,你們都是軟件開發黨,不按期分享乾貨(只有Python軟件開發相關的),包括我本身整理的一份2018最新的Python進階資料和高級開發教程,歡迎進階中和進想深刻Python的小夥伴


shutil模塊

import shutil
>>> help(shutil)
>>> dir(shutil)
['Error', 'ExecError', 'SpecialFileError', 'WindowsError', 
'_ARCHIVE_FORMATS', '_BZ2_SUPPORTED', '_ZLIB_SUPPORTED', '__all__',
 '__builtins__', '__doc__', '__file__', '__name__', '__package__',
 '_basename', '_call_external_zip', '_destinsrc', '_get_gid', '_get_uid',
 '_make_tarball', '_make_zipfile', '_samefile', 'abspath', 
'collections', 'copy', 'copy2', 'copyfile', 'copyfileobj',
 'copymode', 'copystat', 'copytree', 'errno', 'fnmatch', 
'get_archive_formats', 'getgrnam', 'getpwnam', 'ignore_patterns', 
'make_archive', 'move', 'os', 'register_archive_format', 'rmtree', 
'stat', 'sys', 'unregister_archive_format']

好吧,看不懂,仍是得看官方文檔

如今咱們拿剛纔的文件夾舉例子,若是想把file1.txt拷貝到folder2:

>>> shutil.copy2('./file1.txt', './folder2')
------------------------------------------------我是分割線-----------
➜  folder2 ls
file1.txt

還有許多使用工具在shutil裏面這裏就不詳述了。

os.path.getsize()判斷大小 os.path.getsize(文件名)返回的是一個單位爲byte的數值,若是用來查看文件大小,咱們則須要手動寫一個函數,將其換算成容易閱讀的形式。

movie = /Users/home/somemovie.rmvb
def convert_bytes(num):
#   this function will convert bytes to MB.... GB... etc
    for x in ['bytes', 'KB', 'MB', 'GB', 'TB']:
        if num < 1024.0:
            return "%3.1f %s" % (num, x)
        num /= 1024.0

def getDocSize(path):
    try:
        size = os.path.getsize(path)
        return size
    except Exception as err:
        print(err)
print(convert_bytes(getDocSize(movie)))

結果: 1.3 GB [Finished in 0.1s]

這裏咱們只要選擇文件大小小於3M的便可,3M = 3 * 1024kB = 3 * 1024*1024byte

for root, dirs, files in os.walk(os.path.join(usb_path, x[0])): #MyUSB location
    for name in files:
        file = os.path.join(root, name)
        if os.path.getsize(file) < 3*1024*1024:
            shutil.copy2(file, target_folder)

結合shutil.copy2就能夠把選定大小的文件複製進咱們的目標文件夾了

如何指定文件類型

這裏就須要正則表達式來幫助咱們了。

正則表達式內容不少,《python核心編程》中用了整整一章來說,因此咱們也不深刻了。下面是官方文檔,感興趣的能夠看一下。

7.2. re - Regular expression operations - Python 2.7.14 documentation

以下,咱們讓指定文件後綴以及指定文件大小能夠複製進咱們的目標文件:

別忘了導入 re

import re
...
regex_filename = re.compile('(.*zip$)|(.*rar$)|(.*docx$)|(.*ppt$)|(.*xls$)')
for root, dirs, files in os.walk(os.path.join(usb_path, x[0])): #MyUSB location
    for name in files:
        file = os.path.join(root, name)
        if regex_filename.match(file) and os.path.getsize(file) < 1024*1024:
            shutil.copy2(file, target_folder)

用更加複雜的正則表達式能夠更好地指定文件類型

根據修改時間篩選文件

>>> from os.path import *
>>> help(getmtime)
getmtime(filename)
    Return the last modification time of a file, reported by os.stat().

>>> help(getctime)
getctime(filename)
    Return the metadata change time of a file, reported by os.stat().

這時候我在目錄下建立了一個文件叫作newfile

>>> getctime("newfile")
1522746383.716875
# 咱們能夠看到返回的time是從某個時間到如今的秒數,如需閱讀,咱們須要time.ctime來轉換
>>> import time
>>> time.ctime(1522746383.716875)
'Tue Apr  3 17:06:23 2018' # 這就是剛纔建立的時間啦
>>> help(time.ctime)ctime(...) # 查看文檔
    ctime(seconds) -> string

    Convert a time in seconds since the Epoch to a string in local time.
    This is equivalent to asctime(localtime(seconds)). When the time tuple is
    not present, current time as returned by localtime() is used.

總之,對每個文件進行修改時間的篩選能夠只複製那些近期,或者特定時期修改或者添加過的文件,這個功能在特定狀況下頗有用。

總結

其實,標題這麼起只是爲了吸引你們注意,這就是一個小程序,也談不上病毒。我更想經過這個例子,展現python對於文件處理的強大能力,引起你們的學習熱情。以上實現都是基於macos,linux應該同樣,windows稍加修改也能夠成功。

相關文章
相關標籤/搜索