若是您可能沒有上述模塊的話,
使用 pip install XX 進行下載java
分爲2 個大的步驟:1. 先將一個文件夾下的全部文件夾的 .java 文件路徑保存到一個列表中
2. 依次讀取列表的路徑, 將 .java 文件內容保存到word 中python
#!/usr/bin/env python # -*- coding: utf-8 -*- """ __title__ = '' __author__ = 'mike_jun' __mtime__ = '2019-7-1' #目的: 1. 先將一個文件夾下的全部文件夾的 .java 文件路徑保存到一個列表中 2. 依次讀取列表的路徑, 將 .java 文件內容保存到word 中 """ import os from docx import Document from docx.oxml.ns import qn from docx.shared import Pt import re from docx.shared import Length fileList = [] # 使用全局列表保存文件路徑 def getAllFile(path, fileList): # 使用遞歸方法 dirList = [] # 保存文件夾 files = os.listdir(path) # 返回一個列表,其中包含文件 和 文件夾 for f in files: if (os.path.isdir(path + '/' + f)): dirList.append(path + '/' + f) # 將文件夾 名字 進行保存 if (os.path.isfile(path + '/' + f)): fileList.append(path + '/' + f) # 將文件名 保存 for dir in dirList: #若是文件夾爲空時,遞歸自動退出 getAllFile(dir, fileList) # 遞歸保存到將.java 文件保存到 fileList 中 getAllFile( r'E:\src\main\java\com\gdut', fileList) print('文件數量爲: ',len(fileList)) def getJavaFile(fileList): for file in fileList: if not file.endswith('.java'): # 刪除不是 .java 文件的格式 fileList.remove(file) print('文件數量爲: ',len(fileList)) getJavaFile(fileList) print(os.path.isfile(fileList[0])) # 判斷第一個值是不是文件 def saveDocFile(): # SINGLE => 單倍行距(默認) # ONE_POINT_FIVE => 1.5倍行距 # DOUBLE2 => 倍行距 # AT_LEAST => 最小值 # EXACTLY => 固定值 # MULTIPLE => 多倍行距 doc = Document() from docx.enum.text import WD_LINE_SPACING p = doc.add_paragraph('') #增長一頁 doc.styles['Normal'].font.name = 'Times New Roman' # 正文是normal, 設置正文的字體格式 doc.styles['Normal'].font.size = Pt(8) # 設置字體的大小爲 5 號字體 p.line_spacing_rule = WD_LINE_SPACING.EXACTLY # 固定值 paragraph_format = doc.styles['Normal'].paragraph_format paragraph_format.line_spacing = Pt(12.9) # 固定值12,9磅, 保證每頁有50行代碼 save_file = r'E:\text.doc' codeNum = 0 for i, f in enumerate(fileList): print('starting deal %d'%i) with open(f, encoding='UTF-8') as file: # 轉換編碼以實現正確輸出中文格式 for line in file.readlines(): if line == '\n': # 刪除空行 continue if re.match(r'^\s+$', line): # 使用正則表達式刪除全是空格的空行 continue if line.__contains__(r'/*') or \ line.__contains__(r' *'): # 刪除註釋 continue if line.__contains__(r'//'): # 刪除包含 // 的註釋, 嚴格意義上應該使用正則表達式進行刪除 continue p.add_run(line) codeNum += 1 # 記錄是已經寫入的數據 if codeNum == 3050: # 保證打印出不大大超過與 60 頁 doc.save(save_file) return doc.save(save_file) # 不足60 頁進行保存 print('all done') saveDocFile() print('all done')
還有缺點就是:頁眉,頁碼,標題頁沒有作,手動作也是能夠的,呵呵。正則表達式