編程大神進階之路：Python技巧小貼士

時間 2019-11-05

原文原文鏈接

選自medium，做者：Martin Heinz，機器之心編譯，參與：王子嘉、熊宇軒。python

介紹 Python 炫酷功能（例如，變量解包，偏函數，枚舉可迭代對象等）的文章層出不窮。可是還有不少 Python 的編程小技巧鮮被說起。所以，本文會試着介紹一些其它文章沒有提到的小技巧，這些小技巧也是我平時會用到的的。讓咱們一探究竟吧！正則表達式

整理字符串輸入

整理用戶輸入的問題在編程過程當中極爲常見。一般狀況下，將字符轉換爲小寫或大寫就夠了，有時你可使用正則表達式模塊「Regex」完成這項工做。可是若是問題很複雜，可能有更好的方法來解決：編程

user_input = "This\nstring has\tsome whitespaces...\r\n"character_map = {    ord('\n') : ' ',    ord('\t') : ' ',    ord('\r') : None}user_input.translate(character_map)  # This string has some whitespaces... 複製代碼

在本例中，你能夠看到空格符「\ n」和「\ t」都被替換成了單個空格，「\ r」都被刪掉了。這只是個很簡單的例子，咱們能夠更進一步，使用「unicodedata」程序包生成大型重映射表，並使用其中的「combining()」進行生成和映射，咱們能夠
數組

迭代器切片（Slice）bash

若是對迭代器進行切片操做，會返回一個「TypeError」，提示生成器對象沒有下標，可是咱們能夠用一個簡單的方案來解決這個問題：

import itertoolss = itertools.islice(range(50), 10, 20)  # &lt;itertools.islice object at 0x7f70fab88138&gt;for val in s: ...複製代碼

咱們可使用「itertools.islice」建立一個「islice」對象，該對象是一個迭代器，能夠產生咱們想要的項。但須要注意的是，該操做要使用切片以前的全部生成器項，以及「islice」對象中的全部項。

跳過可迭代對象的開頭app

有時你要處理一些以不須要的行（如註釋）開頭的文件。「itertools」再次提供了一種簡單的解決方案：

string_from_file = """// Author: ...// License: ...//// Date: ...Actual content..."""import itertoolsfor line in itertools.dropwhile(lambda line: line.startswith("//"), string_from_file.split("\n")):    print(line)複製代碼

這段代碼只打印初始註釋部分以後的內容。若是咱們只想捨棄可迭代對象的開頭部分（本示例中爲開頭的註釋行），而又不知道要這部分有多長時，這種方法就頗有用了。

只包含關鍵字參數的函數 (kwargs)ide

當咱們使用下面的函數時，建立僅僅須要關鍵字參數做爲輸入的函數來提供更清晰的函數定義，會頗有幫助：

def test(*, a, b):    passtest("value for a", "value for b")  # TypeError: test() takes 0 positional arguments...test(a="value", b="value 2") # Works...複製代碼

如你所見，在關鍵字參數以前加上一個「*」就能夠解決這個問題。若是咱們將某些參數放在「*」參數以前，它們顯然是位置參數。

建立支持「with」語句的對象函數

舉例而言，咱們都知道如何使用「with」語句打開文件或獲取鎖，可是咱們能夠實現本身上下文表達式嗎？是的，咱們可使用「__enter__」和「__exit__」來實現上下文管理協議:

class Connection:    def __init__(self):        ...    def __enter__(self):        # Initialize connection... def __exit__(self, type, value, traceback): # Close connection...with Connection() as c: # __enter__() executes ... # conn.__exit__() executes複製代碼

這是在 Python 中最多見的實現上下文管理的方法，可是還有更簡單的方法:

from contextlib import contextmanager@contextmanagerdef tag(name):    print(f"<{name}>")    yield    print(f"</{name}>")with tag("h1"):    print("This is Title.")複製代碼

上面這段代碼使用 contextmanager 的 manager 裝飾器實現了內容管理協議。在進入 with 塊時 tag 函數的第一部分（在 yield 以前的部分）就已經執行了，而後 with 塊才被執行，最後執行 tag 函數的其他部分。

用「__slots__」節省內存優化

若是你曾經編寫過一個建立了某種類的大量實例的程序，那麼你可能已經注意到，你的程序忽然須要大量的內存。那是由於 Python 使用字典來表示類實例的屬性，這使其速度很快，但內存使用效率卻不是很高。一般狀況下，這並非一個嚴重的問題。可是，若是你的程序所以受到嚴重的影響，不妨試一下「__slots__」：ui

class Person:    __slots__ = ["first_name", "last_name", "phone"]    def __init__(self, first_name, last_name, phone):        self.first_name = first_name        self.last_name = last_name        self.phone = phone複製代碼

當咱們定義了「__slots__」屬性時，Python 沒有使用字典來表示屬性，而是使用小的固定大小的數組，這大大減小了每一個實例所需的內存。使用「__slots__」也有一些缺點：咱們不能聲明任何新的屬性，咱們只能使用「__slots__」上現有的屬性。並且，帶有「__slots__」的類不能使用多重繼承。

限制「CPU」和內存使用量

若是不是想優化程序對內存或 CPU 的使用率，而是想直接將其限制爲某個肯定的數字，Python 也有一個對應的庫能夠作到：

import signalimport resourceimport os# To Limit CPU timedef time_exceeded(signo, frame): print("CPU exceeded...") raise SystemExit(1)def set_max_runtime(seconds): # Install the signal handler and set a resource limit soft, hard = resource.getrlimit(resource.RLIMIT_CPU) resource.setrlimit(resource.RLIMIT_CPU, (seconds, hard)) signal.signal(signal.SIGXCPU, time_exceeded)# To limit memory usagedef set_max_memory(size): soft, hard = resource.getrlimit(resource.RLIMIT_AS) resource.setrlimit(resource.RLIMIT_AS, (size, hard))複製代碼

咱們能夠看到，在上面的代碼片斷中，同時包含設置最大 CPU 運行時間和最大內存使用限制的選項。在限制 CPU 的運行時間時，咱們首先得到該特定資源（RLIMIT_CPU）的軟限制和硬限制，而後使用經過參數指定的秒數和先前檢索到的硬限制來進行設置。最後，若是 CPU 的運行時間超過了限制，咱們將發出系統退出的信號。在內存使用方面，咱們再次檢索軟限制和硬限制，並使用帶「size」參數的「setrlimit」和先前檢索到的硬限制來設置它。

控制能夠/不能夠導入什麼

有些語言有很是明顯的機制來導出成員（變量、方法、接口），例如在 Golang 中只有以大寫字母開頭的成員被導出。然而，在 Python 中，全部成員都會被導出（除非咱們使用了「__all__」）：

def foo():    passdef bar():    pass__all__ = ["bar"]複製代碼

在上面這段代碼中，咱們知道只有「bar」函數被導出了。一樣，咱們可讓「__all__」爲空，這樣就不會導出任何東西，當從這個模塊導入的時候，會形成「AttributeError」。

實現比較運算符的簡單方法

爲一個類實現全部的比較運算符（如 __lt__ , __le__ , __gt__ , __ge__）是很繁瑣的。有更簡單的方法能夠作到這一點嗎？這種時候，「functools.total_ordering」就是一個很好的幫手：

from functools import total_ordering@total_orderingclass Number:    def __init__(self, value):        self.value = value    def __lt__(self, other):        return self.value < other.value    def __eq__(self, other):        return self.value == other.valueprint(Number(20) > Number(3))print(Number(1) < Number(5))print(Number(15) >= Number(15))print(Number(10) <= Number(2))複製代碼

這裏的工做原理到底是怎樣的呢？咱們用「total_ordering」裝飾器簡化實現對類實例排序的過程。咱們只須要定義「__lt__」和「__eq__」就能夠了，它們是實現其他操做所須要的最小的操做集合（這裏也體現了裝飾器的做用——爲咱們填補空白）。

結語

並不是本文中全部提到的功能在平常的 Python 編程中都是必需或有用的，可是其中某些功能可能會不時派上用場，並且它們也可能簡化一些本來就很冗長且使人煩惱的任務。還需指出的是，全部這些功能都是 Python 標準庫的一部分。而在我看來，其中一些功能彷佛並不像標準庫中包含的標準內容，因此當你使用 Python 實現本文提到的某些功能時，請先參閱 Python 的標準庫，若是你不能找到想要的功能，可能只是由於你尚未盡力查找（若是真的沒有，那它確定也存在於一些第三方庫）。

原文連接：

medium.com/m/global-id…