Python中儘可能少用加號「+」鏈接字符串的緣由

在Python中,String對象是定長對象,一旦建立,長度就不可變化,如果使用+號鏈接兩個字符串,則會新開闢一段長度總和長度的內存,再將兩個字符串memcpy進去。若是要鏈接N個String對象,則要進行N-1次內存申請和拷貝。spa

 

string_concat(register PyStringObject *a, register PyObject *bb)
{
register Py_ssize_t size;
register PyStringObject *op;
//................
op = (PyStringObject *)PyObject_MALLOC(PyStringObject_SIZE + size);
if (op == NULL)
return PyErr_NoMemory();
PyObject_INIT_VAR(op, &PyString_Type, size);
op->ob_shash = -1;
op->ob_sstate = SSTATE_NOT_INTERNED;
Py_MEMCPY(op->ob_sval, a->ob_sval, Py_SIZE(a));
Py_MEMCPY(op->ob_sval + Py_SIZE(a), b->ob_sval, Py_SIZE(b));
op->ob_sval[size] = '\0';
return (PyObject *) op;
#undef b
}

 

官方推薦的是使用字符串的join方法,該方法對於鏈接一個list或tuple中的元素很是有效,他會先統計全部元素的長度,申請內存,而後拷貝。code

''.join(['a', 'b', 'c']) //better
'a' + 'b' + 'c'
相關文章
相關標籤/搜索