一、一行代碼實現1--100之和javascript
利用sum()函數求和css
>>> sum(range(0,101))
5050
二、如何在一個函數內部修改全局變量html
利用global 修改全局變量前端
a = 5 def fn(): global a a = 4 fn() print(a)
3、列出5個python標準庫java
os:提供了很多與操做系統相關聯的函數python
sys: 一般用於命令行參數mysql
re: 正則匹配linux
math: 數學運算web
datetime:處理日期時間正則表達式
四、字典如何刪除鍵和合並兩個字典
del和update方法
>>> dic = {"name":"zs", "age":18} >>> del dic["name"] >>> dic {'age': 18} >>> dic2 = {"name":"ls"} >>> dic.update(dic2) >>> dic {'age': 18, 'name': 'ls'}
五、談下python的GIL
GIL 是python的全局解釋器鎖,同一進程中假若有多個線程運行,一個線程在運行python程序的時候會霸佔python解釋器(加了一把鎖即GIL),使該進程內的其餘線程沒法運行,等該線程運行完後其餘線程才能運行。若是線程運行過程當中遇到耗時操做,則解釋器鎖解開,使其餘線程運行。因此在多線程中,線程的運行還是有前後順序的,並非同時進行。
多進程中由於每一個進程都能被系統分配資源,至關於每一個進程有了一個python解釋器,因此多進程能夠實現多個進程的同時運行,缺點是進程系統資源開銷大
六、python實現列表去重的方法
先經過集合去重,在轉列表
七、fun(*args,**kwargs)中的*args,**kwargs什麼意思?
八、python2和python3的range(100)的區別
python2返回列表,python3返回迭代器,節約內存
九、一句話解釋什麼樣的語言可以用裝飾器?
函數能夠做爲參數傳遞的語言,可使用裝飾器
十、python內建數據類型有哪些
整型--int
布爾型--bool
字符串--str
列表--list
元組--tuple
字典--dict
十一、簡述面向對象中__new__和__init__區別
__init__是初始化方法,建立對象後,就馬上被默認調用了,可接收參數,如圖
一、__new__至少要有一個參數cls,表明當前類,此參數在實例化時由Python解釋器自動識別
二、__new__必需要有返回值,返回實例化出來的實例,這點在本身實現__new__時要特別注意,能夠return父類(經過super(當前類名, cls))__new__出來的實例,或者直接是object的__new__出來的實例
三、__init__有一個參數self,就是這個__new__返回的實例,__init__在__new__的基礎上能夠完成一些其它初始化的動做,__init__不須要返回值
四、若是__new__建立的是當前類的實例,會自動調用__init__函數,經過return語句裏面調用的__new__函數的第一個參數是cls來保證是當前類實例,若是是其餘類的類名,;那麼實際建立返回的就是其餘類的實例,其實就不會調用當前類的__init__函數,也不會調用其餘類的__init__函數。
十二、簡述with方法打開處理文件幫我咱們作了什麼?
打開文件在進行讀寫的時候可能會出現一些異常情況,若是按照常規的f.open
寫法,咱們須要try,except,finally,作異常判斷,而且文件最終無論遇到什麼狀況,都要執行finally f.close()關閉文件,with方法幫咱們實現了finally中f.close
(固然還有其餘自定義功能,有興趣能夠研究with方法源碼)
1三、列表[1,2,3,4,5],請使用map()函數輸出[1,4,9,16,25],並使用列表推導式提取出大於10的數,最終輸出[16,25]
map()函數第一個參數是fun,第二個參數是通常是list,第三個參數能夠寫list,也能夠不寫,根據需求
1四、python中生成隨機整數、隨機小數、0--1之間小數方法
隨機整數:random.randint(a,b),生成區間內的整數
隨機小數:習慣用numpy庫,利用np.random.randn(5)生成5個隨機小數
0-1隨機小數:random.random(),括號中不傳參
import random import numpy result = random.randint(10, 20) res = numpy.random.randn(5) ret = random.random() print("正整數",result) print("5個隨機小數",res) print("0-1隨機小數",ret) 打印: 正整數 11 5個隨機小數 [ 0.98433549 1.2379769 -1.73281501 -0.64436276 -1.11252797] 0-1隨機小數 0.7430385844822477
1五、避免轉義給字符串加哪一個字母表示原始字符串?
r , 表示須要原始字符串,不轉義特殊字符
1六、<div class="nam">中國</div>,用正則匹配出標籤裏面的內容(「中國」),其中class的類名是不肯定的
import re str = '<div class="man">中國</div>' res = re.findall(r'<div class=".*">(.*?)</div>', str) #.表明無關緊要;*表明任意字符,知足類名可有變化 #(.*?)提取文本 print(res) 打印: ['中國']
1七、python中斷言方法舉例
assert()方法,斷言成功,則程序繼續執行,斷言失敗,則程序報錯
a = 3 assert (a > 1) print("斷言成功,程序繼續往下執行") b = 4 assert (b > 7) print("斷言失敗,程序報錯") 打印: Traceback (most recent call last): 斷言成功,程序繼續往下執行 File "C:/Users/Administrator/PycharmProjects/myFirstpro/chapter7併發編程/併發編程回顧/線程.py", line 73, in <module> assert (b > 7) AssertionError
1八、數據表student有id,name,score,city字段,其中name中的名字可有重複,須要消除重複行,請寫sql語句
select distinct name from student
1九、10個Linux經常使用命令
ls pwd cd touch rm mkdir tree cp mv cat more grep echo
20、python2和python3區別?列舉5個
一、Python3 使用 print 必需要以小括號包裹打印內容,好比 print('hi')
Python2 既可使用帶小括號的方式,也可使用一個空格來分隔打印內容,好比 print 'hi'
二、python2 range(1,10)返回列表,python3中返回迭代器,節約內存
三、python2中使用ascii編碼,python中使用utf-8編碼
四、python2中unicode表示字符串序列,str表示字節序列
python3中str表示字符串序列,byte表示字節序列
五、python2中爲正常顯示中文,引入coding聲明,python3中不須要
六、python2中是raw_input()函數,python3中是input()函數
2一、列出python中可變數據類型和不可變數據類型,並簡述原理
不可變數據類型:數值型、字符串型string和元組tuple
不容許變量的值發生變化,若是改變了變量的值,至關因而新建了一個對象,而對於相同的值的對象,在內存中則只有一個對象(一個地址),以下圖用id()方法能夠打印對象的id
可變數據類型:列表list和字典dict;
容許變量的值發生變化,即若是對變量進行append、+=等這種操做後,只是改變了變量的值,而不會新建一個對象,變量引用的對象的地址也不會變化,不過對於相同的值的不一樣對象,在內存中則會存在不一樣的對象,即每一個對象都有本身的地址,至關於內存中對於同值的對象保存了多份,這裏不存在引用計數,是實實在在的對象。
2二、s = "ajldjlajfdljfddd",去重並從小到大排序輸出"adfjl"
set去重,去重轉成list,利用sort方法排序,reeverse=False是從小到大排
list是不 變數據類型,s.sort時候沒有返回值,因此註釋的代碼寫法不正確
2三、用lambda函數實現兩個數相乘
2四、字典根據鍵從小到大排序
dict={"name":"zs","age":18,"city":"深圳","tel":"1362626627"}
2五、利用collections庫的Counter方法統計字符串每一個單詞出現的次數"kjalfj;ldsjafl;hdsllfdhg;lahfbl;hl;ahlf;h"
2六、字符串a = "not 404 found 張三 99 深圳",每一個詞中間是空格,用正則過濾掉英文和數字,最終輸出"張三 深圳"
順便貼上匹配小數的代碼,雖然能匹配,可是健壯性有待進一步確認
2七、filter方法求出列表全部奇數並構造新列表,a = [1, 2, 3, 4, 5, 6, 7, 8, 9, 10]
filter() 函數用於過濾序列,過濾掉不符合條件的元素,返回由符合條件元素組成的新列表。該接收兩個參數,第一個爲函數,第二個爲序列,序列的每一個元素做爲參數傳遞給函數進行判,而後返回 True 或 False,最後將返回 True 的元素放到新列表
2八、列表推導式求列表全部奇數並構造新列表,a = [1, 2, 3, 4, 5, 6, 7, 8, 9, 10]
2九、正則re.complie做用
re.compile是將正則表達式編譯成一個對象,加快速度,並重復使用
30、a=(1,)b=(1),c=("1") 分別是什麼類型的數據?
3一、兩個列表[1,5,7,9]和[2,2,6,8]合併爲[1,2,2,3,6,7,8,9]
extend能夠將另外一個集合中的元素逐一添加到列表中,區別於append總體添加
3二、用python刪除文件和用linux命令刪除文件方法
python:os.remove(文件名)
linux: rm 文件名
3三、log日誌中,咱們須要用時間戳記錄error,warning等的發生時間,請用datetime模塊打印當前時間戳 「2018-04-01 11:38:54」
順便把星期的代碼也貼上了
3四、數據庫優化查詢方法
外鍵、索引、聯合查詢、選擇特定字段等等
3五、請列出你會的任意一種統計圖(條形圖、折線圖等)繪製的開源庫,第三方也行
pychart、matplotlib
3六、寫一段自定義異常代碼
自定義異經常使用raise拋出異常
3七、正則表達式匹配中,(.*)和(.*?)匹配區別?
(.*)是貪婪匹配,會把知足正則的儘量多的日後匹配
(.*?)是非貪婪匹配,會把知足正則的儘量少匹配
3八、簡述Django的orm
ORM,全拼Object-Relation Mapping,意爲對象-關係映射
實現了數據模型與數據庫的解耦,經過簡單的配置就能夠輕鬆更換數據庫,而不須要修改代碼只須要面向對象編程,orm操做本質上會根據對接的數據庫引擎,翻譯成對應的sql語句,全部使用Django開發的項目無需關心程序底層使用的是MySQL、Oracle、sqlite....,若是數據庫遷移,只須要更換Django的數據庫引擎便可
3九、[[1,2],[3,4],[5,6]]一行代碼展開該列表,得出[1,2,3,4,5,6]
列表推導式的騷操做
運行過程:for i in a ,每一個i是【1,2】,【3,4】,【5,6】,for j in i,每一個j就是1,2,3,4,5,6,合併後就是結果
還有更騷的方法,將列表轉成numpy矩陣,經過numpy的flatten()方法,代碼永遠是隻有更騷,沒有最騷
40、x="abc",y="def",z=["d","e","f"],分別求出x.join(y)和x.join(z)返回的結果
join()括號裏面的是可迭代對象,x插入可迭代對象中間,造成字符串,結果一致,有沒有忽然感受字符串的常見操做都不會玩了
順便建議你們學下os.path.join()方法,拼接路徑常常用到,也用到了join,和字符串操做中的join有什麼區別,該問題你們能夠查閱相關文檔,後期會有答案
4一、舉例說明異常模塊中try except else finally的相關意義
try..except..else沒有捕獲到異常,執行else語句
try..except..finally無論是否捕獲到異常,都執行finally語句
4二、python中交換兩個數值
4三、舉例說明zip()函數用法
zip()函數在運算時,會以一個或多個序列(可迭代對象)作爲參數,返回一個元組的列表。同時將這些序列中並排的元素配對。
zip()參數能夠接受任何類型的序列,同時也能夠有兩個以上的參數;當傳入參數的長度不一樣時,zip能自動以最短序列長度爲準進行截取,得到元組。
4四、a="張明 98分",用re.sub,將98替換爲100
4五、寫5條經常使用sql語句
show databases;
show tables;
desc 表名;
select * from 表名;
delete from 表名 where id=5;
update students set gender=0,hometown="北京" where id=5
4六、a="hello"和b="你好"編碼成bytes類型
4七、[1,2,3]+[4,5,6]的結果是多少?
兩個列表相加,等價於extend
4八、提升python運行效率的方法
一、使用生成器,由於能夠節約大量內存
二、循環代碼優化,避免過多重複代碼的執行
三、核心模塊用Cython PyPy等,提升效率
四、多進程、多線程、協程
五、多個if elif條件判斷,能夠把最有可能先發生的條件放到前面寫,這樣能夠減小程序判斷的次數,提升效率
4九、簡述mysql和redis區別
redis: 內存型非關係數據庫,數據保存在內存中,速度快
mysql:關係型數據庫,數據保存在磁盤中,檢索的話,會有必定的Io操做,訪問速度相對慢
50、遇到bug如何處理
一、細節上的錯誤,經過print()打印,能執行到print()說明通常上面的代碼沒有問題,分段檢測程序是否有問題,若是是js的話能夠alert或console.log
二、若是涉及一些第三方框架,會去查官方文檔或者一些技術博客。
三、對於bug的管理與歸類總結,通常測試將測試出的bug用teambin等bug管理工具進行記錄,而後咱們會一條一條進行修改,修改的過程也是理解業務邏輯和提升本身編程邏輯縝密性的方法,我也都會收藏作一些筆記記錄。
四、導包問題、城市定位多音字形成的顯示錯誤問題
5一、正則匹配,匹配日期2018-03-20
url='https://sycm.taobao.com/bda/tradinganaly/overview/get_summary.json?dateRange=2018-03-20%7C2018-03-20&dateType=recent1&device=1&token=ff25b109b&_=1521595613462'
仍有同窗問正則,其實匹配並不難,提取一段特徵語句,用(.*?)匹配便可
5二、list=[2,3,5,4,9,6],從小到大排序,不準用sort,輸出[2,3,4,5,6,9]
利用min()方法求出最小值,原列表刪除最小值,新列表加入最小值,遞歸調用獲取最小值的函數,反覆操做
5三、寫一個單列模式
由於建立對象時__new__方法執行,而且必須return 返回實例化出來的對象所cls.__instance是否存在,不存在的話就建立對象,存在的話就返回該對象,來保證只有一個實例對象存在(單列),打印ID,值同樣,說明對象同一個
5四、保留兩位小數
題目自己只有a="%.03f"%1.3335,讓計算a的結果,爲了擴充保留小數的思路,提供round方法(數值,保留位數)
5五、求三個方法打印結果
fn("one",1)直接將鍵值對傳給字典;
fn("two",2)由於字典在內存中是可變數據類型,因此指向同一個地址,傳了新的額參數後,會至關於給字典增長鍵值對
fn("three",3,{})由於傳了一個新字典,因此再也不是原先默認參數的字典
5六、列出常見的狀態碼和意義
200 OK
請求正常處理完畢
204 No Content
請求成功處理,沒有實體的主體返回
206 Partial Content
GET範圍請求已成功處理
301 Moved Permanently
永久重定向,資源已永久分配新URI
302 Found
臨時重定向,資源已臨時分配新URI
303 See Other
臨時重定向,指望使用GET定向獲取
304 Not Modified
發送的附帶條件請求未知足
307 Temporary Redirect
臨時重定向,POST不會變成GET
400 Bad Request
請求報文語法錯誤或參數錯誤
401 Unauthorized
須要經過HTTP認證,或認證失敗
403 Forbidden
請求資源被拒絕
404 Not Found
沒法找到請求資源(服務器無理由拒絕)
500 Internal Server Error
服務器故障或Web應用故障
503 Service Unavailable
服務器超負載或停機維護
5七、分別從前端、後端、數據庫闡述web項目的性能優化
該題目網上有不少方法,我不想截圖網上的長串文字,看的頭疼,按我本身的理解說幾點
前端優化:
一、減小http請求、例如製做精靈圖
二、html和CSS放在頁面上部,javascript放在頁面下面,由於js加載比HTML和Css加載慢,因此要優先加載html和css,以防頁面顯示不全,性能差,也影響用戶體驗差
後端優化:
一、緩存存儲讀寫次數高,變化少的數據,好比網站首頁的信息、商品的信息等。應用程序讀取數據時,通常是先從緩存中讀取,若是讀取不到或數據已失效,再訪問磁盤數據庫,並將數據再次寫入緩存。
二、異步方式,若是有耗時操做,能夠採用異步,好比celery
三、代碼優化,避免循環和判斷次數太多,若是多個if else判斷,優先判斷最有可能先發生的狀況
數據庫優化:
一、若有條件,數據能夠存放於redis,讀取速度快
二、創建索引、外鍵等
5八、使用pop和del刪除字典中的"name"字段,dic={"name":"zs","age":18}
5九、列出常見MYSQL數據存儲引擎
InnoDB:支持事務處理,支持外鍵,支持崩潰修復能力和併發控制。若是須要對事務的完整性要求比較高(好比銀行),要求實現併發控制(好比售票),那選擇InnoDB有很大的優點。若是須要頻繁的更新、刪除操做的數據庫,也能夠選擇InnoDB,由於支持事務的提交(commit)和回滾(rollback)。
MyISAM:插入數據快,空間和內存使用比較低。若是表主要是用於插入新記錄和讀出記錄,那麼選擇MyISAM能實現處理高效率。若是應用的完整性、併發性要求比 較低,也可使用。
MEMORY:全部的數據都在內存中,數據的處理速度快,可是安全性不高。若是須要很快的讀寫速度,對數據的安全性要求較低,能夠選擇MEMOEY。它對錶的大小有要求,不能創建太大的表。因此,這類數據庫只使用在相對較小的數據庫表。
60、計算代碼運行結果,zip函數歷史文章已經說了,得出[("a",1),("b",2),("c",3),("d",4),("e",5)]
dict()建立字典新方法
6一、簡述同源策略
同源策略須要同時知足如下三點要求:
1)協議相同
2)域名相同
3)端口相同
http:www.test.com與https:www.test.com 不一樣源——協議不一樣
http:www.test.com與http:www.admin.com 不一樣源——域名不一樣
http:www.test.com與http:www.test.com:8081 不一樣源——端口不一樣
只要不知足其中任意一個要求,就不符合同源策略,就會出現「跨域」
6二、簡述cookie和session的區別
1,session 在服務器端,cookie 在客戶端(瀏覽器)
二、session 的運行依賴 session id,而 session id 是存在 cookie 中的,也就是說,若是瀏覽器禁用了 cookie ,同時 session 也會失效,存儲Session時,鍵與Cookie中的sessionid相同,值是開發人員設置的鍵值對信息,進行了base64編碼,過時時間由開發人員設置
三、cookie安全性比session差
6三、簡述多線程、多進程
進程:
一、操做系統進行資源分配和調度的基本單位,多個進程之間相互獨立
二、穩定性好,若是一個進程崩潰,不影響其餘進程,可是進程消耗資源大,開啓的進程數量有限制
線程:
一、CPU進行資源分配和調度的基本單位,線程是進程的一部分,是比進程更小的能獨立運行的基本單位,一個進程下的多個線程能夠共享該進程的全部資源
二、若是IO操做密集,則能夠多線程運行效率高,缺點是若是一個線程崩潰,都會形成進程的崩潰
應用:
IO密集的用多線程,在用戶輸入,sleep 時候,能夠切換到其餘線程執行,減小等待的時間
CPU密集的用多進程,由於假如IO操做少,用多線程的話,由於線程共享一個全局解釋器鎖,當前運行的線程會霸佔GIL,其餘線程沒有GIL,就不能充分利用多核CPU的優點
6四、簡述any()和all()方法
any():只要迭代器中有一個元素爲真就爲真
all():迭代器中全部的判斷項返回都是真,結果才爲真
python中什麼元素爲假?
答案:(0,空字符串,空列表、空字典、空元組、None, False)
測試all()和any()方法
6五、IOError、AttributeError、ImportError、IndentationError、IndexError、KeyError、SyntaxError、NameError分別表明什麼異常
IOError:輸入輸出異常
AttributeError:試圖訪問一個對象沒有的屬性
ImportError:沒法引入模塊或包,基本是路徑問題
IndentationError:語法錯誤,代碼沒有正確的對齊
IndexError:下標索引超出序列邊界
KeyError:試圖訪問你字典裏不存在的鍵
SyntaxError:Python代碼邏輯語法出錯,不能執行
NameError:使用一個還未賦予對象的變量
6六、python中copy和deepcopy區別
一、複製不可變數據類型,無論copy仍是deepcopy,都是同一個地址當淺複製的值是不可變對象(數值,字符串,元組)時和=「賦值」的狀況同樣,對象的id值與淺複製原來的值相同。
二、複製的值是可變對象(列表和字典)
淺拷貝copy有兩種狀況:
第一種狀況:複製的 對象中無 複雜 子對象,原來值的改變並不會影響淺複製的值,同時淺複製的值改變也並不會影響原來的值。原來值的id值與淺複製原來的值不一樣。
第二種狀況:複製的對象中有 複雜 子對象 (例如列表中的一個子元素是一個列表), 改變原來的值 中的複雜子對象的值 ,會影響淺複製的值。
深拷貝deepcopy:徹底複製獨立,包括內層列表和字典
6七、列出幾種魔法方法並簡要介紹用途
__init__:對象初始化方法
__new__:建立對象時候執行的方法,單列模式會用到
__str__:當使用print輸出對象的時候,只要本身定義了__str__(self)方法,那麼就會打印從在這個方法中return的數據
__del__:刪除對象執行的方法
6八、C:Users y-wu.junyaDesktop>python 1.py 22 33命令行啓動程序並傳參,print(sys.argv)會輸出什麼數據?
文件名和參數構成的列表
6九、請將[i for i in range(3)]改爲生成器
生成器是特殊的迭代器,
一、列表表達式的【】改成()便可變成生成器
二、函數在返回值得時候出現yield就變成生成器,而不是函數了;
中括號換成小括號便可,有沒有驚呆了
70、a = " hehheh ",去除收尾空格
7一、舉例sort和sorted對列表排序,list=[0,-1,3,-10,5,9]
7二、對list排序foo = [-5,8,0,4,9,-4,-20,-2,8,2,-4],使用lambda函數從小到大排序
7三、使用lambda函數對list排序foo = [-5,8,0,4,9,-4,-20,-2,8,2,-4],輸出結果爲
[0,2,4,8,8,9,-2,-4,-4,-5,-20],正數從小到大,負數從大到小
(傳兩個條件,x<0和abs(x))
7四、列表嵌套字典的排序,分別根據年齡和姓名排序
foo = [{"name":"zs","age":19},{"name":"ll","age":54},
{"name":"wa","age":17},{"name":"df","age":23}
7五、列表嵌套元組,分別按字母和數字排序
7六、列表嵌套列表排序,年齡數字相同怎麼辦?
7七、根據鍵對字典排序(方法一,zip函數)
7八、根據鍵對字典排序(方法二,不用zip)
有沒有發現dic.items和zip(dic.keys(),dic.values())都是爲了構造列表嵌套字典的結構,方便後面用sorted()構造排序規則
7九、列表推導式、字典推導式、生成器
80、最後出一道檢驗題目,根據字符串長度排序,看排序是否靈活運用
8一、舉例說明SQL注入和解決辦法
當以字符串格式化書寫方式的時候,若是用戶輸入的有;+SQL語句,後面的SQL語句會執行,好比例子中的SQL注入會刪除數據庫demo
解決方式:經過傳參數方式解決SQL注入
8二、s="info:xiaoZhang 33 shandong",用正則切分字符串輸出['info', 'xiaoZhang', '33', 'shandong']
|表示或,根據冒號或者空格切分
8三、正則匹配以163.com結尾的郵箱
8四、遞歸求和
8五、python字典和json字符串相互轉化方法
json.dumps()字典轉json字符串,json.loads()json轉字典
8六、MyISAM 與 InnoDB 區別:
一、InnoDB 支持事務,MyISAM 不支持,這一點是很是之重要。事務是一種高
級的處理方式,如在一些列增刪改中只要哪一個出錯還能夠回滾還原,而 MyISAM
就不能夠了;
二、MyISAM 適合查詢以及插入爲主的應用,InnoDB 適合頻繁修改以及涉及到
安全性較高的應用;
三、InnoDB 支持外鍵,MyISAM 不支持;
四、對於自增加的字段,InnoDB 中必須包含只有該字段的索引,可是在 MyISAM
表中能夠和其餘字段一塊兒創建聯合索引;
五、清空整個表時,InnoDB 是一行一行的刪除,效率很是慢。MyISAM 則會重
建表;
8七、統計字符串中某字符出現次數
8八、字符串轉化大小寫
8九、用兩種方法去空格
90、正則匹配不是以4和7結尾的手機號
9一、簡述python引用計數機制
python垃圾回收主要以引用計數爲主,標記-清除和分代清除爲輔的機制,其中標記-清除和分代回收主要是爲了處理循環引用的難題。
引用計數算法
當有1個變量保存了對象的引用時,此對象的引用計數就會加1
當使用del刪除變量指向的對象時,若是對象的引用計數不爲1,好比3,那麼此時只會讓這個引用計數減1,即變爲2,當再次調用del時,變爲1,若是再調用1次del,此時會真的把對象進行刪除
9二、int("1.4"),int(1.4)輸出結果?
int("1.4")報錯,int(1.4)輸出1
9三、列舉3條以上PEP8編碼規範
一、頂級定義之間空兩行,好比函數或者類定義。
二、方法定義、類定義與第一個方法之間,都應該空一行
三、三引號進行註釋
四、使用Pycharm、Eclipse通常使用4個空格來縮進代碼
9四、正則表達式匹配第一個URL
findall結果無需加group(),search須要加group()提取
9五、正則匹配中文
9六、簡述樂觀鎖和悲觀鎖
悲觀鎖, 就是很悲觀,每次去拿數據的時候都認爲別人會修改,因此每次在拿數據的時候都會上鎖,這樣別人想拿這個數據就會block直到它拿到鎖。傳統的關係型數據庫裏邊就用到了不少這種鎖機制,好比行鎖,表鎖等,讀鎖,寫鎖等,都是在作操做以前先上鎖。
樂觀鎖,就是很樂觀,每次去拿數據的時候都認爲別人不會修改,因此不會上鎖,可是在更新的時候會判斷一下在此期間別人有沒有去更新這個數據,可使用版本號等機制,樂觀鎖適用於多讀的應用類型,這樣能夠提升吞吐量
9七、r、r+、rb、rb+文件打開模式區別
模式較多,比較下背背記記便可
9八、Linux命令重定向 > 和 >>
Linux 容許將命令執行結果 重定向到一個 文件
將本應顯示在終端上的內容 輸出/追加 到指定文件中
> 表示輸出,會覆蓋文件原有的內容
>> 表示追加,會將內容追加到已有文件的末尾
用法示例:
將 echo 輸出的信息保存到 1.txt 裏echo Hello Python > 1.txt
將 tree 輸出的信息追加到 1.txt 文件的末尾tree >> 1.txt
9九、正則表達式匹配出<html><h1>www.itcast.cn</h1></html>
前面的<>和後面的<>是對應的,能夠用此方法
100、python傳參數是傳值仍是傳址?
Python中函數參數是引用傳遞(注意不是值傳遞)。對於不可變類型(數值型、字符串、元組),因變量不能修改,因此運算不會影響到變量自身;而對於可變類型(列表字典)來講,函數體運算可能會更改傳入的參數變量。
10一、求兩個列表的交集、差集、並集
10二、生成0-100的隨機數
random.random()生成0-1之間的隨機小數,因此乘以100
10三、lambda匿名函數好處
精簡代碼,lambda省去了定義函數,map省去了寫for循環過程
10四、常見的網絡傳輸協議
UDP、TCP、FTP、HTTP、SMTP等等
10五、單引號、雙引號、三引號用法
一、單引號和雙引號沒有什麼區別,不過單引號不用按shift,打字稍微快一點。表示字符串的時候,單引號裏面能夠用雙引號,而不用轉義字符,反之亦然。
'She said:"Yes." '
or
"She said: 'Yes.' "
二、可是若是直接用單引號擴住單引號,則須要轉義,像這樣:
' She said:'Yes.' '
三、三引號能夠直接書寫多行,一般用於大段,大篇幅的字符串
"""
hello
world
"""
10六、python垃圾回收機制
python垃圾回收主要以引用計數爲主,標記-清除和分代清除爲輔的機制,其中標記-清除和分代回收主要是爲了處理循環引用的難題。
引用計數算法
當有1個變量保存了對象的引用時,此對象的引用計數就會加1
當使用del刪除變量指向的對象時,若是對象的引用計數不爲1,好比3,那麼此時只會讓這個引用計數減1,即變爲2,當再次調用del時,變爲1,若是再調用1次del,此時會真的把對象進行刪除
10七、HTTP請求中get和post區別
一、GET請求是經過URL直接請求數據,數據信息能夠在URL中直接看到,好比瀏覽器訪問;而POST請求是放在請求頭中的,咱們是沒法直接看到的;
二、GET提交有數據大小的限制,通常是不超過1024個字節,而這種說法也不徹底準確,HTTP協議並無設定URL字節長度的上限,而是瀏覽器作了些處理,因此長度依據瀏覽器的不一樣有所不一樣;POST請求在HTTP協議中也沒有作說明,通常來講是沒有設置限制的,可是實際上瀏覽器也有默認值。整體來講,少許的數據使用GET,大量的數據使用POST。
三、GET請求由於數據參數是暴露在URL中的,因此安全性比較低,好比密碼是不能暴露的,就不能使用GET請求;POST請求中,請求參數信息是放在請求頭的,因此安全性較高,可使用。在實際中,涉及到登陸操做的時候,儘可能使用HTTPS請求,安全性更好。
10八、python中讀取Excel文件的方法
應用數據分析庫pandas
109、簡述多線程、多進程
進程:
一、操做系統進行資源分配和調度的基本單位,多個進程之間相互獨立
二、穩定性好,若是一個進程崩潰,不影響其餘進程,可是進程消耗資源大,開啓的進程數量有限制
線程:
一、CPU進行資源分配和調度的基本單位,線程是進程的一部分,是比進程更小的能獨立運行的基本單位,一個進程下的多個線程能夠共享該進程的全部資源
二、若是IO操做密集,則能夠多線程運行效率高,缺點是若是一個線程崩潰,都會形成進程的崩潰
應用:
IO密集的用多線程,在用戶輸入,sleep 時候,能夠切換到其餘線程執行,減小等待的時間
CPU密集的用多進程,由於假如IO操做少,用多線程的話,由於線程共享一個全局解釋器鎖,當前運行的線程會霸佔GIL,其餘線程沒有GIL,就不能充分利用多核CPU的優點
1十、python正則中search和match
import re s = "小明年齡18歲 工資10000" res = re.search(r"\d+",s).group() print("search結果", res) res = re.findall(r"\d+", s) print("findall結果", res) res = re.match("小明", s).group() #匹配以小明開頭的字符串,並匹配出小明 print("match的結果", res) res = re.match(r"\d+", s) print("試錯,不加group爲none,匹配不到", res) # res = re.match("工資", s).group() #工資不是字符串,匹配不到,報錯 # print("match的結果", res) 打印: search結果 18 findall結果 ['18', '10000'] match的結果 小明 試錯,不加group爲none,匹配不到 None
-
來源:python爬蟲人工智能大數據
-
https://mp.weixin.qq.com/s/cQXQC1oJZ_v0d7qBD95o2