注:答案通常在網上都可以找到。
1.對if __name__ == 'main'
的理解陳述
2.python是如何進行內存管理的?
3.請寫出一段Python代碼實現刪除一個list裏面的重複元素
4.Python裏面如何拷貝一個對象?(賦值,淺拷貝,深拷貝的區別)
5.介紹一下except的用法和做用?
6.Python中__new__與__init__
方法的區別
7.經常使用的網絡數據爬取方法
8.遇到過得反爬蟲策略以及解決方法
9.urllib 和 urllib2 的區別
10.設計一個基於session登陸驗證的爬蟲方案
11.列舉網絡爬蟲所用到的網絡數據包,解析包
12.熟悉的爬蟲框架
13.Python在服務器的部署流程,以及環境隔離
14.Django 和 Flask 的相同點與不一樣點,如何進行選擇?
15.寫一個Python中的單例模式
16.Linux部署服務腳本命令(包括啓動和中止的shell腳本)
17.你用過多線程和異步嘛?除此以外你還用過什麼方法來提升爬蟲效率?
18.POST 與 GET的區別python
if __name__ == 'main'
的理解陳述__name__
是當前模塊名,當模塊被直接運行時模塊名爲__main__
,也就是當前的模塊,當模塊被導入時,模塊名就不是__main__
,即代碼將不會執行。請寫出一段Python代碼實現刪除一個list裏面的重複元素web
# 1.使用set函數 list = [1, 3, 4, 5, 51, 2, 3] set(list) # 2.使用字典函數, >>> a = [1, 2, 4, 2, 4, 5, 6, 5, 7, 8, 9, 0] >>> b = {} >>> b = b.fromkeys(a) >>> c = list(b.keys()) >>> c
list()
;3,copy
模塊的copy()
函數}copy
模塊的deep.deepcopy()
函數}except
的用法和做用?__new__
與__init__
方法的區別__new__
:它是建立對象時調用,會返回當前對象的一個實例,能夠用__new__來實現單例__init__
:它是建立對象後調用,對當前對象的一些實例初始化,無返回值經常使用的網絡數據爬取方法ajax
urllib
和 urllib2
的區別urllib
和urllib2
都是接受URL請求的相關模塊,可是urllib2
能夠接受一個Request
類的實例來設置URL請求的headers
,urllib
僅能夠接受URL。urllib
不能夠假裝你的User-Agent字符串。urllib
提供urlencode()
方法用來GET查詢字符串的產生,而urllib2
沒有。這是爲什麼urllib
常和urllib2
一塊兒使用的緣由。列舉網絡爬蟲所用到的網絡數據包,解析包正則表達式
寫一個Python中的單例模式redis
class Singleton(object): _instance = None def __new__(cls, *args, **kw): if not cls._instance: cls._instance = super(Singleton, cls).__new__(cls, *args, **kw) return cls._instance class MyClass(Singleton): a = 1 one = MyClass() two = MyClass() id(one) = id(two) >>> True
你用過多線程和異步嘛?除此以外你還用過什麼方法來提升爬蟲效率?shell
POST與 GET的區別express
什麼是lambda函數?它有什麼好處?
lambda 表達式,一般是在須要一個函數,可是又不想費神去命名一個函數的場合下使用,也就是指匿名函數
lambda函數:首要用途是指點短小的回調函數瀏覽器
lambda [arguments]:expression >>> a=lambdax,y:x+y >>> a(3,11)