真實 Python 爬蟲面試題

閱讀文本大概須要 5 分鐘。python

就在昨天我面試了,來到上海以後面試的第一家公司,面試過程挺順利,不出意外今天下午就會收到 offer。面試完以後,我走在路上,整我的都是在傻笑的狀態,路人一臉關愛智障的眼神,但我仍是很是的開心。mysql

本身一路自學過來,不知道遇到多少 bug,不知道有多少個深夜,還在敲代碼,不知道有多少迷茫的時候。我只知道我必需要更加努力。幸運的是,這一路下來,我沒有放棄。天道酬勤,寧靜致遠。面試

6 月底我從重慶一所普通二本學校畢業,大學獲獎屈指可數,掛科卻不可勝數。最開始我也連 C 語言的「hello world」,都要打錯 4,5 遍。不是頭函數沒有加,就是少了一個字母。就單論大學的學習,我就是一個學渣。sql

我知道學習上比別人差,但至少在努力這個層面,我能夠作到最好。我清楚地記得最開始學技術的時候,是看着別人的博客學。但我看一遍,兩遍,甚至三遍根本就記不住。離開文章,腦海裏一片空白,根本就不知道要寫什麼代碼。數據庫

但那時候我根本不知道如何高效地學習,因而我就用最低效率的方法,看的記不住,那我就抄一遍,把博客裏的內容,一個字一個字地敲打一遍。敲一遍記不住,那我就再敲一遍。這就是我最先學習技術的方式。一個暑假的時間風雨無阻,天天一篇博客敲打文,到了最後,有道雲筆記裏全是本身的敲打文。小程序

如今回想起來那時候本身有多麼的笨,但卻又感謝曾經努力的我。就是靠着比別人多努力一點點,我慢慢能記得博客的內容;就是比別人多努力一點點,我能慢慢的寫一個小程序;就是比別人多努力一點點,我能寫出幾千字的文章;就是比別人多努力一點點,公衆號發展至今已有 1.3W 的讀者數;就是比別人多努力一點點,現在來到我求之不得的上海。數組

七月初,獨身一人,提着一包行李,買了張飛機票,就直接來到上海。上海我沒有朋友,沒有親戚,甚至不知道下飛機以後,我該去往哪裏。但這些都阻擋不了,我想要去上海的心。數據結構

在此記錄下本身來到上海,第一家面試的公司,面試到的題。但願對你之後的 python 爬蟲道路有所幫助。等以後工做穩定,我再詳細寫一篇,如何自學 python 找到爬蟲工做。app

筆試題

  1. python 經常使用數據結構有哪些?請簡要介紹一下。
  2. 簡要描述 Python 中單引號、雙引號、三引號的區別。
  3. 如何在一個 function 裏面設置一個全局的變量?
  4. Python 裏面如何拷貝一個對象?(賦值、淺拷貝、深拷貝的區別)
  5. 若是 custname 字符串的內容爲 utf-8 的字符,如何將 custname 的內容轉爲 gb18030 的字符串?
  6. 請寫出一段 Python 代碼實現刪除一個 list 裏面的重複元素。
  7. 這兩個參數是什麼意思:args,*kwargs?
  8. 統計以下 list 單詞及其出現次數。

a=['apple', 'banana', 'apple', 'tomato', 'orange', 'apple', 'banana', 'watermeton']函數

  1. 給列表中的字典排序:假設有以下 list 對象

alist=[{"name":"a", "age":20}, {"name":"b", "age":30}, {"name":"c", "age":25}]

將 alist 中的元素按照 age 從大到小排序。

  1. 寫出下列代碼的運行結果
a = 1
def fun(a):
  a = 2
fun(a)
print(a)
a = []
def fun(a):
  a.append(1)
fun(a)
print(a)
class Person:
    name = 'Lily'

p1 = Person()
p2 = Person()
p1.name = 'Bob'
print(p1.name)
print(p2.name)
print(Person.name)
  1. 假設有以下兩個 list:a = ['a', 'b', 'c', 'd', 'e'],b = [1, 2, 3, 4, 5],將 a 中的元素做爲 key,b 中元素做爲 value,將 a,b 合併爲字典。
  2. 使用 python 已有的數據結構,簡單的實現一個棧結構。

面試官提的問題

  1. 項目上遇到了哪些難點?如何解決?
  2. 數據如何去重,清洗,存入數據庫?
  3. 有一個升序後又降序的數組,好比 1356742,如何查找到 2 的位置。
  4. 如何查找到二叉樹兩個節點的最低公共祖節點?
  5. mysql 的序列都有哪些?
  6. 遇到哪些反爬機制?如何解決?

以上問題,你是否能所有答出來?

本文首發與公衆號「癡海」,後臺回覆「1024」,領取 2018 最新 python 教程。
癡海

相關文章
相關標籤/搜索