原文地址html
之前的學習,通常須要預先在肚子裏存儲下足夠的知識,必要時,就從海量的信息中提取所需的部分。可是,到了信息領域大大超出"四書五經"的新時期,預先無目的的吞下海量信息的學習方式就有些不合時宜了。如今通常是先知道要學什麼,而後有目的的去尋找答案,這種方式看上去更加有效率。git
不過知道學什麼而後去學習這種方式要求學習者擁有一個一應俱全的信息庫,以供隨時抽取各類目的信息;其次,是須要一個強勁的信息檢索工具,以便高效率的從信息庫中提取信息。很明顯,Internet能夠充當那個海量的信息庫,而搜索引擎,則正是尋找光明之火的絕好工具。程序員
相信用過瀏覽器的人都曾經在搜索框輸入某些關鍵詞,而後從瀏覽器返回的網頁中篩選本身須要的信息,這個過程就是搜索
。可是大部分人並不知道搜索引擎(Web search engine)的存在,並不知道google與baidu這兩大搜索引擎的區別,並不知道怎樣精確地搜索。github
搜索引擎其實就是從互聯網檢索信息的軟件系統,搜索引擎的基本工做原理包括以下三個過程:首先在互聯網中發現、蒐集網頁信息;同時對信息進行提取和組織創建索引庫;再由檢索器根據用戶輸入的查詢關鍵字,在索引庫中快速檢出文檔,進行文檔與查詢的相關度評價,對將要輸出的結果進行排序,並將查詢結果返回給用戶。shell
<!-- more -->
google搜索引擎的工做流程:express
你寫博客、或在Twitter上推微博、更新站點等諸如此類往Web上添加內容的操做小程序
Google bots程序(一種做爲搜索引擎構件的智能代理程序)抓取你網頁的title和description、keyword等內容segmentfault
一旦被Google爬蟲訪問到,網頁幾秒內就被索引了瀏覽器
Google基於連接評估域名和網頁的整體PageRank值網絡
檢查網頁以防止做弊行爲
在對頁面作了損害分析後,如今每一個頁面都有不少用於輔助用戶搜索的數據片(好比檢索關鍵詞)反向引用着它
用戶發出搜索請求
Google會用同義詞匹配與你的搜索關鍵詞語義相近的查詢結果
生成初步的查詢結果
對查詢結果集按權威性和PageRank進行排序,重複的查詢結果被剔除。
對查詢結果進行過濾處理
最終返回給瀏覽器端的用戶一我的性化的、佈局良好的、查詢結果和廣告涇渭分明的有機查詢結果頁面。
國內主要的搜索引擎就是百度了,大部分人用的也是它,不過據好多技術大牛說搜索仍是不要用baidu,用google是王道。我本人幾乎沒用過百度,由於我沒有用它的必要,google很好地完成了我想讓它作的。
關於吐槽百度的文章有不少,吐槽點主要有下面幾個方面吧:百度公司的很是濃重的商業化,搜索結果不好,有不少虛假廣告。陳皓的做環保的程序員,從不用百度開始寫的不錯,能夠看一下。
大多數時候咱們只是輸入兩三個關鍵詞而且以空格分開,而後開始搜索,這樣作搜索結果的命中率並不很好,要想獲得精確的搜索結果咱們須要更加高級的搜索技巧,固然這些技巧並不難。
搜索時過度經常使用的、單獨存在沒有意義的詞彙每每被忽略掉,好比冠詞"a"、"the";介詞"of"、"in"、"on"、"at"、"to";連詞"and"、"or"、"but";從屬連詞"that"、"which"、"when";代詞"my"、"his"、"them"……等等。要對忽略的關鍵字進行強制搜索,則須要在該關鍵字前加上明文的"+"號,另外一個強制搜索的方法是把關鍵字用英文雙引號引發來。由於被英文雙引號引發來,搜索引擎就強制搜索這一特定短語。其餘經常使用技巧以下:
另外還有減號(-)。好比,"the most imporant benefit of education" – "united states"
要求Google返回含有"the most important benefit of education"但不存在"united states"的文章。
另一個威力無窮的符號是星號(*)。Google支持通配符搜索,即搜索字符串中能夠包含星號(*),用來替代任意字符串。好比,想找歷史上"最怎麼樣的"老師的話能夠搜索most * teachers in history such as
。
還有一個運用至關靈活、常常帶來意外收穫的符號是波浪號(~)。把波浪號(~)加在某個單詞前面,是在告訴Google:除了給出的關鍵字以外,還要搜索與波浪號(~)後面的那個單詞相關的詞彙。
在指定網站中搜索的語法site:
。好比,"the purpose of education" site:http://www.time.com/
就是要求Google只返回http://www.time.com這個網站裏的含有"the purpose of education"的文章。
還有下面這些高級技巧:
filetype:
語法,在某一類文件中查找信息。好比要搜索幾個資產負債表的Office文檔搜索:資產負債表 filetype:doc OR filetype:xls OR filetype:ppt
inurl:
語法,搜索的關鍵字包含在URL連接中,"inurl"語法返回的網頁連接中包含第一個關鍵字,後面的關鍵字則出如今連接中或者網頁文檔中。不過"inurl:"後面不能有空格,Google也不對URL符號如"/"進行搜索
allinurl:
語法,"allinurl"語法返回的網頁的連接中包含全部做用關鍵字。
intitle:
和allintitle:
語法,搜索的關鍵字包含在網頁標題中。
link:
語法,搜索全部連接到某個URL地址的網頁。注意:"link"不能與其餘語法相混合操做,因此"link:"後面即便有空格,也將被Google忽略。link只列出Google索引連接很小一部分,而非所有。通常說來,作友情連接的網站都有類似地方。這樣,能夠經過這些友情連接,找到一大批具備類似內容的網站。
還有一些比較高級的用法,具體本身搜索去吧。
有時候經過搜索獲得的答案並不盡人意,這時候若是能在網上提出本身的問題,並有相關領域的人來回答該是多麼好的一件事啊。沒錯,確實能夠這樣作,至少在計算機行業能夠。目前IT方面最好的問答網站毫無疑問是StackExchange,它有至關多的子節點,上面的問答質量至關的高,不過是英文的,須要有必定的英文水平。
而在國內,IT行業的問答網站主要有SegmentFault,正在起步中,社區風氣也不錯。另外還有知乎,上面包含各行各業的話題,裏面回答的質量也是至關的不錯。
雖然說有這麼多好的問答網站,但在提問前必定要本身先搜索一番,不要輕易就去求人。只有當本身通過一番搜索仍沒法解決問題時,再去問別人。經過搜索,你能夠更加清楚本身的問題所在,也能更加明白地描述你的問題。提問時,還能夠加上本身已經搜索到的一些結果,供回答問題者參考。
提問也沒有那麼簡單,關於如何提問能夠參考智慧的提問以及什麼樣的問題是一個好問題,這裏簡單的總結一下(固然是IT行業的,其餘行業能夠借鑑這裏或者自行搜索):
有錯誤的必定要把錯誤碼都貼出來,產生錯誤的那一段程序代碼也要一併提供,須要作錯誤重現,你本身的一些嘗試,很重要,避免其餘人浪費時間。
討論性的問題必定要說出你本身的觀點。
表述要清晰,不止語義清晰,另外文字排版也要清晰明瞭,便於閱讀。
不要大喊大叫、不要抱怨、語氣請低調、尊重他人。
固然問答網站不僅是用來問問題的,你也應該積極地去回答本身熟悉的相關領域,這樣才能豐富社區知識,提升社區質量。固然了,回答問題也是有學問的,能夠參考How To Be A Good Guru,這裏有中文版的。
簡單總結一下回答的要求:
不要回答你不知道答案的問題;
先解釋給本身(若是本身是提問者,你的回答是否能讓本身明白?)
授人以漁,只提供最低限度的幫助
展現你的操做過程
有分寸地使用幽默
若是你不能說出有用的信息,就別說
避免使用術語、難懂的縮寫和俚語
永遠不要用"RTFM"回覆。RTFM:Read The Fucking Manual",去讀該死的手冊。另一個常見的是: STFW:Search The Fucking Web,搜索該死的網絡,或者友好一點的"Google 一下"。
回答要深思熟慮
保持一顆新手的心
搜索和問答每每只是獲取碎片化的知識,要想創建系統化的認識,至少要認真地上完一門課而後慢慢創建本身的認知體系。之前只能經過學校系統地學習,而如今網絡課堂的興起無疑下降了學習的成本,提供了諸多方便。
如今網上公開課領軍的三駕馬車是Coursera,Udacity和EdX,固然必須所有是國外的公開課。在國內相對不錯的公開課有網易公開課,多貝公開課等。
發現果殼作了一個MOOC學院,不錯的mooc導讀網站,若是沒有心儀的課程,能夠如今這裏隨便瀏覽一下。
update: August 20, 2014
公開課有傳統學校課堂沒法比的優勢,好比若是在學校你纏着老師講上3遍,或者讓老師等一下讓你和同窗們討論一會,那你必定會把老師逼瘋。而在網上聽課,則能夠爲所欲爲地"折磨"老師:拖動滾動條,讓老師氣喘吁吁地一路小跑,或者讓他把那一小段說上一百次。最重要的,你可讓老師隨時"閉嘴",拿起紙筆,本身推導一下,甚至編個小程序試試。若是作對了會很開心,若是沒作對,發現錯在哪,不也很開心嗎?把被動地聽,轉換成主動地發現,學到了,你就是贏家。
關於公開課的學習這裏提供幾個資源:
其實上面的幾個資源只不過是我在知乎上面搜了網絡公開課
,而後挑選的結果,強大的搜索會讓你找到你想找到的資源。
選一門本身喜歡的課,聽下去,就這麼簡單。
另外,TED裏的演講也不錯,不少經典。能夠批量的下載TED或者網絡課程的資源,具體能夠看陽志平的文章Mac入門筆記(6):優質課程。
update: August 30, 2014
當你學會了搜索,學會了提問與回答,而且認真聽了課程,確實知道了不少以後,那麼你還想作什麼呢?我想作的就是分享!
得益於如今強大的社交網絡平臺,分享變得如此之簡單。咱們能夠分享本身的小做品或者是學習總結之類的。分享的目的在於傳播,在於交流,固然也能夠得到一些"讚美"、"威望"。
其實分享也是一個測試的過程,讀你文章的人越多,測試就越完全。再讀你文章的時候,讀者能夠提出本身的疑問,而你可能就須要對文章的某部分作進一步的解釋,或者發現本身文章中的不當之處。
經過社交網絡你能夠關注有共同愛好的人,讀他們的文章,盡情的和他們交流,這是多麼一件美妙的事呢!!
在這個信息氾濫的時代,要想獲取高質量的文章,須要有一雙"火眼金睛",還須要有強大的工具金箍棒。
要想有"火眼金睛",必需要有足夠的閱讀量。你須要讀至關多的文章,而後從中篩選出高質量的文章。而後就須要使用金箍棒了,這裏金箍棒就是google reader
(惋惜的是,立刻要關閉了,我至今沒找到能夠替代的閱讀器呢)。咱們能夠把高質量的博客或者站點交給google reader,這樣就能夠獲取最新的文章。
至於用reader的好處,說不出來的,你用上一段時間就知道了。能夠透漏的是,經過google reader我知道了許多。
目前(update: 2014.8)來看最好的訂閱器無疑是feedly,不過因爲衆所周知的緣由,國內訪問不了(也不算訪問不了,只不過得花點錢訪問而已)。不過Android上面有一款應用press,能夠把feedly訂閱的文章導進去。mac上的應用Reeder聽說能夠流暢的訂閱文章,只是要收費而已。你看,花錢買服務是王道啊。
如你所見,本文的好多方面也是我經過搜索得到的,因此,盡情去搜索,去探索未知的世界吧。
Google搜索引擎的工做原理
Google搜索從入門到精通
搜索筆記
MOOC:更好和更時髦的教育系統
在Coursera,隨時都是學習的好時候