https://ai.google/research/people/jeff/正則表達式
上面有他的不少論文和ppt
很不錯算法
我於1999年中期加入Google,目前是研究小組的Google高級研究員,負責Google Brain項目。我感興趣的領域包括大型分佈式系統,性能監控,壓縮技術,信息檢索,機器學習在搜索和其餘相關問題中的應用,微處理器體系結構,編譯器優化以及新產品的開發,這些新產品以新穎有趣的方式組織了現有信息。方法。在Google期間,我從事如下項目:
Google廣告服務系統初始版本的設計和實現。
咱們五代爬網,索引和查詢服務系統的設計和實現,涵蓋了搜索文檔數量,每秒處理的查詢數量以及系統更新頻率的兩個和三個數量級的增加。我最近在WSDM'09上發表了有關構建大型檢索系統(幻燈片)的一些問題的演講。
Google的AdSense內容廣告產品的初步開發(涉及生產服務系統的設計和實施,以及基於頁面內容開發和提升廣告選擇質量的工做)。
協議緩衝區的開發,一種以有效但可擴展的格式對結構化數據進行編碼的方法,以及一種可生成方便的包裝器以使用多種語言處理對象的編譯器。Google幾乎在全部RPC協議中普遍使用協議緩衝區,並在各類持久性存儲系統中存儲結構化信息。協議緩衝區實現的一個版本已開源,可從http://code.google.com/p/protobuf/得到。
Google新聞產品的某些初始生產服務系統能夠與克里希納·巴拉特(Krishna Bharat)合做,將他組裝的原型系統移至已部署的系統中。咱們的搜索排名算法的某些方面,尤爲是改進了處理諸如錨文本之類的頁面外信號的處理。
咱們第一代用於管理機器集羣的自動化做業調度系統的設計和實現。
快速開發和試驗新排名算法的原型基礎架構的設計和實現。
MapReduce的設計和實現,該系統可簡化大規模數據處理應用程序的開發。關於MapReduce的論文出如今OSDI'04中。
BigTable的設計和實現,BigTable是在許多Google產品之下使用的大型半結構化存儲系統。關於BigTable的論文發表在OSDI'06中。
Google Translate(咱們的統計機器翻譯系統)的一些生產系統設計。特別是,我設計並實現了一個用於分佈式高速訪問很是大的語言模型(太大而沒法容納在一臺機器上的內存)的系統。
一些內部工具可簡化快速搜索咱們內部源代碼存儲庫的過程。這個內部工具產生的許多想法都整合到了咱們的Google代碼搜索產品中,其中包括使用正則表達式搜索大量源代碼的功能。
用於大規模培訓和部署深度學習模型的兩代系統的設計和實現:DistBelief和TensorFlow。TensorFlow如今是一個開源項目,託管在GitHub上。架構