助力秋招-獨孤九劍破劍式 | 10家企業面試真題

時間 2019-11-06

原文原文鏈接

【聲明】本文由《大數據技術與架構》讀者提供，未經受權不得轉載。前端

5萬人關注的大數據成神之路，不來了解一下嗎？5萬人關注的大數據成神之路，真的不來了解一下嗎？5萬人關注的大數據成神之路，肯定真的不來了解一下嗎？java

騰訊

關鍵詞【Java基礎】【數據結構】【操做系統】node

【算法】【數據庫】【緩存】
複製代碼

自我介紹mysql

介紹一下你在項目中的承擔的任務linux

你對哪一種語言熟悉nginx

線程池使用過吧，說說線程池中有哪些關鍵字具體使用方法。git

說說hashMap 使用的是哪一種數據結構，web

說說hashMap 和 ConcurrentHashMap 的區別面試

爲啥hashMap是線程不安全的？ajax

鎖機制怎麼使用的？

如何查看linux 內存佔用狀況

如何在4億個數字中去重

快速排序的原理及實現

遞歸算法如何查詢

簡單介紹一下項目中引用Springboot是解決了什麼問題，有什麼優勢？

mybatis和hibernate框架有什麼區別？

使用muybatis有沒有用到om對象？

java語言中重寫和重載有什麼區別？

我看你用到kafka，kafka主要解決什麼問題呢?

kafka如何實現消息是有序的？

kafka如何實現多線程的消費？

hashmap和hashtable 有什麼區別？

簡單介紹一下java的生命週期有哪些階段嗎？

對數據庫瞭解嗎？一個場景，如今數據庫執行過長，如何對它進行優化？

簡單談一下數據庫中的悲觀鎖和樂觀鎖怎麼理解的？

說一下數據庫有哪些索引類型，有什麼優缺點？(主鍵索引)

談談數據庫的事務(ACID特性)

操做系統的劃分有哪些？

什麼是死鎖？死鎖產生有哪些條件？(互斥條件，請求與保持條件，循環等待條件，不可剝奪條件)

進程間通訊有哪些方式?（管道，信號量，信號，消息隊列，共享內存，套接字等方式）

tcp協議有哪些計時器？它分別是作什麼的？

操做系統之間有用戶態和內核態，他們之間有什麼區別？

爲何須要內核態？何時進入內核態？

有用過內存緩存嗎？如redis

redis是經過什麼方式進行持久化的？（RDB和AOP）

tcp協議的三次握手

https的協議瞭解嗎

介紹一下有哪些常見的算法，而且哪些是穩定的，哪些不穩定，以及時間複雜度

對雲計算有了解嗎？

好比雲計算有哪些服務和應用場景

AWS 瞭解嗎？

拆分子數組 leetcode 410

給定一個由非負整數和整數m組成的數組，能夠將數組拆分爲m個非空連續子數組

編寫算法以最小化這些m個子陣列中的最大總和

字節跳動

關鍵詞【Java基礎】【鎖相關】【設計模式】【算法】

自我介紹

介紹一下項目

MapReduce中容易發生數據傾斜，是怎麼產生的，如何處理？

Hive數據傾斜怎麼產生的？怎麼處理？

Spark 數據傾斜怎麼產生，如何處理？

大表和小表如何進行查詢？

說說HashMap？

hashMap使用什麼樣的數據結構？如何擴容？

hashMap線程安全嗎？和它對應的hashTable呢？

CurrentHashMap呢？

HashTable 和CurrentHashMap 的區別？

用過哪些設計模式？講講動態代理模式和單例模式

寫一下單例模式，在多線程狀況下呢？

設計一個棧，包含出棧，入棧，是否爲空等

求兩個大數相加，每一個數100位長度

介紹一下Spring及Springboot

Spring IOC如何解決循環依賴的問題？

有沒有產生過依賴A依賴B，B依賴C？

介紹一下Spring AOP

Spring AOP用的哪些設計模式？

JDK代理和CGlib代理有啥區別？

假如沒有接口，又含有final，如何使用動態代理。

沒有mybatis，如何寫dao層？

說一下沒有mybatis時，經過JDBC具體如何實現這個過程的？

瞭解java線程池嗎？

線程池在提交任務和執行任務時是怎麼作的？

建立線程池，當裏面的線程數量達到最大時，會出現什麼問題？

說一下ThreadLock?

說一下mysql的事務的隔離級別

講一下mysql的存儲引擎

mysql的索引有哪些？

實現一個鏈表反轉，設置一個步長，每隔幾回，鏈表進行反轉

設計一個hashMap，實現一個put方法

阿里巴巴

關鍵詞【變態】，對着圖譜問了一個遍？涉及到雲計算的我都沒畫到圖裏。

自我介紹

研究的課題以及培養方向

介紹一下你參與的項目

項目中有哪一部分是有技術難點的，以及技術架構是怎麼樣的?

50我的的併發量也很低，爲何會出現系統頁面數據顯示過慢?

那大家是怎麼解決那個頁面顯示速度過慢?

如何將多個部門的數據進行融合?

往系統中導入數據的時候會遇到什麼問題?

系統前端採用什麼作的?

導入時，進度條是經過什麼技術實現的?

返回前端是怎麼返回的?

前端機制，websocket有沒有了解

系統產生日誌文件，一天產生多少條?

怎麼用mapreduce處理日誌文件的?

從業務上說一下怎麼對日誌文件進行分區的，怎麼保存的?

用mapreduce處理日誌文件的任務，輸入是什麼，輸出是什麼?

處理日誌時，輸入是一個文本，要對他進行拆分，拆分的緯度是什麼緯度?

用hive怎麼對日誌文件進行多維度分析的?

關於網絡相關的問題

四層模型是哪四層，7層模型是哪7層?

鏈路層要解決什麼問題?

數據鏈路層的網絡地址用什麼表示?

三次握手和四次揮手?

四次揮手，斷開鏈接的時候，常常會出現time_wait的狀態，這個狀態是怎麼產生的?

TCP是在IP的上層仍是下層? 上層

TCP和UDP有什麼區別，以及用途

UDP典型的應用?

HTTP屬於哪一層協議 ?

HTTP底層是基於哪一層協議的?

HTTP和 HTTPS的區別?

說說對HTTP的協議有什麼瞭解?

HTTPS的安全體如今哪一個方面?

說說HTTPS協議關於CA證書這方面的瞭解

HTTPS傳輸時涉及到一些加密算法，有哪些瞭解，以及算法的應用場景好比RSA

對稱加密算法和非對稱加密算法的概念

HTTP協議的method有幾種

get和post的區別

web編程瞭解多少？

在前端提交請求時，cookie中常常有個jsessionid的cookie值，這個cookie值是用來幹嗎的?

服務器通常保存了一個session，瀏覽器爲何知道我屢次請求在一個session裏面，爲何能找到我以前的session

session機制

數據結構

說說樹的遍歷有深度遍歷(DFS)和廣度遍歷，通常怎麼實現

深度遍歷就是先序遍歷先序遍歷採用遞歸，

非遞歸須要用到棧，利用棧的先進後出特性

廣度遍歷就是層次遍歷，應該使用非遞歸，須要用到隊列，先將根入隊，隊列不空時pop,而後入左子樹，再入右子樹

排序算法都有哪些，以及他的時間複雜度

說說平衡二叉樹的特色

Java語言

說一下==和equals的區別？

爲何要重寫equals和hashcode()方法

靜態變量和靜態方法，和實例變量和實例方法有什麼區別?

子類不能重寫靜態方法

爲何要用靜態方法和靜態類

說下關於map以及他的實現類有哪些?

說一下hashmap,hashtable,currenthashmap的區別

常常在遍歷一個map時，在刪除時，常常會遇到併發錯誤

設計模式瞭解哪些，好比單例模式，工廠模式，動態代理模式

說說對垃圾回收機制的瞭解

垃圾回收機制的算法有哪些，初生代用哪些算法，老生代用哪些算法

如何判斷出哪些垃圾該清理，哪些不應清理?

數據庫方面的知識

說說內鏈接和外鏈接的區別

數據庫設計時會碰到一對多，多對多時，應該怎麼設計

就以用戶表和角色表爲例，假如用戶表裏面放着角色表的id做爲角色表的外鍵，那一個用戶對應多個角色，這樣設計會有哪些問題

機器學習方面的問題

監督學習和非監督學習有什麼區別？

springboot應該要接收前端ajax請求時，應該使用什麼註解

springboot中configuration的註解有什麼用?

分佈式集羣有哪些瞭解

nginx有哪些瞭解?

若是一個session在一臺服務器上保存，下一次session請求時，nginx反向代理把個人session請求轉發到另外一臺服務器上，這種狀況該怎麼處理?

微服務架構和一些容器的技術有什麼瞭解?

docker有什麼瞭解?

京東

關鍵詞：【Java基礎】【消息隊列】【緩存】【大數據組件】

自我介紹

int 佔幾個字節？其餘幾個數值型的分別佔幾個？

集合，常常用的組數和鏈表的有哪些？說說ArrayList 和LinkedList

說說HashMap

說說conCurrentHashmap?

線程用過嗎？在哪用的？

五條線程是怎麼設計的？

怎麼啓動一個線程？

瞭解反射嗎？說說反射？

用過Spring嗎？

爲何在配置文件中配置了，就能夠用？

用過redis嗎 redis都有哪些數據結構？

說說Hadoop?

說說HDFS的讀操做和寫操做

說說MapReduce

Hive的元數據，都有哪些？

用過kafka嗎？

寫一個單例模式

final 關鍵字

介紹一下volatile 關鍵字

介紹一下第一個大數據項目，用了哪些技術，畫一下架構圖

flume採集子系統日誌，這些日誌數據都包含哪些？

集羣是怎麼部署的？

分析使用什麼進行分析的？

系統分析的優勢和缺點都有哪些？如何改進一下？

實時計算了解多少？

祖龍娛樂

關鍵詞【變態】【對着圖譜問了一個遍】【涉及原理和源碼】

自我介紹

你本身搭過大數據集羣嗎？那你說說搭建hadoop集羣的3個xml文件

正常的hadoop集羣工做都會啓動哪些進程？

他們的做用分別是什麼？

你能詳細介紹一下secondaryNode 的具體做用嗎？

看來你掌握的還不錯啊，HDFS的塊默認是保存幾份？一個塊多大？

以前的64M 是從哪一個版本變換的？

那假設如今是128M，那我在工做中想把它調爲256M，那我須要調整什麼，才能改變塊的大小？

Hdfs的讀寫過程你瞭解嗎？簡單講講？

MapReduce的工做原理？

map中的一些步驟，例如partition,sort,combiner,shuffle等等。

數據傾斜通常是在Mapper端發生的仍是Reduce中發生的？

發生數據傾斜是由於這個key分佈不均勻，那你會怎麼優化呢？

Mapper端進行combiner以後，除了速度會提高，那從Mapper端到Reduece端的數據量會怎麼變？

map輸出的數據如何超出他的那個小文件內存以後，那他是落地到磁盤仍是落地到HDFS中？

Map到Reduce默認的分區機制是什麼？

hadoop的調優主要針對配置文件的調優你知道哪幾種？

1G的數據文件，裏面有四個字段，分別是id,name,age,class,而後要按照class來分組，id來排序，口述一下mapreduce的過程是怎麼實現的？這裏面會有幾個map?

說說yarn吧，它有什麼優點，能解決什麼問題？

說說Spark吧，Spark爲啥比Mapreduce運行塊，緣由都有哪些?

什麼是RDD？

你都知道哪些RDD算子？

reduceBykey 和groupBykey有啥區別嗎？

如今有一個業務，當SparkStreaming在消費kafka裏面的數據，而後消費了一段時間以後，程序掛了，當下一次程序啓動時如何保證SparkStraming能繼續消費kafka以前的位置?

還有什麼方式能夠保障按照位點消費？

說說Spark的廣播變量？

Spark累加器嗎？

你說說spark中 job,stage,task，分別表明什麼？

說說Spark的工做機制？

你瞭解zookeeper嗎？

說說zookeeper的選舉過程，好比如今有五臺機器，ABCDE依次啓動起來，那麼哪臺是leader？

hive瞭解嗎？

說說內部表和外部表的區別？

你知道UDF嗎？

一張大表，一張小表，你寫join in時，哪一個表放左邊，哪一個表放右邊？

問一下kafka的問題吧，kafka是怎麼進行數據備份的？

消費者是從leader中拿數據，仍是從follow中拿數據？

說說kafka的ISR機制？

kafka裏面存的數據格式都是什麼樣的？

kafka中存的一個是數據文件，一個是索引文件，說說這個？

kafka 是如何清理過時數據的？

一條message中包含哪些信息？

mysql的最左原則嗎？

說說抽象類和接口

集合瞭解吧，說說集合有幾大類,分別介紹一下？

hashMap頂層實現瞭解過嗎？具體講講

說說hashMap在1.8以後優化的環節

HashMap 和 hashTable的區別？

另外一個線程安全的是啥？

說說ConcurrentHashMap的底層實現

java實現多線程的方式有幾種？

講講 synchronized，Lock，ReetrantLock之間的區別

java的線程大概有幾種狀態？

sleep 和 wait方法的區別？

說說volatile關鍵字

說說JVM內存區域分爲幾大塊，分別講一下

說說sql的事務隔離級別

說說mysql的存儲引擎

給你出個sql 題

student(sid，sname,sex,class)course(cid,cname,teacher)grade(cid,sid,score)1.sex 改成age,非空，默認值爲02.統計035號課程分數大於036號課程分數的學生ID3.統計全部003班學生各門功課的課程名稱和平均分

多益網絡

關鍵詞【基礎】【算法】【JVM】

自我介紹

重大項目管理平臺介紹

你主要負責的是哪一塊內容？

項目最難的地方在哪？

開發週期多長？

說一下排行榜公佈的那個具體實現過程

團隊合做中遇到什麼問題？

對互聯網加班有什麼見解？

將一個組數循環右移，根據K來

斐波那契數列，不使用遞歸的方式實現

那你說一下java對象的生命週期

說一下java的垃圾回收機制，和算法等

什麼是遞歸？使用遞歸有什麼優勢和缺點？

說一下圖的表示方法

圖有什麼分類，圖論的分配法？

都有哪些排序算法？

哪些是不穩定的排序算法？

說說快速排序的原理？

順豐科技SP專場

關鍵詞【Java基礎】【Spring】【Mysql】【紅黑樹】

自我介紹

實習期間主要用的技術棧有哪些。（答java、spring、springMVC、mysql、gitLab、layui、easyui）

Spring主要的特色（提AOP和IOC），有啥好處？

說一下IOC

AOP的實現機制

動態代理 jdk方式與cglib方式

Spring中的事務具體怎麼作的？事務的傳播性。

Mysql的事務隔離級別

讀未提交與讀已提交的區別

mysql事務如何保證持久性（提到undolog和redolog）

寫這些日誌文件有什麼好處，爲何要先寫日誌文件而不是先作操做（面試官見我思考搶先答事務會追加到文件後邊再作操做效率高巴拉巴拉）

mybatis怎麼解決sql注入問題（提到#{}和${}）

mybatis的一二級緩存（二級緩存有些忘了）

springMVC處理流程

springMVC的好處在哪裏（答代碼解耦，面試官答：便於多人協做開發）

聊java基礎，集合類有哪些類？

說一下hashMap底層實現原理（數組加鏈表）

hashmap的擴容機制

說一下什麼叫哈希衝突

多線程線程池Executor框架了解麼，爲何要引入線程池

線程池保持線程存活時間的具體參數關鍵詞（答keepaliveTime）

任務隊列滿了之後再來一個任務如何處理(執行拒絕策略)

JUC包裏的東西，有哪些經常使用鎖（答Synchronized，reentrantlock，CAS等等，面試官答原子類等等）

原子類底層瞭解麼，好比AtomicInteger

轉操做系統，問操做系統有幾大模塊，

RPC進程通訊方式有哪些方式（答pipeLine，信號量）

聊網絡，網絡分層結構，大概每層的主要工做是什麼

網絡層的主要功能（答路由），運輸層TCP的主要核心（答可靠傳輸）

數據鏈路層最核心參數

聊經常使用算法，說一下hashmap的紅黑樹

紅黑樹上的紅節點主要是幹什麼的

紅結點和黑結點區別，爲啥是紅的，黑的

紅黑樹爲啥部分平衡。

紅黑樹怎麼旋轉？

字節跳動2

關鍵詞【算法狂魔】

一面：

簡短的自我介紹。

介紹個人項目，balabala講了大概20分鐘，中間穿插着細節提問，有業務方面的，有技術方面的。

說一下悲觀鎖與樂觀鎖。

說一下http和https的區別。

TCP和UDP的應用場景。

http請求頭包含哪些字段。

斐波那鍥數列了解麼？（瞭解）。

動態規劃相比遞歸來講有什麼優勢。

算法題，判斷鏡像二叉樹。（用遞歸寫得）

分析一下算法的時間複雜度，空間複雜度。

redis瞭解麼，如何進行redis頁面緩存。

項目中日誌是如何實現的。

項目中前端向後端傳數據是怎麼傳的。

hadoop的數據包是基於什麼協議的。

項目中登陸功能如何實現的，使用了哪些技術。

cookie和session的區別。

二面：

簡短的自我介紹。

簡單的問了下實習期間作的一個大數據平臺項目。

網絡五層。

應用層常見協議。

http協議返回狀態碼（1xx-5xx）（以前複習了2-5的，面試官說1呢？我說沒有1吧哈哈哈，後來想起了，尷尬）

Https有哪些改進。

數據庫優化方面（好比數據庫慢查詢），我回答了一大堆，起始面試官想問創建索引表的方式

索引的左對齊原則/最左原則（這個是真沒複習到），卡了很長時間，感受面試官有點不耐煩了...

算法，大概就是傳遞東西，只能向左右手邊傳遞，小朋友0向右傳遞，傳遞n次後最後回到小朋友手裏，問傳遞路徑，一個動態規劃問題

三面：手撕單例算法

單例模式中對象何時初始化

JVM構造

基本數據類型（好比int i）在內存中是怎麼存的

類對象何時加載的

static方法和非static方法的區別

static的原理

手撕：一個整數型數組，判斷是否存在一個數，這個數前邊的數比小，後邊的比它大，返回這個數的下標（使用標記數組作）ArrayList的屬性length存在與內存的什麼地方（哭死，這都什麼問題嘛....）

對這個算法如何優化，使它的空間複雜度變爲O（1）設計題：寫日誌類知足多線程向文件中寫日誌，設計一下須要實現哪些方法，說一下大概思路。

四面：

自我介紹

又把一面的項目講了一遍，balabala

將項目細節問了一些，好比排行榜的評分算法。

對於項目的多用戶高併發高訪問量的解決辦法。

橫向擴展系統（面試官問的Nginx負載均衡，說了半天才說到點上。。）

使用過哪些java框架。

實習項目：大數據平臺又介紹了一下。

集羣維護碰見了哪些問題，怎麼解決的。

如何使用HQL對Hive中數據進行處理。

從輸入url到頁面渲染中間過程，若是網絡距離太長，怎麼解決（我說使用路由器轉發，面試官說算了，不瞭解也無所謂？？？一臉懵逼....）。

java的GC算法。

聊了一下碩士期間的課題，我是推薦系統方面的，面試官跟我聊了一下電影推薦系統的系統設計，包括架構，推薦算法等等。

java零拷貝

linux操做：怎麼看應用的cpu使用率

順豐科技2

關鍵詞【基礎】【JVM】【後端】【Kafka】

自我介紹 (介紹完以後，面試官哈哈哈哈哈大笑，你這很熟練啊😏)

項目介紹

說一下垃圾回收和算法

說說Spring

Springboot和Spring的區別(本身加的，是怎麼簡化的，底層如何實現的)

redis數據結構，持久化方式

mybatis 如何獲取自增ID

mybatis 一二級緩存

設計模式工廠模式

大數據項目介紹

說說你對Kafka的理解

kafka的消費者組跟分區之間有什麼關係

kafka有5個消費者，4個分區，是如何消費

kafka的分區有哪些方式，分區算法

數據清洗的流程

數據清洗以後是落到哪裏，數據量大嗎

redis數據如何和mysql的數據保持一致

重大項目管理平臺講講

導出功能如何根據自定義功能導出

還有其餘什麼方式能夠實現導出功能

數據庫設計遇到什麼問題

集合中 arrayList 和linkedlist有什麼區別？

hashMap 說一下

hashMap 爲何設置初始化爲16

hashCode 怎麼對應桶的位置

concurrentHashMap有什麼特色

線程同步有哪些方法

線程同步使用哪些鎖

有一個場景，如今一張表有幾十萬的數據，而後10個線程，

對它併發計算，而後計算完了以後通知，該怎麼設計？(每一個線程處理每一個

線程的事情，而後作個通知)

說說分佈式鎖

SpringAop 用過嗎

JVM內存管理核心算法

浙江大華

關鍵詞【Java基礎】【多線程】【Hbase】【Spark】

自我介紹

SparkStreaming 如何保證消費kafka的數據不丟失等？

說說集合你瞭解哪些？

hashMap講講？

本身實現了一個對象，而後重載在hashcode方法,這個時候還要不要重載其餘方法？須要重寫hashcode 方法和equals方法

在多線程環境中，而後保證使用的對象時線程安全的？(經過加鎖)

虛擬機的堆內存分爲哪幾個區？

堆裏面主要幹什麼？

堆裏面能不能細分到哪些區？

不一樣的區使用的算法都是同樣的嗎？

springboot 和Spring的區別在哪？

Springboot是如何簡化哪些配置，具體是怎麼實現的？

(和SpringbootApplication 註解相結合，在main中經過調用run方法來加載監控任務執行時間，建立應用上下文，程序運行參數等相關配置)

本身都搭建過大數據集羣嗎？

如何搭建的集羣，舉幾個例子介紹一下？跑過哪些項目？

說說Spark的工做機制

說說Spark的合併操做

項目介紹，舉一個例子項目難點，如何解決。

分割數據使用什麼進行分割？

輸入的類型和輸出的類型分別是什麼？

輸出的結果存儲到哪裏？

那Hbase的表結構是什麼樣的？

表中的key是什麼，value是什麼？

你哪些原始日誌是哪哪塊採集過來的？

另外一個項目介紹一下，解決什麼難題？

數據庫優化作了哪些操做？

項目中使用了redis，如何操做的，爲何要使用redis？

怎麼解決雙寫一致性？

使用的用戶量是多大？

假如用戶量大的狀況下，那會出現哪些性能瓶頸？

redis的併發是多大?

項目中如何使用多線程？舉個例子

那累加的線程如何和其餘線程作交互的？

線程安全的容器有哪些？

java虛擬機裏面的垃圾回收機制有哪些？

項目中有沒有用哪些工具看過進程中有哪些線程，JVM內存的狀況。

阿里巴巴2

關鍵詞【按照圖譜來吧】【又廣又深】

自我介紹

說說垃圾回收和相應算法

那併發量很高時，使用哪一種算法？(複製算法)

介紹一下項目

那你在這個項目中最大的成就感是什麼？

那你開發項目主要的優點在哪？(怎麼感受不像是面試，在聊天，哈哈哈)

在網頁上輸入一個URL，說說它所經歷的過程(DNS尋址，TCP鏈接，Http請求，http響應，頁面渲染，TCP關閉鏈接)

不少服務器，那請求落到哪臺服務器上，是經過什麼策略？(經過nginx的ip_hash策略)

日常有沒有了解一些新知識(docker，springcloud)

hashMap實現原理

我的規劃

如今的技術薄弱點在哪裏，怎麼去突破

hash的實現機理是啥？他能帶來哪些好處？經過個人回答，他接着問，B+樹索引的核心在於什麼？咱們知道樹有不少種，爲何要選擇b+樹，而不選擇其餘？數據庫索引有不少種，哪種索引對應的是b+樹實現的？

Spark流式計算過程

Spark如何進行分桶

SparkStreaming 和MapReduce比較，提高的性能在哪？

SparkStreaming 的實時體如今哪？

簡單介紹一下單例模式

簡單介紹一下工廠模式

說一下代理模式和策略模式

JVM內存模型簡單介紹一下

哪些是線程私有，哪些是線程共有

哪一個不會發生內存溢出？

方法區產生內存溢出怎麼判斷？

類加載存在內存中的哪一塊？(類的元數據在方法區，class對象在堆區。)

垃圾回收的一些算法

年輕代，老年代分別用什麼算法？

建立一個線程有幾種方式？

怎麼啓動一個線程？

JDK裏面線程池的定義

多線程裏面，有什麼機制能夠保證線程安全？

voletile如何保證線程安全？

那使用voletile 有什麼缺點？

synchronized用到靜態方法和非靜態方法有什麼區別？(修飾靜態方法，

做用於當前類對象加鎖，修飾非靜態方法，做用於當前對象實例加鎖)

threadlocal瞭解嗎？講講這個

threadLocal 通常是怎麼區分的？不一樣的線程之間是怎麼隔離的？

滴滴

關鍵詞【大數據組件原理】【多線程】【NIO&RPC】

spark任務的執行流程

Spark任務調度有幾種方式？(任務是怎麼分配給executor)（調度算法）

Spark任務分配方式有幾種方式？

yarn的資源調度？

寬窄依賴具體講講

寬依賴是否是要進行shuffle

shuffle操做有幾種方式

Spark任務產生小文件太多，該怎麼處理？(合併小文件的方式有幾種)

(例如sql,函數，distrubutedBy)

hive如何實現UDF的詳細過程(客戶端繼承UDF類，而後打包 )

hive sql解析看過嗎？

Spark sql解析有哪幾個步驟？具體如何操做的(spark內核的sql解析)

(把sql如何拆成多個job)

線程的狀態有幾種？

等待有哪幾種方式？

經常使用的線程池有幾種？

定時的線程池有幾種？

Spingboot部署的時候用的哪一個容器，內部用的哪一個線程池？

多線程過程當中用過哪些鎖？

鎖主要分爲幾大類？

synchronized底層是怎麼實現的？和其它鎖有什麼區別？

Lock鎖講講 ReenTrandLock講講？怎麼優化這個重入鎖？(經過編譯器方式優化)

好比嵌套鎖嵌套了好幾層，編譯器如何優化這些代碼？

鎖優化有哪些方式？(鎖消除，增大粗度等）

鎖消除經過什麼參數能夠控制？

數據庫事務有幾種？(數據庫隔離級別)

事務的傳播機制？(7種)

事務嵌套開啓一個事務，用那種傳播機制？(required)

繼承上一個事務(使用support)

搭一個通訊框架(使用tcp) 用socket編程搭，客戶端、服務端等。

NIO瞭解過嗎？怎麼作的優化？分爲幾個階段？每一個階段是作什麼的？

RPC瞭解嗎？經常使用的RPC框架有哪些？(基於二進制協議的)如(dubbo)

任務調度有用過嗎？(使用springBoot如何快速建立一個定時任務（用一些組件）)

底層如何實現調度的？

蘑菇街

關鍵詞【阿里味】你懂的

自我介紹

說說JVM原理、內部分配

new對象的過程

new一個對象時是如何知道給它分配多大的空間？(JDK64位，建立一個對象佔24字節，32位佔12字節）

項目介紹

說說HDFS (跳躍很快啊)

HDFS寫操做

寫操做中如何判斷客戶端向哪一臺datanode中上傳第一個block塊。(經過就近原則)

那客戶端是怎麼經過距離來判斷哪臺datanode 離他近或者離他遠(看客戶端到達datanode

之間的網絡跳轉的次數來判斷，若是在同一個路由器下面，那距離都同樣，直連，只須要跳轉一次)

第二次上傳block塊根據什麼原則?（就遠原則，保證安全性，防止所有上傳到一個機架上，若是機器壞了，數據就會丟失等。）

場景題過濾出評論中的敏感詞

(想法1：經過正則表達式)

(想法2：布隆過濾器)

(想法3：經過和b+樹相似的字典樹(DFA算法)來實現，字典樹的每一個節點保存每一個字符，

那他所造成的路徑就表明一條一條的字符串，進行查詢時，若是匹配到敏感詞的字符串，那就過濾出去)。

Spring IOC、AOP底層實現

1Spring ioc中的單例模式和原型模式適用場景，何時用單例模式，何時用原型模式。

Spark(spark的內部構造，實現原理，解決了什麼問題，運用場景等)

MapReduce 設計時爲何要設計成 map,reduce的操做，它解決了什麼問題。

說說kafka的原理

服務端從kafka中去拉數據，服務端的空間永遠是有限的，拉完怎麼判斷全部人都拉完了？

歡迎掃碼關注個人公衆號，回覆【JAVAPDF】能夠得到一份200頁秋招面試題！

相關標籤/搜索

每日一句

每一个你不满意的现在，都有一个你没有努力的曾经。