一面:性能
1.講一下索引文件同步這項工做?測試
1.1隨機選定一臺機器執行定時任務時,如何避免單點故障?線程
1.2選定機器是先構建索引再更新本地索引文件仍是邊構建邊更新?orm
1.3當選定的機器構建新索引後沒有上傳oss,有處理方式嗎?(其餘機器沒辦法更新索引文件了)索引
1.4其餘機器從oss下載索引文件時的更新策略?(覆蓋更新仍是先下載再更新)進程
2.講一下用戶畫像這個項目。年齡、性別已是標籤了,大家還須要處理什麼嗎?同步
3.storm程序的基本組成(spout和bolt)?定時任務
3.1storm如何保證數據正確處理?下載
3.2ack機制中bolt1如何確認bolt2正確接受到了數據?程序
3.3如今有這樣一條處理鏈路:spout-->bolt1-->bolt2-->bolt3,一條數據過來,bolt2會等着bolt3發送ack後再bolt1發送ack仍是直接收到數據就發送ack?
4.flink性能測試是怎麼作的?結果?主要關注哪些特性?flink的容錯機制爲何就比storm好?
3.進程和線程的區別?
4.TCP協議中客戶端和服務端都會有哪些狀態?
5.scoket寫過嗎?