大概4月,Flink1.13就發佈了,參加 了Flink1.13 的Meetup,收穫仍是挺多,從大的方面講就是FlingSql的改進和優化,資源調度管理方面的優化,以及流批一體Flink在運行時與DataStream API的優化,另外就是State backend 模塊的優化,本篇文章既是當時作的筆記,又是在後續查閱官網等作的補充,html
Flink 的一個主要目標取得了重要進展,即讓流處理應用的使用像普通應用同樣簡單和天然。Flink 1.13 新引入的被動擴縮容使得流做業的擴縮容和其它應用同樣簡單,使用者僅須要修改並行度便可。react
這個版本還包括一系列重要改動使使用者能夠更好理解流做業的效能。當流做業的效能不及預期的時候,這些改動能夠使使用者能夠更好的分析緣由。這些改動包括用於識別瓶頸節點的負載和反壓視覺化、分析運算元熱點程式碼的 CPU 火焰圖和分析 State Backend 狀態的 State 存取效能指標sql
在剛剛發佈的 1.13 版本中,Flink SQL 帶來了許多新 feature 和功能提高,在這裏圍繞 Winddow TVF,時區支持,DataStream & Table API 交互,hive 兼容性提高,SQL Client 改進 五個方面apache
flip-145 window tvfapi
window 性能優化緩存
flip-162時區分析性能優化
flip-163 改進sql-client,hive兼容性網絡
flip-136 加強datastrem 和 table的轉換架構
Flink 1.13 新增了被動資源管理模式與自適應調度模式,具有靈活的伸縮能力,與雲原生的自動伸縮技術相結合,可以更好地發揮雲環境下彈性計算資源的優點,是 Flink 全面擁抱雲原生技術生態的又一重要里程碑。本次議題將對 Flink 1.13 中的被動資源管理、自適應調度、自定義容器模板等新特性,我以爲這個的擴展才是Flink這次版本特別重要的一個feature函數
在 1.13 中,針對流批一體的目標,Flink 優化了大規模做業調度以及批執行模式下網絡 Shuffle 的性能,從而進一步提升了流做業與批做業的執行性能;同時,在 DataStream API 方面,Flink也正在完善有限流做業的退出語義,從而進一步提升不一樣執行模式下語義與結果的一致性
api下面的shuffle架構實現
更多能夠查看Flink官網 https://ci.apache.org/projects/flink/flink-docs-release-1.13/release-notes/flink-1.13/
參考部分:https://tw511.com/a/01/34869.html
吳邪,小三爺,混跡於後臺,大數據,人工智能領域的小菜鳥。
更多請關注