一文帶你領略虛擬化領域頂級技術會議KVM Forum 2018

KVM Forum是由Linux基金會組織的高端技術論壇會議,主要爲社區各個維護者,開發人員,和用戶提供一個討論Linux虛擬化技術發展趨勢以及挑戰的交流場所。參會人員都集中在KVM虛擬化相關領域,是KVM社區最爲重要和權威的大會。算法

概述安全

2018年度的KVM Forum於10月24-26日在英國愛丁堡召開。本次會議吸引了衆多技術專家參與會議。同時,參會公司彙集了各家雲廠商以及Red Hat、Intel、IBM、AMD等系統和硬件廠商。性能優化

先來看看KVM Forum的超高人氣。網絡

第一天的keynote被圍得風雨不透。框架

滿滿當當的就餐區機器學習

本屆大會總共有51個主題演講,覆蓋虛擬化各個領域,好比:熱遷移、嵌套虛擬化、ARM虛擬化、設備直通、輕量虛擬化、安全及性能優化等方面。性能

熱門議題學習

從議題數量和現場效果來看,如下三個領域比較受到關注:測試

  1. 嵌套虛擬化
  2. 虛擬化性能優化
  3. 熱遷移

嵌套虛擬化 
簡單來講,嵌套虛擬化就是解決如何在虛擬機裏嵌套運行虛擬機的問題。做爲近期新起的熱門話題,嵌套虛擬化相關演講在本次KVM Forum上多達4個。優化

會議介紹了半虛擬化(para-virtualization)VMCS,半虛擬化MSR-bitmap和時鐘優化方面的技術,能夠提高嵌套時vCPU之間的切換性能,幫助KVM更好地運行在虛擬機裏。

另外,會議還涉及了嵌套虛擬化的中斷虛擬化性能優化,以及嵌套虛擬化對PowerPC處理器的支持。

能夠看到,嵌套虛擬化技術在商用中初步取得了必定的成果,但在安全性上帶來的挑戰仍然是你們提問的熱點。

虛擬化性能優化
事實上,虛擬化的性能優化在近幾年的KVM Forum中都比較受關注。在去年的大會上,阿里雲高級技術專家張揚就對消息傳遞類業務在KVM上的性能比較差的問題,虛擬時鐘開銷的問題,以及消息中間件在KVM看到的性能降低等問題提出過有效的解決方案。

這次,相關的演講涵蓋了vCPU優化,內存優化,和I/O優化。vCPU優化包含了半虛擬化(para-virtualization)方面的優化,如PV TLB shootdown,PV IPI性能優化;內存優化涉及了virtio-mem引入半虛擬化接口,支持內存熱插拔等等;I/O優化介紹了vHost Virtio-net 網絡接收隊列的零頁拷貝(zero copy)。

熱遷移
彈性調度和動態伸縮是雲技術的核心特性。然而,它們都很是依賴底層熱遷移的技術性能完善。同時,經過熱遷移還能夠很大程度下降物理故障對客戶的影響。在本屆大會上,熱遷移相關的演講所有人氣高漲。

在過去的一年,阿里雲虛擬化團隊對熱遷移領域大量投入,得到了大量寶貴的經驗。本次參會的3個議題也全都關於熱遷移。在此,咱們爲你們展開詳細介紹。

阿里雲在KVM Forum 2018

今年的KVM Forum,熱遷移的相關主題演講一共有五個,阿里雲佔了其中之三。

《Cloudatlas: Ways to Make Live Migration Easy and Expectable》 
演講者:阿里雲高級技術專家 張超;阿里雲技術專家 謝峯


阿里雲高級技術專家 張超

阿里雲技術專家 謝峯

如何平衡熱遷移資源佔用與性能開銷,同時最小化熱遷移對客戶的業務影響,是全部公有云廠商都面臨的挑戰。阿里雲創新性地利用機器學習的方法來預測熱遷移的代價以及虛擬機的負載,從而肯定一個合理的熱遷移的時機和策略,最終提高遷移成功率以及下降熱遷移對用戶的影響。

阿里雲虛擬化團隊設計了一個完備的系統來執行熱遷移任務的執行。在演講中,提到了機器學習算法部分,阿里雲使用FFT來判斷是不是週期性負載VM,並對週期性負載VM算出週期而後進行預測,對於沒有明顯週期性負載的VM,團隊採用ARIMA和LSTM兩個時間序列模型來作迴歸預測,經過以上三種算法的結合能夠快速並準確地預測出95%以上VM在將來24小時的負載趨勢,從而找到一個最優的遷移時間。

本次演講涉及了大量的算法研究,現場聽衆對使用案例、方案原理、預測效果等很是細節的實現問題進行了進一步的提問。有一位行業專家現場說:這是真正在解決公有云廠商關心的問題。

《A Perfect Solution for Live Migration with Pass-through Devices》
演講者:阿里雲技術專家 徐權

該演講直擊了現有直通設備熱遷移的問題:即如何傳輸設備DMA的內存和如何保存和恢復設備的狀態。

阿里雲技術專家 徐權

演講深刻分析了現有的一些方法和存在的問題。好比Intel在82599網卡上,在虛擬機內部設備驅動引入self emulation layer,模擬設備DMA寫操做,和恢復保存設備狀態。但因爲特定的設備驅動才能工做,並且設備自己設計的缺陷(寄存器只讀,在恢復中沒法100%恢復),並不能很好地解決問題。而若是重新的硬件和設備驅動的角度切入,在成本投入上是巨大的,並且增長了軟件的維護成本。

阿里雲擴展了virtio硬件的功能,如感知虛擬機熱遷移,提供設備bitmap記錄設備DMA訪問內存,以及設備全部的寄存器可以動態地保存和恢復,同時修改現有的熱遷移和VFIO軟件框架。這樣能最大限度地利用現有設備驅動,很好地支持Windows和Linux虛擬機,並不須要單獨維護各個版本的設備驅動,大大下降了成本。

演講結束後,現場有十幾位專家的技術提問。會後徐權還和Linux 社區VFIO maintainer Alex Wiliamson屢次討論如何改進現有的VFIO來支持直通設備熱遷移的通用框架。

《Live Migration Support for GPU with SRIOV: Challenges and Solution》
阿里雲與AMD聯合演講,阿里雲演講者:阿里雲高級技術專家 鄭曉

GPU的熱遷移支持是業界的難點。首先,GPU硬件的調度與上下文切換是以millisecond 爲單位的,是CPU的好幾個數量級,由此會引起GPU任務的搶佔問題。再者,GPU在雲計算領域的拓展是最近幾年出現的熱點,而GPU硬件自己對於虛擬化熱遷移的支持還沒有完善,好比GPU對local memory的dirty track,對non local memory的dirty track的硬件支持等。這些都爲GPU的熱遷移帶來不少挑戰。

阿里雲高級技術專家 鄭曉

演講中提到了GPU 任務在遷移途中的時效性,搶佔問題,好比GPU硬件自己在還沒有支持framebuffer dirty track的時候,如何經過hypervisor的措施,經過系統軟件的方法來彌補,以及GPU自己上下文的切換須要處理的細節等等。

全部上面提到的問題在阿里雲與AMD聯合開發的第一天就開始考慮與設計。其中有衆多獨有的創新點。例如,在某些型號GPU硬件不支持dirty track的時候,經過軟件的方式來跟蹤GPU的Framebuffer dirty page;在Service downtime等關鍵性能指標不符合預期的時候,如何把數據從6秒優化到了0.35秒左右;功能方面,從單機遷移完善到多機多卡遷移;在穩定性方面,從一開始的作一次就宕機,到後續連續上千次的壓力測試……

此外,演講還加入了現場的Live Demo,從使用體驗上面來講,已經能夠作到GPU渲染任務的流暢遷移。

該演講獲得了高度關注。會後,部分頂級硬件廠商還與演講者詳細討論了更多的熱遷移細節和性能指標。

小結

參加完本次KVM Forum,咱們深入感受到,如何解決實際生產環境中碰見的現實問題,正受到業界愈來愈多的重視。

經過參會,促進了咱們和虛擬化業界的交流,也讓團隊獲取了大量信息和寶貴經驗,這些均可以幫助咱們更好地提高,而且不斷打磨提高彈性計算產品的底層能力。

原文連接

相關文章
相關標籤/搜索