AWS雲計算平臺工做使用中的心得

筆者目前所在公司的海外業務平臺因爲牽涉到多機房布點和成本的考慮,目前基本上採用的是AWS雲計算平臺,產品線涉及到了EC2/EBS/S3/Redshift等,目前平臺已經穩定運行幾年了,在使用過程仍是有很多心得和感想的,特意作了些總結跟你們一塊兒分享下,對AWS有興趣的同窗也能夠關注下。做爲一個資深運維,熟悉各類雲計算平臺,但仍是對AWS強大的控制檯功能仍是很驚異的,控制檯提供的功能是很是強大的,小到系統的AMI鏡像備份恢復,用戶的IAM權限分配,而後Instance機器種類和外置磁盤EBS的選型,大到分佈式S3的文件存儲功能,AWS強大的控制檯都提供了相應的功能。若是不喜歡用圖形界面操做的話,喜歡自動化運維的同窗,AWS也提供了強大的BOTO3接口(基於Python),同窗們也能夠利用Python腳原本進行相關的服務器後臺程序開發工做。ios

 注:經過適用於 Python AWS 開發工具包 boto3 快速開始使用 AWSBoto3 能夠支持您輕鬆將Python 應用程序、庫或腳本與 AWS 服務進行集成,包括 Amazon S3Amazon EC2 Amazon DynamoDB 等。(建立AWS免費賬戶git

 

另外,AWS控制檯有些功能是很是人性化的,好比我經過控制檯購買了一年的c3.xlarge4 vcpu+ 7.5內存)預留實例(預留實例是一種比較節約的計費方式,一般爲以年爲計費單位,比單獨購買通常要便宜35%左右),但在使用過程過程當中,我發現業務量不須要c3.xlarge這樣高性能的機器,那咱們能夠經過修改預留實例的方式,將其分離成2臺性能稍弱的c3.large,這樣剝離出來的一臺c3.large機器就能夠多出來跑別的業務了。github

 

另外,AWS的產品線是很是豐富,經過控制檯咱們就能看到,各類各樣的產品都在列表內,你們能夠根據工做需求來取捨。咱們通常用得比較多的有EC2AWS雲主機)、Route53DNS)、CDNElastic Load Balancing AWS負載均衡)、S3/Glacier(雲存儲)、數據庫產品有RDSRedshiftNoSQLDynamonDBElasticMapReduceHadoop計算框架)等等,AWS的產品線是很是豐富的,甚至能夠說,咱們工做中產生的業務需求,頗有可能就能經過AWS的產品來實現。經過AWSEMR服務來實現工做中的Hadoop/Spark來進行海量離線業務日誌的處理和分析,是一件很是容易和輕鬆的事情,事實上,這部分的工做是徹底不須要運維人員來參與的。數據庫

 

另外,事實上,AWS雲計算平臺進行彈性擴容是一件很是容易和方便的事情,拿咱們的業務平臺來講,在上線前期,因爲宣傳及商務談判等緣由,入口流量及用戶數都比較少,這個時候平臺很穩定,總體系統負載及QPS都比較低,但隨着後期商業談判的成功,入口流量及用戶都愈來愈多,系統負載、QPS都偏高,機器還常常出現了CPU利用率達到100%的狀況。這個時候咱們能夠經過調用AWS API接口來實現彈性擴容,包括主機的分配、流量的分配、IP的綁定、域名解析的配置,還有存儲服務等,這部分的工做若是作成自動擴容也是比較容易實現的,咱們能夠經過Ansible自動化配置管理工具或Python語言自行開發。事實上,爲了節約費用,不少時候咱們能夠考慮開啓更便宜的Spot Instance(比Instance實例收費便宜多了,但公網IP不固定,因爲採用的是競價模式,很容易被別人買走)。另外,後續的工做咱們仍是要在工做中考慮到,好比說某項業務量降下去之後,咱們再也不須要那麼多機器了(AWS是以Instance實例實際使用的小時數來收費的,咱們關閉機器之後AWS就再也不收費了),咱們應該如何在不影響業務穩定性的前提下來減小機器數量從而起到節約成本的做用呢,這些都須要咱們在實際的開發工做中考慮到。服務器

 

另外,在實際使用工做中咱們也發現,AWS平臺目前也仍是存着一些問題的,這些也應該是咱們在使用過程注意的地方:架構

1、有段時間,美國西部的機器由於亞馬遜硬件升級的緣由,不斷的要進行業務遷移的工做,事實上若是是某個集羣內的機器的話倒沒什麼影響,若是機器上面正跑着重要核心業務的話,對總體系統仍是很是有影響的;併發

2、使用中有機器仍是有重啓的狀況,還發生過機器失聯的狀況,固然了這種狀況並很少見,一年中咱們也只發現了兩起,就是沒有任何郵件通知的狀況下,機器發生了失聯狀況;負載均衡

3、亞馬遜自帶的監控功能或產口還不是很強,因此咱們仍是須要本身配置nagioszabbix監控服務,並針對業務需求來開發插件;框架

4、預留實例的出售是一件比較麻煩的事情,比較好買,但感受很是難出售,因此筆者每次購買預留實例會很是當心謹慎。運維

5、AWS的賬單功能仍是挺完善的,但也可能會產生誤收費的狀況,這個時候須要英語口語或郵件溝通,通常狀況下AWS會退款的。

 

雖然AWS雲計算平臺或多或少的存在些問題,但整體來講並不會影響咱們業務系統的總體性能和穩定,咱們可以在節約成本的前提下,可以很是方便的進行擴容工做和Hadoop/Spark數據計算,在全球部署本身的數據中心,這些工做因爲使用了AWS平臺感受操做起來很是簡單方便,感謝AWS提供了這麼些偉大的產品,預祝其越作越好。 (聯繫AWS專家


筆者簡介

餘洪春(撫琴煮酒)運維架構師、高級運維開發工程師,《構建高可用Linux服務器》、《Linux集羣和自動化運維》做者,ChinaUnix論壇「集羣和高可用」及「監控及自動化運維」版版主。從事雲計算和電子商務網站運維工做10多年,在Linux集羣、自動化運維、雲計算及高併發高流量網站架構設計等方面進行了深刻的研究,在大量一線實踐中積累了豐富的經驗。精通負載均衡高可用和自動化運維技術,擅長高併發高流量網站系統架構設計。

相關文章
相關標籤/搜索