国产一级一区二区_segui88久久综合9999_97久久夜色精品国产_欧美色网一区二区

掃一掃
關注微信公眾號

運維 | 美團數據庫智能運維探索與實踐
2018-12-17   美團技術團隊

從自動化到智能化運維過渡時,美團DBA團隊進行了哪些思考、探索與實踐?本文根據趙應鋼在“第九屆中國數據庫技術大會”上的演講內容整理而成,部分內容有更新。

背景

近些年,傳統的數據庫運維方式已經越來越難于滿足業務方對數據庫的穩定性、可用性、靈活性的要求。隨著數據庫規模急速擴大,各種NewSQL系統上線使用,運維逐漸跟不上業務發展,各種矛盾暴露的更加明顯。在業務的驅動下,美團點評DBA團隊經歷了從“人肉”運維到工具化、產品化、自助化、自動化的轉型之旅,也開始了智能運維在數據庫領域的思考和實踐。

數據庫智能運維探索與實踐

本文將介紹美團點評整個數據庫平臺的演進歷史,以及我們當前的情況和面臨的一些挑戰,最后分享一下我們從自動化到智能化運維過渡時,所進行的思考、探索與實踐。

數據庫平臺的演變

我們數據庫平臺的演進大概經歷了五個大的階段:

數據庫智能運維探索與實踐

第一個是腳本化階段,這個階段,我們人少,集群少,服務流量也比較小,腳本化的模式足以支撐整個服務。

第二個是工具化階段,我們把一些腳本包裝成工具,圍繞CMDB管理資產和服務,并完善了監控系統。這時,我們的工具箱也逐漸豐富起來,包括DDL變更工具、SQL Review工具、慢查詢采集分析工具和備份閃回工具等等。

第三個是產品化階段,工具化階段可能還是單個的工具,但是在完成一些復雜操作時,就需要把這些工具組裝起來形成一個產品。當然,并不是說這個產品一定要做成Web系統的形式,而是工具組裝起來形成一套流程之后,就可以保證所有DBA的操作行為,對流程的理解以及對線上的影響都是一致的。我們會在易用性和安全性層面不斷進行打磨。而工具產品化的主要受益者是DBA,其定位是提升運維服務的效率,減少事故的發生,并方便進行快速統一的迭代。

第四個是打造私有云平臺階段,隨著美團點評業務的高速發展,僅靠十幾、二十個DBA越來越難以滿足業務發展的需要。所以我們就把某些日常操作開放授權,讓開發人員自助去做,將DBA從繁瑣的操作中解放出來。當時整個平臺每天執行300多次改表操作;自助查詢超過1萬次;自助申請賬號、授權并調整監控;自助定義敏感數據并授權給業務方管理員自助審批和管理;自定義業務的高峰和低峰時間段等等;自助下載、查詢日志等等。

第五個是自動化階段,對這個階段的理解,其實是“仁者見仁,智者見智”。大多數人理解的自動化,只是通過Web平臺來執行某些操作,但我們認為這只是半自動化,所謂的自動化應該是完全不需要人參與。目前,我們很多操作都還處于半自動化階段,下一個階段我們需要從半自動過渡到全自動。以MySQL系統為例,從運維角度看包括主從的高可用、服務過載的自我保護、容量自動診斷與評估以及集群的自動擴縮容等等。

現狀和面臨的挑戰

下圖是我們平臺的現狀,以關系數據庫RDS平臺為例,其中集成了很多管理的功能,例如主從的高可用、MGW的管理、DNS的變更、備份系統、升級流程、流量分配和切換系統、賬號管理、數據歸檔、服務與資產的流轉系統等等。

數據庫智能運維探索與實踐

而且我們按照邏輯對平臺設計進行了劃分,例如以用戶維度劃分的RDS自助平臺,DBA管理平臺和測試環境管理平臺;以功能維度劃分的運維、運營和監控;以存儲類型為維度劃分的關系型數據庫MySQL、分布式KV緩存、分布式KV存儲,以及正在建設中的NewSQL數據庫平臺等等。未來,我們希望打造成“MySQL+NoSQL+NewSQL,存儲+緩存的一站式服務平臺”。

挑戰一:RootCause定位難

即便我們打造了一個很強大的平臺,但還是發現有很多問題難以搞定。第一個就是故障定位,如果是簡單的故障,我們有類似天網、雷達這樣的系統去發現和定位。但是如果故障發生在數據庫內部,那就需要專業的數據庫知識,去定位和查明到底是什么原因導致了故障。

數據庫智能運維探索與實踐

通常來講,故障的軌跡是一個鏈,但也可能是一個“多米諾骨牌”的連環。可能因為一些原因導致SQL執行變慢,引起連接數的增長,進而導致業務超時,而業務超時又會引發業務不斷重試,結果會產生更多的問題。當我們收到一個報警時,可能已經過了30秒甚至更長時間,DBA再去查看時,已經錯過了最佳的事故處理時機。所以,我們要在故障發生之后,制定一些應對策略,例如快速切換主庫、自動屏蔽下線問題從庫等等。除此之外,還有一個比較難的問題,就是如何避免相似的故障再次出現。

挑戰二:人力和發展困境

第二個挑戰是人力和發展的困境,當服務流量成倍增長時,其成本并不是以相同的速度對應增長的。當業務邏輯越來越復雜時,每增加一塊錢的營收,其后面對應的數據庫QPS可能是2倍甚至5倍,業務邏輯越復雜,服務支撐的難度越大。另外,傳統的關系型數據庫在容量、延時、響應時間以及數據量等方面很容易達到瓶頸,這就需要我們不斷拆分集群,同時開發訴求也多種多樣,當我們嘗試使用平臺化的思想去解決問題時,還要充分思考如何滿足研發人員多樣化的需求。

數據庫智能運維探索與實踐

人力困境這一問題,從DBA的角度來說,時間被嚴重的碎片化,自身的成長就會遇到瓶頸,比如經常會做一些枯燥的重復操作;另外,業務咨詢量暴增,盡管我們已經在嘗試平臺化的方法,但是還是跟不上業務發展的速度。還有一個就是專業的DBA越來越匱乏,越來越貴,關鍵是根本招聘不到人手。

在這種背景下,我們必須去思考:如何突破困局?如何朝著智能化轉型?傳統運維苦在哪里?智能化運維又能解決哪些問題?

數據庫智能運維探索與實踐

首先從故障產生的原因來說,傳統運維是故障觸發,而智能運維是隱患驅動。換句話來說,智能運維不用報警,通過看報表就能知道可能要出事了,能夠把故障消滅在“萌芽”階段;第二,傳統運維是被動接受,而智能運維是主動出擊。但主動出擊不一定是通過DBA去做,可能是系統或者機器人操作;第三,傳統運維是由DBA發起和解決的,而智能運維是系統發起、RD自助;第四,傳統運維屬于“人肉救火”,而智能運維屬于“智能決策執行”;最后一點,傳統運維需要DBA親臨事故現場,而智能運維DBA只需要“隱身幕后”。

從自動化到智能化

那么,如何從半自動化過渡到自動化,進而發展到智能化運維呢?在這個過程中,我們會面臨哪些痛點呢?

數據庫智能運維探索與實踐

我們的目標是為整個公司的業務系統提供高效、穩定、快速的存儲服務,這也是DBA存在的價值。業務并不關心后面是MySQL還是NoSQL,只關心數據是否沒丟,服務是否可用,出了問題之后多長時間能夠恢復等等。所以我們盡可能做到把這些東西對開發人員透明化,提供穩定高效快速的服務。而站在公司的角度,就是在有限的資源下,提升效率,降低成本,盡可能長遠地解決問題。

數據庫智能運維探索與實踐

上圖是傳統運維和智能運維的特點分析,左邊屬于傳統運維,右邊屬于智能運維。傳統運維在采集這一塊做的不夠,所以它沒有太多的數據可供參考,其分析和預警能力是比較弱的。而智能運維剛好是反過來,重采集,很多功夫都在平時做了,包括分析、預警和執行,智能分析并推送關鍵報表。

而我們的目標,是讓智能運維中的“報警+分析+執行”的比重占據的越來越少。

數據庫智能運維探索與實踐

決策執行如何去做呢?我們都知道,預警重要但不緊急,但報警是緊急且重要的,如果你不能夠及時去處理的話,事態可能會擴大,甚至會給公司帶來直接的經濟損失。

預警通常代表我們已經定位了一個問題,它的決策思路是非常清晰的,可以使用基于規則或AI的方式去解決,相對難度更小一些。而報警依賴于現場的鏈路分析,變量多、路徑長,所以決策難,間接導致任何決策的風險可能都變大。所以說我們的策略就是全面的采集數據,然后增多預警,率先實現預警發現和處理的智能化。就像我們既有步槍,也有手槍和刺刀,能遠距離解決敵人的,就盡量不要短兵相接、肉搏上陣。

數據庫智能運維探索與實踐

數據采集,從數據庫角度來說,我們產生的數據分成四塊,Global Status、Variable,Processlist、InnoDB Status,Slow、Error、General Log和Binlog;從應用側來說,包含端到端成功率、響應時間95線、99線、錯誤日志和吞吐量;從系統層面,支持秒級采樣、操作系統各項指標;從變更側來看,包含集群拓撲調整、在線DDL、DML變更、DB平臺操作日志和應用端發布記錄等等。

數據庫智能運維探索與實踐

數據分析,首先是圍繞集群分析,接著是實例、庫,最后是表,其中每個對象都可以在多項指標上同比和環比,具體對比項可參考上圖。

數據庫智能運維探索與實踐

通過上面的步驟,我們基本可以獲得數據庫的畫像,并且幫助我們從整體上做資源規劃和服務治理。例如,有些集群實例數特別多且有繼續增加的趨勢,那么服務器需要scale up;讀增加迅猛,讀寫比變大,那么應考慮存儲KV化;利用率和分布情況會影響到服務器采購和預算制定;哪幾類報警最多,就專項治理,各個擊破。

數據庫智能運維探索與實踐

從局部來說,我們根據分析到的一些數據,可以做一個集群的健康體檢,例如數據庫的某些指標是否超標、如何做調整等等。

數據庫智能運維探索與實踐

數據庫預警,通過分析去發現隱患,把報警轉化為預警。上圖是我們實際情況下的報警統計分析結果,其中主從延遲占比最大。假設load.1minPerCPU比較高,我們怎么去解決?那么,可能需要采購CPU單核性能更高的機器,而不是采用更多的核心。再比如說磁盤空間,當我們發現3T的磁盤空間普遍不夠時,我們下次可以采購6T或更大空間的磁盤。

數據庫智能運維探索與實踐

針對空間預警問題,什么時候需要拆分集群?MySQL數據庫里,拆分或遷移數據庫,花費的時間可能會很久。所以需要評估當前集群,按目前的增長速度還能支撐多長時間,進而反推何時要開始拆分、擴容等操作。

數據庫智能運維探索與實踐

針對慢查詢的預警問題,我們會統計紅黑榜,上圖是統計數據,也有利用率和出軌率的數據。假設這是一個金融事業群的數據庫,假設有業務需要訪問且是直連,那么這時就會產生幾個問題:第一個,有沒有數據所有者的授權;第二個,如果不通過服務化方式或者接口,發生故障時,它可能會導致整個金融的數據庫掛,如何進行降級?所以,我們會去統計出軌率跟慢查詢,如果某數據庫正被以一種非法的方式訪問,那么我們就會掃描出來,再去進行服務治理。

數據庫智能運維探索與實踐

從運維的層面來說,我們做了故障快速轉移,包括自動生成配置文件,自動判斷是否啟用監控,切換后自動重寫配置,以及從庫可自動恢復上線等等。

數據庫智能運維探索與實踐

報警自動處理,目前來說大部分的處理工作還是基于規則,在大背景下擬定規則,觸發之后,按照滿足的前提條件觸發動作,隨著庫的規則定義的逐漸完善和豐富,可以逐步解決很多簡單的問題,這部分就不再需要人的參與。

數據庫智能運維探索與實踐

展望

未來我們還會做一個故障診斷平臺,類似于“扁鵲”,實現日志的采集、入庫和分析,同時提供接口,供全鏈路的故障定位和分析、服務化治理。

展望智能運維,應該是在自動化和智能化上交疊演進,在ABC(AI、Big Data、Cloud Computing)三個方向上深入融合。在數據庫領域,NoSQL和SQL界限正變得模糊,軟硬結合、存儲計算分離架構也被越來越多的應用,智能運維正當其時,我們也面臨更多新的挑戰。我們的目標是,希望通過DB平臺的不斷建設加固,平臺能自己發現問題,自動定位問題,并智能的解決問題。

作者簡介

應鋼,美團點評研究員,數據庫專家。曾就職于百度、新浪、去哪兒網等,10年數據庫自動化運維開發、數據庫性能優化、大規模數據庫集群技術保障和架構優化經驗。精通主流的SQL與NoSQL系統,現專注于公司業務在NewSQL領域的創新和落地。

熱詞搜索:智能運維 美團

上一篇:易寶支付CTO陳斌:“安全保護的不僅僅是數據,更多地是保護你的服務。”
下一篇:綠盟安全態勢感知解決方案

分享到: 收藏
国产一级一区二区_segui88久久综合9999_97久久夜色精品国产_欧美色网一区二区
国产三区在线成人av| 久久无码av三级| 欧美精品一区二区三区蜜桃视频| 久久久噜噜噜久噜久久综合| 99免费精品在线观看| 日韩高清在线不卡| 欧美疯狂性受xxxxx喷水图片| 26uuu亚洲综合色| 欧美久久久久久久久久| 欧美一区二区网站| 日韩精品一区在线观看| 国产 欧美在线| 亚洲综合丝袜美腿| 精品日韩欧美在线| 99re这里都是精品| 亚洲综合无码一区二区| 国产综合成人久久大片91| 99re这里只有精品首页| 国模一区二区三区白浆| 精品久久免费看| 欧美一区二区精美| 亚洲一区二区三区精品在线| 婷婷国产v国产偷v亚洲高清| 欧美一区二区三区啪啪| 欧美在线短视频| 国产在线播放一区二区三区| 亚洲日本一区二区三区| 日韩欧美在线影院| 在线一区二区三区四区| 懂色av一区二区夜夜嗨| 免费一级片91| 亚洲图片有声小说| 国产精品污污网站在线观看 | 欧美精品一区二区三区在线| 99久久综合精品| 国产一区二区三区久久久| 午夜精品一区二区三区免费视频 | 久久精品国产色蜜蜜麻豆| 亚洲男人的天堂一区二区| 久久一夜天堂av一区二区三区| 欧美日韩国产大片| 色婷婷一区二区三区四区| 高清不卡一二三区| 国产成人99久久亚洲综合精品| 蜜桃在线一区二区三区| 三级久久三级久久| 日韩在线一二三区| 亚洲成人av一区| 亚洲国产wwwccc36天堂| 一区二区三区成人在线视频 | 国产精品久久网站| 中文字幕中文在线不卡住| 中文字幕乱码日本亚洲一区二区| 精品欧美一区二区三区精品久久 | 日韩午夜激情电影| 欧美一区二区三区免费大片 | 日韩精品一区二| 精品久久久久久久久久久久久久久| 欧美日韩免费观看一区二区三区| 91久久精品一区二区三| 一本色道久久综合狠狠躁的推荐 | 国产一区二区电影| 精品系列免费在线观看| 国产一区二区成人久久免费影院| 国产精品99久久久久久似苏梦涵 | 欧美美女视频在线观看| 欧美高清视频在线高清观看mv色露露十八 | 午夜精品久久久久久久久久久 | 精品国产不卡一区二区三区| 国产午夜亚洲精品午夜鲁丝片| 久久精品一级爱片| 亚洲日本成人在线观看| 一区二区高清在线| 偷偷要91色婷婷| 国产成人综合网| 97精品视频在线观看自产线路二| 欧亚一区二区三区| 日韩欧美一级精品久久| 久久久久九九视频| 一区二区在线观看视频| 欧美aaaaaa午夜精品| 成人av资源在线| 欧美日韩久久不卡| 国产精品卡一卡二| 天堂蜜桃一区二区三区| 国产99精品在线观看| 欧美日韩精品一区二区三区| 久久久久久久久久久久久久久99| 一区二区三区久久久| 久久精品久久99精品久久| 成人av资源网站| 在线电影院国产精品| 中文字幕免费不卡| 日韩电影免费在线| 91麻豆国产福利在线观看| 日韩视频中午一区| 一区二区三区视频在线看| 国产乱码精品一区二区三区忘忧草| 91福利在线看| 国产精品色噜噜| 久久精品国产成人一区二区三区| 91麻豆.com| 久久久久久电影| 美女视频黄免费的久久| 欧美系列在线观看| 国产精品久久福利| 国产一区二区电影| 日韩欧美一区二区免费| 亚洲一区在线观看视频| 99久久久久久| 国产精品免费aⅴ片在线观看| 六月婷婷色综合| 欧美日韩国产免费| 亚洲国产日韩精品| 色综合天天做天天爱| 国产精品福利影院| 成人av电影观看| 国产日产欧美一区二区三区| 狠狠色丁香久久婷婷综合_中| 欧美电影一区二区| 天天色图综合网| 91精品免费观看| 天天影视色香欲综合网老头| 欧美日韩中文国产| 亚洲国产精品久久人人爱蜜臀| 99精品视频一区| 亚洲图片欧美激情| 91九色02白丝porn| 亚洲综合一区二区三区| 欧美在线不卡一区| 亚洲电影一级黄| 88在线观看91蜜桃国自产| 亚洲高清免费视频| 欧美美女一区二区| 精品一区二区精品| 国产欧美精品区一区二区三区 | 欧美精品一区二区三区在线| 久久99精品久久只有精品| 久久久精品日韩欧美| 国产91精品精华液一区二区三区| 国产欧美日韩视频在线观看| 粉嫩绯色av一区二区在线观看 | 亚洲一区二区五区| 欧美日韩1234| 精一区二区三区| 国产精品美女久久久久久 | 亚洲一区视频在线| 日韩一区二区三区av| 激情偷乱视频一区二区三区| 久久久久久久久久久久电影 | www.色精品| 亚洲一区视频在线观看视频| 91精品国产入口| 粉嫩av一区二区三区粉嫩 | 婷婷久久综合九色综合伊人色| 精品免费国产二区三区| 国产成人精品综合在线观看 | 免费日韩伦理电影| 国产日产欧美一区二区三区| av一本久道久久综合久久鬼色| 日韩伦理电影网| 日韩欧美视频在线| 91在线码无精品| 久久成人精品无人区| 亚洲天堂成人在线观看| 日韩欧美专区在线| 91视频一区二区| 奇米色777欧美一区二区| 国产精品精品国产色婷婷| 日韩一区二区在线观看| 91丨九色丨蝌蚪富婆spa| 黑人巨大精品欧美黑白配亚洲| 自拍偷拍亚洲综合| 欧美精品一区视频| 欧美精品少妇一区二区三区| 成人av资源站| 国产米奇在线777精品观看| 亚洲成a天堂v人片| 国产精品亲子乱子伦xxxx裸| 日韩精品一区二区三区视频在线观看| 日本精品一级二级| 成人视屏免费看| 蜜臀精品一区二区三区在线观看| 亚洲激情综合网| 欧美激情在线看| 久久只精品国产| 日韩视频免费观看高清在线视频| 91极品美女在线| 99久久婷婷国产综合精品电影| 国产乱码精品一区二区三区av| 日韩电影网1区2区| 一区二区久久久| 亚洲色大成网站www久久九九| 久久先锋影音av鲁色资源| 欧美一区二区不卡视频| 这里只有精品视频在线观看| 欧美亚洲国产一区在线观看网站| www.欧美日韩国产在线| 成人高清视频免费观看| 懂色av中文一区二区三区|