云计算、AI、云原生、大数据等一站式技术学习平台

网站首页 > 教程文章 正文

这里有来自阿里和美团的运维经验分享

jxf315 2025-02-08 11:27:42 教程文章 67 ℃

每年的双十一都是一个全民狂欢的日子,零点钟声响起,手机上电脑前的你和无数的小伙伴一起拼命刷呀刷,新闻里曝出频频刷新的交易量,节节攀升的交易额记录,消费狂欢规模之大范围之广蔚为奇观。热闹的背后,总有一群人运维人员严阵以待迎接每年的技术大考,一次又一次的胜利得来不易,从他们这里得到的经验弥足珍贵。

在日常运维生活中的你或许没有这么让人激动的经历,但你或多或少也肯定面对着云计算环境带来的压力。面对成百上千台机器,几十个模块,几十万个监控项,哪些机器监控项缺少、那些状态异常、哪些报警、报警多少次……复杂多样的监控数据让你手忙脚乱,但这却是对整个平台直观而全面的了解的基础,你的监控做好了吗?分布式系统规模越来越大,复杂性越来越高,运维人员对生产系担负重要责任,旧有的方法已渐不得法,如何在监控数据的指导下持续完善监控系统,如何做优化来系统资源的利用率仍是个问题?纵使这些你已经思虑周全,灾备也有了,却也称不上高枕无忧,天灾或者人祸出现就是不幸,宕机了,断电了,设备故障了……如何更好的做紧急处理?如何更好的做灾难恢复?搞不好是要出事儿的。

变化发展的数据中心为运维人员不断带来新的挑战,在这个精彩纷呈的IT运维世界里,总有些人的经历过的事情是你没经历过的。如果,能有机会见识上面运维团队的运维经验分享的话想必是极好的!这个可以有,即将在6月3-5举办的中国云计算大会我们设立了云计算IT基础设施与自动化运维论坛,论坛上我们将为大家呈现来自阿里云、IBM、微软、UCloud、美团、百度和联通在运维管理上的声音,这其中,特别先剧透阿里和美团的两位专家的“经验”:

一位是柯旻,是阿里集团技术保障部-云计算运维-高级技术专家,他花名大舞,2007年加入阿里,目前负责阿里大数据平台(Hadoop(云梯)/odps(5k)/OTS/Hbase/Spark/storm等)运维工作,专注于大规模海量数据分布式计算平台运维工作,他将在论坛现场为大家带来名为《阿里云大数据运维经验分享》主题演讲。

阿里集团近几年的大规模集群机器数量快速发展,当运维数千台甚至上万规模集群的时候,会遇到诸多挑战,如硬件配置的差异化,用户数和任务数的急剧膨胀,大压力下的边界效应,小概率事件被触发等。相对以前传统运维来说在规模和经验方面都在快速发生变化,在本次演讲将和大家分享我们自动化,数据化的实战经验以及从运维转向运营的一些心路历程。

另外一位是洪丹,他是美团网高级技术专家,SRE团队负责人,2008年清华大学电子系硕士毕业,曾供职于腾讯,现在全面负责美团网所有业务的站点稳定性保障工作,从质量、效率、成本三个维度支撑美团业务的高速发展。技术专长包括业务高可用架构设计、立体化监控、运维自动化、网站性能与成本优化等。论坛现场,他将为大家带来名为《美团应用监控与分析实践》的主题演讲。

美团网作为国内最大的O2O电商平台,业务交易额持续保持每年近3倍的高速增长,业务访问量每月都能刷新记录。产品功能迭代迅速,新业务不断涌现。为了确保业务的高可用和高速访问,监控成为核心环节。演讲中将介绍美团的应用监控体系,分享他们通过应用监控与分析解决服务稳定性问题的实践,以及如何结合监控和美团云优化运维成本和工作效率。

好吧,相信这场云计算IT基础设施与自动化运维论坛会在阿里云、IBM、微软、UCloud、美团网、百度和联通在运维话题上轮番上演的经验分享下变得全程无尿点。你准备好了吗?一年一度的中国云计算即将召开,5月27日,报名的大门即将关闭,还没有下手要门票的同学抓紧时间了!

6月3-5日,北京国家会议中心,第七届中国云计算大会,3天主会,17场分论坛,3场实战培训,160+位讲师,议题全公开!

Tags:

最近发表
标签列表