3月31日,2018年首场 Open Talk —— “智能运维探索与实践 ”在杭州楼友会咖啡顺利举办,此次活动由又拍云和日志易联合举办。本场是 Open Talk 技术沙龙自 2015年启动以来的第40场活动。

本次活动,又拍云、日志易与华数传媒、二维火、宝付支付等公司的运维精英在现场分享探讨了自动化运维、安全运维、DevOps等运维的话题,活动吸引了来自阿里巴巴、网易、华为、中电海康、同盾科技、挖财等众多公司的开发、运维人员参与。

找到最适合公司的运维模式

二维火运维总监七喜分享了近两年二维火运维系统的演进。二维火作为一家餐饮和零售收银解决方案服务商,在收银机和收银系统方面有着丰富的开发经验,大量的机器与复杂的系统架构造成了运维难度的上升。

二维火在运维发展中经历了大量业务项目并发的初始阶段,遇到无法单人维护好这些项目的问题,开始尝试单云管理,研发协作自动化。当业务量再一次增加后,二维火使用多云管理与容器化,对数据进行备份,增加数据安全性。

image.png

七喜还阐述自己对DevOps的理解,他认为DevOps是需要开发对系统进行维护的,开发专注于对业务的运维,而专业的运维人员专注于对底层系统的维护。运维人员只需要维护基本平台,交付上线自动化,不参与业务系统维护。

七喜在分享中讲到,作为一个运维人员,最重要的就是找到正确的工作模式,找到最适合公司业务现状、规模的运维方式。

业务流程优化实现高效运维

华数传媒作为国内重要的数字电视网络运营商,在数字电视领域有着深厚的技术积淀。华数传媒P8解决方案专家、高级项目经理姚建兵,在分享中讲到,华数传媒的业务模块有主要有OTT、PC和3G三块,对运维造成了很大的压力。华数传媒对运维系统进行了优化,将UGCPGC、华数自产、异构放到统一编排库来管理。

image.png

华数传媒是又拍云的重要客户,双方在CDN方面展开了深入合作。华数传媒开发了统一云存储,对CDN合并回源,一个资产值回源一次,以此减少CDN源站存储量,成功减少了CDN带宽,降低成本。

华数传媒开发了CDN统一调度平台,可以根据不同服务厂商,以不同CDN价格及用户的实际服务情况进行调度,智能匹配服务。统一调度平台架构中通过CNCMS选择不同CDN厂商,GSLB对不同地域的用户进行智能调度。

姚建兵还通过对华数传媒直播业务、直播转点播快速上线业务、点播转直播、点播转直播、 华数网内节点调度等多个方面的业务案例进行讲解分析。

补丁、端口与日志中的安全运维

在金融领域,安全运维关系十分重大,作为第三方电子支付公司,宝付支付格外重视对个人以及企业资产的保护。

宝付支付安全运维经理吴世俊对工作中实践应用的分析,深入浅出地讲解了在安全运维中,对遗漏资产的管理造成了潜在的安全隐患,以及如何避免。

image.png

针对补丁的问题,吴世俊以微软永恒之蓝漏洞举例,说明及时更新补丁的重要性;并列举了包括漏洞扫描、补丁管理工具、虚拟化部署等在内的一系列安全运维中补丁管理的方法。

吴世俊强调运维人员要拒绝对外开放高危端口,保证自身端口安全。常见的端口存在很多风险,比如端口22,可以进行弱口令探测。最后吴世俊讲解了日志分享的重要性以及如何进行日志管理。

依靠日志分析实现智能运维

目前在运维中出现了越来越可怕的漏洞和攻击行为:Bash的shellshock, OpenSSL的heartbleed,Glibc漏洞等,同时分布式和微服务的潮流让业务模块更加离散,以及出现百万级服务器数量。

image.png

面对业务的变化,在运维工作中出现了各种问题。比如:是否需要经常查看系统或设备的日志?应用崩溃能否及时定位故障问题根源?遭受攻击时是否能够及时发现并告警?

日志易一直在IT运维日志、业务日志实时采集、搜索、分析、可视化系统研发等领域深耕,针对上述问题,日志易技术总监唐文俊给出了一系列解答。

唐文俊认为要解决这些问题,可以依靠构建数据采集、数据存储、数据分析、数据展现的智能运维架构。

在数据驱动中,监控软件大多是采样式的,采样意味着监控的评定是模糊估算。在做到总体稳定的初级目标以后,有必要通过全量数据分析的方式,对细节做更明确、更高效的诊断和优化。随着技术的发展,大数据的兴起,靠数据来驱动运维,成为了一种新的趋势。

数据中心里的高效运维

又拍云是国内知名的云服务商,以场景化CDN作为核心业务,拥有6个数据中心,300多个自建CDN节点,服务了25万客户。庞大的CDN网络和客户规模,需要又拍云的运维团队拥有强大的自动化运维能力。

又拍云运维总监邵海杨在分享会中,首先向大家展示了又拍云第二代自动化运维,讲述第二代自动化运维存在的问题。到了第三代又拍云数据中心架构搭建了服务化资源池,使用虚拟机搭建资源池,判断程序是否符合分布式、松耦合、无状态的理念。

image.png

邵海杨在分享中介绍了又拍云目前在生产环境中使用的基本组件:UPDNSDNSmasq、LVS、ATS、ELK等。这些组件保证了又拍云数据中心的稳定运作。

本次讲师分享的精彩内容,后续将会在又拍云公众号、Open Talk 官网(https://opentalk.upyun.com)同步更新,敬请期待。

现场精彩瞬间

image.png

image.png

image.png