活动预告 | 智能化软件开发微访谈·第二十一期:可观测性与智能化运维
时间:2022-12-21 16:00:00
CodeWisdom
复旦大学智能软件开发沙龙CodeWisdom团队参与了学术和技术沙龙,专注于代码大数据和智能软件的开发,通过各种在线和离线交流活动促进学术研究和实践技术的发展。微访谈是基于沙龙微信群的智能软件开发沙龙开展的在线交流活动。其形式是邀请宾围绕特定话题进行在线访谈,并与微信群成员互动。
可观测性和智能化运维
智能软件开发微访谈·第二十一期
访谈简介
云原生软件系统以微服务系统结构为主要特征,通过细粒度的服务拆分和服务的独立开发、交付、部署和扩展,大大降低了单个服务开发的复杂性和整个系统的可用性和可伸缩性。然而,云原生软件系统包含的大量服务之间的复杂、动态的交互关系和系统的复杂和动态的运行环境,使系统的运行维护管理和高可用性保证成为一个重要的挑战。目前,指标(metrics)、日志(log)、链路轨迹(trace)主柱的可观性(Observability)已成为所谓的智能运维(即AIOps)的重要基础。具体的可观具体含义是什么?实践中可观测性的具体实践是什么?可观测性的流行代表着我们看待复杂软件系统的眼光发生了什么样的变化?智能运维基于可观测性的未来发展方向在哪里?
针对这些问题,本次微访谈邀请了来自学术界和工业界的许多专家讨论可观测性和智能运维的主题,总结了行业实践和学术研究进展,讨论了相关技术问题和未来的发展方向。
访谈问题
01
你能谈谈你对可观测性的理解吗?为什么可观测性对以微服务架构为主要特征的云原生软件系统尤为重要?它与我们通常所说的监控有什么关系?
02
为什么可观察性的概念在过去两年中流行起来?可观察性的流行代表了我们对复杂软件系统的看法?
03
您所在的企业和您所知道的企业在收集、处理和分析可观测数据方面的成功实践是什么?目前使用的可观测技术还存在哪些问题和不足?更细粒度、更深层次的可观测技术是否有实际需求和应用前景?
04
如何评价数据挖掘、深度学习、知识图谱等智能技术在可观测数据分析中的作用?智能技术在当前云原生软件系统运维实践中发挥了什么作用?
05
你认为基于可观测性的智能操作和维护的未来发展前景如何?学术界和工业界值得探索的发展方向是什么?你对相关领域的学术研究者或工业实践者有什么建议?
访谈时间和地点
2022年6月26日下午15:00-17:00
微信群智能软件开发沙龙
主持人
彭鑫
复旦大学教授
复旦大学计算机科学技术学院副院长、软件学院副院长、教授、博士生导师彭欣。中国计算机学会软件工程委员会副主任、开源发展委员会常务委员、上海计算机学会青年工作委员会主任、《Journal of Software: Evolution and Process》联合主编,《ACM Transactions on Software Engineering and Methodology》编委会,软件学报编委会,《Empirical Software Engineering》编委,IEEE国际会议软件维护与演化(ICSME)执委(2017-2020)。2016年获得NASAC青年软件创新奖。2016年获得NASAC青年软件创新奖。主要研究方向包括软件开发大数据分析、软件智能开发、云原生与智能操作维护、计算系统中人机集成、机器人软件工程等。获得研究工作ICSM 最佳论文奖2011年,ACM SIGSOFT杰出论文奖(ASE 2018/2021)、IEEE TCSE杰出论文奖(ICSME 2018/2019/2020)、IEEE Transactions on Software Engineering年度最佳论文奖(2018)。带领复旦大学CodeWisdom研究团队开展软件开发大数据分析和软件智能开发与运维研究与实践,研究成果在多家大型企业中得到实际应用。
访谈嘉宾
裴丹
清华大学计算机系副教授
裴丹博士是清华大学计算机系副教授、博士生导师。裴博士的主要研究方向是基于机器学习的智能操作和维护(AIOps),与国内大型金融机构、运营商、互联网公司合作。裴博士在美国UCLA获得博士学位后,加入美国AT&T研究院担任资深研究员、主任研究员。裴博士在智能运维领域发表了近200篇学术论文和20多项美国专利授权。他是AIOps Challenge挑战赛的创始人。他是ACM和IEEE的Senior Member。
陈鹏飞
中山大学副教授
副教授陈鹏飞是中山大学数据科学与计算机学院引进的百人计划青年骨干教师、博士生导师。2016年6月,他在西安交通大学计算机科学与技术系获得博士学位。2012年7月-2012年11月作为“明日之星”在微软亚洲研究工作实习,2016年6月-2018年1月在IBM2017年2月至2017年4月,中国研究员云计算部担任研究员IBM T.J. Watson研究中心工作。主要方向是:云计算、智能运维( AIOps)、自动驾驶、微服务、无服务器计算、软件可靠性等。例如,近年来在国际会议上WWW、IEEE INFOCOM、IEEE ISSRE、IEEE ICWS等和期刊如IEEE TNNLS、IEEE TDSC、IEEE TSC发表50多篇论文,其中包括SCI论文11篇,中国科学院一区及CCF A6篇类别会议和期刊论文,以及多个国际期刊和会议的审稿人。目前,项目团队承担了多个项目,包括国家重点研发项目、大数据中心项目、国家自然基金青年项目、广东省重点研发项目、广东省自然基金表面项目、广州科技项目、校企合作项目。
贺品嘉
香港中文大学(深圳)助理教授
助理教授、校长青年学者、香港中文大学博士生导师。毕业于香港中文大学,在苏黎世联邦理工学院担任博士后三年。软件可靠性、软件测试、研究方向MLOps、智能运维等。近年来在ICSE, FSE, ASE, ISSTA, OSDI, CSUR, TDSC等待顶级会议期刊发表20多篇学术论文。获得ISSRE最具影响力的论文奖。Google Scholar引用超2300次,H-Index为19。主导自动化日志分析开源项目LogPAI在GitHub上被star 3000多次,7万多次被380多个学术界组织下载。
张圣林
南开大学软件学院副教授
南开大学软件学院副教授张圣林,博士生导师,CCF网络专委、软件工程专委、服务计算专委执行委员,YOCSEF天津AC委员。主要研究方向是基于机器学习的智能操作和维护,包括异常检测、故障定位、根因分析和故障预测。获ISSRE 18最佳学术论文奖、清华大学优秀博士论文、天津科技进步一等奖、南开大学第九届好老师好朋友称号、华为计算产品线最佳技术合作教授入选天津131创新人才培训项目(第三级)。在ATC, WWW, VLDB, SIGMETRICS, CoNEXT, INFOCOM, IJCAI等待国际会议和JSAC, TC, TSC, TNSM, JSS国内外期刊发表高水平论文40余篇。主持国家自然科学基金青年基金项目1项,中国博士后科学基金项目1项,横向项目8项(与华为、字节跳动、网上商业银行、ZTE等合作)。担任WWW22, ICNP22, IWQoS22, ISSRE 19/20/21/22程序委员会委员,TON/JSAC/TDSC/IoTJ/ASUR/TNSM/JCST等待期刊审稿人。
林庆维
首席研究员
林庆维, 微软亚洲研究所首席研究员带领研究团队致力于云智能算法创新。研究技术结合大量云平台数据,有效提高云系统的质量和资源效率。林庆维在云智能/智能运维领域~在高影响力的国际会议上发表了50篇文章,包括ICSE, FSE, OSDI, NSDI, AAAI, SigKDD等。其研究个产品部门采用其研究成果,包括微软云Azure,Office,Bing,Windows等。林庆伟多次作为会议主席组织微软云智能峰会。
王含璋
eBay应用研究员
根因分析产品负责人,两年内带领团队从头完成支持各类运维报警的分析框架研发及产品落地,现已支持公司级测试生产和生产环境的实时故障根因分析。同时作为eBay科研与高校合作小组的初级成员协助建设标准化的公司级产学研生态,促进和管理多个国际高校合作项目。科研兴趣主要包括分布式系统智能运维和根因检测、敏捷开发效率分析、微服务系统重构和演进以及软件知识图谱。
凌志钧
字节跳动 APM服务负责人
2018年加入字节跳动,拥有私有云10多年 风险控制离线在线平台,可观测基础设施 目前负责基础设施-可观测性基础设施建设 包括指模型的时序数据库bytetsd、链路追踪bytedTrace、报警引擎bAlarm、可观测性平台Argos等产品的研发和运营运维工作。
林帆
阿里云 云效数据洞察产品板块技术负责人
花名金戟,阿里云云研发部高级技术专家,前ThoughtWorks资深DevOps技术咨询师,多届极客邦CNut全球容器技术大会和CSDN架构技术实战峰会讲师。著有《CoreOS实践之路》和《容器即服务:从零构建企业级容器集群》两本书籍。原阿里巴巴研发平台效率度量负责人,目前负责云效产品的研发数据洞察板块。
蔡小刚
华为云应用运维域首席架构师
先后就职于IBM和华为,长期从事应用和云的ops,aiops、bigfastdata等方面的技术研究和工程化工作,主导架计了APM、AOM、LTS、CTS等云服务,持续构筑华为云面向租户的立体运维能力。常年与国内外高校紧密合作,在多个技术领域进行前瞻性研究和难题攻关;是技术分享社区的参与者和推动者。
范超
京东零售平台运维负责人
10年电商平台技术经验,专注平台立体化监控和智能运维提效。负责APM平台建设,以及图片压缩技术迭代,传输协议升级多个技术专项落地,为业务质量提升不断创造价值。探索使用更准确的监测数据,反映业务运行质量,并转化到技改项目中;通过更完善的工具和平台化思路,沉淀技术运营价值,推进业务运维升级。
排版|CodeWisdom
文案|CodeWisdom
专注智能化软件开发,欢迎关注我们