< 返回上层

【IDCC2020】圆桌论坛:AI定义IDC

2020-12-10 12:39:03 125次

2020年12月10日,由中国IDC产业年度大典组委会主办,中国IDC圈协办的第十五届中国IDC产业年度大典(IDCC 2020)进入了第二天的议程。经过一天精彩纷呈的讨论,数千名参会人员,包括IDC企业、电信运营商、互联网、金融、政府和厂商等产业上下游领导、专家以及从业者以更加饱满的热情关注并参与了今天的论坛。

今天的主论坛主题为《重新定义IDC——未来IDC论坛》,本次论坛分为人工智能与IDC、金融科技与IDC、金融科技与IDC三大篇章,讨论未来IDC的种种发展可能。在第一篇章“人工智能与IDC”论坛上,由南京新一代人工智能研究院有限公司 CEO,中国人工智能产业发展联盟评估工作组组长曹峰主持,竹间智能首席运营官孙彬、旷视科技IT总监胡宝群、有孚网络华北区、北京有孚云计算科技有限公司总经理商彦强、万国数据智能化技术总监夏玉学等专家共同进行了一场题为《AI定义IDC》的精彩圆桌讨论。

圆桌论坛AI定义IDC

曹峰:感谢徐总的精彩分享,听了两位大咖的演讲大家意犹未尽,我们进入今天上午的第二个小环节,圆桌论坛的环节,我们有请对话嘉宾:竹间智能首席运营官孙彬、旷视科技IT总监胡宝群、有孚网络华北区、北京有孚云计算科技有限公司总经理商彦强、 万国数据智能化技术总监夏玉学登台。请各位先简单介绍一下自己。

孙彬:我来自竹间智能,我们是自然语言核心技术的一家创新公司,我们过去五六年一直在为头部企业,包括头部政府相关企业服务,在人机对话领域,人机阅读方面,知识工程方面提供产品和平台,我们也服务了金融的银行、证券、保险,到政府政务,以及智能设备,医疗教育领域中的头部企业,致力于打造企业级服务平台,将人机对话变得更简单,不用担心自然语义理解很难的技术,不用再招聘算法工程师和语言学家,就可以在工厂上创建对话机器人和我们自己的应有相结合。

同样我们过去也跟很多头部企业一直把电话机器人、质检机器人等等人机耦合性的产品落地,在很多数据中心里也做运营服务的机器人等等,这都是我们的落地场景,目前更多的知识图谱领域中的用自然语义理解非结构化数据变成结构化数据,建立知识图谱,方便我们的查询、比对,包括我们在IDC运维中各种各样的场景如何比较,如何查询,如何显示,如何提醒,这都是我们一些有过的经验,所以通过这几分钟希望今天能跟大家分享我的经验和各位同行们取经,就介绍到这里,谢谢各位。

胡宝群:大家好,我是旷视科技的胡宝群,我们是以一家人工智能产品和解决方案为主的公司,专注于个人物联网、供应链物联网、城市物联网,向客户提供算法、软件、硬件产品,全站一体化的解决方案,我本人从事IT运维行业10年经验,跟各位大咖比比较嫩。最近也在做超算中心的运维工作,谢谢。

商彦强:大家好,我来自有孚网络叫商彦强,有孚网络创立于2001年,今年整整第20个年头了,海兰信的老总谈到做两件事,我们也是做两件事,第一是我们自建高等级的云计算数据中心,自持有,自运营。第二件事,有孚网络自己拥有有孚云平台,服务金融、政府、教育、医疗等等。20多年来有孚网络经历了两次发展历程,目前有10万家客户,是一个非常大的数字。这些客户都是toB客户,企业客户,所以我个人也是特别兴奋于在服务企业客户的领域里,跟我们的产业界上下游做很多的探索、研究、联合创新。

目前最新的情况也给各位汇报,有孚网络在全国立足于一线城市,北京、上海、深圳,自建高等级数据中心将近3万架,规划将近3万架。目前整体的发展态势,每年以10亿元以上的投资带动百亿元以上的产业。所以在这个过程中,我们特别需要合作伙伴,政产学研,我们来提供用户,提供场景,提供联合创新,也希望能和各位产业界伙伴,学界的同仁们加强交流,在有孚自己的产业研究院里孵化更多的技术场景,可以和在座的各位专家们联合做很多的尝试,把这些尝试更好的赋能于整个行业,谢谢。

夏玉学:大家上午好,我是来自万国数据的夏玉学,主要是做智能化解决方案的研发与落地工作。万国数据是全国最大的第三方数据中心基础设施服务提供商,目前主要是聚焦在头部客户,在一线城市,北上广深。目前我们有60座自建的大型数据中心,万国数据在设计、建设,包括运维各个方面在行业里处于领先水平。像数据中心能源利用效率,数据中心安全运行,这一块其实是在业界有口皆碑的,一方面得益于万国有一只非常专业的技术团队,还有得益于智能化、数据化解决方案的大规模运行,一会儿我可以分享一下这方面的点点滴滴,感谢各位。

曹峰:感谢几位专家精彩的介绍,总结一下今天我们有一个关键词,就是智能化运维,可视化运维等等。所以第一个问题就聚焦于运维这个问题,今天四位专家比较有代表性,左边两位专家更多是数据中心能力的提供方,右边两位专家是数据中心能力的使用方,同时他们很多技术还是能够赋能到数据中心里的,所以我相信运维这个话题四位专家都有一些自己的感受或者是自己公司会有相关的宝贵经验和最佳实践。

夏玉学:智能化在万国是运维倒逼的场景,以万国的规模如果采取传统运维方式,光招运维工程师就是非常头疼的问题。所以在过去五六年里,我们基于运维,整个从日常的比较繁琐的巡检,一直到故障的应急处理,大量采用智能化的手段,数字化的手段,来解放我们的人力,提升人力效率。

在这里我举一个简单的小例子,数据中心因为外界环境的变化,负载本身的变化,特别是高密机柜的变化是非常难以预测的,导致我们数据中心IT机房里经常出现局部的高温。通常在传统数据中心里需要暖通专业人士到现场做紧急的补救和处理,最近两年我们采用了基于AI控温算法,可以自动根据外界环境变化,动态调整空调的风机转速,以及水阀的开度,这样可以让数据中心所有温度测点在很小范围内变化,这样可以极大的减少现场运维工程师应急的工作,提升整个效率,这是一个小小的例子。

再一个机器人巡检,包括平时一二重故障的自动应急、自动确认,综合技术手段的使用可以大幅降低我们数据中心对传统运维人力的需求,极大的提升整个运维效率。

商彦强:现在最急缺的就是人才,尤其是新基建数据中心的风刮起来之后,跟很多业界朋友交流的时候,包括我们头部的互联网企业,重要的金融级客户,他们一直在诉苦,就是找不到合适的人才。其中最难找的也就是高等级的运维人才,在北京、上海、深圳,以及三大区域的周边都出现了这个现象,以至于友商之间运维的人才互相都很熟悉,本身这是一个好事,但是同时我们也看到这就是人工智能带给我们的一些机遇。

在这里,刚才万国的兄弟谈到了应用了智能巡检,智能客服,有孚是什么情况呢,我在负责的华北区机房,我们整体设计是6600机架,单体在海淀区应该是最大的,国家A级机房,很多金融客户,城市核心都设在了这里。我们的运维人员目前只有40个,为什么能做到呢?如果按照传统的流程或者专业知识来做工作的话,我们粗略估计需要100多人,我们部署了60万个不同的监测感应电,所有监测感应点这些信息、数据定期上传整体智能运维监测平台,我的办公室边上就是ECC,我经常听见ECC各种各样的声音,闪光,各种各样的提示,很多运维小伙子都是年轻人,刚毕业一两年,助手ECC的这帮兄弟们,其实他们的工作很清闲,更多的是用了智能化的手段。

刚才商汤科技的杨总分享得非常精彩,我们和商汤几年前就开始联合,在整个智能IDC的架构下,包括它的业务怎么梳理,资产怎么管控,做了很多探索性的工作,从上海到北京,到深圳,这个工作也一直持续着在进行。

几年前,有孚网络联合腾讯,腾讯有一个很好的产品叫腾讯智维,经过8年多的研发,上千次的迭代,在国际上很多节点,大概有80多家节点,做了不断的消烟囱的工作,这个系统有孚和腾讯一起联合着进行了适应客户的研发,并且我们把它作为一个不光是自用的产品,推到了客户,很多银行,包括股份银行,还有一些城商行,他们都开始使用这样一套智能化的运维系统,效率极大的提升。

我们也希望今后能够和更多的业界同仁,不光是人工智能领域的,金融科技领域的,大数据挖掘领域的,我们提供更多的场景,随着有孚本身数据中心布局的加速,我们会有更多的实验场景,会有更多的商用场景,来一起推动整个人工智能在自动化运维领域的实践和应用,谢谢。

胡宝群:这几年比较鼓励建超大型数据中心,随着需求的增加,我相信运维的需求也会增加。刚才提到了这方面的人才相对来说比较少,一二线城市都比较少,更不用谈三四线或者比较偏远的内蒙。超大型数据中心又会在比较偏远的地方建设,这类人才培养,如果我们用智能化解决的话,其实整个人才培养梯队相对来说就比较容易,我只需要人员辅助管理不管是机器人还是智能化的设备,相当于整体的运维配套体系就很容易建设起来,我不需要从零到一的人才梯队培养。

而超大型数据中心一旦建设的话,我相信整体成本也非常重要,怎么样在超大型数据中心里提高我们的效率,怎么能提高用户的响应时间和整体的运维成本的降低,对智能数据中心的诉求很多,但是挑战也蛮大的。现在AI的成本还是蛮高的,面临的挑战就是AI未来的成本要低于现在人力成本的情况下,我相信才真正是一个智能数据中心的起点。

下来有很多数据中心已经开始试用,没有真正完全的替代人,未来数据中心也不会完全替代人,只是提效的工具,辅助我们做好运维,帮助我们降本增效的工具。

孙彬:人工智能的团队一直都在致力于干一件事,就是用技术跟伙伴或者客户的场景结合,想办法用技术解决这类问题,提高效率,降低成本,这是我们的使命。在过去我们的历程中,有几个场景我觉得可以服务到各位。第一个是做人工智能的时候我们一直在构建知识的平台,就是建立知识图谱,建立自动化构建知识库的能力。随着我们对大量的巨型数据中心,海量设备,物联数据上升之后,对数据的查询、比较、分析,其实完全可以用到人工智能相关技术的。

举个简单的例子,目前如果我们将所有的联网设备,弱电、强电、空调设施,这些历史数据全都存在这边,我们可以进行分析,并且进行知识图谱的构建,进行比较查询。就像您刚才说的,可以在办公室里任何时候对比,我要查询一下什么时候能源消耗的对比,或者我们带宽的变化情况,换句话说人工智能在人机对话里面进行搜索比对,查询,这其实是可以提高很大效率的。

原来在数据中心管理中会出报表,不管是运营人员还是各个老总都会看,但是如果想新加一些想法,看一些趋势的时候,往往还要再定制。这些东西其实可以交给人工智能的机器人完成,在知识图谱构建完毕,大数据构建完毕之后,完全可以按照你的需要环比、同比、趋势对比,这样可以帮助我们重点发现,这是我想提到的可以助力的地方。

另外一点是分析,人工智能最好的方式是进行数据分析,我们有这么大量的工作,人工智能还在做多一步就是预测性的故障分析。数据中心的故障,进行建模之后,推导在什么情况下设备故障会在这个区间发生,或者什么时候能发生,如果我们能提前巡检、环检、设备替换的话,可以降低故障发生率,当然这要跟产业的各个合作伙伴合作,用真实的数据实践来改变这件事情。

第三点还有及时通知的作用,7×24小时运作,相关工作人员都在各个地方,其实要通知到关键的人员也很重要。现在的人工智能可以提供7×24小时值班型的电话机器人或者语音机器人,可以在预设场景下建立电话通知、紧急通知,甚至可以进行定期巡检数据采集。除了我们主动的提交数据之外,也可以主动搜索拿回一些数据,避免因为人为疏忽漏填或者忘记上交造成的数据缺失,这样在我们的数据中心管理者身边,给每一位做一个小助手,这样也可以让我们的管理上一个台阶,让团队跨地区的时候,人工智能在通知、协同、数据采集方面,也有它的应用场景,抛砖引玉,就先说这几点,希望我们一起来探讨。

曹峰:感谢孙总,感谢几位,这几个观点场景描绘我们看到很美好,另外很多应用其实也应用到实际的使用中了。但是其实大家畅想了一下目前的好处,我相信实际在部署或者在一些使用机器学习,在数据中心相关业务上肯定有一些问题或者阻碍。胡总也讲到了机器的成本问题,是很大的问题,除此之外,还有什么问题也请各位专家分享一下,相信这些问题都不是个性化的问题,希望能和技术界、产业界提供很好的参考,针对这些问题解决一些事情。

商彦强:挑战还是很大,因为我个人是网络传输的技术背景,我们比较钟情于在数据中心领域里网络性能。因为随着人工智能的应用,不管是从端还是到中心,这样大规模,大吞吐量的数据呈现,实际给网络带来的压力非常大。第一是传输,第二是安全,在我们数据中心本身来说,其实从疫情期间我们就上了整个一套系统,这套系统实际上更多的是防疫期间的使用,但是和我们原有员工的考勤,客户的接待,信息的处理,实际上多半年一直处于联调的过程,这个过程中就碰到了很多具体的问题。

小到设备安装的时候网线的牢固性,从哪里引电,这是很细节的。当我们在讨论这些大的应用场景,产业赋能的时候,我们要看现场那根线是怎么连的,连了之后是不是稳固,你网络的信号,网络的传输,是不是有三家运营商足够强大的网络支持,这些都是问题。

我们看到最近整个北京市经信委,包括北京市通管局联合建委做了一件很好的事,与人工智能客户中心应用非常相关,所有商业楼宇今后卡脖子的带宽问题,已经上升到这样一个高度,就是说我们工信部通信管理局这个角度助力于人工智能和客户的使用角度,来做一些细致的工作。但是这些问题每天都在发生,我们的考勤系统也不怕丢丑,经常有漏的,这都是实际问题。员工考勤打不上了,到月底就来找我了,说考勤怎么搞错了,奖金哪里去了,这也都是工程师面临的问题。我们实际做都是一步一步走的,一个模块一个模块开始的,我想这也是我们大家坐在一起的意义所在,这也是我们工作所在。

昨天黄超总谈到了,因为我们热爱这个行业,我们热爱这份事业,数据中心把我们聚在一起,人工智能定义下的数据中心,我相信除了大型的,中心化的,刚才我说一个线的问题,一个楼宇卡脖子的问题之外,还能影响用户体验生产生活的东西非常多。正是因为这些挑战,也给了我们不断改进工作,优化系统的机会,谢谢。

孙彬:我从这个话题往下讲,在人工智能里面我们一直面临着一个挑战,就是人工智能准确率的问题。我们知道在数据中心里要做到零差错,但是今天在人工智能赛道中我们往往提到的是准确率,提准确率的意义是我们并不是百分之百完全执行正确的,这是因为数据训练,这是因为场景情况等等的影响。所以哪怕在图像方面,人脸识别方面,人机对话方面,准确率无限接近准确,但是依然会有意外情况,或者不在这个范围内的情况。

今天如果在数据中心这么高准确率,这么高精密的情况下,人工智能会不会受到挑战?我们也看到,人工智能大家对它的期望,把它作为什么?我觉得人工智能不是来替代人工的,不是替代那些需要准确判断的场景的,它是一个特别好的人的辅助。我们一直在倡导现在产业在发展,我们不断的向准确率提高,但是目前阶段我们看到更好的场景是人机辅助的场景,用人工智能技术帮助人,帮助人进行改善。

举个简单的例子,比如说服务方面,你用机器人打电话,每个人几乎都接到过,都觉得机器人不够聪明,因为它所有的对话需要被设计,被准备,一万个人总有一万零一个不同的问题。今天人机的配合,比如说通过人工智能给话务人员辅助、引导、质检,甚至在做人机培训,可以通过人机了解服务中的问题反过来做培训。同样在IDC产业发展中,人工智能的落地也可以遵循这个规律,利用人工智能的优势帮助我们的管理或者是数据提高效率,把重复性的工作由人工智能来完成,将这些需要紧急判断的,需要更多人为处置的事情交给核心有经验的人来处理,这样可以大大提高效率。对人工职能的期望,产业一定是不断发展的,一定会有钢铁侠里面的贾维斯这样的人来帮助你,但是怎么能提高效率方面,我们要向技术提供者和管理者提问,要一起思考,如何提高效率,并且发现它的重复性的事情交给它,思考的问题人工处理,达到人工智能和人类智慧结合,这是最好的落地实践。

夏玉学:万国作为一个AI应用场景的公司,像孙总刚才讲的,第一点是关于数据,AI现在的特点是什么呢?它需要有足量的、高质量的数据,有这样的数据,AI可以给你一个很好的效果。但是如果没有呢,这个效果可能就很难理想,像刚才孙总提到的。从这一点上讲,数据中心理论上讲是一个大数据的源头,存储大数据的地方,但是涉及到基础设施,其实远远谈不上大数据,某种意义上只能算是小数据。特别是考虑到机电设备的特质,像电压的抖动,整个过程通常是几秒钟之内,传统弱电架构是很难采集数据的,采集不到数据AI也无能为力,这是我们过去一年多做的第一件事,就是我们重新设计了整个弱电架构,在数据中心的设计建设阶段就充分考虑对AI的友好性,来抓取数据。

随着数据不断的充沛,智能化效果就会体现,这是我今天想分享的第一点,就是对AI在数据中心的应用,我们不能急于求成,既不能过于乐观的去肯定它,忽视现实中遇到的困难跟问题,也不能盲目的去全盘否定,因为目前的结果可能没有这么理想,而是应该回到源头,重视对数据的获取,特别是对高质量数据的获取,这是我想讲的第一个观点,也是万国数据在过去AI应用中遇到的实际问题和解决思路,供各位同行来参考。

第二点我想分享的是AI对数据中心安全性的影响,因为在数据中心行业里对AI的安全性一直有争议,2019年就有一篇很著名的文章,里面重点提到了AI给数据中心带来的风险,其中一个观点我非常认可,这一点也要回到AI的特质。以深度学习为主的AI算法,特点是执行有效果,但是我的语义很难解释,逻辑很难解释。一个业务专家很难解释AI的逻辑是什么,尽管它有效果,所以这可以认为是AI一种独特的魅力,但是也带来了风险,因为一旦出现状况,比如说传统的专家系统如果业务专家在现场懂得怎么补救,但是AI是不懂得的,因为逻辑都不明白,这是一种很大的风险。

我们真正在数据中心部署这种AI,特别是控制的AI法的时候,要优先考虑。我们过去是怎么解决的呢?很重要的一点是充分结合了专家的经验,专家不光指导算法,最快的寻找最优解,还有最寻找出来的最优解做一个安全性过滤,把有可能带来风险的最优解提除掉,这是我们在做的,相对来说也是能有效的解决安全性问题的方法,我就分享这两点,也希望听一下行业的声音,听一下AI专家的建议。

胡宝群:我补充几点,我觉得AI在真正落地的过程中还会有一个挑战的点,就是整体的异构性。在数据中心中有硬件的,有设备的异构,有价格的异构,我在整套智能系统或者智能机器人设定程序的时候,这种异构性会给整体维护人员带来非常大的挑战,这个挑战既有学习成本也有没有办法解决的一些场景,因为更多的AI还是希望数据中心有一定标准化,才能为自动化或者人工智能整体提高效率,所以我觉得这一块的异构性是未来AI落地比较大的挑战。

孙彬:刚才提到人工智能安全性的问题,我觉得可以补充两句,这的确对我们来说是一个点醒。人工智能在计算的时候往往是用深度学习的方式来计算,用大量的数据说这就是苹果,要记住这个样子就是苹果,这样的故障就是因为这样的参数,但是可能并不会有推理,它是怎么产生的。但是再往下走一步,可以分析周围的数据往下走,这是数据工程的工作。

我想提到另外一点,当我们有专家知识库的同时,这些专家知识可能只是在个别人,在一些人的手里。我觉得我们做技术的团队可以多做一件事,如何将专家知识库变成更多的人能够使用,我觉得这是我们可为之的事。如果今天我们将运维管理或者现象的内容进行归集、梳理,把它建立成我们运维自己的知识库,专家意见知识库,给它设定相关的场景、参数等等,可以通过实时的运维机器人的方式进行查询、比对、提醒,这样我们没有太多经验的运维的同时,再处理问题的时候,通过这样的查询能够让专家知识库及时帮助它,这样7×24小时能有人提点,可以更快的发现问题,这也是一种人机配合的模式。

所以人工智能并不是替代人去解决更难的问题,而是帮助我们广大的运维人员获得更多的渠道,获得专家知识,这样在现实中间更能解决问题。从安全性的角度来讲,它更加能帮到运维人员,当然这需要我们前期设计知识库,就补充这一点,谢谢。

夏玉学:这个行业专家系统构建了一二十年,真正应用的效果并不好,确实可以借助刚才孙总说的知识图谱,加快有效信息的查询和使用,这一点确实是我们需要从前端做设计,不断的实践、孵化的。

曹峰:感谢,因为时间的关系,最后我们还是希望点一个题,因为我们是人工智能的环节,我们大会的主题是IDC,主题也是重新定义IDC,各位专家分别用一两句话时间展望、总结,给我们这个小的篇章做一个结语。

孙彬:首先我认为人工智能对IDC的发展是两个维度,第一人工智能一方面促进了IDC的需求,因为人工智能有大量IoT设备连进来,有了数据就可以进行分析、响应,比如说视觉的响应,人机对话的响应,人工智能帮助人的方便同时需要依赖于快速的网络、带宽、计算、存储、大量的数据,所以人工智能的发展一定会催生IDC的发展。当然人工智能也是为IDC产业服务的,人工智能技术同样在服务着IDC的管理和运维,不管是预测故障分析还是运维方面的服务,还是内部服务方面,我觉得人工智能都可以帮助服务再上一个台阶。

相互的产业是不断往前迭代的,任何的技术都是在催生我们IDC的产业发展,只要科技在往前走,IDC产业也一定是往上走的,在这个过程中希望大家一起在这个大船上向前推进,就说这些。

胡宝群:我作为数据中心使用者的角度展望一下未来的IDC,在AI场景下使用,AI有训练和推理两个场景。在训练的场景下,未来的大方向可能就是非一二线城市超大数据中心的场景,因为它的场景就是需要把一些数据放到数据中心,不断的去训练,不断优化算法,最终把算法应用到某一个场景中。推理部分的展望更贴近于边缘数据中心,因为它不需要太大量的集群,只是基于某一个场景去解决某一个我想解决的问题。包括在超算这一部分,在训练这一部分,前面几位也分享到了,需要更高的电力,现在一台GPU,功率两三千瓦,传统数据机柜也就放一两台。现在已经有一些能达到五六千瓦的了,传统机柜一台也放不了了,所以AI的方向一定是高电力的,10千瓦甚至20千瓦以上的。

商彦强:未来一定是两个大方向,互相融合,AI和IDC产业相互促进,这是大家都见得到的,让我们的生活和工作更美好。另外是从用户的角度应用,一个是中心端,一个是边缘端。我们的智能终端,不管是手机、汽车,物联网的设备等等,都在人工智能边缘计算的催生下越来越下沉,所以说刚才海兰信副总的海底型,靠近城市边缘的场景也会有非常广泛的应用,这样两个方向都会非常美好,谢谢。

夏玉学:万国数据作为全国最大的第三方数据中心基础设施的运营商,我可以说我们对智能化,对AI的道路是坚定不移的。我们回到源头,从弱电系统设计开始,一直到软件的开发,都是充分考虑到AI的友好性,确保新的数据中心都是对AI友好的,随着智能化效果不断的呈现,我们可以给业界同仁分享更多智能化的AI的在数据中心应用的案例,感谢各位。

曹峰:感谢各位专家的精彩分享,谢谢。

非常抱歉未能帮助到您。为了给您提供更好的服务,我们很需要您进一步的反馈信息:

在文档使用中是否遇到以下问题: