袋鼠云陈吉平:数字时代,每家企业都需要搭建数据中台
陈吉平(拖雷)
袋鼠是陆地上跳得最快的动物,只前进不后退。袋鼠云要在数据中台的赛道上,一往无前。
中国第一批大数据平台构建者与架构设计者,曾担任阿里巴巴集团数据平台事业部大数据研究员,并打造了集团的统一数据标准与数据安全体系。基于对中国数字化前景及企业数字化需求的深刻理解,2015年创办袋鼠云,致力于运用自主创新研发的大数据、云原生、数字孪生等技术产品,有效支持企业数据中台、数据可视化、数据化运维的数字化建设需求,为客户建设自主可控的数字化基础设施和数据共享中心,挖掘数据价值,实现数字化转型。带领公司每年以100%的业绩成长速度迅猛发展,成功为3000+客户实现数字化转型升级,确立了公司在数字化建设领域的行业领先地位。2020年7月,袋鼠云与阿里云、腾讯云等共同被高德纳(Gartner)评选为数据中台标杆供应商。
“目前整个社会对数据的应用程度,还处在数据时代的前期,就好比刚刚出现电灯泡的电气时代。就像从蒸汽时期进入电气时代,只要一直发展下去,会出现冰箱、电视、洗衣机。做平台层和应用层的区别就像建电网和造电器的区别。”拖雷擅长用比喻、举例子,颇有布道者气质,过去几年频频讨论的数据中台,他解释得深入浅出。
拖雷本名陈吉平,建筑工程专业毕业,搞过研发、做过DBA(数据库管理员),还当过投资人。在阿里任职11年,他曾在的数据平台事业部集合了全中国顶尖的数据大牛。如同《射雕英雄传》里的同名人物,在阿里期间,拖雷参与了淘宝第一代数据仓库、阿里集团大数据平台建设……攻无不克,战绩斐然。
2015年底,拖雷创立袋鼠云,致力于为企业提供一站式的大数据基础平台。此后,同事业部的老友也纷纷加入数据中台的创业队列。“未来十年是企业服务的黄金十年,数据中台是企业数字化转型的最佳解决方案,在数据经济的大潮来临之际,每家企业都会搭建自己的数据中台。”
数字化转型就像一场大迁徙,数以亿计的企业正浩浩荡荡地跨越湍急的河流。拖雷和他的战友们的努力,都将被确凿无疑地镌刻在河流的两岸。
谈创业初衷|数据中台就是企业数字化转型的最佳解决方案
“中台客栈——‘数’下英雄会”沙龙现场
2019年12月6日,在“中台客栈——‘数’下英雄会”沙龙上,新华智云首席数据官李金波(介然)、袋鼠云创始人陈吉平(拖雷)、数澜科技创始人甘云锋(风剑)、奇点云创始人张金银(行在)(上图从右至左)四位阿里老友难得聚首,论道中台的现状和未来。
章丰:上次听你布道是在一个“中台老友会”的现场,那天来了好几位阿里云的资深战将。
拖雷:2004年我加入淘宝的大数据部门,参与建设了淘宝的首个数据仓库。2012年,阿里正式成立了数据平台事业部。那时马云开始提DT(data technology,数据处理技术)时代,畅想世界将从IT时代进化到DT时代,阿里巴巴要做一家数字化驱动的公司。
阿里的云计算起步更早,要追溯到2010年。当时马云在深圳IT领袖峰会上讲云计算是未来,马化腾、李彦宏都不认同,但我们对马云是信服的。那时候他常说:“我好比天上飞的老鹰,你们是地面奔跑的狮子和狼。我能看到更远的地方,但是你们需要跑一段时间才能看到我今天看得到的地方。”
章丰:2015年,数据平台事业部正式并入阿里云。几乎就在那两年,你们团队的成员相继离职,风剑和行在相继创办了数澜和奇点云。是什么动因促使你走出创业这一步的?
拖雷:我是团队里第一个离职的,当初其实没有创业的打算,只是想换一种生活方式。过了半年每天睡到自然醒的生活,无所事事,有点“坐不住”了。2015年10月,我和老同事丁原、江枫相约去西藏旅游。我们一路上从云计算、大数据聊到AI,萌发了创业的念头,这基于两个判断。
一是我们意识到2C的红利式微,难有新的机会。和美国相比,当时中国的企业服务市场刚萌芽,有着巨大的体量和增长空间,后来市场的投资风向也印证了这一点。
二是随着技术兴起,未来中国的数据智能将迎来高速增长。马云当时说,未来30年是弯道超车的最好机会,所有的企业都会进行数字化转型,就像电器时代对蒸汽时代的颠覆。既然要数字化转型,我们相信数据中台就是企业最佳的解决方案。
11月旅游回来,我们就注册了公司,想好了就马上去做。
章丰:为什么命名为“袋鼠云”?
拖雷:公司的全称是杭州玳数科技有限公司。“玳数”谐音“大数”,代表我们想做数据智能的践行者。“玳数”又谐音“袋鼠”,袋鼠是陆地上跳得最快的动物,只会前进不会后退。“袋鼠云”寓意着我们是以云原生为基础提供大数据技术产品和服务的公司,一贯秉承袋鼠精神,拥有不断跳跃发展至高至远的实力和动力。
谈中台的“拖雷定义”|袋鼠云总结出数据中台建设“全景图”
章丰:这两年“中台”的概念很热,但也存在被泛化甚至过度解读。你对中台的定义是什么?
拖雷:对于中台,至今没有明确的定义。袋鼠云始终在规范数据中台的定义和标准,经过多年实践和沉淀,我们总结出了数据中台建设“全景图”,剖析了企业数据中台建设的具体实施路径。
第一步,数字化咨询。帮助企业对现有的数据资源进行盘点和统计,了解有哪些数据,能做什么,相当于数据中台的顶层设计与规划。
第二步,数据平台化。结合顶层设计,对数据中台做详细设计,制定好平台的选型标准与策略,以及数据资源的盘点和汇聚,对所有的结构化数据进行摸排,确定实施模块、里程碑、实施优先级及行动路线。
第三步,数据资产化。通过把数据归集、清洗、加工、建模,使数据资产化,让数据资产真正成为企业未来的核心资产。这部分是“脏活”“累活”,但是如果离开这步,所有的数据应用与场景将会是空中楼阁。
第四步,数据服务化。帮助企业搭建全域数据共享能力中心,从而为上层的数据应用提供支持,将数据资产转化为数据价值,从成本中心变成利润中心,比如通过智能营销、决策指挥、精准预测等场景应用,实现数据驱动,挖掘数据价值。
第五步,数据价值化。数据价值化是一个变现的过程,由于数据平台化、数据资产化、数据服务化的完整构建,数据应用得以在企业内部低成本、高效率地构建和试错,数据化应用数量大幅增长,最终输送到企业的各个层级、各个岗位和各种业务场景,从提升营收、降低成本、控制业务风险、提高业务效率、创新业务模式等多方面实现数据价值。
第六步,数据化运营。数据中台建设不像从前的应用软件购买,不是一锤子买卖,而是持续迭代的过程。只要数据量还在增加,数据的维度还在增加,算法还要调整,就需要在公司内建立持续性的数据化运营的组织、机制和流程,持续挖掘数据的价值并不断创新。
数据中台建设自然离不开隐藏在背后并且贯穿全局的平台设施,也就是数据中台的底座。袋鼠云自主研发的云原生一站式数据中台PaaS“数栈DTinsight”就是这样的平台。数栈DTinsight具备天生云原生、自研核心引擎、金融级安全特性,围绕数据平台化、数据资产化、数据服务化三大核心能力,覆盖数据源采集、离线计算、实时计算、数据挖掘、数据治理、数据资产管理、数据共享服务等整个数据中台生命周期,能够使企业快速高效建设自主可控的数据中台基础设施、构建全域数据共享中心,使企业能够有效应用云计算、大数据等新一代信息技术,激发数据要素、创新驱动潜能,实现信息时代的跨越式创新发展。
我们认为企业做数据中台需要咨询先行,做好数据化的顶层设计和咨询规划,然后是数据平台化、数据资产化、数据服务化,一直到数据价值化,这是一个企业数字化建设的主航道,以实现数据对企业的全面赋能。企业在数字化进程中,一定要让数据化运营与保障贯穿始终,才能最大限度地保证企业数字化转型的成功。
章丰:这套方法论很有解释力,过去往往把中台理解成产品和项目,你认为是一整套体系。
数据中台建设“全景图”
拖雷:中台首先是一种战略选择、一种组织形式,其次才是有形的产品支撑和实施的方法论,大部分人理解的中台只是在场景层和应用层。有一些失败案例就是把数据中台作为单个产品或项目去实施。其实数据中台是“产品+组织战略”的配合,需要持续项目来迭代。
章丰:从概念到实施,也需要文化制度、组织制度的支撑。
拖雷:企业搭建数据中台需要从意识上转变,配合顶层设计、组织架构等一系列支持。当初华为投入几十亿元上ERP、CRM等系统,进行大刀阔斧的改革,“牵一发而动全身”,也是任正非亲自主导的。企业做数据中台,不是CIO(首席信息官)买了工具了事,由决策者亲自来抓,自上而下更容易成功。
谈行业格局|能做基础设施的企业只有四五家
章丰:行业内已经形成了几家独立的中台服务商,你如何看待未来的行业格局?
拖雷:数据中台领域会呈现两大阵营,第一阵营是平台型企业,有能力做PaaS级别的基础设施;第二阵营是应用型企业,提供数据应用解决方案。如果用电力领域来类比,基础设施相当于电网,应用相当于电器。今天也许只能造出灯泡等简陋的电器,甚至对比蒸汽时代的机器并没有质的提升,但只要坚持发展,未来会出现冰箱、电视、洗衣机,提高人类生产生活的效率。
为什么2015年阿里提出“大中台、小前台”?得益于中台的强大支撑,前台部门只需要关注业务的开发,不用重复造轮子,这让产品研发更灵活。所以阿里可以在短时间内上线“聚划算”“闲鱼”,同类平台投入的研发资源可能是阿里的几十倍。
章丰:选择平台路线,短期内很难形成规模化收入。好比电器少,摊到的电网开发成本就更高。袋鼠云如何解决这个问题?
拖雷:从成立之初,我们就把帮助企业搭建大数据基础设施作为核心战略,让客户和生态伙伴能够在数栈DTinsight平台上搭建和操作各种数据应用;同时打造标杆用户来验证和完善我们做基础设施的能力,两方面相辅相成。对创业公司而言,这是一种相对良性和合理的模式,基础设施的市场培育还需要时间,且交付周期都比较长,我们已经在这个赛道上做到了领先的位置。
章丰:未来在基础设施端会呈现怎样的图景,会像今天的云服务市场吗?
拖雷:随着物联网、云计算等深入发展,数据体量还会爆发式增长,今天已用的数据量可能不及总量的1%。我相信中国及全世界所有的公司都需要数字化驱动,未来每家企业都需要搭建数据中台。所以未来的市场足以支撑几家伟大的平台型公司。这就好比路修好了、加油站建好了,家家户户都买得起汽车的时候,汽车生产厂商自然会形成规模。
但是纵观整个行业,有能力做平台的服务商也就四五家,且不会一家独大,就像今天的云计算市场,而应用端会聚集大量公司。今天所谓的做数据中台的公司,大多只参与其中的一道环节,比如数据清洗加工,它们也是生态的一员,如果底层的数据质量不高、标准混乱,土壤不肥,不可能结出好果子。在大量的应用型公司中,可能会出现几十家、几百家在垂直领域、具体场景中形成规模的公司。就像有的公司聚焦AI算法、智能报表等场景解决方案,有的公司聚焦例如智慧公安、智慧电力等某个行业解决方案。
章丰:未来可能袋鼠云和你的几位老友都做大了,周围还有不同领域的“小巨人”,每家公司都有自己的气质和特点。你会怎么定义袋鼠云的特点?
拖雷:我觉得仁者见仁、智者见智。奔驰主打乘坐舒适,宝马强调操控性能,可能还有一家是性价比有优势。袋鼠云会坚持自己的特色,打造我们认为最契合市场和用户需求的产品,“让数据产生价值”。
谈生态建设|电网上的电器越多 生态越繁荣
目前,在金融、政企等领域,袋鼠云已经形成了标杆案例,服务了华夏银行、中原银行、国泰君安证券、银河证券、招商证券、平安人寿、国家电网,以及西湖景区、良渚景区、宁波舟山港等客户。更广袤的领域,袋鼠云希望联手合作伙伴一起拓展。拖雷判断,“数据中台真正的护城河是生态,建立生态的时机也非常重要”。袋鼠云已逐渐形成自己的生态圈,与阿里云、移动云、ZStack、浙江大学、Cloudera等达成合作伙伴关系。
章丰:目前袋鼠云的生态建设进展如何?
拖雷:2019年我们启动了生态伙伴招募,已经与一百多家合作伙伴建立合作,超过一半的订单都来自我们的生态合作伙伴。
袋鼠云负责提供平台的基础设施,合作伙伴连接应用到场景中。例如袋鼠云与数知科技一起,共同构建面向央企、政府的数据中台解决方案;联手云徙科技,共同服务地产客户;联合中航金网成立信创大数据联合实验室,致力于共同推进军工行业国产化进程。好比袋鼠云搭建了一个高质量的电网,提供稳定的电力、便宜的电价,电器制造商可以直接使用,不用自己另造电网和发电机。电网上的电器越多,生态就越繁荣。
章丰:一家公司不可能在所有垂直领域都做成专家。
拖雷:就像谷歌不会独立开发安卓操作系统上的所有应用,我们要找到垂直领域最专业的人,做出最有行业价值的产品。另外,我们也在不断提高自己的核心技术能力,搭建好中台的基础设施,提供更强大的底层支撑。
谈数据可视化|要做“酷炫的大屏”更要有数据支撑
疫情期间,袋鼠云研发的“员工健康追踪云图”发挥了价值,企业可以及时掌握员工假期去过哪里、从哪里返程、健康状态如何,用以指导复工。云图的实现,得益于袋鼠云的数据可视化平台——EasyV。在平台上,客户通过拖、拉、拽等简单操作,就能搭建出精美的数据可视化界面。
章丰:数据可视化的应用很常见,然而我们也发现有些地方把“驾驶舱”做得很炫,但数据量很小、更新频次低,甚至谈不上对数据的挖掘。你如何看待数据可视化的价值?
拖雷:第一,数据可视化作为视觉呈现的一种方式,“炫”是它的价值之一。尤其对有接待、展示需求的客户来说,如何让“驾驶舱”的视觉更震撼,让受众更快、更有效地获取信息,也是一种价值。EasyV具备时下先进的数字孪生和3D可视化的技术,能够将物理世界发生的一切映射到数字空间,实时保持数字空间与物理世界的协调一致,从而更加形象、生动地呈现数据的价值。
第二,展示之外,数据可视化还要“让数字化价值看得见”。比如我们为国家电网提供的大屏可视化决策系统,对接了电力多种业务系统。面向业务指挥场景的可视化,要做到数据实时、全域和精准,从而辅助决策。水利、文旅、安全、交通、金融等行业都可以利用数据可视化辅助决策,我们希望这类应用会越来越多。
章丰:数据可视化不仅是“看”,还要“用”起来。
拖雷:我们不仅要让数据用起来,还要往前走一步,让数据产生价值。在大数据被有效使用前,阿里有句玩笑话“坐在金山上啃馒头”,手握数据不知道能干什么。后来发现这些数据可以为一线运营的“小二”所用,还可以搭建TCIF(消费者信息数据系统)帮助阿里了解消费者、优化广告投放,这也就进入“用”的阶段。数据如果不变现,就是成本;挖掘出价值,才会从成本转变为利润,激发商业价值。
数字孪生、数据可视化场景
章丰:会不会出现这样一种情况,数据可视化工具很强大,但底层的数据质量很差?
拖雷:这就需要强大的数据中台作为支撑。就像城市电网,如果开发阶段没有统一规划,到处挖线,到后期就不知道哪里可以挖。如果事先进行规划,主干线的布局、已布局线路、可开发的线路都会一目了然。今天数据中台就承担着这个功能,集中现有数据资源,进行可视化呈现,那么各部门、各业务需求方都可以清晰了解自身数据资源的现状——现有数据质量如何,还需要获取哪些数据、补充哪些外部数据,从而大规模提高企业数据资源利用的效率,形成数据赋能业务、业务反哺数据的良性循环。
谈价格和价值|以价值为驱动 攻克付费意愿难关
章丰:你在“中台老友会”上提到目前数据中台落地产品为用户创造的价值远远高于价格。这是什么原因造成的?
拖雷:这与中国的现状有关。相比国外,国内对软件付费的意愿一向很弱,对看得见、摸得着的硬件认可度更高。但我相信这个趋势一定会改变。
第一,中国传统的企业服务模式会被颠覆,从传统“卖人头”、做外包的模式,逐渐转向以技术为导向、以价值为导向的服务模式。国内越来越多的公司愿意在研发投入、芯片设计上下血本,当技术壁垒形成后,技术本身带来的附加值将会形成议价权。
第二,国内市场的付费意愿会逐步提高。企业的背后也是人,这一代消费者慢慢开始为会员服务、知识、版权买单,也会逐渐建立起为服务买单的意愿。
第三,付费模式将发生转变。中国的企业服务市场,经历了从买断模式到包年服务模式的转变,未来还将不断创新,由此催生出新的大公司。
章丰:数据中台是一种理念,在传统行业、政府机构等的理念改造上,你觉得还需要多长的周期?
拖雷:需要等上几年时间,但也不会太久。因为国人接受新事物的能力很强,创新能力很强。云计算提出才短短十多年,已经发展到可以大规模在生产网络中部署并承载关键业务了,数据中台的趋势也一样。
我常说我们是最幸运的一代,成长于国家高速发展的时期,经历了破坏性创新的时代。满目的繁荣和创新,塑造了我们乐观的天性。我始终相信,中国未来十年是企业服务的黄金十年。土壤逐渐肥沃,小树正在生根,不妨多一点耐心。
快问快答
面对压力,你有什么解压之道?
玩,旅游、打游戏。我比较乐观,没把压力当回事。
你获取新知识、新信息的关键方法是什么?
看书和思考。人如果要提升,一定要培养深度思考能力。
为了激励团队,你惯用的“伎俩”是什么?
近两年我会更注重企业愿景与企业文化建设,我们秉承“让数据产生价值”的愿景,给企业提供一个可靠的、稳定的、具备高技术能力的基础设施,为整个中国的数字化建设贡献自己的力量,让大家感受到成就感。另外,在文化方面,我们打造开放、创新的互联网企业文化,让员工能感受到自己的价值与意义。
你认为“数字新浙商”,“新”在哪里?
用新的思路去看未来,用好数据能源,让数据产生真正的价值。