Views: 580
在赢者通吃的生态中,脆弱性往往体现在对于定义输赢的标准上面。当在定义不完备的前提下,所谓赢者的种种就会被当成金科玉律。那么,那些登堂入室的琐碎大多就需要推敲和明辨。
中台的概念被炒起来了。内外热度让人怀疑哥伦布降临,乔布斯再生。各种组织鼓吹数据中台的专家多如牛毛。而亲身参与过企业构建数据服务平台全过程最一线声音也说这是技术发展正确趋势,是在之前基础上正确演进。看完这些东西,顿悟了原来技术可以做成宗教,赶紧翻出10年前写的数据平台标书咂摸两遍,心情好了很多。
无可厚非,阿里在这个领域起到了至关重要的作用。从海外游戏公司技术中台到现在中国神话系的阿里数据中台,我们可以清楚的看到阿里数据技术人在里面做的巨大贡献。然而,业界太多“新瓶装旧酒”的专家,包裹中台概念,行传统数据平台之实。就好像,自动炒菜机做出来的回锅肉就不是回锅肉了一样。更有甚者,一口一个数据中台,然后做出来的东西即便是用传统数据仓库平台标准考量也不能算合格。
从《大数据大创新 阿里巴巴云上数据中台之道》里面,可以看到从2012年阿里巴巴才开始对于数据服务和业务服务本身提炼认知、构建中台。这和传统EDW认知培育、实践过程整整错开了7年。05年之前,Teradata就已经在各个银行、电信落地数据治理的方法论,构建EDW体系,推广将数据和业务系统结合的模式创新。此时,阿里还盘桓在如何从Oracle RAC架构泥潭走出来,以解决OLTP效率的漩涡中(《企业 IT 架构转型之道 阿里巴巴中台战略思想和架构实战》P37)。
3年后,张主席在《阿里巴巴集团全面组织升级,启动中台战略》里面提到构建“大中台小前台”组织机制和业务机制。在这10年中,五大行、电信通讯和金融企业等诸多企业大多已经构建了完善的数据平台体系。光是银行体系针对数据治理相关标准也都优化了好几套,相关项目也做了不计其数。小范围,或者说某一个领域的成绩并没有让业界如此激动。
回过头来看看,企业信息系统建设历程。联机分析处理(OLAP) 和 联机事务处理(OLTP)的本质区别就决定了对数据容器要求的差异。大数据时代中,诸多产品和技术只是从技术上解决了数据处理能力的问题。阿里关键贡献是围绕着数据中台进行的组织变革,进而作用到业务发展。这恰恰和技术本身关系不大。
当然,不能否认技术积累的量变,会带来对于业务模式的革新和质变,但是,回过头来看 数据处理和 业务处理被分别提出,本身就是因为计算资源有限情况下的一种折中方案。当计算资源和效率不是问题和瓶颈的时候,他们的区分就没有那么重要了。
数据中台到底属于 OLTP 还是 OLAP,还是兼而有之呢。数据中台的核心在于数据能力的组织和共享。为了达到数据能力的共享,一方面需要实现高效的数据处理能力,另一方面也需要实现便捷数据应用能力落地,同时辅助功能、管理体系和系统也不可或缺。在这个体系中,我觉得应该包含以下内容:
• 统一管理的资源能力
数据中台上游是指数据资源,处理基石是计算资源,而应用则是构建在需求资源之上。这其实与传统数据仓库平台构建没有区别。继承相关方法论和架构体系是有益处的。例如,即便物理模型千差万别,作为现实社会和数字环境桥梁的逻辑模型必然更加重要。按照主题域构建的数据逻辑模型,按照处理逻辑和优化架构开发的资源分层能力,系统实现多维度资源归一化识别,资源之间网络化/图谱化关系梳理都是资源能力必然要求。
• 统一工具化的开发能力
数据中台中,对于工具和产品的要求更加明确。这是传统数据仓库体系中最需要变革的:大到统一数据生产环境的自动化部署、监控运维,小到分析程序开发代码调试及版本管理都有明确的技术要求和体验要求。中台系统中,会将开发过程从 IDE、Client 中提炼出来,形成统一开发平台,数据提取和分析、代码编写和调试都可以在中台提供的 Web Console 中实现。这样的模式既可以保证开发过程的数据安全,也可以保证在运维部署过程中的自动化、产品化和持续性保障,彻底摆脱离散开发环境的桎梏。
• 场景化的应用能力
数据中台的服务体系构架一定是基于应用域的服务。研究阿里的数据中台全景图,以服务形式存在的数据应用能力是重要的形式。而服务本身设计和搭建就是以场景为基础,满足场景中数据能力的需求。通过服务和服务之间的解耦、整合,实现场景化和生态化的部署实践。它是曾经微服务体系的演进,也是服务于产品线、服务于业务需求的唯一出口。
• 体系化的管控能力
如前面所提到的,数据中台的成功往往不取决于技术能力,更关键的是组织革新、管理能力和数据管控体系。以数据标准作为切入点的数据管控体系是平台管控的核心。统一口径标准制定、服务规范制定、元数据管理,以及组织功能和结构优化都是数据中台要考虑的问题。简单从系统架构考虑,而忽略组织在其中的作用,往往会导致中台的失败。
所以,我觉得数据中台是在计算资源和性能不构成瓶颈的前提下,构建在高效模型体系、技术体系、应用体系和治理体系下的能力池。这是组织内处理能力融合的一种机制,是更先进的数据融合和技术融合体系,更完整、更封闭。最终目的是提高企业内外部数据能力,进而提高业务能力。
马爸爸花了小20年做成了阿里巴巴生态。在生态中,每一个店铺就是店主的自己企业,每一个小的应用都直接作用于业务经营和生产。他们汇集的三大业务垂直领域数据,整合四大跨领域技术和数据能力,构建 OneData 体系数据域和能力域,最终直接受益者都是这个生态里面每一个终端用户。
试想05年开始,银行体系的诸多大佬如果有马爸爸这种坚持,以数据仓库平台治理的方法论和技术,开拓创新,恐怕真正第一个意义上的数据中台不会出现在互联网企业。现实是,我们在传统 EDW 领域听到最多的是“这个架构处理这个企业的需求已经足够了”,“这个方案对于这个企业已经足够了”,“这个产品对于这个方案系统来说已经足够了”;在互联网企业听到的最多的却是“发展太快,环境变化太快,技术方案满足不了,我们要优化”。所以,最终真正的数据中台只会出现在互联网生态公司。
“照猫画虎”还有后一句。也不知道最后行业里面的专家们会画出多少“犬类虎”。也许,那个时候他们已经在其他领域,比如区块链提出诸如博彩凭证中的应用体系架构的论调。而对企业组织来说最可怕就是各色人等缺乏对于客观规律和基本常识的敬畏,狂妄如老教授前叫嚣的黄口小儿,一知半解的装腔作势,最终的恶果还是得企业来承担。
上帝保佑天真的孩子。