指标管理中台的产品演进路径
中台的概念没出来之前,会称之为指标管理平台。对于指标管理平台这个偏后端数据资产管理与治理的数据产品来讲,其建设的初衷主要解决以下几个问题,如果你也要做指标管理,可以看下这几个需求场景是否都覆盖了。
相反,如果你来自新加坡,那么那里的数 新加坡数据 据库技术发展非常迅速,最终可能会取代一些传统的数据和分析方法。应用程序功能云原生数据库广泛应用的预测分析由人工智能 NoSQL 解决方案推动,用于管理大量非结构化信息区块链之类的技术正在重塑数据安全性和完整性,无服务器架构为运营安排最佳方案。
指标字典的存档与信息查询
企业发展初期数据产品不成熟,经营管理会上不同部门(产品、运营、销售等)一起给老板开会汇报业绩,发现数据对不上。于是为了方便排除数据问题,就形成了指标统计口径说明字典,那个时候在线文档还不流行,主要是excel或者Wiki维护。
主要问题:信息传递困难、流程不清晰、更新不及时,且无法和报表产品联动。指标管理平台1.0的版本首先先要把指标统计口径能够线上化维护起来,并且可以把信息输出给下游报表应用,鼠标悬浮时,tooltips就可以展示指标说明。
统一指标口径的业务流程规范
有了指标字典,还是没法解决数据对不上的问题,于是老板给数据部门下了个需求,数据团队牵头把指标口径统一一下,下次会议不要再出现会上对数的问题了。
于是,数据PM想了个办法,新增指标需求的时候,要有统一的流程,业务部分申请,数据分析师审核,数据PM整理需求,数据开发进行数据报表开发,把这个流程集成到指标管理平台当中。并且可以通过工单流转的方式,进行IM或者邮件的提醒。
这样一来,流程是规范了,但是牺牲的是指标开发效率,比较涉及不同角色协同。对于指标数量比较少,且更新不频繁的业务是没问题的。
指标的数据统计逻辑
业务统计口径是明确了,但业务经常反馈数据问题,数据开发排查时,要逐层翻代码才能知道这个指标使用的是哪个数据源,SQL逻辑是什么,每个任务光点开操作就要好几层,有时不小心误操作保存了,就导致了数据bug,所以,指标还需要和数据源绑定。有了指标和数据源的映射,就可以把指标血缘做起来了。
指标血缘是指可以链路追踪指标数据加工的来源,以及输出的报表或API应用,当业务端质疑指标异常或需要确认指标口径时,可以基于血缘工具找到产出表,以及最源头的数据来源。同时,当数据质量监控测发现数据质量问题时,可以及时反馈到下游应用,应用端对用户进行提醒,避免错误的数据给用户带来负面的决策影响。
通常数据血缘是服务于整个数据中台体系,所以指标平台可以复用公共的血缘查询能力,没必要单独建设,只需要把平台内的模型、数据集、指标、应用的关系数据采集好,反馈给血缘模块,血缘模块进行数据链路扩展即可。
指标数据API接口输出
主要是在做定制化Dashboard或者可视化大屏开发时,需要前端开发改造Echart,Java后端开发写接口查数据开发清洗好的数据表(根据数量大小和实时性要求,放到不同的查询引擎,如MySQL,Greenplum,Clickhouse等)。
这样一来,一个可视化页面可能就需要一周的时间。对于报 加拿大数据资源 表需求来说,就是指标和分析维度,指标API的结构相对固定,能不能让系统配置化,而不是Java开发写没技术含量的代码呢,这里其实有点低代码和中台的意思了。因为指标已经和数据源绑定,查询逻辑也有了,自动生成一个查询体的接口,通过一些JDBC/ODBC的链接返回数据,给前端画图使用。
自助式指标分析
数据化运营促使人人都需要用数据,会员业务部要看会员的订单量,营销部门要看活动订单量。都是一个订单数指标,限制条件不同。标准化的指标生存流程已经很难支撑业务爆炸式增长的数据需求。所以,业务人员开始手写SQL或者推动公司自研或者外采自助BI产品。
知道了数据集、字段含义后,自己拖拉拽进行可视化分析,配置可视化Dashboard。这样一来,定制化开发的可视化报表需求越来越少,主要在一些大屏或者给管理层使用的定制化功能方面了。
这个时候,指标平台想要发挥余热,就要和自助BI分析结合(自研产品),把指标管理平台作为一个数据源类型,用户可以直接选择指标、共有的分析维度,借助自助BI的可视化配置能力,基于指标配置报表。毕竟相比较基于数据模型来说,指标的加工程度更高。
智能AI指标分析
ChatGpt火了后,各行各业都想着蹭上热点,很多人担心被AI替代。对于数据结构化程度较高的指标管理平台,天然就有了可以和AI结合的优势,18年在携程的 社交帖子 时候尝试做过一个数据问答的产品,即用户输入数据指标需求,通过知识图谱返回指标的拆解分析。现在AI更加智能,能够做的事情和功能会更加强大。比如昨天App订单数是多少?帮我做一个营销效果分析的报表(利用NLP和AI把营销域的指标呼唤出来,组合成一个可视化报表)。
指标管理平台彻底解决数据口径不一致的问题吗?
从指标管理平台提供的解决方案可以看出,主要是指标建设流程的规范化,以及指标生产到应用流程的全链路产品化。流程的规范化涉及一个指标需求在不同工种之间的需求流转,在系统初期指标上线效率整体还是比较低的。
再者就是数据中台的思想是提高数据输出效率,很多数据中台的产品解决方案会包括自主BI数据产品,即产品和运营可以直接基于数据集进行拖拽式的分析和可视化报表配置。规范化和自助化存在交叉和冲突。
不做指标统一管理,指标永远是错综混乱,指标标准化,一定程度又会影响数据分析的时效性,那到底该如何权衡,或者确定好指标管理平台的目标和边界呢?指标的建设是需要长期的积累和完善的,可能规范化的初期会有一段时间的阵痛期,但随着平台内指标的丰富,新增的需求可能会越来越少,即可以确定的是对于业务条线多的企业是需要将指标统一管理,对于在公共层面的通用指标,必须由指标管理平台统一生产和管理。
而对于一些业务临时性、个性化强的指标或者数据报表需求,可以基于自助BI工具,以及SQL取数工具等,快速自助化获取所需的数据即可。例如,某运营部门需要对端午节新上线的一个盲盒活动进行数据监控分析,直接基于盲盒数据模型,利用自助分析进行可视化配置的效率远远高于先生产指标,再利用指标的流程。
指标管理平台是可以帮助企业进行指标规范化管理的有效工具,但规范化带来的牺牲就是流程的冗长和效率问题。对于共用的指标以及缓慢变化的业务,可以基于系统进行管理和维护,而对于小范围的业务条线以及时效性要求更高的业务场景,可以用自助BI等产品加以辅助,但最终的原则一定是公共指标系统化管理、流程化生产。
另外,指标输出应用场景方面,还可以继续扩展如指标波动监控、分析报告自动生成推送等能力,把指标管理平台作为数据中台能力的出口之一,不断完善系统功能。