之所以热爱这份职业,跟了解一个陌生朋友的情形类似,起初TA的样子很模糊,随着时间深入地了解,逐步看到诸多可能性和变化,也慢慢感受到TA的无穷魅力。
原始采集的数据都是无序的、混乱的、非结构化的,但是,数据背后探寻问题的方法、思路甚至发展历程是有规律的,在无序的世界里寻找有序的规律,是很大的乐趣所在。
就拿业务发展的周期问题来说吧,通常业务发展会经历初创、发展、成熟、衰退四个时期,你当然可以有很多种途径了解新接触的业务所处的时期,那在数据的世界里,有没有一个门槛低又行之有效的方法呢?我的建议是,通过公司最核心的指标了解管理层关注的侧重点。如果全部的关注集中在规模指标,比如GMV、单量、DAU之类,说明公司正在市场奋力厮杀,规模增长是第一位的。如果在资金成本类的数据上做得比较深,说明野蛮生长的时代告一段落,要看效率了。如果开始关注市场、合作伙伴的数据,就能进一步说明已经在市场中有地位,并且也在关注上下游生态的情况,到了“由内及外”的阶段。聊天能骗人数字会骗人,但是很少有人会在日常报表结构上骗人。
猜猜严选数仓里哪个数据域的中间层被调用最多?答案是交易域,交易域里有大量交易金额、订单笔数等信息,说明目前我们更关心“结果”,如果有朝一日用户域、商品域、流量域跑到了更前面,说明我们关注的焦点前置到了“原因”和“过程”,会是个了不起的变化。
再比如电商的流量分析,涉及到搜索、推荐、栏目等一系列应用模块,其中有算法介入也有人工配置,是一个包罗万象的复杂命题。应该从什么角度入手呢,一种方法是把不同模块下的流量分成“入”、“分”、“接”、“值”、“环”、“出”六个标准环节,在每个环节里都定义出核心的指标,如UV、曝光PV、点击PV、CTR、CVR等等一系列标准度量,通过对不同商品及用户类型的“细分”、“对比”和“溯源”来发现数据变动背后的根因,一个复杂的问题依靠标准的“环节+指标+方法”降低了学习和探索的门槛,从而变得有机可寻。
章法无处不在,追本溯源是有趣的,提炼出章法更是有趣的。
很多时候我们看数据,会不自觉追求震撼的效果。销售额翻5倍,用户数10倍增长,扑面而来的冲击感,有没有?什么,毛利率才增长0.3%?太逊了。很长一段时间里,我都觉得冲击感弱的案例是不值得投入的。但是,真正让我对大数据的威力肃然起敬的,恰恰是一些看上去特别微弱的数据变化。2016年在阿里做双十一,每天一大早,数据团队会给集团CEO及其班委发一份数据早报,让我至今印象深刻的一件事儿,是我们看到商家发货率同比上升1%,连续两年如此,日常却不存在。这是个很小的变化,跟其他海量增长指标比起来完全可以忽略。出于好奇,我们决定一探究竟。最后发现是单量向大商家集中,头部商家发货压力越来越大速度越来越慢导致的,这种现象在大促时被进一步放大,就有了商家发货率逐年放慢的数据表现。基于上述现象,发展出了后来大家都很熟悉的预售模式、大商家直发、仓内预包装等大促玩法,来纾解双十一商家发货压力。
另外一个案例是物流体系会监控平台运单在承运商(四通一达)的占比,发现份额在以非常微弱的幅度持续下滑,一开始我们怀疑是服务商接口回传少了,但随着事态的发展,才让我们逐步意识到它背后藏着一个庞然大物–PDD。后来跟前端数据的同学一交流,原来他们也发现在差不多的时间段内,低客单价的用户活跃度在缓慢降低,这些微小的持续的变化需要靠极其敏锐的嗅觉才能捕捉到。
这两件事都给了我很大的启迪,时代的巨变往往起源于一个细微的变化,你见过它,但不一定真正看见了它。
演艺圈很爱跨界,什么演员的诞生,跨界歌王,碰撞出了不少新鲜火花。数据圈其实也是,不同领域的数据,如果不流通不合作,是完全静态的。一旦做出奇妙的搭配,就会流动起来,进而演化出新的数据资产。
值得庆幸的是,今天市场上有很多提供数据服务的公司,购买和交换数据的门槛越来越低,说明行业越来越繁荣,各个企业也越来越重视自己的数据资产,尽管整个市场离成熟还有一段漫长的道路,途中我们要规范权限、法律制度甚至触及到道德伦理,但不可否认的是,市场早已觉醒。
就拿天气信息来说,个人认为实在是非常适合混搭。零售场景很多都是跟天气相关的,比如冬季羽绒服鹅绒被这类应季品在气温骤降时,不做折扣的前提下销售额能提升15%~30%,今年是个寒冬还是暖冬,春节在几月,不同地区寒潮来临的时间,这些信息都能在备货、促销甚至是触达用户时起到关键作用。更有意思的是,天气的冷暖也会引起用户口味的变化,各地用户呈现出了有趣的差异,比如每年到了秋冬季节,天气湿寒的江苏地区偏甜辣口味的零食就会卖得好,当粤北地区降温,广州的朋友对关东煮的需求就会增多,但是温度相对舒适的深圳用户,会对碳酸饮料有非常微妙的依赖,诸如此类的信息已经被越来越多的便利店经营者重视。除此在外,天气信息也与物流、供应链、交通等诸多行业有着千丝万缕的联系,很多企业第一份外部采买数据都会考虑天气。
流量红利用完了,数据红利又来了。
这是一个美好的时代,海量数据创造了更为丰富的就业机会,虽然每个个体的工作与贡献微乎其微,但是无数个数据工作者所共同创造的环境,是对这个时代最好的献礼。都说数据工作会被人工智能取代,也有人说这世上绝大部分工作都会被人工智能取代,如果今后的工作能够被曾经倾注过的事情取代,也是个让人引以为傲的迭代,其余的事情,管他呢~
转自:SunnySun(孙妍)