员工bi是什么意思(bi是什么意思)

文末领取10 大厂数据分析岗面试题及答案

本篇主要讲业务线建设。用于解答管理层的疑惑、解答对数据不了解的同事的疑惑、怎么和数据团队合作。

适用于中等体量的互联网公司,(50 ~ 500人)

01 数据、数据团队能做什么?

一般可按上图理解,数据团队的工作一般包括2块。

1. 中台(基础设施建设)

这方面讨论很多,best practice基本相同。主要是提供通用的各类基础设施。比如:

从业务线抽数、存到HDFS上(ETL)

管理数仓中的各类数据(数据治理中的元数据管理)

数仓模型(维度表、事实表)的加工、调度管理

机器学习模型的监控、工具提供等

按当前的实践,主要可分3大块:数据科学、数据开发、数据治理底层是数据集成平台,上层则通过各类方式把加工处理好的数据给出去。

2. 业务线建设(数据应用)

这方面内容很多,但大部分讨论比较散,因此很多人只了解一部分。参照Airbnb的架构和我的理解,可分成3块:

(1) 数据分析/BI

即最传统的BI工作,出报表、数据分析报告。

比如,该业务线的每天表现是怎样的,因此需要制定指标、开发报表,同时还涉及一些EDA、专题分析。

(2) 增长/试验

即增长方面的工作,主要是A/B测试及效果分析。

比如,分析用户在注册流程中各个步骤的碰到的问题,看漏斗、drop-off rate,然后考虑产品层面有什么可以改进的地方。另一方面,改进上线后要分析效果,看对各类用户的影响、程度;难度大一些的,是一些参数、策略的优化,比如定价的优化。

(3) 数据功能与产品

即面向用户的功能和产品(上面的BI、试验都是对内的),核心是算法模型、指标。

比如,对信息类产品(如内容、资讯),常有推荐系统、排序;涉及钱的,会有风控、反欺诈;类saas的产品,会有面向商家、个人的BI服务,比如淘宝/Stripe的商家数据后台等。

需要注意的是,通常不包括专门的领域。比如搜索、量化交易、线路调度、语音助手、财务、人脸识别都是极其依赖数据的产品、功能,一般专门成立团队做。

按上面的划分,也回答了数据能做什么,怎样使用数据改进产品。

02 数据工作的顺序

当人们想到要做数据工作时,最先想的可能是做AI、算法、机器学习,然后就打算招人开干,快速上线。但实际的工作流程并不是这样的,也就有了开头图里的箭头顺序。

一切工作都是从ETL开始的,需要先接好数据,经过分析,最终才能有产出。如果没有足够的基础设施支撑,一方面工作效率会很低(比如报表需要手写开发、命令行SQL查数),另一方面,一两个字段搞错了,整个分析、算法的结论可能也就错了,整个产出也就白费了。实际中,也有要用的数据存错了、没有存的情况,这些都是数据应用的基础。

所以,实际的工作顺序,是从搭建中台开始,然后做业务线建设。这样算的东西才准确,而不是从业务线应用开始。另一方面,数据工作的顺序也值得从分析、增长再做到机器学习,因为这些工作的难易、ROI不同的。如果没有做过系统性分析,那么数据分析、增长也能有不少low hanging fruit, 也能逐步提高整个团队对数据的理解。

另外,上述业务线的数据工作,在中台都有对应的基础设施支持,比如报表、分析对应的是BI平台(如metabase),这也是中台本身的意义。只是不同阶段可以做到不同程度,不需一蹴而就。

03 分工与流程

1. 数据团队内分工(“不为人知的data engineer”)

需要做数据工作,直接招NB的data scientist就行了?

实际上并不需要。如前述,中台/基础设施先行于业务线,需要有data engineer。data scientist所做的一切工作都需要有data engineer把ETL、调度等工作做好。

因此,数据工作的分工是data scientist –

(0)
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容,请发送邮件至 PTU@FOXMAIL.COM 举报,一经查实,立刻删除。