转载自己的博客

【数据分析】Tableau_30天修炼技巧

 

自己做零售也有不短时间了,不久前偶遇Tableau,初恋即是热爱;认真学习到现在一个月时间有余,我已经能做出基本的可视化报表。分享自己的一点体会,希望能帮助更多Tableau爱好者。

一、

学习Tableau 30天,总结自己在零售数据分析过程中的几点感想,

1、了解业务,建立充满洞察的数据模型,比拥有大数据更重要

作为十年的零售企业,多年的数据模型止步不前,个人认为,一方面是工具理性不够透彻,比如止步在Excel阶段,而不能使用Pivot,甚至Tableau之类的大型BI工具去分析,从而无法建立基于大数据的逻辑;另一方面,也是最重要的,信息和数据的员工不了解业务,因此不能深入地理解业务的需求建立数据模型,只能止步在“业务需要什么,我给什么”的阶段。

那我们就只能依赖于业务部门提出详细的需求吗?此路往往异常艰难。业务部门的分析框架,多半局限在自己的视野之中,而且出于利益的考虑,往往还会选择性地筛选数据、分析数据、展示数据,数据的有效性层层递减。

因此,一个优秀的数据分析师,首先是业务专家。在这一方面数据分析师要向会计师学习,会计师有国际通用的分析框架,业务却往往是每个公司都有自己千疮百孔的业务分析框架。精于业务的数据分析师需要了解业务,跳出业务部门的局限性,从公司的高度,参考行业的通用分析方法和框架,建立公正透明、重点突出、相互支撑的分析框架,进而借助BI工具建立数据模型,并在不断地分享中修改和升级。同时,有效地指导业务部门负责人使用数据模型的可视化图表,在他们看来可能魔幻、充满变化的可视化中寻找业务的问题和解决线索,实现数据洞察的价值。

我想,这才是数据分析师的修炼。对数据的洞察,比拥有数据更重要。

数据分析.jpg

2、循序渐进,不断推倒重来

对于初学者,要有耐心不断地修改自己的作品,甚至推倒重来。以我学习LOD的经验,第一次的成功多半充满侥幸,第二次第三次的自然输出才是成功;而伴随不断的学习,只有推倒重来,才能从根本上精简自己的数据模型,而不是在脆弱的学习成果上打补丁。

比如,有一天发现通过data blending,可以把门店基础数据(静态数据)和业务数据(定期更新)分开,而不用在数据源中反复链接。这就需要我从头开始搭建整个框架,而不是通过“替换数据源”开始另一个噩梦(我亲尝了这个滋味,最后还是从头来过容易)。

3、多看官方教程

虽然我买了几本Tableau的书,也确实有点好处,我依然认为最好的学习资料都在官方网站的学习和社区中。如果Tableau中文帮助有歧义,我就去找英文的help文档,总能找到你想要的东西。

4、一颗对数据敏感的心。

如果没有看过代码,如果大学C语言都讨厌,如果看到一堆数据就头晕,恐怕此生与数据分析无缘了。

数据分析需要统计学、概率论的知识,更需要一颗对数据敏感的心。知识是可以积累的,对数据的感觉却是在业务的真实环境中锻炼的。

 

二、

说完学习的总结,我想简单介绍一下自己学习Tableau的主要步骤。

  1. 试用软件,乱点一通,导入一点数据尝尝鲜;嗯~有点滋味;
  2. 买书,看了一本《人人都是数据分析师–Tabaleau应用实战》,间歇性拿着公司百万行数据练手;
  3. 整理公司的半年业务数据,开始分析之路,可视化展现慢慢有了雏形,遇到LOD(详细级别表达式)卡住……
  4. 用一个星期多的时间,反复钻研LOD,不惜做一个十行的数据表做练习,在练习中发现各种语法的计算差异,增进理解;所有的学习笔记,一律记录在onenote中,不断更新;
  5. 借助自己的业务理解,按商品品类、门店运营、会员分析、员工分析等板块,逐个建立分析的维度和模型;V1.0,V1.1……不断的分享给公司业务部门,提出修改意见;
  6. 学习官方指南,了解之前有意绕开的部分功能,比如data blending,修改或重建数据模型,加快分析效率;
  7. 指导信息部门员工学习Tableau,联系Tableau销售经理咨询价格,还发给美女经理一张分析图求教,索要Tableau营销ppt,给董事长推荐Tableau分析工具……

最兴奋的时间是前面一周,每天都在练习,后来一段时间开会耽误了学习,加上LOD反复搞不懂大费周章有点心会气冷,效率慢了一些。坚持学习,30天,Tableau就会有回报,相信自己! 三、我说一下自己学习Tableau的几点偏实战的总结吧,数据分析大拿请自觉绕行,初学者还可以参考。

数据整理

1、Tableau挑剔数据,需要提前整理好数据表

Tableau自身对于数据复杂整理的能力毕竟有限,而且规范的数据格式可以避免后期大量的麻烦。如果公司在使用各种信息系统,大多数系统中直接导出来的数据都是格式化的,比如ERP,KIS,稍加修改甚至无需修改就可以使用;而对于人资每月制作的工资表,财务每月出的门店利润表,就需要适当整理,特别是把不同月份的整合到一起,增加“日期”的维度,把标题从首列改到首行等。当数据来自不同部门时,还需要对比数据差异,建议已主系统中的销售数据作为基准数据,然后整合财务部门经过调整的毛利和利润数据。虽然这本不该数据分析师的工作范围之内,但是数据甄别越早,所有的部门都会避免后期的麻烦,毕竟是利人利己、未雨绸缪的好事情。

数据分析的镇山石

2.hiearchy、Set 和group分类神器

我曾经在第一篇的博文中列举了分层、组、集、参数、计算字段的对比,(迎战大数据,自从有了你,从而「如虎添翼」)这是数据整理和分析的基础。

set分组Hiearchy分层

3、天杀的LOD必杀技——Fixed、Include、Exclude

我在LOD上花了最长的时间,至今依然有不解的地方需要继续钻研。不过,在LOD上花费再多的时间,也是值得的,因为它会实现你之前想要但是难以做到的可视化展示。我用**我的思维方式,诠释一下理工男的高级成就。深挖数据的可视化展示,有宽度和深度两个方向,前者比如从国家到省市,从省市到乡镇;后者比如从商品品类结构到单个品类的会员分析,从单品类的会员分析到品类中商品的会员平均订单购买数量。你会发现,宽度是在一个维度(dimension)上度量(measure)的展开,而深度则是在不同维度上的展开。

向视图中添加维度来增加标记数量的过程称为设置详细级别。……某些情况下,向视图中添加度量可能会增加视图中标记的数量。但这与更改视图的详细级别不同。The process of adding dimensions to the view to increase the number of marks is known as setting the level of detail. ……In some cases, adding a measure to the view can increase the number of marks in the view. But this is not the same as changing the view's level of detail.

因此,设置详细级别表达式,需要的增加数据的深度,而不是广度。增加维度,是更改详细级别的充分但不必要条件。——更改详细级别,意味着要增加维度;但是增加维度,并不必然会更改详细级别。这也是详细级别表达式LOD的初衷,因为数据宽度的扩宽或者收窄,可以通过拖拽我们想要的度量(measure)字段来实现,但是要在一个可视化视图中,引入可视化视图中没有的字段,就不是拖拽所能完成。——写到这里我自己有点豁然开朗了……God bless me.于是引入了三个LOD表达式:Fixed, include, Exclude看英文的意思就知道,fixed可以指定级别维度,而include和exclude相对,前者在现有视图的基础上以较低的详细级别运算,后者以较高的详细级别运算。[gallery ids="1480,1481,1482" type="slideshow"]

避免数据冗余和数据混乱

4、使用Extract filters在数据提取阶段排除异常数据

这可以视为是一劳永逸,不留后患的筛选,我起初是绕行的,后来当遇到百万行的数据时,特意查询了筛选的顺序(Tableau's Order of Operations),这才发现这就是不可忽视的筛选工具。在Tableau 的操作顺序中,提取数据筛选是级别最高的,在遇到百万行数据时,提取阶段过滤掉异常数据,就可以避免后期反复的筛选导致的性能下降,还有内心的不安。[caption id="attachment_1293" align="alignnone" width="818"]筛选器和操作顺序

筛选器和操作顺序[/caption][caption id="attachment_1533" align="alignnone" width="466"]

数据提取

数据提取,删除门店卡和无效会员[/caption]

5、Data Blending数据混合,避免反复导入同一个数据表

刚开始学习时,我会把门店参数表和很多个数据表建立链接,我觉得这样很酷。但等有了百万行的数据时,这样就不酷而是麻烦了,而且一定有多个数据源共用一个数据表的简单方法才对。于是遇到了 Data Blending,使用数据混合,可以避免反复使用参数表或基本表与数据表“链接”,减少数据冗余。

如果您需要分析不同数据库中的数据,但在多连接数据源中不支持这些数据库,或者您需要分析的表处于不同的详细级别,请使用数据混合。利用数据混合,可以在一个工作表上合并多个数据源中的数据。

好啦,今天分享到这里吧。又是一个下午,算是对自己过去近一个的交代啦。作为初学者的自己,还需要多多练习,希望找到志同道合的朋友一起进步。(我的微信 yupengwu,请注明Tableau)

第一版  2017年8月19日 V1.1
修改版  2017年8月21日 V1.2