Skip navigation

Beijing

12 posts

情景:

        Tableau制作出的图,放到PowerPoint中。我以前是这么做的,点击图片,选择复制,选择图像,然后到ppt上,粘贴。

        这样出来,模糊。

 

        更好地方法,有的,大家可以在百度上搜索“Convert Tableau to PowerPoint”找到这一篇技术文章,作者是Joshua Milligan2015316日发表。

 

        大致步骤如下:点击文件,打印为PDF Adobe Acrobat Pro中打开此文件,另存为“Microsoft PowerPoint”,即可获得清晰度更高的图。

Linux环境下,由10.5.1升级到2018.1.4,出现布局错乱。明细表数据无法正常显示,这种情况如何解决。

 

微信图片编辑_20180921143823.jpg

官网有很多非常丰富的资源和宝藏,这里针对分析主题摘抄了一些链接供大家参考!

 

个人认为Tableau是比较适合做数据探索式分析的,这种分析就要快速对数据提出业务问题并进行回答,简单说:提问-回答-再提问=探索分析。这一过程其实用很多工具都可以实现,只不过Tableau可以更顺手,让迭代速度更快,从而可以加快结论的产生。

 

如果大家觉得有用欢迎给我点赞,回复这个帖子分享给大家你用Tableau做过的分析和有价值的分析场景吧!

 

Tableau 的分析

https://www.tableau.com/zh-cn/solutions/analytics

 

快速分析

https://www.tableau.com/zh-cn/about/blog/2015/1/analytics-flow-36387

 

Tableau的高级分析应用

https://www.tableau.com/zh-cn/learn/webinars/on-demand%20advanced-analytics

 

核对清单:高级分析的 6 个必备要素

https://www.tableau.com/zh-cn/resource/checklist-6-must-haves-your-advanced-analytics

 

我们来谈谈高级分析方法

https://www.tableau.com/zh-cn/about/blog/2017/4/lets-talk-advanced-analytics-68604

 

使用 Tableau 进行高级分析(白皮书)

https://www.tableau.com/zh-cn/learn/whitepapers/advanced-analytics-tableau

 

使用 Tableau 进行基准分析的两种方式

https://www.tableau.com/zh-cn/about/blog/2017/8/two-approaches-benchmarking-tableau-75859

 

酷炫和实用:分析市场的哪些趋势可实际用于业务?

https://www.tableau.com/zh-cn/about/blog/2017/3/shiny-vs-useful-which-trends-analytics-market-are-business-ready-67692

 

使用 Tableau 2018.1 在浏览器中开始分析

https://www.tableau.com/zh-cn/about/blog/2018/3/start-your-analysis-browser-tableau-20181-84623

 

IT 部门如何为企业提供大规模自助式分析功能

https://www.tableau.com/zh-cn/about/blog/2017/2/how-it-can-empower-enterprise-self-service-analytics-scale-66223

 

回顾我如何通过使用 Tableau 在财务分析工作中节省时间

https://www.tableau.com/zh-cn/about/blog/2018/4/my-journey-saving-time-using-tableau-finance-analytics-84894

在进行Linux10.5.1关于Linux10.5.1版本的tableau server 升级至2018.1.4时,

执行:sudo /opt/tableau/tableau_server/packages/scripts.<version>/upgrade-tsm -u <tsm_system_admin> -p <tsm_system_admin_password> --accepteula 命令后,TSM upgrade,更新失败,导致整个2018.1.4升级失败。

附件为升级日志记录。

三个月前,我不经意间看到了一个数据分析的软件Tableau,凭着对数据的敏感,觉得是值得挖一挖的金矿,于是开始从尝试到执著。接下来的十天时间,白天做公司的业务数据分析,晚上读书和看官方帮助;再后来的两个月,平日工作在身,闲暇之余持续学习,两个月时间,自己在大数据分析上的进步让自己甚为满意。

 

这一切,由Tableau所赐。

 

何为Tableau

 

网上有人称之为“大数据时代的梵高”,虽有盛誉之嫌,也算实至名归。

 

诞生于2003年的Tableau,基于斯坦福独有的专利数据技术 VizQL,这个专利技术创新性地把拖动等操作转化为查询语言,然后通过图形化表达出来,就是我们看到的漂亮的、无与伦比的、可以五彩斑斓夺人眼球的可视化了。一篇文章说国内的数据分析平台研究了十几年,正在奋起直追,在技术这个领域,空有勤奋断然是不好使的啊。

 

Tableau——帮助用户理解自己的数据。

它的口号也会让你动心——“所有人都能学会的业务分析工具”。如果你熟练表格的数据透视图,学习这个软件,就像从数据的三楼坐电梯直达十二楼,从此在非专业的行业里,可以一骑飘尘了。当然,要到圈子里混,R语言,python,以及DW等等,最好揣好了再出门。

 

不过有一句话,已经能激励我们了:

Gartner说:“2020年,平民数据科学家的数量其增长速度将比数据科学家的数量快五倍。”

我的学习过程 三阶段

 

作为公司数据的外行,我的学习充满了坎坷,起初的好奇,后来的苦涩和坚持,最后的欢喜,都是路上的别样感受。

 

第一阶段

 

第一阶段基本是摸索和尝试,Tableau赢得了我的好奇心,在可视化上的易用性、数据提取和分析的速度上深得吾心。

 

Day1 下载并注册试用版,看着界面就像表格的透视图嘛,导入一个规范的表格,拖拖拽拽,拽拽拖拖,嗯,还不错……

Day1 看看京东上有没有教程,搜到一本《人人都是数据分析师–Tabaleau应用实战》,下单,第二天到货。打开快速浏览,“入门篇”,一分钟翻完;数据连接,两分钟看看重点;初级可视化分析,和表格差不多,快快看过。开始练习软件……

Day2 这个软件好像不像是“所有人都能学会”呢,为什么拖来拖去和结果结果不一样? 好奇怪,维度、度量、标记,页面、分析、筛选…… 一点点练习。用公司的数据,分析半年经营分析,切换各种“智能显示”,很不错。

Day3 遇到进一步的瓶颈了,分析半年度的员工薪酬、半年度的品类业绩、单品类的会员消费流水…… 找不到环比,不知道如何使用标记,日期总是跳来跳去……

Day5 下班不带电脑,晚上重新翻书,从第一章开始,觉得新鲜的、有用的地方做标签,用一页纸做“初级可视化”的笔记,明白条形图、直方图、柱状图、折线图、气泡图、饼图、压力图、标靶图、甘特图的使用场景,如何通过维度、度量、标记+行、列、筛选加工而成;

Day6 花一整天的时间,练习高级数据操作——分层、参数、集、组、参考线,并且在实践中练习。

屏幕快照 2017-07-28 20.34.03.png

Day7~9 用一套数据反复练习,不断变换,有困难立刻上官方帮助网站查询,,虽然图标是英文版软件展示,但是对我毫无压力;凡是要重点学习的,一律保存到OneNote笔记中。

Day10~花了两天,还没弄清楚 「详细级别表达式」是个什么鬼,因为涉及到数组{ },还有充满误导性的 冒号……

 

 

第二阶段——学习 LOD

 

我起初低估了LOD的难度,本以为两天可以,结果两个周才基本拿下。也许对于非理科生而言,这真是最大的拦路虎。

连续几个迟迟不能领会LOD的意思,于是我用了最笨拙也是有效的办法,创建八行五列测试数据,反复地验证、试错,同时不断地寻找各种资料学习,于是有了后来的几篇博客。

 

&1& 【数据分析】Tableau详细级别表达式_进阶必备

  • 在此文中,从何为“表达式”入手,我对比了“行级别表达式”、“视图级别表达式”、“表范围 详细级别表达式”和“ 超越视图级别的详细级别表达式”。
  • 行级别表达式(Row Level Expressions)相当于Excel的公式,针对单行数据执行操作运算,比如基于销售清单计算单品毛利率,利润率= [Profit] / [Sales]
  • 视图级别表达式(View Level Expression)是可视级别字段的操作计算,这些计算多半包含聚合运算,比如基于销售清单计算门店的平均利润率,利润率=sum([profit])/sum([sales])
  • 详细级别表达式( LOD=Level of Detail Expression)
  • 表范围详细级别表达式,是LOD的简化版,它省略了维度;对比并理解{ Min(Profit) }和 Min(Profit) 的不同;
  • LOD,通过实际的联系,我发现了自己的误区,fixed维度,就是锁定维度的所有数值。
  • 总结一句话,实践出真知啊。
  • 博客附图 行级别表达式.jpg

&2&【数据分析】Tableau详细级别表达式_续

  • 在本文中,我说明了LOD与维度、度量的关系,三种LOD表达式在Tableau操作中的位置,以及LOD的语法。

 

&3& Tableau|LOD详细级别表达式终极实操

  • 此文我汇总了主要的官方LOD引文,作为总结;
  • 梳理了LOD需求的推荐方法,引用了官方的三个案例,通过清晰地表达“焦点”和“背景环境”梳理需求;值得好好学习的方法。
  • 汇总官方的LOD相关的博客资源,特别推荐LOD详细表达式。

&4& 【数据分析】Tableau_30天修炼技巧

  • 在学习Tableau路上的分享,突出了对业务理解的重要性,总结了Tableau的几个学习重点。

 

第三阶段——去教别人

     在教别人的过程中,获得成长,这是我进步的好方法。我在学习过程中,帮助公司大数据部门的同事认识Tableau的好处,指导学习,分享自己掌握的各种资料,并解答他们的问题。

     不要吝啬分享,就会获得更多。

     当然,因为LOD的出乎意料的苦难,我迟迟没有学习地图和R语言,其实也是没有到合适的时机吧。下一步,我要放慢速度,在练习中分享,就像已经分享的两篇可视化的文章。

 

 

说说跨界学习的体会

 

我大学政治学本科和教育学硕士毕业的,呃 ?不是理科生? 真不是。

可惜我高中数学就好,好到老师都不管我就考全班第一。

言归正传,很多知名人物都说,自己每隔几年都会读一个崭新领域的书,如此才会跟上这个世界的变化,同时可以跨领域地应用人类的智慧;李笑来老师分享自己如何“实现财富自由”,他说自己每个领域都不是最强的,但是多个领域的集成优势让自己最终把握商机和抓住机会。

 

我从今年开始全力向实用性知识转移,比如销售心理学、定价、数据分析、财务和金融等等,数据分析是迄今最为应用性的知识了,十天时间,其实也是困难重重,总结一二,以勉自己。

 

  • 切不可盲目,过分自信是成功的绊脚石。虽说整体的印象和“试用性”的探索很重要,但是没个新行业都有我们不知道的基础知识,太基础了,容易忽视,确实这个行业的基石。金融学的基础知识P=C/r,一旦明白了,好多事情就会豁然开朗,但是如果自以为简单而绕行,就步入了荆棘之路。所以克里斯坦森建议说,遇到困难,他能给出的建议就是,「回到原理」。
  • 应用性的知识没有「我以为」,只有you can, or you can’t.  文科的研究生可以把“论历史是一门科学”写成洋洋洒洒几万字,我当年也单凭分析两个词组academic power and academic authority 就发表一篇CSSCI。但是应用没有“我以为”,我觉得我晚上看明白了,第二天还是做不出来书里的样子,那就是还没学好。谦虚的对待技术,因为它会立马回给你颜色。
  • 永远相信,有更高效的方式,可以做好眼下的工作。对于离不开表格的人而言,Excel是冲锋枪,但是一旦迈过这个阶段,你会发现,数据可视化就是战斗机群啊。你见过冲锋枪敌得过飞机的吗? 这已经不仅仅是效率的问题了。

     集中精力,攻克难关;不急不躁,按耐成性。

 

 

 

 

实践出真知,坚持生智慧。

 

 

2017年7月28日 第一版

2017年10月18日 第二版

转载自己的博客

【数据分析】Tableau_30天修炼技巧

 

自己做零售也有不短时间了,不久前偶遇Tableau,初恋即是热爱;认真学习到现在一个月时间有余,我已经能做出基本的可视化报表。分享自己的一点体会,希望能帮助更多Tableau爱好者。

一、

学习Tableau 30天,总结自己在零售数据分析过程中的几点感想,

1、了解业务,建立充满洞察的数据模型,比拥有大数据更重要

作为十年的零售企业,多年的数据模型止步不前,个人认为,一方面是工具理性不够透彻,比如止步在Excel阶段,而不能使用Pivot,甚至Tableau之类的大型BI工具去分析,从而无法建立基于大数据的逻辑;另一方面,也是最重要的,信息和数据的员工不了解业务,因此不能深入地理解业务的需求建立数据模型,只能止步在“业务需要什么,我给什么”的阶段。

那我们就只能依赖于业务部门提出详细的需求吗?此路往往异常艰难。业务部门的分析框架,多半局限在自己的视野之中,而且出于利益的考虑,往往还会选择性地筛选数据、分析数据、展示数据,数据的有效性层层递减。

因此,一个优秀的数据分析师,首先是业务专家。在这一方面数据分析师要向会计师学习,会计师有国际通用的分析框架,业务却往往是每个公司都有自己千疮百孔的业务分析框架。精于业务的数据分析师需要了解业务,跳出业务部门的局限性,从公司的高度,参考行业的通用分析方法和框架,建立公正透明、重点突出、相互支撑的分析框架,进而借助BI工具建立数据模型,并在不断地分享中修改和升级。同时,有效地指导业务部门负责人使用数据模型的可视化图表,在他们看来可能魔幻、充满变化的可视化中寻找业务的问题和解决线索,实现数据洞察的价值。

我想,这才是数据分析师的修炼。对数据的洞察,比拥有数据更重要。

数据分析.jpg

2、循序渐进,不断推倒重来

对于初学者,要有耐心不断地修改自己的作品,甚至推倒重来。以我学习LOD的经验,第一次的成功多半充满侥幸,第二次第三次的自然输出才是成功;而伴随不断的学习,只有推倒重来,才能从根本上精简自己的数据模型,而不是在脆弱的学习成果上打补丁。

比如,有一天发现通过data blending,可以把门店基础数据(静态数据)和业务数据(定期更新)分开,而不用在数据源中反复链接。这就需要我从头开始搭建整个框架,而不是通过“替换数据源”开始另一个噩梦(我亲尝了这个滋味,最后还是从头来过容易)。

3、多看官方教程

虽然我买了几本Tableau的书,也确实有点好处,我依然认为最好的学习资料都在官方网站的学习和社区中。如果Tableau中文帮助有歧义,我就去找英文的help文档,总能找到你想要的东西。

4、一颗对数据敏感的心。

如果没有看过代码,如果大学C语言都讨厌,如果看到一堆数据就头晕,恐怕此生与数据分析无缘了。

数据分析需要统计学、概率论的知识,更需要一颗对数据敏感的心。知识是可以积累的,对数据的感觉却是在业务的真实环境中锻炼的。

 

二、

说完学习的总结,我想简单介绍一下自己学习Tableau的主要步骤。

  1. 试用软件,乱点一通,导入一点数据尝尝鲜;嗯~有点滋味;
  2. 买书,看了一本《人人都是数据分析师–Tabaleau应用实战》,间歇性拿着公司百万行数据练手;
  3. 整理公司的半年业务数据,开始分析之路,可视化展现慢慢有了雏形,遇到LOD(详细级别表达式)卡住……
  4. 用一个星期多的时间,反复钻研LOD,不惜做一个十行的数据表做练习,在练习中发现各种语法的计算差异,增进理解;所有的学习笔记,一律记录在onenote中,不断更新;
  5. 借助自己的业务理解,按商品品类、门店运营、会员分析、员工分析等板块,逐个建立分析的维度和模型;V1.0,V1.1……不断的分享给公司业务部门,提出修改意见;
  6. 学习官方指南,了解之前有意绕开的部分功能,比如data blending,修改或重建数据模型,加快分析效率;
  7. 指导信息部门员工学习Tableau,联系Tableau销售经理咨询价格,还发给美女经理一张分析图求教,索要Tableau营销ppt,给董事长推荐Tableau分析工具……

最兴奋的时间是前面一周,每天都在练习,后来一段时间开会耽误了学习,加上LOD反复搞不懂大费周章有点心会气冷,效率慢了一些。坚持学习,30天,Tableau就会有回报,相信自己! 三、我说一下自己学习Tableau的几点偏实战的总结吧,数据分析大拿请自觉绕行,初学者还可以参考。

数据整理

1、Tableau挑剔数据,需要提前整理好数据表

Tableau自身对于数据复杂整理的能力毕竟有限,而且规范的数据格式可以避免后期大量的麻烦。如果公司在使用各种信息系统,大多数系统中直接导出来的数据都是格式化的,比如ERP,KIS,稍加修改甚至无需修改就可以使用;而对于人资每月制作的工资表,财务每月出的门店利润表,就需要适当整理,特别是把不同月份的整合到一起,增加“日期”的维度,把标题从首列改到首行等。当数据来自不同部门时,还需要对比数据差异,建议已主系统中的销售数据作为基准数据,然后整合财务部门经过调整的毛利和利润数据。虽然这本不该数据分析师的工作范围之内,但是数据甄别越早,所有的部门都会避免后期的麻烦,毕竟是利人利己、未雨绸缪的好事情。

数据分析的镇山石

2.hiearchy、Set 和group分类神器

我曾经在第一篇的博文中列举了分层、组、集、参数、计算字段的对比,(迎战大数据,自从有了你,从而「如虎添翼」)这是数据整理和分析的基础。

set分组Hiearchy分层

3、天杀的LOD必杀技——Fixed、Include、Exclude

我在LOD上花了最长的时间,至今依然有不解的地方需要继续钻研。不过,在LOD上花费再多的时间,也是值得的,因为它会实现你之前想要但是难以做到的可视化展示。我用**我的思维方式,诠释一下理工男的高级成就。深挖数据的可视化展示,有宽度和深度两个方向,前者比如从国家到省市,从省市到乡镇;后者比如从商品品类结构到单个品类的会员分析,从单品类的会员分析到品类中商品的会员平均订单购买数量。你会发现,宽度是在一个维度(dimension)上度量(measure)的展开,而深度则是在不同维度上的展开。

向视图中添加维度来增加标记数量的过程称为设置详细级别。……某些情况下,向视图中添加度量可能会增加视图中标记的数量。但这与更改视图的详细级别不同。The process of adding dimensions to the view to increase the number of marks is known as setting the level of detail. ……In some cases, adding a measure to the view can increase the number of marks in the view. But this is not the same as changing the view's level of detail.

因此,设置详细级别表达式,需要的增加数据的深度,而不是广度。增加维度,是更改详细级别的充分但不必要条件。——更改详细级别,意味着要增加维度;但是增加维度,并不必然会更改详细级别。这也是详细级别表达式LOD的初衷,因为数据宽度的扩宽或者收窄,可以通过拖拽我们想要的度量(measure)字段来实现,但是要在一个可视化视图中,引入可视化视图中没有的字段,就不是拖拽所能完成。——写到这里我自己有点豁然开朗了……God bless me.于是引入了三个LOD表达式:Fixed, include, Exclude看英文的意思就知道,fixed可以指定级别维度,而include和exclude相对,前者在现有视图的基础上以较低的详细级别运算,后者以较高的详细级别运算。[gallery ids="1480,1481,1482" type="slideshow"]

避免数据冗余和数据混乱

4、使用Extract filters在数据提取阶段排除异常数据

这可以视为是一劳永逸,不留后患的筛选,我起初是绕行的,后来当遇到百万行的数据时,特意查询了筛选的顺序(Tableau's Order of Operations),这才发现这就是不可忽视的筛选工具。在Tableau 的操作顺序中,提取数据筛选是级别最高的,在遇到百万行数据时,提取阶段过滤掉异常数据,就可以避免后期反复的筛选导致的性能下降,还有内心的不安。[caption id="attachment_1293" align="alignnone" width="818"]筛选器和操作顺序

筛选器和操作顺序[/caption][caption id="attachment_1533" align="alignnone" width="466"]

数据提取

数据提取,删除门店卡和无效会员[/caption]

5、Data Blending数据混合,避免反复导入同一个数据表

刚开始学习时,我会把门店参数表和很多个数据表建立链接,我觉得这样很酷。但等有了百万行的数据时,这样就不酷而是麻烦了,而且一定有多个数据源共用一个数据表的简单方法才对。于是遇到了 Data Blending,使用数据混合,可以避免反复使用参数表或基本表与数据表“链接”,减少数据冗余。

如果您需要分析不同数据库中的数据,但在多连接数据源中不支持这些数据库,或者您需要分析的表处于不同的详细级别,请使用数据混合。利用数据混合,可以在一个工作表上合并多个数据源中的数据。

好啦,今天分享到这里吧。又是一个下午,算是对自己过去近一个的交代啦。作为初学者的自己,还需要多多练习,希望找到志同道合的朋友一起进步。(我的微信 yupengwu,请注明Tableau)

第一版  2017年8月19日 V1.1
修改版  2017年8月21日 V1.2

在下钻到日期字段的月份级别时,默认情况下 Tableau 将使用完整月份名称,例如“January”、“February”、“March”等。这样有时可能会占用比预期更多的视图空间。 那么如何使用三字母缩写(Jan、Feb、Mar 等)或单字母缩写(例如,J、F、M 等)来显示月份缩写? 请参考: 

缩写月份名称 | Tableau Software

利用Tableau 函数 HEXBINX 和 HEXBINY,在二维平面中将群集数据进行六边形分桶。这两个函数支持使用直方图或按照地图中的地理详细级别对单个维度中的数据进行分桶。具体使用方法可以参考文章:

使用 Tableau 实现六边形分桶 | Tableau Software

最近发现的知识库里面一篇教制作帕累托图的文章,还附带视频资料。

使用帕累托分析法 | Tableau Software

您可以在 Tableau Desktop 和 Tableau Server 中编辑视图,但 Desktop 和 Server 编辑功能有一些不同。本文说明 Tableau Server Web 编辑功能,以及 Tableau Server Web 编辑与 Tableau Desktop 编辑之间的一般差异。

 

 

Tableau Server 中的 Web 编辑 | Tableau Software

总是苦恼省份该如何书写,“福建”还是“福建省”?

对于无法自动识别的地区,一对一对应耗时太长?

城市到底是指县级市还是地级市?

 

当我们苦恼于这些的时候,总是希望能有个大的列表,告诉我们到底哪些地名能自动生成经纬度。

 

哒哒!

 

其实这些信息都存在Tableau的Program Files里面。只需将这些.tds文件拉到Tableau Desktop里面,就可以看到所有的可自动生成经纬度的地名。

 

1.PNG

 

是不是很炫酷?