Skip navigation
2017
upload_2017-9-5_13-53-11.png
Bắt đầu thảo luận
Tiếp tục trên tableau server, tableau online và lần đầu tiên Tableau Mobile thảo luận trong Tableau cho phép bạn nghiên cứu phân tích cùng với các phản hồi và ảnh chụp nhanh được cải thiện.

 

Để bắt đầu, hãy chọn biểu tượng Nhận xét từ thanh công cụ trên web hoặc từ trình đơn trong điện thoại di động.
upload_2017-9-5_13-54-26.png

 

Ảnh chụp nhanh của Viz có thể được đính kèm với bất kỳ nhận xét nào và bao gồm hai phần: (1) hình ảnh của viz và (2) bộ lọc và lựa chọn của nó tại thời điểm ảnh chụp nhanh đã được tạo. Chúng cho phép người dùng duy trì và chuyển tải ngữ cảnh phân tích của họ, cho phép thảo luận liền mạch ngay cả khi người dùng không đồng định vị hoặc hợp tác trong thời gian thực.

 

upload_2017-9-5_13-54-44.png

 

Nếu bạn đã quen thuộc với "chế độ xem tùy chỉnh", các bức ảnh chụp nhanh sẽ rất quen thuộc. Trong trình duyệt, chỉ cần nhấp vào một bức ảnh chụp nhanh để áp dụng tất cả các bộ lọc và lựa chọn có liên quan. Đối với người dùng điện thoại di động của chúng tôi, chúng tôi nhận thức được những thách thức của các màn hình nhỏ hơn, vì vậy chúng tôi muốn lấp đầy mỗi pixel với nội dung hữu ích: Ảnh chụp nhanh của Viz có dạng hình ảnh toàn màn hình trong thời điểm ảnh chụp được tạo ra.

 

What’s next?

 

Đây chỉ là bước đầu tiên trong trải nghiệm phân tích cộng tác phong phú và thảo luận nhiều hơn. Để tận dụng kiến thức chuyên môn của những người xung quanh bạn là rất quan trọng bằng cách tiến hành phân tích kỹ lưỡng, vì vậy chúng tôi đã bắt đầu phát triển việc gắn thẻ sẽ giúp bạn thông báo cho đồng nghiệp của bạn trong thời gian thực về dữ liệu quan trọng. Bằng cách đầu tư vào những khả năng này, chúng tôi sẽ thảo luận và cộng tác một phần tích hợp trong trải nghiệm Tableau hàng ngày của bạn.

 

 

Anh chị muốn thể hiện doanh số năm nay và năm trước, đồng thời thể hiện số chênh lệch giữa năm nay và năm trước đó bằng biểu đồ waterfall như hình dưới đây, cách thức thực hiện như sau:

 

upload_2017-7-5_10-53-10.png

 

Bước 1: Tạo parameter “year”: Chọn mũi tên xuống bên trái Dimensions -> Create Parameter...

 

upload_2017-7-5_10-53-19.png

 

Bước 2: Chọn Analysis -> Create Calculated Field...

 

Tạo 4 field có tên:

- Current Year: giá trị thể hiện doanh số của năm nay

 

upload_2017-7-5_10-53-37.png

 

- Last Year: giá trị thể hiện doanh số của năm trước

 

upload_2017-7-5_10-53-48.png

 

- Incremental: thể hiện chênh lệch giữa doanh số năm nay so với năm trước.

 

upload_2017-7-5_10-54-6.png

 

- “Value”: tạo một giá trị bắt đầu cho thanh Gantt Bar

 

upload_2017-7-5_10-54-17.png

 

- “Increase/Decrease”: để tạo một giá trị cảnh báo, nếu nó lớn hơn 0 thì cảnh báo “Increase”, ngược lại thì “Decrease”

 

upload_2017-7-5_10-54-30.png

 

Bước 3: Thực hiện vẽ chart:

 

- Đưa Measure Values (gồm Curent YearLast Year) vào Rows và Measure Names vào Columns.

 

upload_2017-7-5_10-56-33.png

 

- Đưa “Value” vào Rows và chọn Dual Axis.

 

upload_2017-7-5_10-56-46.png

 

- Ở thẻ Mark, lớp “Measure Values” chọn kiểu chart Bar và ở lớp “Value” chọn kiểu chart Gantt Bar.

 

upload_2017-7-5_10-56-56.png

- Ở lớp AGG(Value), kéo “Incremental” vào Size, “Increase/decrease” vào Color. Sau đó chỉnh màu cho Decrease và Increase.

 

upload_2017-7-5_11-3-14.png

 

- Muốn giá trị Value ở vị trí giữa Last YearCurrent Year: ở lớp AGG(Value), kéo “Value” vào Measure Values như trong hình và sao đó kéo “Value” ra.

 

upload_2017-7-5_11-3-31.png

 

Vậy là chart Waterfall đã hoàn thành.

Để tạo nút liên kết với link bên ngoài Tabeau, bạn chuẩn bị trước Dashboard để thực hiện các thao tác sau:

 

upload_2017-7-18_15-41-17.png

 

Bước 1: Tạo 1 Sheet mới, rồi tạo thêm một giá trị mới ‘Go To Website’

 

upload_2017-7-18_15-41-40.png

 

Bước 2: Kéo view mới theo hình bên dưới

 

upload_2017-7-18_15-41-55.png

 

Chọn loại chart là Shape và chọn hình mũi tên và format lại view.

 

upload_2017-7-18_15-42-24.png

 

Bước 3: Kéo sheet ‘Go to Website’ vào dashboard Shipping.

 

upload_2017-7-18_15-42-42.png

 

Bước 4: Tạo Action cho nút liên kết.

 

Chọn Dashboard > Action. Khi đó sẽ xuất hiện bảng action như sau:

 

upload_2017-7-18_15-42-56.png

 

Chọn Add Action > URL.

 

upload_2017-7-18_15-43-32.png

 

Bạn tạo liên kết với nút ‘Go To Website’ và gắn link liên kết cho nó.

 

upload_2017-7-18_15-43-44.png

 

Chúc bạn thành công!

Anh chị muốn sử dụng Parameter để chọn hoặc là xem giá trị tỉnh thành A hoặc xem toàn bộ tỉnh thành thì anh chị thực hiện như sau:

 

1. Tạo parameter

Để tạo ra Parameter lựa chọn cho các Measure, bạn thực hiện như sau:

Bước 1: Chọn vào mũi tên thả xuống ở bên phải Dimensions và chọn Create parameter…
Bước 2
:Cửa sổ Create parameter sẽ mở ra. Thiết lập các Properties.

Ví dụ đặt tên và thiết lập cho Parameter như hình dưới đây, sau đó chọn OK
upload_2017-11-22_14-56-0.png

 

2. Tạo Create Calculated Field… để truyền giá trị cho Parameter

 

upload_2017-11-22_14-56-20.png

Sau đó, anh chị chỉnh lại kiểu data cho Field mới tạo này để Tableau hiểu Field mới này là tỉnh thành

 

upload_2017-11-22_14-56-36.png

 

 

Cuối cùng, anh chị kéo field mới này vào Detail và Show Parameter, Chọn Parameter để xem sự thay đổi.

 

upload_2017-11-22_14-56-48.png

 

Chúc anh chị thành công!

Truong Dai

Map đến District

Posted by Truong Dai Nov 26, 2017

Anh chị có một file dữ liệu về LatitudeLongitude của quận/huyện:

 

[IMG]

upload_2017-11-23_8-50-2.png

 

Để map được đến District, anh chị thực hiện như sau:

 

Đầu tiên, anh chị cần chỉnh kiểu biểu đồ là Polygon

 

upload_2017-11-23_8-39-32.png

 

 

Tiếp theo, anh chị kéo:

- Latitude vào Rows

- Longitude vào Columns

- District Code vào Detail

- Point vào thẻ Path

- Để xem quận huyện đó tên gì và thuộc tỉnh nào thì kéo District NameProvince vào Tooltip

 

upload_2017-11-23_8-40-5.png

 

Chúc anh chị thành công!

Tableau Online và Tableau Server là sản phẩm được đưa ra nhằm mục đích xuất bản, chia sẻ, và phân phối workbook và dữ liệu.

Giống nhau:

  • Cần Tableau Desktop Professional Edition để có thể xuất bản workbooks ( Views và Dashboards) và các nguồn dữ liệu.
  • Tuỳ chỉnh thương hiệu: thay đổi logo và tên công ty.

Khác nhau:

upload_2017-7-24_14-50-24.png
upload_2017-7-24_14-52-5.png
upload_2017-7-24_14-52-42.png
upload_2017-7-24_14-53-36.png

Truong Dai

Level of Details

Posted by Truong Dai Nov 22, 2017

Level of Details (LOD) Expression - Biểu thức thể hiện chi tiết theo từng cấp độ.

 

1. Ứng dụng

LOD thường được gọi là Biểu thức LOD hoặc các phép tính LOD, được sử dụng trong nhiều trường hợp, cụ thể như sau:

  • Khi bạn cần phân tích theo từng nhóm, so sánh sự khác nhau giữa các nhóm
  • Tính tổng và trung bình theo từng phân khúc
  • Các phép toán tập hợp của tập hợp,
  • Phân phối của tập dữ liệu

2. Một số khái niệm có liên quan: Row Level - View Level

 

Một phép tính mà bạn dễ dàng nhận thấy nhất trong hầu hết các phân tích là xem xét tỷ suất lợi nhuận Profit Ratio.

Profit Ratio = Profit / Sales

Trong Tableau, công thức này sẽ được tính trên từng record của data, có nghĩa là với từng dòng, giá trị Profit sẽ chia cho giá trị Sales tương ứng.

 

Khi dùng Profit Ratio để phân tích, Tableau hiển thị lên màn hình thông qua các phép tính tập hợp (Aggregated) như là Sum, Avg, … Sẽ không có vấn đề gì nếu Dimension của bạn là từng record trong data (Row level), tuy nhiên bạn muốn nhìn ở góc độ khác theo Region hoặc bất kỳ chiều phân tích nào còn lại thì kết quả sẽ không như bạn mong muốn nữa.

Cách thức mà Tableau tính toán như sau: Profit Ratio tính theo từng dòng như trên, sau đó ứng với từng vùng miền nó sẽ được Sum (Avg,…) lại, kết quả bạn nhìn thấy hoàn toàn sai so với giá trị bạn cần.

Vậy để biểu thị đúng công thức sẽ như thế nào?

 

Profit Ratio = Sum(Profit) / Sum(Sales)

Nếu drag công thức để phân tích, Tableau sẽ hiển thị chức năng AGG – Aggregated (Tập hợp) và với việc tính tập hợp này bạn có thể xem ở bất kỳ Dimension nào (View Level)

Trước khi được hỗ trợ LOD trong Tableau, bạn không thể tạo ra các tính toán khác với cấp độ view của nó

 

Ví dụ: bạn muốn so sánh doanh số của từng cửa hàng với doanh số trung bình của tất cả cửa hàng.

 

Nếu sử dụng công thức: [Sales] – AVG[Sales] thì Tableau sẽ báo lỗi: “Cannot mix aggregate and non – aggregate agruments with this function" nhưng với LOD, đã không còn khó khăn trong tính toán này cho bạn nữa, đơn giản: [Sales] - {AVG[Sales]}

3. Cú pháp của biểu thức LOD

Một biểu thức LOD có cấu trúc như sau:

{ [FIXED | INCLUDE | EXCLUDE] <Chiều Phân Tích> : <Phép Toán Tập Hợp>}

Trong đó:

 

{ }: Toàn bộ biểu thức LoD được xuất hiện bên trong dấu ngoặc nhọn

 

[FIXED | INCLUDE | EXCLUDE]: Từ khóa sử dụng. Với:

  • FIXED: Tổng hợp các kết quả Dimension được quy định trong Calculation. Khi sử dụng hàm này, tất cả các bộ lọc đều không ảnh hưởng đến giá trị của nó.
  • EXCLUDE: Loại bỏ đi Dimension đặt trong cấu trúc hàm
  • INCLUDE: Xác định mức độ chi tiết theo Dimension trong hàm.

Chiều Phân Tích: Có thể một hoặc nhiều Dimension kể cả Dimension về thời gian và chúng ngăn cách nhau bằng dấu phẩy –“ ,”

Phép Toán Tập Hợp: các tính toán được thực hiện theo mục tiêu.

 

 

4. Hạn chế của LOD

  • Không show kết quả ngoài màn hình Datasource
  • Biểu thức LOD với measure có kiểu dữ liệu Float có thể cho kết quả không chính xác
  • Khi Blending Data, các field liên kết ở Primary Data phải được bật lên trước khi sử dung LOD ở Secondary Data.

 

Lưu ý: Biểu thức LOD khi tạo ra khi sử dụng FIXED có thể là Dimensions hoặc Measures; INCLUDE & EXCLUDE luôn luôn là Measures.

 

upload_2017-7-25_14-44-14.png

Truong Dai

Cấu hình Tableau Server

Posted by Truong Dai Nov 21, 2017

Sau khi cài đặt Tableau Server, cấu hình Tableau Server có các thẻ sau: General, Data Connections, Servers, SMTP Setup, Alerts and Subsriptions, SSL, SAML, Kerberos, SAP HANA, OpenID.

1. Thẻ General
upload_2017-7-15_16-17-13.png
·
Server Run as User:

 

· User Authentication: Để có thể hiểu rõ sự khác nhau giữa Use Active Directory và Use Local Authentication bạn có thể tham khảo bài viết trước: https://bsdinsight.atlassian.net/wiki/display/TAB/User+identity+in+Tableau+Server

 

· Gateway: Port number là cổng mà http sử dụng để người dùng sử dụng trình duyệt vào Tableau Server. Cổng mặc định khi cài đặt Tableau Server là 8000. Khi vào trình duyệt ta phải thêm port number phía sau IP. Để không phải thêm port number trong đường dẫn trình duyệt, chúng ta có thể chuyển sang port 80. Lưu ý rằng giải phóng port 80 này trước khi cài đặt.

 

2. Thẻ Data Connections
upload_2017-7-15_16-18-3.png

Khi bạn publish workbook có dữ liệu ở chế độ Connect Live, workbook cần một lịch trình để làm mới dữ liệu.

 

· Refresh less often: Làm mới dữ liệu không thường xuyên, hay nói cách khác dữ liệu chỉ có thể Refresh data khi xem workbook khi user nhấp vào nút refresh.

 

· Balanced: Một lựa chọn mà đa số các user sử dụng, với lựa chọn này hệ thống Tableau Server sẽ tự động refresh data sau một khoảng thời gian đúng bằng thời gian cài đặt.

 

· Refresh more often: Dữ liệu sẽ được cập nhật liên tục.

 

Initial SQL: Khi kết nối với một số cơ sở dữ liệu, bạn có thể chỉ định một lệnh Initial SQL để chạy khi mở workbook, làm mới dữ liệu, đăng nhập hay publish Tableau Server. Initial SQL khác với custom SQL, xác định các mối quan hệ để chạy các truy vấn.

3. Thẻ Servers
upload_2017-7-15_16-18-45.png

Trong thẻ này chúng ta cài đặt các thành phần của Tableau Server. Tùy vào mục đích và máy chủ vật lý mà ta thay đổi các thông số cho phù hợp.

 

· VizQL Server: Tiêu thụ tài nguyên đáng chú ý trong quá trình user loading view và tương tác workbook thông qua trình duyệt web. Việc tải và tương tác phụ thuộc vào CPU, I/O, Network. Quá trình tải này chỉ được tạo bởi brower-based. Không thể chạy ngoài bộ nhớ tiến trình.

 

· Application Server: Chỉ tiêu thụ tài nguyên đáng chú ý trong các hoạt động thường xuyên như đóng gói workbook, tạo ra ảnh tĩnh cho View. Nhiệm vụ này có thể đươc làm dựa trên tương tác browser-based hoặc tabcmd.

 

· Backgrounder: Một tiến trình đơn luồng nơi mà nhiều tiến trình có thể chạy trên nhiều hoặc tất cả máy chủ worker để tăng hiệu suất. Các backgrounder thường không tiêu thụ nhiều bộ nhớ quá trình, nhưng nó có thể tiêu thụ CPU, I / O, hoặc tài nguyên mạng dựa vào tính chất của khối lượng công việc trình bày cho nó. Ví dụ: làm mới dữ liệu Extract có thể sử dụng băng thông mạng để lấy dữ liệu, tài nguyên CPU cũng có thể được tiêu thụ để lưu dữ liệu và thực hiện các tabcmd phức tạp.

 

· Cache Server: query cache được phân phối và chia sẻ qua các cụm máy chủ. VizQL server, backgrounder, và data server tạo yêu cầu lưu trữ đến cache server để thay cho users hay công việc. Cahe là đơn luồng, vì thế để tăng hiệu suất phải bạn phải chạy thêm thực thể của Cache Server hoặc giảm số lượng Application Server hay VizQL Server processes

 

· Data Server: Đây là một proxy nên chỉ bị ảnh hưởng bởi mạng, nó cũng sử dụng CPU khi có nhiều user sử dụng đồng thời. Nhiệm vụ này được tạo bởi browser và Tableau Desktop-based interaction và công việc extract refresh cho dữ liệu nguồn trên Tableau Server.

 

· Data Engine: Thực hiện các yêu cầu từ VizQL server, application server, API server, data server, và backgrounder server processes. The data engine services thực hiện hầu hết các quá trình máy chủ khác. Nó tải Extracts data vào bộ nhớ và thực hiện các truy vấn. Bộ nhớ tiêu thụ phụ thuộc vào kích thước dữ liệu Extracts được tải. Data Engine là đa tiến trình giải quyết nhiều yêu cầu trong cùng một thời gian. Chú ý rằng Data Engine tiêu thụ CPU, I/O, tài nguyên mạng, tất cả đều là thành phần tạo ra hiện tượng thắt cổ chai. Khi tất cả các yêu tố phù hợp, Data Engine sẽ tiêu thụ toàn bộ Cpu để thực hiện công việc.

 

· File Store: Kiểm soát việc lưu trữ Extracts. Một tiến trình File Store sẽ được tạo ra một hoặc nhiều Data Engine được cài đặt. File Store đảm bảo rằng Extracts được đồng bộ hóa với các File Store Node khác là hợp lệ khi có một File Store Node dừng hoạt động.

 

· Repository: Cơ sở dữ liệu được lưu trữ Server data. Thường tiêu thụ ít tài nguyên. Nó cũng có thể tạo ra nút thắt cổ chai trong vài trường hợp hiếm gặp khi thực hiện các hoạt động như đang xem tất cả các workbook bởi user hoặc đang thay đổi phân quyền.

 

· Gateway: là một thành phần Apache web server. Vai trò của gateway là xử lý các yêu cầu từ user đến server (Tableau Desktop, Mobile, cân bằng tải, proxy,…). Chỉ chạy một gateway duy nhất cho server.

 

· Search & Browse: Quá trình này phụ thuộc vào bộ nhớ trước tiên và thứ 2 là I/O. Số lượng bộ nhớ được sử dụng tương đương với số lượng nội dung trên máy chủ (Số lượng sites/projects/workbooks/datasources/views/users)

 

Để có thể tối ưu Tableau Server, bạn có thể tham khảo link sau: Cấu hình Tableau Server Improve Server Performance

 

4. Thẻ SMTP Setup

upload_2017-7-15_16-19-25.png

· SMTP Server: SMTP là giao thức truyền tải thư tín đơn giản. SMTP server là máy chủ hỗ trợ các phần mềm chuyên gửi mail như Gmail, Yahoo

 

· Port: Cổng của SMTP Server.

 

· User name: Tên đăng nhặp của SMTP.

 

· Password: Mật khẩu của SMTP.

 

· Send email from: Các thư điện tử thông báo được gủi từ email này.

 

· Send email to: Các thông báo gửi đến email này.

 

· Tableau Server URL: Đường dẫn đăng nhập vào Tableau Server.


Chú ý:
Tableau server url là địa chỉ IP4

 

- Cách lấy địa chỉ IP4: vào Control Panel--> Network and Internet--> Network and Sharing Center--> Ethernet (or wifi_name)--> Properties--> Internet Protocol version 4.

 

5. Thẻ Alerts and Subsriptions

upload_2017-7-15_16-21-4.png

 

· Khi chúng ta tích chọn ‘Enable users to receive emails for subcriptions to views’ có nghĩa là cho phép người dùng có thêm chức năng thông báo sự thay đổi của view qua email.

 

· Send email alerts for server component up, own, and failover events: Gửi thông báo cho Administrator về tình trạng Tableau Server.

 

· Record disk space usage information, uncluding threshold violations: Theo mặc định Tableau Server được cấu hình để lưu dữ liệu về việc sử dụng disk space. Nếu chúng ta không muốn lưu thông tin sử dụng không gian đĩa thì có thể bỏ tích chọn, tuy nhiên Tableau Server không khuyến khích điều này do không thể xem thông tin không gian đĩa khi cần

 

· Tableau Server sẽ gửi thông báo cho bạn biết khi một trong những Tableau Server Nodes giảm xuống dưới Warning threshold và Critical threshold với tần suất gửi email là “Send email alert every”.

 

6. Thẻ SSL (Secure Socket Layer)

Tải thẻ này giúp bạn tăng bảo mật khi sử dụng Tableau Server thông qua trình duyệt web.

 

SSL là một giao thức cho phép bạn truyền đạt thông tin một cách bảo mật và an toàn qua mạng. Và điều bạn cần chính là chứng chỉ SSL để có thể cài đặt phần này.

upload_2017-7-15_16-21-54.png

7. Thẻ SAML (Security Assertion Markup Language)

 

SAML là một tiêu chuẩn XML cho phép bảo mật web domain để trao đổi xác thực người dùng và phân quyền dữ liệu. Nếu bạn muốn sử dụng Single Sign On, bạn cần phải cài đặt thẻ SAML.

 

upload_2017-7-15_16-22-21.png

8. Kerberos

Tableau Server hỗ trợ single sign-on (SSO) dựa trên Kerberos. Users với Active Directory (AD) accounts trong môi trường Kerberos đã tạo có thể sử dụng SSO để kết nối Tableau Server từ Tableau Desktop và web browers. Ngoài ra, Tableau Server có thể sử dụng Kerberos để xác thực Microsoft SQL, MSAS, PostgreSQL, and Terradata data sources. Tableau Server được cấu hình Kerberos, bạn có thể tạo kết nối SSO để Cloudera Impala databases sử dụng máy chủ quản lý thông tin để xác thực Impala LDAP.

 

upload_2017-7-15_16-23-5.png


9. SAP HANA

- sAP HANA được cấu hình hỗ trợ SSO, sau khi bạn đăng nhập vào SAP HANA server, bạn có thể truy cập dữ liệu, publish dữ liệu và workbook lên Tableau Server mà không phải đăng nhập lại.

 

- Bạn cũng có thể publish dữ liệu hay workbook cho user khác với SSO có thể truy cập dữ liệu và workbook được publish mà không phải đăng nhập lại.

upload_2017-7-15_16-24-8.png

 

10. OpenID

 

- Tableau Server sử dụng OpenID Connect để single-sign on (SSO)

 

- Bạn chỉ có thể sử dụng OpenID Connect kết nối Tableau Server khi máy chủ sử dụng Local authentication. Bạn nên sử dụng cùng SSL để tăng tính bảo mật.

upload_2017-7-15_16-24-46.png

Bước 1: Chúng ta cần tải Tableau Server phiên bản mới nhất tại website: http://www.tableau.com/products/server/download

Bước 2: Chúng ta nhấp vào file Tableau Server để cài đặt và làm theo hình bên dưới:

- Chọn--> Run

upload_2017-7-15_16-2-17.png

- Click--> Next
upload_2017-7-15_16-2-49.png
- Browse: chọn thư mục cài đặt Tableau Server, tốt nhất nên để mặc định.
- Chọn--> Next để tiếp tục
upload_2017-7-15_16-5-16.png

upload_2017-7-15_16-5-27.png

upload_2017-7-15_16-5-47.png
- Click--> Next
upload_2017-7-15_16-6-34.png

upload_2017-7-15_16-6-44.png
- Chọn--> Next
upload_2017-7-15_16-7-3.png
- Chọn--> Install
upload_2017-7-15_16-7-19.png

upload_2017-7-15_16-11-22.png

- Chọn--> Next để tiếp tục

upload_2017-7-15_16-11-9.png

- Chọn--> Start trial now để dung thử 14 ngày

upload_2017-7-15_16-11-54.png

- Nếu chúng ta có key thì chúng ta chọn Activate the produc, trong trường hợp khác chúng ta chọn Start trial now để tiếp tục cài đặt. Sau đó sẽ có bảng cấu Tableau Server hiện lên như hình:

 

o 1--> User: Bao gồm tên miền và tên máy (computer name)

 

o 2--> Password: mật khẩu sử dụng để mở máy

 

o 3--> Domain: Tên miền (Click phải vào This PCà Propertiesà Change Settingà ChangeàDomain)

 

o 4--> Nick name: Computer name

 

o 5--> Use Authentication là phương pháp chứng thực đia phương.

 

o 6--> Use Active Directory là phương pháp xác thực bên ngoài.

 

- Sau khi cấu hình này hoàn tất, chúng ta không thể thay đổi phương pháp xác thực. Trong thực tế để thay đổi cấu hình này, bạn phải gỡ bỏ Tableau Server và xóa các cài đặt trong máy tính và cài lại.

 

7 Gateway Port number: mình có thể thay đổi gateway thành 80, hoặc gateway mặc định là 8000. Bạn có thể tham khảo website: https://onlinehelp.tableau.com/current/server/en-us/ports.htm

upload_2017-7-15_16-13-41.png

Trình kết nối MongoDB dành cho Quản trị Kinh doanh cho phép bạn sử dụng MongoDB làm nguồn dữ liệu cho các công cụ phân tích dựa trên SQL và các công cụ trực quan dữ liệu như Tableau. Tạo ra các hình ảnh minh hoạ và biểu đồ của Tableau một cách liền mạch sẽ giúp bạn trích xuất thông tin chi tiết và giá trị ẩn trong dữ liệu đa cấu trúc của bạn.
Trình kết nối MongoDB cho BI là một phần của MongoDB Enterprise Advanced. Bắt đầu bằng cách tải MongoDB Connector cho BI từ đây. https://www.mongodb.com/download-center?jmp=tbl#bi-connector

 

Kết nối từ Tableau

 

Đây là hướng dẫn ngắn về cách kết nối với Trình kết nối BI từ Tableau có hoặc không có chứng chỉ MongoDB.

 

Kết nối cơ bản không yêu cầu chứng thực

 

Trước khi kết nối, bạn nên có kết nối BI đang chạy. Nếu cần, hãy xem lại tài liệu để cài đặt Trình kết nối BI.
https://docs.mongodb.com/bi-connect...5.1346242432.1501490147-1351966231.1501490147

Mở Tableau và nhấp vào kết nối MongoDB BI trong cột bên trái của Tableau. Cửa sổ kết nối sẽ xuất hiện nơi bạn có thể nhập thông tin đăng nhập. Nếu bạn đang kết nối với một thể hiện của MongoDB, nơi tính năng xác thực không được bật, bạn sẽ không cần nhập tên người dùng hoặc mật khẩu. Đơn giản chỉ cần nhập vào máy chủ lưu trữ và cổng mà mongosqld và nhấp vào Đăng nhập để kết nối. Theo mặc định, mongld sẽ liên kết với cổng 3307.

 

upload_2017-8-1_11-49-12.png

 

Kết nối với SSL

 

Khi bạn sử dụng Trình kết nối BI với một ví dụ của MongoDB với --auth enabled, bạn sẽ cần phải xác thực trong Tableau như là một người dùng hiện tại đã được tuyên bố trong MongoDB. Điều này được gọi là chứng thực "pass-through" vì BI Connector "passes through" quá trình xác thực đến ví dụ MongoDB tiềm ẩn. Để đảm bảo tính bảo mật thông qua yêu cầu bảo mật, một kết nối SSL được mật mã được thực hiện giữa BI Connector và Tableau. Dưới đây là các bước để kết nối khi xác thực được bật.

 

Bước 1: Thiết lập Mongosqld

 

Bạn có thể kích hoạt chứng thực pass-through trong mongoslqd với việc sử dụng tham số --auth. Lấy ví dụ dòng lệnh sau đây

 

$ ./mongosqld --schemaDirectory /home/vagrant/schema - --addr=10.11.12.13:3307 --auth --sslPEMKeyFile=/mongosqld-server.pem

 

Trong ví dụ này mongosqld đã được bắt đầu với cờ --auth cùng với một giấy chứng nhận SSL yêu cầu cần thiết để xác thực kết nối BI cho khách hàng như Tableau. Trong ví dụ này mongosqld-server.pem là một chứng chỉ tự ký mà chúng ta đã tạo ra cho hướng dẫn này. Nếu bạn không quen thuộc với chứng chỉ SSL, bạn có thể thực hiện kịch bản này để tạo chứng chỉ tự ký của riêng bạn. Kịch bản sẽ tạo ra tất cả các chứng chỉ bạn cần để thực hiện xác thực hai chiều hoàn toàn giữa mongod, mongosqld và Tableau. Tuy nhiên, một thiết lập cơ bản chỉ đòi hỏi mongosqld-server.pem.

 

Bước 2: Kết nối từ Tableau

 

Khi mongosqld đang chạy với pass-through, bạn có thể kết nối từ Tableau bằng cách thêm tên người dùng và thông tin đăng nhập của bạn vào cửa sổ kết nối. Quản lý người dùng trong MongoDB là duy nhất trong đó người dùng được liên kết với một cơ sở dữ liệu chung. Đây thường là cơ sở dữ liệu trong đó người dùng được khai báo lần đầu tiên khi người dùng được tạo. Trình kết nối BI yêu cầu bạn chỉ định cơ sở dữ liệu mà người dùng đã được tạo ra bằng cách chuyển nó như một cặp khóa / giá trị như một phần của tên người dùng. Trong ví dụ dưới đây, người dùng đã được khai báo trong cơ sở dữ liệu "test", vì vậy chúng tôi chỉ định rằng cơ sở dữ liệu gia đình sử dụng tùy chọn? Source = test nối với username. Chi tiết về định dạng chuỗi tên người dùng MongoDB có trong tài liệu của tôi.

 

upload_2017-8-1_11-49-55.png
Khi bạn đã thêm tên người dùng và mật khẩu được định dạng đúng vào cửa sổ bật lên, bạn có thể nhấp vào "đăng nhập" và Tableau sẽ hoàn tất kết nối.

 

Nếu bạn yêu cầu chứng chỉ đó của Bảng xác thực mongosqld, hãy chọn hộp kiểm "Yêu cầu SSL". Cửa sổ pop-up sẽ mở rộng với các trường lựa chọn tệp bổ sung mà bạn có thể sử dụng để xác định CA cert được sử dụng để ký vào mongosqld-server.pem của mongosqld. Hướng dẫn này sử dụng chứng chỉ tự ký kết, được tạo bằng tập lệnh bash mà chúng ta đã liên kết đến trước đó. Chứng chỉ này được gọi là ca.crt và là chứng chỉ bạn cần chọn với nút "browse".

 

Nhấp vào "No custom configuration file specified" để kích hoạt nút trình duyệt, như được hiển thị bên dưới.
upload_2017-8-1_11-50-17.png

 

Khi bạn đã chọn đúng xác nhận, bạn có thể hoàn tất kết nối bằng cách nhấp vào "đăng nhập" và Tableau sẽ hoàn tất kết nối với Trình kết nối BI. Cơ sở dữ liệu MongoDB sẽ có sẵn ở bên phải.

 

 

Tableau thúc đẩy các luồng điểu tra trực quan để phân tích nhóm nhanh và linh hoạt hơn. Bạn có thể phân tích theo mong muốn của bạn nếu bạn muốn tăng thêm các phân khúc, hay Tableau có thể tự động phân cùm, để giúp bạn khám phá các mẫu mới mà đáng lẽ sẽ rất khó khăn đối với dữ liệu có nhiều chiều phân tích.

 

*Các tính năng: Calculated fields(Giá trị), Clustering(Phân cụm), Sets, Groups(Nhóm)

 

Để tạo ra giả thuyết ban đầu, nhà doanh nghiệp hoặc các chuyên gia nghiên cứu thường bắt đầu theo cùng một cách:

 

Tạo các phân khúc và/hoặc tiến hành phân tích nhóm tương tự. Đưa ra một loạt câu hỏi về các phân đoạn khác nhau giúp các nhà phân tích hiểu dữ liệu và xác minh các giả thuyết của họ. (Ví dụ: “Khách hàng có thanh toán bằng tín dụng có tốt hơn khách hàng thanh toán bình thường không?”). Khả năng lại lại nhanh chóng có thể giúp thúc đẩy sự phát triển mô hình và đảm bảo rằng các dự án luôn đi đúng hướng. Nền tảng lý tưởng cho giai đoạn này cần hỗ trợ những điều sau:

 

- Tạo ý tưởng nhanh:

 

Cung cấp một bảng điều tra trực quan và phản hồi gần như tức thời cho các câu hỏi được hỏi trong luồng phân tích.

 

- Hoạt động đơn giản:

 

Tạo và kết hợp các nhóm bằng cách sử dụng các hoạt động thiết lập chuẩn hoặc một giao diện người dùng đơn giản.

 

- Xử lý các vấn đề dữ liệu:

 

Sửa lỗi của dữ liệu chính xác và điều chỉnh các nhóm mà không cần phải cho phép để sửa đổi nguồn dữ liệu bên dưới.

 

- Liên tục cập nhật khi dữ liệu thay đổi:

 

Truyền dữ liệu cập nhập thông qua phân tích mà không cần chạy tập lênh cập nhật bằng tay hoặc làm mới bộ nhớ cache.

 

1. Tạo nhóm bằng Cluster: Một số ví dụ về tính năng tạo cụm bằng cluster.

 

upload_2017-8-8_10-7-49.png

 

Hình 1: Bảng dashboard tương tác cho thấy sự đóng góp về doanh số bán hàng theo quốc gia và sản phẩm.

 

Tableau sở hữu một loạt các tính năng phong phú để có thể phân tích nhanh và lặp lại các phân đoạn.

 

Ví dụ: Chỉ với một vài trường được tính toán và một số thao tác kéo thả, bạn có thể tạo bảng dashboard thể hiện sự chia nhỏ mức đóng góp của một quốc gia cho tổng doanh số bán hàng theo các loại sản phẩm.

 

upload_2017-8-8_10-8-59.png

Hình 2: Tự động tạo phân khúc dữ liệu bằng cách sử dụng Clustering.

 

Clustering trong Tableau là một lựa chọn khác sử dụng phương pháp unsupervised machine learning cho các dữ liệu phân khúc, đặc biệt rất hữu ích khi cần xem xét nhiều biến.

 

Trong hình số 2, bạn có thể thấy kết quả của các quốc gia xếp nhóm dựa trên các chỉ số phát triển của liên hợp quốc. Thuật toán đề xuất giải pháp Cluster-3 tương ứng với các nước kém phát triển, đang phát triển và phát triển.

 

Giao diện linh hoạt của Tableau cũng giúp bạn dễ dàng kiểm tra các lý thuyết khác nhau và khám phá các bảng phân phối trên các nhóm phân tích. Ngoài ra Tableau còn giúp bạn tiết kiệm thời gian.

 

upload_2017-8-8_10-9-13.png

Hình 3: Phân khúc và khám phá dữ liệu trong vài giây

 

Như đã thấy trong hình 3, chỉ cần kéo dimension và measures được sử dụng trong clustering để tạo ra nhiều góc nhình nhỏ, làm nổi bật sự khác nhau giữa ba nhóm quốc gia.

 

Để hiểu rõ hơn về tính năng Clusters bạn xem bài viết Clustering works in Tableau.

 

2. Phân tích xu hướng:

upload_2017-8-8_10-10-21.png

Hình 4: Khám phá và so sánh xu hướng giữa các phân đoạn

 

Hình 4 thể hiện độ tuổi trung bình của các nhóm quốc gia, và có xu hướng khác với độ tuổi trung bình của toàn cầu. Ta có thể thấy độ tuổi trung bình ngày càng tăng ở các nước phát triển, trong khi các nước kém phát triển đang giảm do sự phát triển lớn về tỷ lệ sinh. Đường xu hướng được tự động cập nhật lại mà không cần người dùng bổ sung hay chỉnh sửa.

 

Xem thêm hướng dẫn tại bài viết Trend Line trong Tableau Desktop

 

3. Tạo nhóm bằng Sets:

 

upload_2017-8-8_10-11-15.png

 

Hình 5: Sử dụng Sets linh động

 

Khi sử dụng Sets, bạn có thể xác định được các nhóm của đối tượng trong dự liệu, hoặc chọn bằng tay như trong hình hoặc sử dụng chương trình logic có kế hoạch. Sets có hữu ích ở một số trường hợp như lọc, làm nổi bật, tính toán nhóm tương tự, và phân tích outlier. Bạn cũng có thể tổ hợp nhiều sets (hình 6) để thử nghiệm các trường hợp khác hoặc tạo ra nhiều nhóm tương tự.

upload_2017-8-8_10-11-25.png

 

Hình 6: Kết hợp Sets

 

Xem chi tiết tại bài viết Sets in Tableau

 

4. Tạo nhóm bằng Groups:

 

upload_2017-8-8_10-11-58.png

 

Hình 7: Tạo nhóm

 

Để hổ trợ cho nhu cầu tạo danh mục và thiết lập hệ thống phân cấp, Tableau có một tính năng được gọi là Group. Nó cũng giúp cho việc làm sạch dữ liệu.

 

Các nhóm cho phép người dùng cấu trúc dữ liệu một cách trực quan để phân tích, ví dụ: Tạo một nhóm các quốc gia nói tiếng anh. Điều này cho phép các nhà phân tích tùy chỉnh và kiểm soát tổng hợp dữ liệu.

 

Ngoài ra, nhóm giúp dữ liệu có sự nhất quán và chất lượng dữ liệu tốt hơn. Ví dụ: California có thể được gọi theo tên đầy đủ hoặc cũng có thể được gọi là CA hoặc Calif. Nhà phân tích không có quyền thay đổi trực tiếp hệ thống mã nguồn để giải quyết vấn đề, điều này gây lên sự xung đột dữ liệu khi phân tích. Với Groups, bạn có thể nhanh chóng xác định phân đoạn mới bao gồm tất cả các tên của thay thế khác và không làm gián đoạn luồng phân tích.

 

Xem chi tiết tại bài Tạo Group trong Tableau

 

Kết luận:

 

Trong Tableau, nếu bạn chọn kết nối trực tiếp (live) và tự động cập nhật dữ liệu, thì phân tích của bạn và các tính năng khác như Sets, Groups cũng sẽ được cập nhật theo. Dữ liệu của bạn sẽ tự động cập nhật, và không cần xây dựng lại báo cáo hoặc thực hiện lại các lệnh một cách thủ công. Các bản được cập nhật giúp giảm bớt gánh nặng báo cáo.

 

Bằng cách cho phép người dùng phân loại dữ liệu một cách nhanh chóng, Tableau cho phép người dùng phân tích một cách dễ dàng.

Đây là 2 tính năng về chuỗi thời gian: dự báo và đường xu hướng. Với 2 tính năng này, thay vì anh chị chỉ xem sự biến động của doanh thu theo chuỗi thời gian thì anh chị có thể biết thêm tình hình kinh doanh của công ty anh chị đang có xu hướng đi lên hay đi xuống (Trend Line) và dự đoán tình hình kinh doanh trong tương lai (Forecast).

 

Dưới đây là một ví dụ hướng dẫn tạo ra các đường Trend Line và Forecast trong biểu đồ thể hiện sự biến động doanh số theo tháng của các Category.

  • Bước 1: Kéo Category, Sales vào Rows, Order Date vào Columns (Chọn kiểu thời gian theo tháng) và Category vào Color.

upload_2017-8-9_16-46-49.png

  • Bước 2: Chọn thẻ Analytics, kéo Forcast vào trong biểu đồ

upload_2017-8-9_16-47-42.png

  • Bước 3: Ở thẻ Analytics, kéo Trend Line vào biểu đồ, kéo tương ứng với kiểu đường Trend Line muốn phân tích. Ở ví dụ này, dùng đường Linear.


upload_2017-8-9_16-48-16.png
Truong Dai

Sophisticated Calculations

Posted by Truong Dai Nov 12, 2017

Các tính năng: Ngôn ngữ lập trình thông minh, biểu thức LOD, tạo công thức nhanh, các hàm thống kê.

 

Thông thường, dữ liệu nguồn không chứa tất cả các lĩnh vực cần thiết cho một phân tích toàn diện. Các nhà phân tích cần một ngôn ngữ đơn giản nhưng mạnh mẽ để chuyển đổi dữ liệu. Để trao quyền đầy đủ, các nhà phân tích cần có các khả năng sau:

 

- Tính đa dạng: Các công thức tính toán được hỗ trợ bởi một thư viện các chức năng.

 

- Tính linh hoạt: Một công thức được tổng hợp bởi nhiều công thức tính toán khác.

 

- Kết quả tính toán: Các phép toán phức tạp và phép toán lặp phụ thuộc vào dữ liệu.

 

Mặc dù Tableau rất dễ sử dụng nhưng chúng tôi cũng cung cấp một tính năng mạnh mẽ có thể biểu hiện các logic phức tạp. Với các trường tính mới, bạn có thể dễ dàng thực hiện các phép tính số học, biểu hiện logic có điều kiện, hoặc thực hiện các thao tác chuyên biệt trên dữ liệu. Có hai khả năng chính cho tính năng này là Lever Of Detail (LOD) Expressions và Table Calculations.

 

Với tính năng này đã làm tăng khả năng biểu đạt ngôn ngữ cho Tableau. Có nhiều trường hợp phân tích trước đây khá thách thức hoặc không thể làm được, thì bây giờ có thể xử lý với một biểu thức rất đơn giản, súc tích.

1. Level of detail:

 

Level of Details (LOD) Expression - Biểu thức thể hiện chi tiết theo từng cấp độ.

LOD thường được gọi là Biểu thức LOD hoặc các phép tính LOD, được sử dụng trong nhiều trường hợp, cụ thể như sau:

 

  • Khi bạn cần phân tích theo từng nhóm, so sánh sự khác nhau giữa các nhóm
  • Tính tổng và trung bình theo từng phân khúc
  • Các phép toán tập hợp của tập hợp
  • Phân phối của tập dữ liệu

Một số ví dụ về LOD...

upload_2017-8-10_13-49-27.png

Hình 1: Tần suất đặt hàng của khách hàng: số lượng khách hàng đã thực hiện một đơn đặt hàng, hai đơn đặt hàng, ba đơn đặt hàng… là bao nhiêu.

 

upload_2017-8-10_13-49-39.png

 

Hình 2: Phân tích theo nhóm: phân loại khách hàng theo năm mua hàng đầu tiên để so sánh doanh số bán hàng hàng năm. Chúng ta sử dụng LOD để xác định ngày đặt hàng tối thiểu cho mỗi khách hàng.

 

upload_2017-8-10_13-49-55.png

 

Hình 3: KPI hàng ngày: với các thông tin cần thiết cho KIP theo ngày, LOD cho phép bạn dễ dàng tạo các chỉ số KPI để phân tích.

 

Xem bài viết Level of Details (Part 1) để biết thêm thông tin chi tiết.

 

2. Table Calculation:

 

Cũng như LOD, với Table Calculation bạn cũng có thể tách nhóm và sử dụng các công thức tính toán có sẵn trong Tableau để phân tích dữ liệu. Đơn giản với vài click chuột, không cần bạn biết về kỹ thuật, và tiết kiệm thời gian phân tích cho người tiêu dùng để tạo biểu thức tính toán mới.

 

upload_2017-8-10_13-55-42.png

 

Hình 4: Lấy mẫu dữ liệu trong ngày cho thấy những thông tin cần thiết có thể có về các chart trên.

 

Để biết thêm thông tin chi tiết bạn xem bài viết : Table Calculations Update

Ngoài việc phân tích những giá trị trong quá khứ, tính năng What-If sẽ giúp Anh/Chị tính toán các giá trị tương lai dựa vào những giá trị đầu vào hiện có.

 

Giả sử, anh/chị có dữ liệu về bán hàng gồm các thông tin về nhóm sản phẩm, loại sản phẩm, giá bán, số lượng, giá vốn, doanh số, lợi nhuận. Thay vì chỉ phân tích tình hình kinh doanh của công ty trong các năm trước đó, thì anh chị có thể tạo ra các tình huống thay đổi các thông tin về số lượng, giá vốn hay giá bán để xem doanh số, lợi nhuận sẽ thay đổi ra sao.

 

Dưới đây là một ví dụ về tính năng What-If và các bước thực hiện:

  1. Tạo 3 parameter: Cogs change, Units change, Quantity change. Khi Cogs, Units, Quantity thay đổi N% so với ban đầu, ta sẽ có các giá trị Sales, Profit tương ứng.

upload_2017-8-8_16-50-37.png
upload_2017-8-8_16-50-45.png

2. Tạo các giá trị mới dựa trên các giá trị thay đổi ở parameter:

    • Khi giá trị trong parameter Cogs change tăng/giảm N%, từ đây sẽ tạo ra được giá trị mới Cogs New.
    • Tương tự, ta cũng sẽ có các giá trị Quantity New, Units New:

upload_2017-8-8_16-53-57.png

    • Sales, Profit và Profit Ratio là các giá trị thay đổi theo Cogs, Quantity và Units, chính vì vậy, phải tạo các giá trị Sales New, Profit New, Profit Ratio New tương ứng.

upload_2017-8-8_16-54-48.png

 

3. Kéo Category vào Rows, chọn drill down xuống Sub-category. Tiếp theo, kéo Sales New vào Columns, Profit New vào Color. Sau đó, chọn show 3 parameter đã tạo.

upload_2017-8-8_16-57-46.png

 

4. Thêm một sheet mới, kéo Profit Ratio New vào Label.

upload_2017-8-8_16-58-43.png

5. Tạo một dashboard mới, kéo cả 2 chart vào trong dashboard.

upload_2017-8-8_16-59-3.png
Sau đó, anh/chị chọn tỷ lệ thay đổi của Cogs, Quantity hoặc Units. Anh/Chị sẽ thấy sự khác biệt. Có thể theo dõi sự khác biệt này qua chart Profit Ratio điều chỉnh.

 


Như hình bên dưới, khi giá trị Units tăng 12% thì giá trị Profit Ratio sẽ đạt được là 21.89%.

upload_2017-8-8_17-0-11.png

Khi quản lý một chuỗi cửa hàng thuộc nhiều tiểu bang khác nhau thì việc đề ra Target cho các tiểu bang là điều cần thiết để có thể đánh giá được hiệu quả kinh doanh của các tiểu bang đó. Từ việc đề ra các Target cho từng sản phẩm, từng tiểu bang, có thể cho biết được các tiểu bang nào đang kinh doanh kém hiệu quả, các tiểu bang nào đang kinh doanh tốt. Ngoài ra, anh chị cũng có thể đánh giá được ở từng tiểu bang có bao nhiêu % các sản phẩm đạt trên mục tiêu đưa ra,...

Dưới đây là một ví dụ minh hoạ và hướng dẫn thiết kế:

1. Tạo chart thể hiện sự chênh lệch giữa thực tế đạt được so với mục tiêu đề ra của các tiểu bang dựa trên các sản phẩm. Đồng thời thể hiện % các sản phẩm đạt trên mục tiêu ở các tiểu bang đó.
  • Bước 1: Tạo field Difference Between Actual and Target Profit để tính giá trị chênh lệch giữa Profit và Target Profit. Tiếp theo, tạo field Difference Between Actual and Target by Product để lấy giá trị chênh lệch theo từng sản phẩm.
upload_2017-8-12_16-19-21.png

 


  • Bước 2: Kéo State vào Rows, Difference Between Actual and Target by Product vào Colums và Color. Sau đó, ở thẻ Label chọn Show Mark Label. Chỉnh Format Numbers về dạng Currency.

upload_2017-8-12_16-19-50.png


  • Bước 3: Tạo field Number of Products Above Target để đếm các sản phẩm có lợi nhuận đạt được lớn hơn mục tiêu đề ra. Sau đó, dựa trên field vừa tạo, tính giá trị Percentage of Products Above Target để biết được có bao nhiêu % sản phẩm đạt được mục tiêu đề ra trong tổng các sản phẩm.

upload_2017-8-12_16-20-34.png


  • Bước 4: Kéo Perentage of Products Above Target vào Columns và ở thẻ Label chọn Show Mark Label.

upload_2017-8-12_16-20-51.png


2. Thiết kế chart thứ 2 để theo dõi lợi nhuận thực tế đạt được và lợi nhuận mục tiêu của từng sản phẩm.

  • Bước 5: Tạo một sheet mới, kéo Profit vào Rows, Product vào Columns, Difference Between Actual and Target Profit vào Color và Target Profit vào Detail. Trong thẻ Color, chỉnh màu sắc thành 2 màu để dễ dàng nhận biết được các sản phẩm đã đạt và chưa đạt yêu cầu.

upload_2017-8-12_16-22-20.png


  • Bước 6: Ở thẻ Analytics, kéo Average Line vào chart, chọn theo Cell. Tableau sẽ tự động lấy trung bình theo giá trị Profit. Để chỉnh đường trung bình theo Target Profit chỉ cần nhấp chuột vào đường trung bình, chọn Edit và chỉnh theo giá trị Target Profit.

upload_2017-8-12_16-23-36.png

upload_2017-8-12_16-23-45.png

upload_2017-8-12_16-24-2.png


  • Bước 7: Tạo Dashboard mới và kéo 2 chart vào. Ở chart State, chọn tính năng Use as Filter.

 

upload_2017-8-12_16-24-37.png

 


Lúc này, khi anh chị nhấp vào một tiểu bang bất kỳ thì sẽ biết được giá trị chênh lệch lợi nhuận giữa thực tế và mục tiêu đề ra, cũng như bao nhiêu % sản phẩm đạt trên mục tiêu và đó là những sản phẩm nào.

 

Mất người dùng thân thiết. Mất khách hàng quan trọng. Nếu bạn là một người khởi đầu bạn biết rằng khách hàng là vua. Bạn nên luôn luôn đo lường và cải thiện mức độ giữ chân người dùng, vì vậy bạn có thể giữ nhiều người dùng hơn theo thời gian. Trong bài đăng này, sẽ hướng dẫn bạn cách tính toán số người dùng duy trì dữ liệu của chính bạn trong SQL.

 

Defining retention

Nếu người A sử dụng sản phẩm này vào Thứ Hai, và sử dụng lại vào thứ ba, cô ấy là một người dùng được giữ lại. Nếu người B sử dụng sản phẩm vào thứ hai, nhưng không phải vào thứ ba, ông là một người dùng đã mất hiệu lực. Giữ lại thứ hai là số người dùng được giữ lại chia cho tổng số người dùng. Nếu A và B là hai người duy nhất vào thứ Hai, thì việc giữ lại thứ hai là 50%.

 

Tính tolans user retention cơ bản

Chìa khóa để tính toán tỷ lệ giữ chân là tính người dùng đang hoạt động tại thời điểm số 1, sau đó đếm số người hoạt động ở thời điểm số 2. Một cách dễ dàng để làm điều này trong SQL là để lại tham gia bảng hoạt động người dùng của bạn để nó giống như vậy:

 

select*

 

from activity

 

left join activity as future_activity on

 

activity.user_id = future_activity.user_id

 

and activity.date = future_activity.date - interval '1 day'

 

Bây giờ, đối với mỗi hàng hoạt động của người dùng, ta có - trong cùng một hàng - hoạt động của họ 1 ngày trong tương lai. Điều này cho chúng ta một bảng lý tưởng để tính toán lưu giữ với một số tính đơn giản:

 

select

 

activity.date,

 

count(distinct activity.user_id) as active_users,

 

count(distinct future_activity.user_id) as retained_users,

 

count(distinct future_activity.user_id) /

 

count(distinct activity.user_id)::float as retention

 

from activity

 

left join activity as future_activity on

 

activity.user_id = future_activity.user_id

 

and activity.date = future_activity.date - interval '1 day'

 

group by 1

 

 

Trong công cụ phân tích dữ liệu, chúng ta nhận được biểu đồ này:

upload_2017-8-11_8-24-51.png

 

Để có thêm tín dụng, hãy thay đổi thời gian giữ lại 1 ngày sang 7 ngày hoặc 30 ngày để nắm bắt được ý nghĩa tham gia của người dùng dài hạn.

select

 

users.date as date,

 

count(distinct activity.user_id) as new_users,

 

count(distinct future_activity.user_id) as retained_users,

 

count(distinct future_activity.user_id) /

 

count(distinct activity.user_id)::float as retention

 

from activity

 

-- Limits activity to activity from new users

 

join users on

 

activity.user_id = users.id

 

and users.date = activity.date

 

left join activity as future_activity on

 

activity.user_id = future_activity.user_id

 

and activity.date = future_activity.date - interval '1 day'

 

group by 1

 

upload_2017-8-11_8-25-34.png

 

Ta thấy rằng mặc dù tỷ lệ giữ lại chung là 46%, tỷ lệ giữ chân người dùng mới chỉ là 5,8%! Bây giờ ta thấy tại sao nó rất hữu ích để chia ra người dùng mới. Cải thiện giữ người dùng mới nên rõ ràng là một ưu tiên.

 

Để xem xét việc giữ lại người dùng, chỉ cần thay đổi:

users.date = activity.date

đến:

users.date != activity.date

 

Điều này loại trừ hoạt động từ những người dùng tham gia vào ngày đó. Truy vấn bây giờ giống như sau:

select

 

activity.date as date,

 

count(distinct activity.user_id) as new_users,

 

count(distinct future_activity.user_id) as retained_users,

 

count(distinct future_activity.user_id) /

 

count(distinct activity.user_id)::float as retention

 

from activity

 

-- Limits activity to activity from existing users

 

join users on

 

activity.user_id = users.id

 

and users.date != activity.date

 

left join activity as future_activity on

 

activity.user_id = future_activity.user_id

 

and activity.date = future_activity.date - interval '1 day'

 

group by 1

 

upload_2017-8-11_8-27-36.png

Theo dự kiến, tỷ lệ giữ chân người dùng hiện tại cao hơn mức trung bình chung: 66% so với 46%.

 

Calculating retention in cohorts

Sẽ rất hữu ích để so sánh việc duy trì người dùng tham gia vào tuần A với những người tham gia vào tuần B. Điều này cho phép ta xem liệu những thay đổi sản phẩm của ta có cải thiện tỷ lệ duy trì của ta hay không. Lý tưởng nhất là sẽ kết thúc bằng biểu đồ như sau:


upload_2017-8-11_8-28-0.png

Ta sẽ bắt đầu bằng cách xác định một vài truy vấn phụ hữu ích để đơn giản hóa vấn đề. New_user_activity giới hạn hoạt động của người dùng cho người dùng mới:

with new_user_activity as (

 

select activity.*from activity

 

join users on

 

users.id = activity.user_id

 

and users.date = activity.date

 

)

 

cohort_active_user_count Tính toán tổng số người dùng đang hoạt động - mẫu số trong tính toán lưu giữ trong mỗi nhóm hàng ngày:

, cohort_active_user_count as (

 

select

 

date, count(distinct user_id) ascount

 

from new_user_activity

 

groupby1

 

)

 

Trên hết, ta sẽ thực hiện một vài thay đổi nhỏ hơn cho truy vấn chính:

 

Tính toán thời gian lưu giữ - số ngày giữ lại – như future_activity.date - new_user_activity.date, Và nhóm theo nhóm.Với nhóm này, ta sẽ mất số đơn giản của người dùng đang hoạt động trong nhóm. May mắn thay ta nghĩ về điều này và làm cho cohort_active_user_count Truy vấn phụ, ta có thể tham gia và sử dụng làm mẫu số. Cuối cùng, chúng ta sẽ quấn truy vấn vào một truy vấn bên ngoài tạo ra kết xuất đẹp, loại trừ các hàng và hàng giả mạo.

select date, 'Day '|| to_char(period, 'DD') as period,

 

new_users, retained_users, retention

 

from (

 

select

 

new_user_activity.date as date,

 

(future_activity.date

 

- new_user_activity.date) as period,

 

max(cohort_size.count) as new_users, -- all equal in group

 

count(distinct future_activity.user_id) as retained_users,

 

count(distinct future_activity.user_id) /

 

max(cohort_size.count)::float as retention

 

from new_user_activity

 

leftjoin activity as future_activity on

 

new_user_activity.user_id = future_activity.user_id

 

and new_user_activity.date < future_activity.date

 

and (new_user_activity.date + interval '10 days')

 

>= future_activity.date

 

leftjoin cohort_active_user_count as cohort_size on

 

new_user_activity.date = cohort_size.date

 

groupby1, 2) t

 

where period isnotnull

 

orderby date, period

 

Chú ý đến phạm vi Join, Một trong những thủ thuật SQL yêu thích của tôi, để có được nhiều ngày duy trì trong một biểu đồ.

VD:
upload_2017-8-11_8-29-53.png

Với Periscope, chúng ta có thể tự động xoay kết quả rồi tô màu theo phần trăm:

upload_2017-8-11_8-30-12.png

Making retention more specific

Nhớ cách lưu giữ người dùng mới và người dùng hiện tại khác nhau như thế nào? Bạn có thể thấy các biến thể giống nhau trên nhiều phân đoạn người dùng. Cần vượt qua sự lưu giữ bằng cách: Nhân khẩu học, nội dung trả lời của người dùng, Thu toán thanh toán với người dùng không phải trả tiền, các loại hoạt động khác nhau - xem, tạo, mua, v.v ...

TabPy là một API mới cho phép đánh giá code Python từ trong Tableau workbook.

 

Khi sử dụng TabPy với Tableau, ta có thể xác định các lĩnh vực tính toán bằng Python, do đó tận dụng sức mạnh của một số lượng lớn các thư viện ngay từ visualizations.

 

Sự tích hợp Python mới này trong Tableau cho phép các kịch bản mạnh mẽ. Ví dụ, chỉ cần một vài dòng code Python thì có thể đánh giá các sản phẩm được bán tại một nhà bán lẻ trực tuyến. Sau đó, bạn có thể khám phá các kết quả theo nhiều cách trong Tableau.

 

upload_2017-8-12_13-45-31.png

 

Chấm điểm: Tạo kênh chuyển đổi hiệu quả hơn bằng cách ghi lại hành vi của người dùng của bạn bằng mô hình dự đoán.

 

Dự đoán: Tìm hiểu khi nào và tại sao người dùng rời khỏi, dự đoán và ngăn không cho nó xảy ra.

 

Bạn có thể dễ dàng cài đặt máy chủ TabPy trên máy tính của bạn hoặc trên một máy chủ từ xa. Định cấu hình Tableau để kết nối với dịch vụ này bằng cách nhập URL dịch vụ và số cổng trong phần

 

Help>Setting and Performance> Cài đặt và Hiệu suất> External Service Connection.

 

Sau đó, bạn có thể sử dụng các tập lệnh Python như là một phần của các lĩnh vực đã tính của bạn trong Tableau.

 

upload_2017-8-12_13-45-50.png

 

TabPy sử dụng môi trường Anaconda phổ biến, được cài đặt sẵn và sẵn sàng sử dụng với nhiều gói Python phổ biến bao gồm scipy, numpy và scikit-learn. Nhưng bạn có thể cài đặt và sử dụng thư viện Python trong kịch bản của bạn.

 

Nếu bạn có một nhóm các developer các mô hình tùy chỉnh trong công ty của bạn, TabPy cũng có thể tạo điều kiện chia sẻ những mô hình này với những người khác muốn sử dụng chúng trong Tableau thông qua mô hình được xuất bản.

 

Sau khi published, tất cả những gì cần để chạy mô hình là một dòng mã Python trong Tableau bất kể loại mô hình hay phức tạp. Bạn có thể ước tính xác suất của khách hàng bằng cách sử dụng hồi quy logistic, mạng perceptron nhiều lớp, hoặc các cây tăng cường độ dốc cũng dễ dàng bằng cách đơn giản truyền dữ liệu mới vào mô hình.

upload_2017-8-12_13-46-12.png

 

Sử dụng các mô hình được published có nhiều lợi ích. Các chức năng phức tạp trở nên dễ dàng hơn để duy trì, chia sẻ và sử dụng lại như các phương pháp được triển khai trong môi trường dự báo dịch vụ. Bạn có thể cải tiến và cập nhật mô hình và mã đằng sau điểm cuối trong khi lĩnh vực tính vẫn tiếp tục hoạt động mà không có bất kỳ thay đổi nào. Và một tác giả bảng điều khiển không cần biết hoặc lo lắng về sự phức tạp của mô hình đằng sau điểm cuối này.

 

Cùng với nhau, Tableau và Python cho phép nhiều mô hình phân tích nâng cao hơn, làm cho bảng điều khiển của bạn thậm chí còn có hiệu quả hơn.

upload_2017-8-14_8-36-57.png
Từ đây chúng tôi sẽ chuyển sang tab OData. Tab này sẽ cần phải được phổ biến với một số thông tin để cấu hình đúng cách kết nối OData. Đầu tiên, hãy chọn "Cấu hình Lược đồ".

 

upload_2017-8-14_8-37-8.png

 

Trên trang Cấu hình Lược đồ, chọn DYNAMICSCRM từ 'Chọn lược đồ' kéo xuống.
upload_2017-8-14_8-37-32.png
upload_2017-8-14_8-37-37.png

 

Từ đây, bạn có thể quyết định bản đồ nào của bảng hoặc các đối tượng có sẵn từ Dynamics. Như lưu ý, điều này đúng cho tất cả các kết nối DataDirect Cloud OData được thiết lập.

 

upload_2017-8-14_8-37-52.png

 

Với mục đích của hướng dẫn này, chúng tôi sẽ chỉ sử dụng ACCOUNT. Chọn bảng ACCOUNT bằng cách nhấp vào vòng tròn ở bên phải tên. Nó sẽ chuyển sang màu xanh với dấu kiểm sau khi được chọn. Khi đã chọn, nhấp vào Lưu và Đóng.

 

upload_2017-8-14_8-38-5.png
Bạn sẽ được trả về cài đặt OData. Bây giờ bạn sẽ thấy rằng trường Schema Map được điền.
upload_2017-8-14_8-38-15.png
Tại thời điểm này, D2C được cấu hình để mở một điểm cuối OData đối với dữ liệu Dynamics của bạn. Để đảm bảo rằng các cuộc gọi OData đang hoạt động, tôi luôn thích thử nghiệm nhanh. Sao chép chuỗi trong Access URI. Đây là điểm cuối OData mà công cụ sẽ bị trúng. Dán điều này vào một tab trình duyệt mới và nhấn Enter. Bạn sẽ được nhắc xác thực. Nhập tên người dùng và mật khẩu của DataDirect Cloud.

 

upload_2017-8-14_8-38-30.png
Một khi đã được chứng thực, phản hồi bạn cần xem là XML với Service and Workspace info. Bạn sẽ nhận thấy ACCOUNTS bộ sưu tập xuất hiện. Đây là cùng một bảng mà chúng tôi đã chọn trong khi cấu hình Schema. Tại thời điểm này chúng tôi đã sẵn sàng để cấu hình Tableauđể tiêu thụ dữ liệu Dynamics thông qua OData.

 

upload_2017-8-14_8-38-41.png

 

Cấu hình Tableau dùng Dynamics Data thông qua D2C ODATA

 

Mở Tableau. Như thường lệ, ở màn hình khởi động, bạn sẽ có nhiều lựa chọn kết nối. Một trong số đó là OData, có thể được tìm thấy trong Máy chủ khác.
upload_2017-8-14_8-38-59.png

 

Sau khi được chọn, dấu nhắc kết nối OData sẽ xuất hiện. Nó sẽ cần một vài thông tin:

 

Server: Đây là URL từ D2C, chỉ được kiểm tra trong trình duyệt.

 

Chọn Use a specific username and password. Đây sẽ là tên người dùng và mật khẩu D2C của bạn.

upload_2017-8-14_8-41-14.png

 

Sau một vài giây Tableau sẽ chứa metadata về bảng. Cụ thể hơn nó cho thấy các cột có sẵn từ bảng đó.

 

upload_2017-8-14_8-41-30.png