Skip navigation
2018
Truong Dai

Multiple Sort

Posted by Truong Dai Mar 28, 2018

Sử dụng Sample - Superstore thực hiện ví dụ này.

 

Bước 1: Tạo 1 chart như hình vẽ. Kéo Category, Customer Segment, Region vào Rows; Kéo Sales vào Columns.

 

upload_2018-3-27_9-49-30.png

 

Bước 2: Sort Descending theo biến Region.

 

upload_2018-3-27_9-49-46.png

 

Bước 3: Tạo một biến mới mang giá trị - sum(Sales)

upload_2018-3-27_9-50-0.png

Bước 4:
Kép field – Sales vào Rows -> Chọn Discrete.

 

upload_2018-3-27_9-50-14.png

Bước 5:
Kéo field – Sales vào giữa Region và Customer Segment. Bạn sẽ được kết quả là sort theo nhiều dimension.

 

upload_2018-3-27_9-50-27.png

Chúc các bạn thành công!

Bản đồ là một cách viz tuyệt vời, nó giúp bạn khám phá, xem xét sự thay đổi dữ liệu trên bề mặt không gian địa lý. Trong Tableau việc khám phá đặc trưng theo thuộc tính địa lý trong tập dữ liệu của bạn trở nên dễ dàng hơn bao giờ hết. Nhưng nếu bạn muốn viz nhiều yếu tố khác lọc theo các vị trí trong bản đồ, bạn có thể sử dụng nhiều chart trên dashboard hoặc viz trực tiếp trong tooltip như hình minh họa.

 

upload_2018-3-7_15-52-28.png

Tuy nhiên, đôi khi bạn vẫn muốn so sánh trực tiếp 2 thuộc tính trên cùng một bản đồ. Và bản đồ choropleth bivariate sẽ xử lý vấn đề này giúp bạn. Mặc dù có nhiều thách thức hơn so với việc viz 1 yếu tố, nhưng nó mang lại một trãi nghiệm mới, nâng cao việc xem ảnh hưởng tới các thuộc tính có liên quan trong Tableau.


Vậy bản đồ “bivariate choropleth” là gì?

 

Một chart map choropleth đặc trưng (hay còn goi là filled symbol) trong Tableau chỉ thể hiện một giá trị cho mỗi polygon.

 

Điều này cho phép độc giả dễ dàng đánh giá được hai thuộc tính thay đổi như thế nào và có mối quan hệ với nhau ra sao.

 

Ví dụ: bạn muốn xem mối quan hệ giữa tỷ lệ béo phì và mức độ thiếu lương thực ở một số bang ở Mỹ, bạn có thể tạo ra hai chart map và đặt chúng gần nhau trên dashboard. Để tìm mối quan hệ giữa các yếu tố, người xem cần xem 1 yếu tố trên bản đồ này và so sánh với yếu tố kia trên bản đồ khác. Cách này bắt buộc mắt của bạn phải di chuyển qua lại để so sánh, như ví dụ dưới đây.

upload_2018-3-7_15-54-15.png

 

Với bản đồ choropleth, bạn có thể xem xét sự tương quan giữa tỷ lệ béo phì và tỷ lệ an toàn thực phẩm cùng lúc, thông qua việc kết hợp hai thuộc tính lại với nhau và sử dụng nhiều màu sắc để phân biệt một cách nhanh chóng. Như ở nơi cả hai yếu tố đều có tỷ lệ lớn (màu đen – màu nâu nhạt), hoặc cùng thấp (màu xám) hoặc một yếu tố thấp và một yếu tố cao (xanh nhạt – cam).

 

upload_2018-3-7_15-55-10.png

 

Bằng cách thêm vào chú thích về màu sắc, dữ liệu của bạn được giải thích một cách trực quan hơn .

 

Vậy làm thế nào để thiết kế bản đồ choropleth có hiệu quả trong Tableau

 

Chúng ta sử dụng ví dụ về tỷ lệ báo phì và mức độ an toàn thực phẩm như đề cập phía trên để đào sâu vào vấn đề này.

 

Bước 1: Đơn giản hóa và phân loại dữ liệu của bạn

Việc quan trọng nhất khi bắt đầu là phải đơn giản hóa dữ liệu của bạn. Bởi vì bản đồ bivariate cho phép thấy tất cả các kết hợp của hai thuộc tính nên nó khá là phức tạp. Ví dụ bản đồ có hai thuộc tính thì sẽ có 4 màu khác biệt (2x2) và bản đồ có 3 loại cho mỗi thuộc tính thì sẽ có 9 màu khác biệt (3x3) …

 

Nếu bạn nghĩ tới nguyên tắc 7 +/- 2 là số đối tượng bạn có thể giữ để làm việc trong bộ nhớ thì rất dễ dàng để thấy tại sao bản đồ kết hợp hơn 9 màu sắc thì rất khó giải thích, do nó có quá nhiều category để nhớ.

 

Đối với hầu hết các dữ liệu, bạn không nên tạo quá 3 nhóm dữ liệu. Cách bạn tạo ra như thế nào phụ thuộc vào 2 thuộc tính trên bản đồ của bạn và những gì có ý nghĩa để so sánh giữa chúng. Một nguyên tắc là nếu bạn có thể so sánh giữa các bản đồ khác nhau thì bạn cũng có thể so sánh chúng trên bản đồ bivariate

 

Trong ví dụ so sánh tỷ lệ béo phì và an toàn thực phẩm ở Mỹ, mỗi thuộc tính được chia làm 3 nhóm.

Để chia data thành 3 nhóm, tạo một công thức như sau:

 

upload_2018-3-7_15-57-18.png

 

upload_2018-3-7_15-58-11.png

 

Bước 2: Gom 2 yếu tố thành 1 dimension

upload_2018-3-7_15-58-40.png

Bước 3: Kéo field mới tạo vào màu sắc và điều chỉnh màu sắc để có kết quả tốt nhất.

 

upload_2018-3-7_15-59-12.png

 

Bước 4: Thêm legend vào để việc đọc hiểu được dễ dàng hơn.

 

upload_2018-3-7_15-59-38.png

 

Bước 5: Thêm action highlight để làm nổi bật chart khi người dùng chọn vào legend.

upload_2018-3-7_16-0-7.png

 

Chúc các bạn thành công!

 

* Bump Chart: có một mục đích tương đối đơn giản-Bump chart được sử dụng để hình dung sự thay đổi thứ tự xếp hạng theo thời gian.

 

Là một cách thể hiện hiệu quả để cho thấy các thứ hạng sắp xếp như thế nào qua các biện pháp khác nhau theo thời gian. Ví dụ, bạn có thể muốn xem loại danh mục sản phẩm đã xếp hạng theo doanh số bán hàng từ năm này sang năm khác. Hoặc có thể bạn muốn sử dụng các tháng rời rạc làm yếu tố thời gian để xem liệu thứ hạng của danh mục sản phẩm có thay đổi hay không theo thời vụ.

 

* Xây dựng Bump Chart trong Tableau: Sử dụng Sample Superstore để làm mẫu. Thể hiện thứ hạng sắp xếp theo doanh thu bán hàng của các loại sản phẩm theo quý.

 

Bước 1: Tạo giá trị mới để sắp xếp thứ hạng theo doanh thu bán hàng:

 

RANK(SUM(Sales))

 

upload_2018-3-10_16-10-8.png

 

Bước 2: Kéo Oder date vào Columns. Kéo Rank vào Rows. Kéo Sub-category Color.

 

upload_2018-3-10_16-11-43.png

 

Bước 3: Chọn thời gian Oder Date là Quarter

 

upload_2018-3-10_16-15-31.png

 

Bước 4: Chọn Edit table calculation… > Compute Using chọn Specific Dimensions > Sub-Category > Restaring every > Month of Order date

 

upload_2018-3-10_16-18-37.png

 

Bước 5: Duplicate file Rank > Sử dụng Dual Axis

 

upload_2018-3-10_16-18-52.png

 

Chọn kiểu chart cho lớp thứ 2 là Cicrle

 

Trên thanh Header chọn Edit Axis

upload_2018-3-10_16-19-47.png

 

Chọn Reversed:

 

upload_2018-3-10_16-19-58.png

 

upload_2018-3-10_16-20-7.png

 

Chúc bạn Thành công !

Thu thập dữ liệu Web là một công việc rất tẻ nhạt cho hầu hết các chủ trang web và nhà phát triển.

 

Công cụ Web Scraping của UiPath giúp bạn xây dựng một hệ thống tự động hóa để trích xuất dữ liệu từ các trang web trong một khoảng thời gian rất ngắn.

 

upload_2018-3-8_8-57-53.png

 

1. Truy cập Trình gỡ rối Web Scraping
Bạn có thể truy cập wizard bằng cách nhấp vào Web Scraping trong menu Design.

 

upload_2018-3-8_9-0-3.png

 

2. Bắt đầu

 

Trước khi chạy Web Scraping, đảm bảo rằng bạn đã kéo lên trang web bạn muốn cạo.

 

3. Chạy Web Scraping

 

Trình hướng dẫn sẽ hỏi bạn hai yếu tố từ trang web bạn muốn cạo. Quá trình cạo được dựa trên mẫu dữ liệu bạn đã chọn. Hãy kiểm tra hình ảnh mẫu bên dưới lấy từ các kết quả của eBay. Giả sử chúng ta muốn cạo tên của mặt hàng được liệt kê và giá cả. Trình hướng dẫn sẽ yêu cầu nhấp vào mục đầu tiên và thứ hai trong danh sách để tạo một mẫu của những gì cần phải được bỏ.

 

upload_2018-3-8_9-6-16.png
4. Chọn một phần tử trong page

 

Ở giai đoạn này, Web Scraping sẽ xác định loại trang bạn đang cố gắng trích xuất. Nếu trang ở dạng bảng như ví dụ Google Contacts, trình hướng dẫn sẽ có thể phát hiện ra nó. Trình hướng dẫn cho phép bạn chọn một mục bạn cần để cạo. Thực hiện theo hướng dẫn từng bước trong trình hướng dẫn và luồng công việc sẽ được tạo tự động khi bạn đã hoàn tất. Bước đầu tiên là chọn phần tử đầu tiên. Nếu chúng ta muốn scrape các tiêu đề của mục trong hình ảnh mẫu, phần tử đầu tiên là "danh sách tiêu đề" của mục đầu tiên trong trang kết quả của eBay và phần tử thứ hai sẽ là mục thứ hai. Đó là cách đơn giản nó được. Cùng một khuôn mẫu được sử dụng để scrape tên giá.

 

upload_2018-3-8_9-9-34.png

 

Điều quan trọng cần nhớ là khi bạn thiết lập mục đầu tiên và thứ hai làm các phần tử mô hình, việc scraping các dữ liệu khác từ cùng một loại dựa trên cùng một mẫu.

 

5. Đổi tên các tiêu đề cột

 

Khi bạn đã chọn mục đầu tiên và thứ hai, dữ liệu của bạn sẽ được lưu vào tệp CSV. Trình hướng dẫn cho phép bạn tuỳ chỉnh các tiêu đề để dễ dàng xác định và quản lý nội dung.

 

upload_2018-3-8_9-11-6.png

 

Bạn có thể kích hoạt tùy chọn Extract URL nếu có.

 

6. Trích xuất dữ liệu bổ sung
Khi bạn đã đạt đến bước này, bạn đã chọn phần tử đầu tiên và thứ hai cho mục đầu tiên của mình. Nó sẽ cho bạn thấy một bản xem trước các dữ liệu cần trích xuất. Nếu bạn muốn chọn một tập hợp các mục khác tạo thành cùng một trang web, bạn có thể sử dụng Extract Connection Data button. Điều này sẽ tiến hành cùng một quá trình bạn đã làm cho mục đầu tiên sẽ hỏi bạn về phần tử thứ nhất và thứ hai.

 

7. Dữ liệu trải dài trên nhiều trang
Có những lần mà dữ liệu kéo dài nhiều trang. Web Scraping có thể trích xuất dữ liệu kéo dài nhiều trang bằng cách chỉ định nút Next từ trang web.

 

8. Kéo bảng
Bạn có thể chạy trình hướng dẫn để tạo tệp tin CSV đầu ra. Tệp CSV sẽ được lưu trong cùng một thư mục nơi Workflow được lưu. Để dễ dàng truy cập nó, bạn có thể vào bảng Workspace, kích chuột phải vào Workflow file và nhấp vào Open Containing Folder. Bây giờ bạn có một giải pháp để trích xuất một lượng lớn dữ liệu từ bất kỳ định dạng trang web nào.

 

1. Mọi người thích phân tích trực quan của Tableau

 

Với Tableau, bạn phân tích khi bạn hình dung, giữ trọng tâm vào các câu hỏi chứ không phải phần mềm. Khách hàng của chúng tôi cho chúng tôi biết khả năng duy trì dòng chảy của phân tích là một yếu tố rất lớn cho lý do họ chọn sản phẩm của chúng tôi. Và trong Bảng, không có giới hạn đối với số lượng dữ liệu bạn có thể phân tích. Trên thực tế, công nghệ dữ liệu mới của Hyper, Tableau được thiết kế để xử lý bộ dữ liệu phức tạp lớn. Đọc để xem cách khách hàng đánh giá Tableau cho sự hài lòng và thành công của người dùng.

 

“Chúng tôi đã xem xét một số lựa chọn và nhận thấy Tableau phù hợp nhất và giá cả phải chăng cho nhu cầu của chúng tôi. Nó có thể kết nối với nhiều nguồn dữ liệu khác nhau và hợp nhất chúng vào các thông tin có ý nghĩa và dễ tiêu hóa.”

 

 

CIO IN THE EDUCATION INDUSTRY

 

 

upload_2018-3-2_15-12-51.png

 

2. Một nền tảng linh hoạt để phù hợp với chiến lược dữ liệu của bạn

 

Chúng tôi hỗ trợ bạn bất kể chiến lược dữ liệu của bạn là gì: tại chỗ, trên đám mây công cộng, trong nền tảng đám mây được quản lý đầy đủ của chúng tôi, trên Windows hoặc trên Linux.

 

Với 67 kết nối dữ liệu gốc, bạn có thể truy cập dữ liệu từ hầu hết các nguồn từ các cơ sở dữ liệu như Microsoft SQL Server và Vertica đến các ứng dụng đám mây như Amazon Web Services, Microsoft Azure và Google BigQuery. Kết nối trực tiếp với cơ sở dữ liệu của bạn để tìm thông tin chi tiết theo thời gian thực hoặc bằng các trích liệu được cung cấp bởi Hyper. Nền tảng của bạn nên làm việc với dữ liệu của bạn, bất kể dữ liệu đó tồn tại ở đâu.

 

upload_2018-3-2_15-13-14.png

 

3. Sự đổi mới tập trung vào khách hàng làm tăng giá trị

 

Từ khi thành lập, Tableau đã cách mạng hóa cách mọi người tương tác với dữ liệu. Chúng tôi lắng nghe nhu cầu của khách hàng và cung cấp các công nghệ tiên tiến giúp bạn tìm hiểu sâu hơn trong bộ dữ liệu lớn hơn. Trong năm qua, Tableau đã cung cấp hơn 100 khả năng mới - bao gồm công cụ siêu dữ liệu, trình kết nối PDF, cải tiến mã hóa địa lý và trong chú giải công cụ - với bốn phiên bản mạnh mẽ giúp khách hàng làm nhiều hơn với dữ liệu. Chúng tôi đang làm cho các tiêu đề bằng cách xử lý ngôn ngữ tự nhiên, chuẩn bị cho phép học máy, và nhiều hơn nữa.

 

4. Tiêu chuẩn doanh nghiệp về phân tích tự phục vụ, được hỗ trợ bởi CNTT

 

Một nền phân tích hiện đại nên kết hợp khám phá dữ liệu tự phục vụ với sự bảo mật và quản trị mạnh mẽ. Bảng có thể được cấu hình dựa trên nhu cầu cơ sở hạ tầng hiện tại và trong tương lai của bạn-bao gồm các tiêu chuẩn chứng thực-cung cấp một cách tiếp cận đơn giản để triển khai và bảo trì. Trong sáu năm Garner đã nhận ra Tableau như là một nhà lãnh đạo trong BI hiện đại. Các doanh nghiệp như Charles Schwab, Honeywell và ExxonMobil phụ thuộc vào Tableau là nền tảng BI hiện đại của họ để hỗ trợ hàng chục ngàn người dùng.

 

upload_2018-3-2_15-13-45.png

 

5. Tác động cao với tổng chi phí sở hữu thấp

 

Tableau làm việc với cơ sở hạ tầng của bạn và trực quan, dẫn đến chi phí đào tạo thấp hơn và tỷ lệ chấp nhận cao hơn trong toàn doanh nghiệp. Đây chỉ là một vài lý do khiến khách hàng báo cáo tổng chi phí sở hữu (TCO) thấp hơn các nhà cung cấp BI khác. (Và bạn có thể yên tâm - nền tảng Tableau đến mà không có bất kỳ chi phí ẩn hoặc tiện ích nào.)

 

6. Cộng đồng say mê học tập và chia sẻ

Cộng đồng Tableau là vô song. Sự có mặt của nó mở rộng 246 nhóm người dùng trên toàn cầu, các diễn đàn trực tuyến, blog và các nền tảng xã hội. Hơn 300.000 người dùng đã đăng 7.000 cuộc trò chuyện mới cho Tableau Public mỗi tuần. Năm 2017, hơn 14.000 khách hàng và đối tác từ mọi ngành đã tham gia hội nghị Tableau. Cộng đồng của chúng tôi tiếp tục truyền cảm hứng cho chúng tôi và định hướng lộ trình sản phẩm của chúng tôi.

Bài viết sẽ hướng dẫn các bạn cách kết hợp nhiều Datasource trong một view với Tableau.

 

Ví dụ: Bạn có 2 chi nhánh kinh doanh các sản phẩm khác nhau và mỗi chi nhánh sẽ có một cơ sở dữ liệu riêng. Vậy làm thế nào để bạn tạo ra một bảng danh sách tất cả các sản phẩm ở 2 chi nhánh và tính tổng doanh thu của chúng.

 

Bạn có thể dùng Tableau để thực hiện yêu cầu trên.

 

Tableau combine multidatasource one view10.png

 

Các bước chính:

  • Liệt kê tất cả các sản phẩm ở hai chi nhánh của bạn vào một file Excel và copy chúng vào tableau.
  • Tạo các field để lấy giá trị doanh thu ở hai datasource
  • Tạo liên kết cho hai Datasource gốc
  • Tạo view với dữ liệu từ 2 datasource

Hướng dẫn thực hành

  • Bước 1: Bạn import hai cơ sở dữ liệu của bạn vào Tableau
  • Bước 2: Liệt kê tất cả các sản phẩm mà bạn muốn hiển thị ở view cuối cùng vào một sheet excel

Tableau combine multidatasource one view.png

  • Bước 2: Copy dữ liệu trên vào Tableau bằng cách click vào Data -> Paste Data. Sau khi copy data trên excel vào Tableau, bạn sẽ thấy một datasource mới hiển thị trong Data. Bạn kéo Product vào Rows

Tableau combine multidatasource one view1.png

  • Bước 3: Bạn đang ở Datasource Clipboard (Datasource vừa được tạo ra từ file excel). Bạn tạo các calculated để lấy Sales từ 2 datasource gốc. Tạo Calculated Sale_superstore lấy Sales từ datasource Superstore.

 

Tableau combine multidatasource one view3.png

  • Bước 4: Bạn tạo tiếp calculated Sales_Coff lấy Sales từ datasource Coffe chain

Tableau combine multidatasource one view4.png

  • Bước 5: Tiếp tục tạo Calculated Sales_work lấy tổng của 2 calculated trên

Tableau combine multidatasource one view5.png

  • Bước 6: Tạo relationship cho hai datasource gốc bằng cách click vào Data -> Edit Relationships
  • Bước 7: Ở cửa sổ Relationships, click vào datasource Supstore, click custom và chọn Product ở Primary data source và Category ở Second data source

Tableau combine multidatasource one view7.png

 

  • Bước 8: Tương tự ở Datasource Coffe chain, chọn Product ở Primary datasource và Product type ở Second datasource
  • Bước 9: Ở sheet 1, bạn đã kéo Product vào Rows ở bước 2, bạn lần lượt double click vào 3 calculated tạo ở trên.
  • Bước 10: Tạo total bằng cách click vào Analysis->Total->Show columns Grand Totals

Sau khi hoàn thành các bước trên, các bạn sẽ có một crosstab là dữ liệu doanh thu của tất cả các sản phẩm ở 2 chi nhánh của bạn

 

Tableau combine multidatasource one view9.png