Skip navigation
2017

Trong phiên bản tableau 10.4, nó giúp tận dụng không gian trống (space) , đường viền (borders) và hình nền (backgrounds) trong dashboard của bạn.
Vậy space là gì? Đó là phần không bị ảnh hưởng bởi các thao tác, khoảng trống giữa các phần tử trong dashboard của bạn và đó là yếu tố cần thiết để thiết kế trực quan. Sử dụng hiệu quả space cho phép bạn chuyển đổi trang tổng quan một cách tối ưu để truyền đạt rõ ràng và có hiệu quả dữ liệu.

Hãy xem nó hoạt động như thế nào nhé!

Kiểm soát padding, Borders, và nhiều hơn nữa

Đây là một dashboard nerdy ví dụ về space. Tableau 10.4 có thể làm cho người xem dễ dàng hơn trong việc quan sát dữ liệu. Ví dụ bắt đầu bằng cách thêm một space để declutter dasdboard.

 

Từ khung Giao diện, ta chọn toàn bộ bảng điều khiển (dashboard) trong Item Hierarchy. Từ đó, có thể áp dụng một số đệm ngoài

[IMG]
Thêm space là 30 pixel cho không gian bổ sung vào các cạnh bên ngoài của dashboard.

Điều này rất tốt, nhưng ta nên bỏ qua. Khoảng cách của trang tổng quan cũng cho phép ta tạo ra và chỉnh sửa borders. Hãy tạo ra một và sau đó thêm một vài padding giữa các borders và dashboard.

[IMG]
Đặc biệt khi nhúng bảng điều khiển, một borders giúp xác định khu vực làm việc cho người xem.

Trước tiên, muốn thêm một số padding vào phía trên bên trái của container trong bố cục này. Ta muốn thay đổi màu nền của vùng chứa, điều này sẽ giúp phân biệt mục đích của phần dashboard này.

[IMG]
Và chúng ta có kết quả cập nhật ở bên trái

Điều này sẽ hữu ích hơn nhiều cho người dùng cuối.

Quản lý dashboard của bạn

Ta có đề cập đến việc chúng ta đã xóa không gian dự trữ giữa các trang bảng điều khiển? Trong các phiên bản trước của Tableau, 4 điểm ảnh không gian bắt buộc được xây dựng vào các mặt của mỗi mặt nạ dashboard (chúng ta gọi nó là "gutter"). Điều này có nghĩa là luôn có một khoảng cách giữa các mặt hàng tiếp giáp. Vâng, Bây giờ chúng ta đã có câu trả lời cuối cùng về cách thực hiện tốt nhất các phương pháp để phân tích.

Đó là mức thấp của spacing trong dashboard. Nó giúp ta kiểm soát tốt hơn việc trình bày và sử dụng của dashboard, từ space sang borders và backgrounds.

Trở ngại của việc cập nhật.

Spacing Dashboard kết hợp các tính năng thông báo chính khác trong Bảng 10.4. Trong bản phát hành này, chúng tôi cam kết giúp bạn có được dữ liệu đúng trước những người phù hợp, trên toàn doanh nghiệp.

Chứng nhận nguồn dữ liệu giúp các tổ chức quảng bá các nguồn tốt nhất cho các nhóm sử dụng. Chúng hoạt động liên tục với các đề xuất mở rộng về các nguồn dữ liệu, giúp thúc đẩy việc tiếp thu nguồn dữ liệu tối ưu cho việc phân tích.

Khi đã đến thời điểm công bố, với khả năng hạ cấp và publish workbook, cộng tác viên của bạn chắc chắn sẽ có được thông tin chi tiết họ cần - ngay cả khi tổ chức của bạn đang chạy phiên bản cũ của Tableau Server.

Và đối sự phát triển của các hình ảnh hóa mạnh mẽ, tableau 10.4 đã hỗ trợ thêm file không gian hình học tuyến tính (linear geometry).

Ta có thể dowload bản 10.4 beta tại đây

https://www.tableau.com/getbeta

Online Analytical Processing (OLAP) là một công nghệ được dùng để sắp xếp cơ sở dữ liệu công việc lớn và hỗ trợ nghiệp vụ thông minh. Cơ sở dữ liệu OLAP được chia thành một hoặc nhiều khối và mỗi khối được tổ chức và được thiết kế khối người quản trị cho phù hợp với cách bạn truy xuất và phân tích dữ liệu sao cho nó dễ dàng hơn để tạo và sử dụng PivotTable báo cáo và báo cáo PivotChart mà bạn cần.
Nghiệp vụ thông minh là gì?
Phân tích kinh doanh thường muốn nhận nào của doanh nghiệp, để xem rộng hơn các xu hướng dựa trên tổng hợp dữ liệu, và để xem các xu hướng chia bằng bất kỳ số nào của biến số. Nghiệp vụ thông minh là quy trình trích xuất dữ liệu từ cơ sở dữ liệu OLAP và sau đó phân tích dữ liệu đó cho thông tin mà bạn có thể dùng để đưa ra quyết định Cập nhật thông tin doanh nghiệp và thực hiện thao tác. Để được trợ giúp thông minh ví dụ, OLAP và business trả lời các kiểu câu hỏi về dữ liệu nghiệp vụ:

  • Tổng doanh thu của tất cả sản phẩm cho 2007 so sánh với tổng doanh thu từ năm 2006 làm thế nào?

  • Làm thế nào của chúng tôi khả năng sinh lợi đến ngày so với cùng một khoảng thời gian trong năm năm qua?
  • Số lượng tiền đã khách hàng qua tuổi 35 dành cuối năm, và làm thế nào đã hành vi đó thay đổi theo thời gian?
  • Số lượng sản phẩm được bán trong hai quốc gia/khu vực cụ thể tháng này khác với cùng một tháng năm trước?
  • Đối với mỗi nhóm tuổi thọ của khách hàng, chi tiết những lợi nhuận (cả lề tỷ lệ phần trăm và tổng cộng) theo thể loại sản phẩm là gì?
  • Tìm thấy nhân viên bán hàng trên cùng và dưới cùng, distributor, nhà cung cấp, khách hàng, đối tác hoặc khách hàng.

Online Analytical Processing (, OLAP) là gì?

Xử lý phân tích (OLAP) trực tuyến cơ sở dữ liệu giúp dễ dàng truy vấn nghiệp vụ thông minh. OLAP là một công nghệ cơ sở dữ liệu đã được tối ưu hóa cho truy vấn và báo cáo, thay vì xử lý giao dịch. Dữ liệu nguồn OLAP là cơ sở dữ liệu trực tuyến giao dịch xử lý (OLTP) thường được lưu trữ trong kho lưu trữ dữ liệu. Dữ liệu OLAP được lấy từ dữ liệu lịch sử này, và tổng hợp vào cấu trúc cho phép phân tích phức tạp. Dữ liệu OLAP cũng được sắp xếp hierarchically và lưu trữ trong khối thay vì bảng. Nó là một công nghệ phức tạp dùng cấu trúc đa chiều để cung cấp quyền truy nhập nhanh vào dữ liệu để phân tích. Tổ chức này giúp dễ dàng cho một báo cáo PivotTable hoặc báo cáo PivotChart để hiển thị tóm tắt ở mức cao, chẳng hạn như tổng doanh số trên một toàn bộ quốc gia hoặc khu vực, và cũng hiển thị các chi tiết cho site nơi doanh số đặc biệt là mạnh hoặc yếu.

Cơ sở dữ liệu OLAP được thiết kế để tăng tốc độ quá trình truy xuất dữ liệu. Vì các máy chủ OLAP, chứ không phải là Microsoft Office Excel, hàm tính giá trị tóm tắt, ít dữ liệu cần được gửi đến Excel khi bạn tạo hoặc thay đổi báo cáo. Phương pháp này cho phép bạn làm việc với số lượng lớn hơn nhiều nguồn dữ liệu hơn bạn có thể nếu dữ liệu đã được sắp xếp trong một cơ sở dữ liệu truyền thống, nơi Excel truy xuất tất cả các bản ghi riêng lẻ và sau đó tính toán các giá trị tóm tắt.

Cơ sở dữ liệu OLAP chứa hai kiểu dữ liệu cơ bản: thước đo là dữ liệu số, quantities và giá trị trung bình mà bạn dùng để đưa ra quyết định Cập nhật thông tin doanh nghiệp và kích thước, là các thể loại mà bạn dùng để sắp xếp các số đo. Cơ sở dữ liệu OLAP giúp tổ chức dữ liệu theo nhiều cấp độ chi tiết, bằng cách dùng các thể loại cùng mà bạn đã quen thuộc với để phân tích dữ liệu.

Các phần sau đây mô tả mỗi cấu phần chi tiết:

Khối Một cấu trúc dữ liệu tổng hợp các số đo bằng cấp độ và cấu trúc phân cấp của từng kích thước bạn muốn phân tích. Các khối kết hợp một vài kích thước, chẳng hạn như đường thời gian, địa lý và sản phẩm, với tóm tắt dữ liệu, chẳng hạn như doanh số hoặc số liệu kiểm kê. Cube không phải là "Cube" trong nghiêm toán nghĩa vì chúng không nhất thiết phải có cạnh bằng nhau. Tuy nhiên, họ là một ẩn dụ apt cho một khái niệm phức tạp.

Thước đo Tập giá trị trong một khối dựa trên một cột trong bảng dữ kiện của khối và có là giá trị số thường. Thước đo là các giá trị Trung tâm trong khối mà preprocessed, tổng hợp và phân tích. Ví dụ phổ biến có doanh thu, lợi nhuận, doanh thu và chi phí.

Thành viên Một mục trong một cấu trúc phân cấp thể hiện một hoặc nhiều lần xuất hiện của dữ liệu. Thành viên có thể là duy nhất hoặc nonunique. Ví dụ, 2007 và 2008 đại diện cho các thành viên duy nhất trong năm mức của tham số thời gian, trong khi tháng một đại diện cho các thành viên nonunique trong tháng mức vì có thể có nhiều hơn một tháng một trong tham số thời gian nếu nó có chứa dữ liệu cho nhiều hơn một năm.

Phần tử được tính toán Thành viên của tham số có giá trị được tính toán chạy lần bằng cách sử dụng một biểu thức. Phần tử được tính toán giá trị có thể xuất phát từ giá trị của thành viên khác. Ví dụ, một thành viên được tính toán, lợi nhuận, có thể được xác định bằng cách trừ đi giá trị của thành viên, chi phí, từ giá trị của thành viên, doanh thu.

Tham số Một tập hợp của một hoặc nhiều tổ chức cấu trúc phân cấp độ trong khối mà người dùng hiểu được và sử dụng làm cơ số cho phân tích dữ liệu. Ví dụ, một chiều địa lý có thể bao gồm cấp độ cho quốc gia/vùng, bang/tỉnh và thành phố. Hoặc, tham số thời gian có thể bao gồm một cấu trúc phân cấp có các cấp độ cho năm, quý, tháng và ngày. Trong một báo cáo PivotTable hoặc báo cáo PivotChart, mỗi cấu trúc phân cấp trở thành một tập hợp trường mà bạn có thể bung rộng và thu gọn để hiển thị cấp độ cao hơn hoặc thấp hơn.

Cấu trúc phân cấp Một cấu trúc lô-gic cây tổ chức các thành viên của tham số sao cho mỗi thành viên có mẹ một thành viên và số 0 hoặc thành viên con khác. Con là một phần trong mức thấp hơn kế tiếp trong cấu trúc phân cấp trực tiếp liên quan đến thành viên hiện tại. Ví dụ, trong một cấu trúc phân cấp thời gian có chứa các cấp độ quý, tháng và ngày, tháng là con của quý 1. Mẹ là một phần trong cấp độ cao hơn trong một cấu trúc phân cấp trực tiếp liên quan đến thành viên hiện tại. Giá trị mẹ thường là tổng hợp của các giá trị của tất cả các con của nó. Ví dụ, trong một thời gian cấu trúc phân cấp có chứa các cấp độ quý, tháng và ngày, quý 1 là mẹ của tháng.

Mức Trong một cấu trúc phân cấp, dữ liệu có thể được sắp xếp thành thấp và cao cấp độ chi tiết, chẳng hạn như năm, quý, tháng và ngày mức trong cấu trúc phân cấp thời gian.
Các tính năng OLAP trong Excel
OLAP truy xuất dữ liệu Bạn có thể kết nối với nguồn dữ liệu OLAP giống như bạn thực hiện với các nguồn dữ liệu ngoài. Bạn có thể làm việc với cơ sở dữ liệu được tạo bằng phiên bản dịch vụ Microsoft SQL Server OLAP 7.0, phiên bản Microsoft SQL Server Analysis Services 2000, và phiên bản dịch vụ phân tích Microsoft SQL Server 2005, sản phẩm máy chủ Microsoft OLAP. Excel cũng có thể làm việc với các sản phẩm OLAP bên thứ ba tương thích với OLE DB cho OLAP.

Bạn có thể hiển thị dữ liệu OLAP chỉ dưới dạng báo cáo PivotTable hoặc báo cáo PivotChart hoặc trong một hàm trang tính được chuyển đổi từ báo cáo PivotTable, nhưng không phải là một miền dữ liệu ngoài. Bạn có thể lưu báo cáo OLAP PivotTable và báo cáo PivotChart trong báo cáo mẫu, và bạn có thể tạo tệp kết nối dữ liệu Office (ODC) (.odc) để kết nối với cơ sở dữ liệu OLAP cho các truy vấn OLAP. Khi bạn mở một tệp ODC, Excel sẽ hiển thị báo cáo PivotTable trống sẵn sàng để bạn bố trí.

Tạo các tệp khối ngoại tuyến dùng Bạn có thể tạo một tệp khối vuông ngoại tuyến (.cub) với một tập hợp con dữ liệu từ cơ sở dữ liệu máy chủ OLAP. Sử dụng tệp khối vuông ngoại tuyến để làm việc với dữ liệu OLAP khi bạn không được kết nối với mạng của bạn. Cube cho phép bạn làm việc với số lượng lớn dữ liệu trong một báo cáo PivotTable hoặc báo cáo PivotChart hơn bạn có thể nếu không, và sẽ đẩy nhanh quá trình truy xuất dữ liệu. Bạn có thể tạo các tệp khối chỉ khi bạn sử dụng một Phần mềm cung cấp truy cập OLAP, chẳng hạn như Microsoft dịch vụ phân tích SQL Server 2005, phiên bản mà hỗ trợ tính năng này.

Hành động máy chủ Một hành động máy chủ là một tính năng hữu ích nhưng tùy chọn mà người quản trị khối OLAP có thể xác định trên một máy chủ mà sử dụng một thành viên khối hoặc đo làm tham số vào truy vấn để có được các chi tiết trong khối, hoặc để khởi động ứng dụng khác, chẳng hạn như một trình duyệt. Excel hỗ trợ URL, báo cáo, Rowset, truy sâu đến và mở rộng tới chi tiết máy chủ hành động, nhưng nó không hỗ trợ sở hữu, điều khoản và tập hợp dữ liệu. Để biết thêm thông tin, hãy xem thực hiện một hành động máy chủ OLAP trong báo cáo PivotTable .

KPI KPI là một số đo được tính toán đặc biệt được xác định trên máy chủ cho phép bạn theo dõi "chỉ số hiệu suất then chốt" bao gồm các trạng thái (có giá trị hiện tại đáp ứng một number? cụ thể) và xu hướng (giá trị là gì qua time?). Khi những mục này được hiển thị, máy chủ có thể gửi các biểu tượng liên quan tương tự như biểu tượng Excel mới được thiết lập để cho biết trên hoặc dưới mức trạng thái (chẳng hạn như biểu tượng dừng ánh sáng) hoặc có một giá trị đang thịnh hành lên hoặc xuống (chẳng hạn như một biểu tượng mũi tên hướng).

Định dạng máy chủ Người quản trị khối có thể tạo số đo và phần tử được tính toán với định dạng, định dạng phông và quy tắc định dạng có điều kiện, có thể được chỉ định là một quy tắc công ty chuẩn business màu. Ví dụ, một định dạng máy chủ cho lợi nhuận có thể định dạng số tiền tệ, một ô màu xanh lá cây nếu giá trị lớn hơn hoặc bằng 30.000 và màu đỏ nếu giá trị nhỏ hơn 30.000, và một kiểu phông chữ đậm nếu giá trị nhỏ hơn 30.000 và thông thường khi lớn hơn hoặc bằng 30.000. Để biết thêm thông tin, hãy xem thiết kế bố trí và định dạng của báo cáo PivotTable.

Ngôn ngữ hiển thị Office Người quản trị khối có thể xác định bản dịch cho dữ liệu và lỗi trên máy chủ cho những người cần phải xem PivotTable thông tin trong ngôn ngữ khác. Tính năng này được xác định là một thuộc tính tệp kết nối và thiết đặt quốc gia/khu vực máy tính của người dùng phải tương ứng với ngôn ngữ hiển thị.
Cấu phần mềm mà bạn cần để truy nhập nguồn dữ liệu OLAP
Nhà cung cấp một OLAP Để thiết lập nguồn dữ liệu OLAP cho Excel, bạn cần một trong các nhà cung cấp OLAP sau đây:

  • Nhà cung cấp Microsoft OLAP Excel bao gồm phần mềm trình điều khiển nguồn dữ liệu và máy khách mà bạn cần để truy nhập cơ sở dữ liệu được tạo bằng phiên bản dịch vụ Microsoft SQL Server OLAP 7.0, phiên bản dịch vụ Microsoft SQL Server OLAP 2000 (8.0) và phiên bản dịch vụ phân tích Microsoft SQL Server 2005 (9.0).

  • Nhà cung cấp bên thứ ba OLAP Cho các sản phẩm OLAP, bạn cần cài đặt trình điều khiển bổ sung và phần mềm khách. Để sử dụng các tính năng của Excel để làm việc với dữ liệu OLAP, sản phẩm của bên thứ ba phải phù hợp với OLE DB cho OLAP chuẩn và là Microsoft Office tương thích. Để biết thông tin về cách cài đặt và sử dụng nhà cung cấp OLAP bên thứ ba, tham khảo người quản trị hệ thống của bạn hoặc nhà cung cấp cho OLAP sản phẩm của bạn.

Máy chủ cơ sở dữ liệu và các tệp khối Phần mềm máy khách Excel OLAP hỗ trợ kết nối đến hai loại cơ sở dữ liệu OLAP. Nếu cơ sở dữ liệu trên máy chủ OLAP sẵn dùng trên mạng của bạn, bạn có thể truy xuất dữ liệu nguồn từ nó trực tiếp. Nếu bạn có một tệp khối vuông ngoại tuyến có chứa dữ liệu OLAP hoặc tệp định nghĩa khối , bạn có thể kết nối với tệp đó và truy xuất dữ liệu nguồn từ đó.


Nguồn dữ liệu Nguồn dữ liệu cho phép bạn truy nhập vào tất cả dữ liệu trong cơ sở dữ liệu OLAP hoặc tệp khối ngoại tuyến. Sau khi bạn tạo nguồn dữ liệu OLAP, bạn có thể tạo báo cáo theo đó, và trả về dữ liệu OLAP để Excel ở dạng một báo cáo PivotTable hoặc báo cáo PivotChart, hoặc trong một hàm trang tính được chuyển đổi từ báo cáo PivotTable.

Truy vấn Microsoft Bạn có thể sử dụng truy vấn để truy xuất dữ liệu từ cơ sở dữ liệu bên ngoài chẳng hạn như Microsoft SQL hoặc Microsoft Access. Bạn không cần phải sử dụng truy vấn để truy xuất dữ liệu từ một PivotTable OLAP được kết nối với một tệp khối vuông.

Anh/Chị muốn thể hiện Doanh thu, Lợi nhuận theo Loại sản phẩm như hình dưới đây. Ngoài cách vẽ Bullet Graphs như thông thường, BSD sẽ hướng dẫn Anh/Chị vẽ theo cách mới đơn giản hơn.

 

upload_2017-7-28_15-7-7.png

 

Các bước thực hiện như sau:

 

Bước 1: Kéo SalesProfit vào Columns, Sub–Category vào Rows.

upload_2017-7-28_15-7-30.png

Bước 2:
Click phải Profit, chọn Dual Axis.

upload_2017-7-28_15-7-42.png

Bước 3:
Vào thẻ Marks chỉnh kiểu chart. Chọn kiểu chart Bar cho Sales Gantt Bar cho Profit.

upload_2017-7-28_15-8-49.png

Bước 4:
Click phải vào header của Profit, click Synchronize Axis để đồng nhất số liệu của SalesProfit; chọn Show Header để ẩn đi thanh header.


upload_2017-7-28_15-9-2.png

Profit & Loss là quan điểm hàng đầu đối với bất kỳ doanh nghiệp nào. Nó cung cấp cho nhà quản trị các chỉ số quan trọng như: Doanh thu thuần, lợi nhuận thuần, lợi nhuận biên,.. Ngoài ra có thể theo dõi các yếu tố này theo vùng miền, kênh bán hàng, phân khúc khách hàng thậm chí là loại sản phẩm.

 

upload_2017-7-29_11-40-0.png

 

Hình trên là phiên bản mà hầu hết mọi người sử dụng, tuy nhiên nó chỉ phù hợp cho Desktop và Tablet còn giao diện Mobile sẽ không đáp ứng được nhu cầu người dùng.

 

Bài viết này sẽ giới thiệu một template mới xử lý được khó khăn trên ngoài ra còn cung cấp cho nhà quản trị góc nhìn mới, thao tác dễ dàng hơn.

 

upload_2017-7-29_11-40-43.png

 

Trong đó:
Bar: Các thanh thể hiện các chỉ số so với cùng kỳ. Màu sắc thanh thể hiện mục tiêu của các chỉ số. Màu xanh: đạt mục tiêu & màu cam: không đạt mục tiêu.
Sparklines: đường line thể hiện các chỉ số theo tháng. Các đường chấm đứt khúc thể hiện sự khác biệt giũa các chỉ số so với ngân sách. Màu sắc của các chấm tròn ở cuối mỗi đường line thể hiện sự khác biệt của ngân sách tháng cuối với tháng trước đó.

 

Nguồn: Andy Kriebel

 

Nhiều tổ chức đã và đang đầu tư vào các nền tảng phân tích và kiến thức về thể chế trong một thời gian. Do đó, bạn có thể có nhu cầu rất cụ thể và một bộ sưu tập có giá trị của công việc hiện tại.

 

Bên cạnh đó, một nền tảng phân tích toàn diện phải hỗ trợ khả năng tích hợp với các công nghệ phân tích tiên tiến khác, cho phép bạn mở rộng chức năng có thể và tận dụng các khoản đầu tư hiện có trong các giải pháp khác. Hỗ trợ tích hợp với các công nghệ bổ sung cho phép:

 

Sử dụng không giới hạn các phương pháp lựa chọn:

 

Đem lại các thuật toán và những tiến bộ mới nhất từ cộng đồng rộng lớn.

 

Tận dụng công việc đầu tiên:

 

Kết nối với logic và mô hình trước đây để đảm bảo thực tiễn thể chế tốt nhất và tránh lặp lại công việc trước.

 

Kết quả mô hình của Visualize và interrogate

 

Sử dụng giao diện người dùng trực quan để giúp giải thích, khám phá các kết quả của mô hình và giao tiếp với đồng nghiệp của bạn.

 

Tableau kết hợp trực tiếp với Python và R để hỗ trợ người dùng với các mô hình hiện tại và thúc đẩy cộng đồng thống kê trên toàn thế giới. Tableau gửi các kịch bản và dữ liệu tới các dịch vụ dự báo bên ngoài như RServe và TabPy. Các kết quả sau đó được trả lại cho Tableau để sử dụng bởi công cụ hiển thị Tableau. Điều này cho phép người dùng Tableau gọi bất kỳ hàm nào có sẵn trong R hoặc Python trên dữ liệu trong Tableau và để điều khiển mô hình được tạo ra trong các môi trường này bằng Tableau. (1)

 

Trong Hình 15 và 16, bạn có thể thấy một số ví dụ trong đó R được sử dụng để tính các thống kê mô tả trên một bộ dữ liệu trong Tableau, với Tableau được sử dụng để hình dung các kết quả. Hình 15 là một biểu diễn đồ họa của mật độ xác suất cho dữ liệu thể hiện trong sơ đồ phân tán và hình 16 minh họa việc kiểm tra xác suất.

 

(1) Tableau cũng có thể đọc R, SAS, và dữ liệu SPSS fles như một nguồn dữ liệu. Mặc dù một cuộc thảo luận đầy đủ về các nguồn dữ liệu nằm ngoài phạm vi của bài báo này, nhưng đáng chú ý là Tableau có thể kết nối trực tiếp tới các kết quả của fle từ một số chương trình thống kê thông thường

 

upload_2017-8-10_8-7-51.png

 

Hình 15: mật độ hạt nhân biến thể được tính trong R, hình dung trong Tableau

 

Source: boraberan.wordpress.com/
upload_2017-8-10_8-8-15.png

 

Hình 16: R và Tableau được sử dụng để tính toán và hình dung các kết quả kiểm tra ý nghĩa

 

Source: boraberan.wordpress.com/
Mô hình có thể đi sâu hơn nhiều so với thống kê cơ bản. Với sự tích hợp R và Python, bạn có thể phân tích văn bản để giải thích tình cảm (Hình 17) hoặc hiển thị các kết quả của phân tích theo quy tắc như chuỗi cung ứng hoặc tối ưu hoá danh mục chứng khoán (Hình 18).

 

upload_2017-8-10_8-8-50.png
Hình 17: Phân tích ý kiến

 

Source: boraberan.wordpress.com/

 


Trong Hình 18, bạn có thể thấy một danh mục được tối ưu hoá được mô phỏng và mô phỏng trong R, nhưng được hình dung trong Tableau.
upload_2017-8-10_8-9-16.png
Hình 18: Tối ưu hoá danh mục cổ phiếu

 

Source: boraberan.wordpress.com
Việc tích hợp hỗ trợ chạy mã R hoặc Python trực tiếp bên trong Tableau, cũng như các mô hình và các kịch bản defaced bên ngoài Tableau. Hình 19 cho thấy một bảng điều khiển sử dụng tăng cường gradient, kỹ thuật học tập toàn bộ để cung cấp các gợi ý chẩn đoán cho các khối u vú dựa trên các trường hợp ung thư lịch sử. Mô hình này được đào tạo và đánh giá một cách chính xác cho một nhà khoa học dữ liệu trong môi trường lập trình Python sau đó xuất bản sang TabPy (Tableau Python Server). Bảng điều khiển cung cấp felds nhập mẫu để cho phép người dùng nhập các giá trị cho các thông tin y tế khác nhau

 

Các chỉ số được chuyển đến mô hình học máy được lưu trữ này và chuyển thành đề xuất chẩn đoán trong thời gian thực. Điều này cho phép nhiều nhà phân tích và bảng điều khiển xây dựng trên các tài sản học tập dùng chung mà các nhà khoa học dữ liệu có thể dễ dàng quản lý ở một vị trí bằng cách sử dụng công cụ được lựa chọn của họ.
upload_2017-8-10_8-9-50.png

 

Hình 19: Mô hình học máy toàn bộ với các tham số đầu vào

 


Sự kết hợp của Tableau với Python và R cực kỳ mạnh. Nó cho phép các kết quả mô hình hóa phức tạp được thể hiện dưới dạng hình ảnh đẹp và hấp dẫn cho người dùng ở bất kỳ trình độ kỹ năng nào và đặt câu hỏi nếu - nếu có câu hỏi và đánh giá kịch bản giả thuyết bằng cách tương tác với các điều khiển được nhúng vào bảng điều khiển.

 

Phần kết luận:

 

Bằng nhiều cách, Tableau đứng một mình giữa các nền tảng phân tích. Nhờ sứ mệnh của chúng tôi để tăng cường trí thông minh của con người, chúng tôi đã thiết kế Tableau với cả người dùng doanh nghiệp và nhà khoa học dữ liệu. Bằng cách tập trung vào sứ mệnh của chúng tôi để trao quyền cho người dùng đặt các câu hỏi thú vị về dữ liệu của họ nhanh nhất có thể, chúng tôi đã xây dựng một nền tảng có chức năng có giá trị cho người dùng ở tất cả các cấp.

 

Bảng frontaufer nổi bật của Tableau cho phép người dùng doanh nghiệp đặt câu hỏi mà không cần mã hoặc hiểu cơ sở dữ liệu. Tableau cũng có chiều sâu phân tích cần thiết để trở thành một vũ khí mạnh mẽ trong kho vũ khí của một nhà khoa học dữ liệu. Bằng cách tận dụng các tính toán phức tạp, tích hợp R và Python, phân tích nhóm nhanh và khả năng tiên đoán, các nhà khoa học dữ liệu có thể hoàn thành các phân tích phức tạp tại Tableau và dễ dàng chia sẻ các kết quả trực quan. Cho dù bạn sử dụng Tableau để khám phá và kiểm tra chất lượng hoặc thiết kế và thử nghiệm mô hình, bản chất tương tác của nền tảng này sẽ tiết kiệm vô số giờ trong suốt dự án. Bằng cách phân tích dễ tiếp cận hơn và nhanh hơn để hoàn thành ở mọi cấp độ, Tableau thúc đẩy sự hợp tác quan trọng và ra quyết định tốt hơn trong toàn doanh nghiệp.

 

1. Cài đặt và Deploy Tableau

 

Xóa các phiên bản trước của Tableau Desktop trong khi cài đặt (chỉ dành cho Windows)

 

Khi bạn cài đặt phiên bản mới nhất của Tableau Desktop hoặc Tableau Reader từ dòng lệnh, bây giờ bạn có thể tự động xóa các phiên bản đã cài đặt trước đó của các ứng dụng đó khỏi máy. Bắt đầu với phiên bản 10.4, bạn có thể đặt cài đặt thuộc tính cài đặt REMOVEINSTALLEDAPP thành "1" và trong quá trình cài đặt, trình cài đặt sẽ phát hiện và xóa bất kỳ phiên bản đã cài đặt trước nào trở lại phiên bản 9.3. Nếu máy có Tableau Desktop hoặc Tableau Reader phiên bản 9.2 hoặc cài đặt trước, các phiên bản này sẽ không tự động được gỡ cài đặt. Thay vào đó, bạn phải gỡ cài đặt chúng theo cách thủ công.

Note: Tableau Public không sử dụng thuộc tính trình cài đặt vì nó luôn luôn loại bỏ phiên bản trước đó khi bạn cài đặt phiên bản mới.

Để biết thêm thông tin về cách thiết lập các thuộc tính cài đặt từ dòng lệnh, xem phần Deploy Tableau Desktop trong hướng dẫn Deployment Desktop Tableau.
Hạ Cấp và public workbook đến các phiên bản cũ của Tableau Server

Trong các bản phát hành trước, public workbook cho Tableau Server có thể là vấn đề khi Tableau Desktop và Tableau Server có trên các phiên bản chính của ứng dụng. Ví dụ: nếu bạn đã cố xuất bản bảng tính được tạo trong Tableau Desktop 10.3 trở lên.Tableau Server chạy trên phiên bản 10.2, bạn đã nhận được lỗi như hình này.
upload_2017-10-6_15-19-0.png
Bây giờ trong Tableau Desktop 10.4 (Windows và Mac) khi bạn xuất bản bảng tính lên phiên bản cũ của Tableau Server (10.2 trở đi), bạn sẽ nhận được thông báo cảnh báo cho biết rằng bảng tính sẽ bị hạ cấp xuống phiên bản bạn đang xuất bản đến. Bất kỳ tính năng hoặc chức năng nào có trong bảng tính không có sẵn trong phiên bản cũ hơn sẽ bị xóa vì tính tương thích.

Note: Tùy chọn downgrade mới không có sẵn khi xuất bản các bảng tính lên Tableau Server 10.1 và các phiên bản trước đó.

 

upload_2017-10-6_15-19-30.png

 

Bạn vẫn có thể mở bảng tính đã được hạ cấp xuống trong phiên bản hiện tại của Tableau Desktop nhưng bạn có thể cần phải thêm lại các tính năng đã bị xóa khi bảng tính bị hạ cấp. Để biết thêm thông tin về tính tương thích.
Kết nối và chuẩn bị dữ liệu
Nguồn dữ liệu được chứng nhận và đề xuất

 

Đã bao giờ bạn tự hỏi liệu bạn có thể tin cậy dữ liệu cơ bản của mình hay muốn tránh tạo ra một nguồn dữ liệu hoàn toàn mới? Tác giả Quan điểm Tableau với sự tin cậy và tốc độ sử dụng các nguồn dữ liệu đã được chứng nhận và đề xuất trước đó bởi những người khác. Nguồn dữ liệu đã được chứng nhận được hỗ trợ bởi cả Bảng và Online. Các nguồn dữ liệu này được các nhà quản trị trang web và các nhà lãnh đạo dự án lựa chọn cẩn thận và xuất hiện với một huy hiệu chứng nhận duy nhất. Di chuột qua huy hiệu để tìm hiểu người đã xác nhận nguồn dữ liệu, đọc bất kỳ ghi chú mang tính mô tả nào mà họ đã cung cấp và xác nhận loại kết nối. Đây là cách các nguồn dữ liệu được chứng nhận nhìn khi bạn kết nối với dữ liệu trong Tableau Desktop.
upload_2017-10-6_15-20-16.png

 

Và đây là cách bạn có thể xác định được các nguồn dữ liệu được chứng nhận trong Bảng thông tin trực tuyến hoặc máy chủ Tableau.
upload_2017-10-6_15-20-35.png

 

Nguồn dữ liệu đề xuất được hỗ trợ bởi máy chủ Tableau. Các nguồn dữ liệu này bao gồm các nguồn được chứng nhận cá nhân và một số khác được tự động chọn cho bạn dựa trên các mẫu sử dụng tại tổ chức của bạn. Bạn có thể truy cập các nguồn dữ liệu được đề xuất ở phía bên phải trang thiết lập nguồn dữ liệu trong Tableau Desktop, trong khi bạn đăng nhập vào Tableau Server.
upload_2017-10-6_15-20-50.png

New Denodo connector

Sử dụng đầu nối Denodo để kết nối với dữ liệu Denodo.

 

Thêm Databases(ODBC) cho Mac

 

Bây giờ bạn có thể sử dụng bộ kết nối Cơ sở dữ liệu Khác (ODBC) trên máy Mac để kết nối với một cơ sở dữ liệu khi trình điều khiển cơ sở dữ liệu bạn muốn kết nối với thực hiện các tiêu chuẩn ODBC.

 

Trình kết nối Oracle hỗ trợ SSL

 

Bây giờ bạn có thể kết nối với Oracle bằng cách sử dụng SSL trên cơ sở, sau khi bạn cấu hình khách hàng của Oracle.

 

Hỗ trợ SAP GUI 7,4

 

Tableau hỗ trợ định dạng XML Cảnh quan Giao diện Người dùng SAP mới.

 

Tạo một trích xuất SAP BW mà không có giấy phép đặc biệt

 

Bắt đầu từ 10.4, bạn có thể tạo ra một giải nén SAP BW mà không cần một chìa khóa cấp phép đặc biệt. Trước 10.4, các trích xuất của SAP BW là một tính năng beta không được hỗ trợ.

 

Lượt truy cập Thiết kế và Phân tích Dữ liệu

 

Khoảng cách trang tổng quan chính xác, với điều khiển màu đường viền và màu nền

 

Nếu trước đây bạn đã sử dụng các đối tượng trống để tinh chỉnh bố cục bảng điều khiển, bạn sẽ thực sự đánh giá cao các điều khiển khoảng cách mới. Padding cho phép bạn định vị chính xác các vị trí trên bảng điều khiển, trong khi các đường viền và màu nền cho phép bạn làm nổi bật chúng.

upload_2017-10-6_15-22-2.png
A. Outer padding
B. Blue border
C. Inner padding with light blue background
Để giúp bạn nhanh chóng tạo bố cục hấp dẫn, mặc định padding được tối ưu hóa cho các loại bảng điều khiển khác nhau. Các vùng chứa bố cục không có lớp padding theo mặc định, sheets và objects có bốn pixel, và toàn bộ bảng điều khiển có tám điểm ảnh cho hình ảnh không có rắc rối và xuất PDF.

 


Trước đây, các trang tổng quan liền kề nhau đã được cách nhau bằng tối thiểu là bốn pixel, nhưng bây giờ bạn có thể tạo các mẫu thiết kế liền mạch bằng cách chỉ định không padding.
upload_2017-10-6_15-22-54.png

Khoảng cách trang tổng quan khả dụng ở cả Tableau Desktop và không gian làm việc của Web của Tableau Server và Tableau Online.

Hỗ trợ High DPI cho Windows

 

Nếu mở rộng quy mô DPI trên máy tính Windows của bạn, giờ đây bạn có thể tự tin tạo quan điểm của mình, biết rằng chúng sẽ trông đẹp ở tỉ lệ 100% khi thực hiện ở tỷ lệ 200%.

 

Trước khi High DPI Scaling

upload_2017-10-6_15-23-32.png

Sau khi High DPI Scaling

upload_2017-10-6_15-23-46.png
Hỗ trợ cho hình học tuyến tính

Bắt đầu với Bảng 10.4, bạn có thể kết nối với các tệp không gian có chứa các hình học tuyến tính.

Để tạo bản đồ có hình học tuyến tính:

1. Connect to your spatial data.

2. Navigate to a worksheet.

3. In the Data pane, double-click the Geometry field.

upload_2017-10-6_15-24-18.png

Bạn có thể mã hóa kích thước và màu sắc, cũng như thêm các cấp độ bổ sung vào chế độ xem.

 

Cập nhật và bổ sung dữ liệu bản đồ

 

Trong Bảng 10.4, có hơn 32.000 thành phố mới của Hoa Kỳ. Ngoài ra, mã NUTS sau đây được hỗ trợ

 

  • DE401
  • DEB3I
  • DEG0I
  • DK012
  • DK021
  • EL641
  • ES521
  • HU321
  • NL230
  • NL327
  • AT113
  • FR623
  • AT322
  • LI000

MATLAB integration

upload_2017-10-6_15-25-31.png

Tính năng mới trong Web Authoring

 

Bật thanh công cụ View trên web

 

Trong các bản phát hành trước, khi tác giả trên web, bạn chỉ có thể xem và sử dụng Thanh công cụ Xem khi làm việc với chế độ xem bản đồ. Bây giờ bạn có thể bật Thanh công cụ Xem cho bất kỳ chế độ xem hoặc trang tổng quan nào trong bảng tính của bạn trong tác giả trang web.

 

Từ thanh menu top, chọn worksheet ->Show view toolbar và chọn một option.

upload_2017-10-6_15-25-50.png

Từ bảng điều khiển, hãy chọn vùng trên trang tổng quan nơi bạn muốn hiển thị Thanh công cụ Xem, sau đó thực hiện một trong các thao tác sau:

 

Từ menu top chọn Worksheet > Show View Toolbar.

 

Chọn drop-down arrow, tùy chọn thích hợp từ trình đơn ngữ cảnh.

upload_2017-10-6_15-26-7.png

Chỉnh sửa nhóm trên web

 

Bắt đầu với Tableau phiên bản 10.4, bạn có thể chỉnh sửa nhóm. Để chỉnh sửa nhóm, trong ngăn Dữ liệu, nhấp chuột phải vào một trường nhóm và chọn Chỉnh sửa nhóm. Trong hộp thoại Chỉnh nhóm mở ra, bạn có thể thêm hoặc xóa các thành viên khỏi một nhóm hiện có, cũng như tạo các nhóm mới trong trường nhóm. Bạn cũng có thể chọn Bao gồm một nhóm Khác.

 

Tạo bí danh trên web

 

Bắt đầu với Tableau phiên bản 10.4, bạn có thể tạo bí danh cho các thành viên trong một không gian để các nhãn của chúng xuất hiện khác nhau trong chế độ xem.

 

Để tạo bí danh cho một trường:

 

  1. Trong Data pane, right-click vào dimension và chọn Aliases.
  1. Trong hợp thoại Edit Aliases, dưới Value (Alias), chọn thành viên và đặt tên mới.

Định dạng đường kẻ

 

Khi bạn là tác giả trên tableau server, bạn có thể nhanh chóng thay đổi tất cả các dòng trong bảng tính của bạn. Chọn Format> Workbook, sau đó mở rộng phần Lines trên Workbook và làm các lựa chọn của bạn.

upload_2017-10-6_15-26-22.png

Chia sẻ và cộng tác

 

Nếu bạn sở hữu chế độ xem, bạn có thể nhanh chóng tìm ra ai trong tổ chức của bạn đã nhìn thấy nó. Ở đầu trang trang chính, nhấp vào Chế độ xem. Sau đó di chuột qua chế độ xem cụ thể mà bạn quan tâm và chọn Ai đã xem Chế độ xem này? từ trình đơn ở phía trên bên phải.

 

upload_2017-10-6_15-26-34.png

 

Có một tài liệu của Microsoft điểm qua một vài tình huống ta cần dùng SSIS

 

1. Khi ta cần tập trung dữ liệu từ nhiều nguồn khác nhau:

 

Ví dụ như có 1 tập đoàn lớn có nhiều chi nhánh, rải rác ở nhiều nơi trên một quốc gia hay thậm chí nhiều quốc gia khác nhau, họ lưu trữ dữ liệu ở các relational database khác nhau như MySQL, Oracle, SQL Server hay trong file Excel, .txt file hay XML file và họ có nhu cầu tập trung tất cả dữ liệu vào một chỗ để phân tích.

 

Thậm chí có trường hợp cùng một loại dữ liệu, nhưng lại được lưu trữ ở nhiều database có schema khác nhau, và thậm chí ở nhiều datatype khác nhau.

 

Trong tình huống này SSIS có thể đáp ứng tốt, nó có thể kết nối đến các data source nói trên, thực hiện chuẩn hóa dữ liệu và load dữ liệu đến một database tập trung.

 

2. Khi ta cần load dữ liệu cho Data warehouse hay Data Mart.

 

Khi một công ty đã xây dựng xong một data warehouse hay các Data Mart, họ cần load dữ liệu từ các nguồn khác nhau vào data warehouse này, và dữ liệu thường rất lớn.

 

SSIS package có thể được cấu hình "restartable". Điều này có nghĩa là bước load dữ liệu có thể trải qua nhiều step, và khi nó thất bại ở một step nào đó, khi ta chạy lại package, nó sẽ chạy tiếp ở bước đã thất bại, không phải chạy lại từ đầu mất thời gian.

 

SSIS package có thể được dùng để load dữ liệu cho các fact và dimension table.

 

SSIS package có thể thực hiện được các function như sum, average, count...

 

SSIS package có thể kết nối đến Analysis Services để xử lý các cube và dimension
3. Khi ta cần làm sạch dữ liệu
Trong quá trình transformation data dùng SSIS, ta có thể làm sạch và chuẩn hóa dữ liệu. Bạn có thể tham khảo các bài viết về lookup, fuzzy lookup để biết thêm chi tiết.

 

Thông thường nó sẽ dò chính xác dùng lookup transformation task trước, nếu không khớp, nó sẽ dùng Fuzzy lookup dò kết quả tương tự.

 

4. Khi ta cần xây dựng Business Intelligence vào trong quá trình transformation.
Tôi đang tìm hiểu thêm kiến thức về vấn đề này.

 

5. Khi ta cần tự động hóa công việc quản trị

 

Các công việc như backup hàng loạt database, mỗi database đặt trong 1 thư mục riêng, rồi gửi email thông báo cho database administrator xem công việc thành công hay thất bại...và nhiều công việc quản trị khác, ta có thể làm dễ dàng với SSIS trên một server hay thậm chí nhiều server cùng lúc.

 

Tham khảo thông tin đầy đủ tại đây:
http://msdn.microsoft.com/en-us/library/ms137795(v=sql.105).aspx

 

SQL Server Integration Service (SSIS) được đưa vào từ bản 2005, là phiên bản tiếp theo của DTS trong SQL Server 2000 trở về trước. Đây là công cụ dùng để thực hiện các tác vụ tích hợp dữ liệu (Data integration), là thành phần chính trong các ứng dụng data warehouse. Nói nôm na là nó gom dữ liệu từ các nguồn khác nhau và tổ chức lại theo cách thích hợp cho các mục đích báo cáo nhất định. Bài viết này giới thiệu cách xây dựng 1 ứng dụng đơn giản là import 1 file dữ liệu ở dạng text vào database.

 

- Giả sử đây là file dữ liệu bán hàng hàng ngày được lưu tại C:\Users\BSD\Desktop\Sale.txt và có cấu trúc như sau:

 

Ngay, TenSP, SL, Gia

4/25/2012, Lolita, 14, 50000

4/25/2012, Ai va Ky, 9, 60000

4/26/2012, Tieu su Steve Jobs,5, 75000

Trước hết là tạo database và bảng để chứa dữ liệu này:

 

USE master
GO
CREATEDATABASE SaleImport
GO
USE SaleImport
GO
CREATETABLE dbo.Sale(
Ngay DATE NULL,
TenSP VARCHAR(100)NULL,
SL INT NULL,
Gia INT NULL
)


Để tạo ứng dụng SSIS bạn dùng Visual Studio. Sau khi mở Visual Studio và tạo new project, ở cửa sổ mở ra bạn thực hiện các lựa chọn như trong hình dưới:
upload_2017-8-1_15-0-53.png

Ở đây mình sử dụng Visual Studio 2015 và SQL SERVER 2016

Một project mới sẽ được tạo và một file package.dtsx được mở sẵn. SSIS được tổ chức thành các file .dtsx và thường được gọi là các SSIS package. Vì các SSIS package đều liên quan đến việc di chuyển dữ liệu từ môt nơi (nguồn) đến một nơi khác (đích) nên thành phần cơ bản của mỗi SSIS package bao gồm:
- Connection (kết nối) đến nguồn
- Connection đến đích
- Data Flow Task là tác vụ dẫn dữ liệu từ nguồn đến đích

Ta sẽ lần lượt tạo các thành phần này cho package ở trên.

Tạo connection đến nguồn: Nguồn ở đây là file text, nên ở ô Connection managers bạn bấm phải chuột và chọn “New Flat File Connection…”:

upload_2017-8-1_15-1-15.png

Ở cửa sổ hiện ra, bạn nhập vào như hình dưới:

upload_2017-8-1_15-1-31.png

Tạo connection đến đích: Đích ở đây là SQL Server database, bạn sẽ kết nối vào thông qua OLE DB, nên lần này nên ở ô Connection managers bạn bấm phải chuột và chọn “New OLE DB Connection…”:

upload_2017-8-1_15-1-48.png

Ở cửa sổ tiếp theo bạn thực hiện các lựa chọn như hình dưới (server tôi đang dùng có tên là devdbbi1, bạn cần đánh tên server của bạn):

upload_2017-8-1_15-2-1.png

Tạo Data Flow Task: Ở cột Toolbox bạn chọn “Data Flow Task” rồi kéo và thả vào trong lòng package:

upload_2017-8-1_15-2-12.png
Sau đó bạn nhắp đúp vào hộp “Data Flow Task” trong package để mở nó ra. Một trang trắng sẽ hiện ra và cột Toolbox bên trái cũng chỉ hiện các chức năng liên quan đến data flow task. Ở đây bạn cần tạo hai thứ: data flow source và data flow destination tương ứng với hai connection bạn tạo ở trên.
Tạo data flow source: Ở cột Toolbox bạn kéo “Flat File Source” và thả vào lòng trang bên phải. Sau đó bạn nhắp đúp để mở nó ra như sau:
upload_2017-8-1_15-2-28.png
upload_2017-8-1_15-2-33.png

Tạo data flow destination: Ở cột Toolbox bạn kéo “OLE DB Destination” và thả vào lòng trang bên phải. Tiếp đến bạn dùng chuột nối mũi tên xanh từ hộp “Flat File Source” vào hộp “OLE DB Destination”:

upload_2017-8-1_15-2-50.png

Sau đó bạn nhắp đúp vào hộp “OLE DB Destination” để cấu hình nó:

upload_2017-8-1_15-3-4.png

Vậy là package đã được tạo xong. Bạn có thể chạy và khi kết thúc thành công các hộp sẽ chuyển thành màu xanh thế này:
Bạn kiểm tra bảng trong SaleImport database sẽ thấy dữ liệu đã được chuyển vào.
Có thể bạn sẽ hỏi, tại sao phải cần đến SSIS để import dữ liệu? Việc này có thể làm được bằng giao diện trong Management Studio, hoặc dùng BULK INSERT. Xin thưa SSIS có thể làm được rất nhiều việc mà BULK INSERT hoặc giao diện không làm được. SSIS rất linh hoạt và mạnh mẽ cho các ứng dụng kiểu này, một vài ví dụ:
- Nó có thể đồng thời import dữ liệu từ nhiều nguồn khác nhau: text, xml, các database khác.
- Nó cũng có thể download file từ ftp hoặc internet.
- Trong quá trình import nó có khả năng thực hiện rất nhiều các tác vụ xử lý dữ liệu (transformation) trước khi nhập vào database

Trong bài này chúng tôi sẽ cung cấp cho bạn một bức tranh toàn cảnh về cách big data phù hợp với kiến trúc BI hiện tại của bạn và cách kết nối tableau với Spark để làm phong phú báo cáo BI và Dashboard bằng các dữ liệu mà bạn không thể phân tích trước đây. Cung cấp cho báo cáo và Dashboard một chế độ xem 360 độ và hiểu những gì, khi nào, tại sao, ai, ở đâu và bằng cách nào.

 

Sinh Thái Big Data

 

Khi xem xét một giải pháp big data, điều quan trọng là hãy ghi nhớ kiến trúc của một hệ thống BI truyền thống và cách Big Data xuất hiện.

 

Với hệ thống này, nó cho phép xử lý dữ liệu nhanh hơn, da dạng hơn, tạo cơ hội thu thập dữ liệu hiệu quả và an toàn .

 

Ngoài ra, sử dụng Big Data chol phép cấu trúc phần cứng phát hiện chiều ngang, tiết kiệm và linh hoạt hơn.

 

Vì vậy, làm thế nào để đưa sinh thái big data này vào? Khái niệm kiến trúc là khá giống nhau, nhưng có sự thay đổi lớn. Sự khác biệt chính là một bộ nguồn dữ liệu hoàn toàn mới, đặc biệt là không có cấu trúc và môi trường hoàn toàn mới để lưu trữ dữ liệu và lấy dữ liệu.

upload_2017-8-21_8-31-43.png

 

Trong hình trên, ở phía trên ta có kiến trúc BI truyền thống. Dưới đây ta có thể kiến trúc Big Data mới vẫn dữ được cùng một khái niệm, thu thập dữ liệu ,vv. Chúng tôi đang hiển thị một vài công cụ có sẵn trong dự án Apache Hadoop.

 

Điều quan trọng cần chỉ ra là báo cáo và trực quan được kết hợp. Chúng ta phải kết hợp dữ liệu lớn để cụng caapschees độ xem 360 độ, giá trị thực sự nằm ở đó. Để kết hợp nó có nhiều lựa chọn khác nhau.

 

Triển khai dữ liệu lớn: Apache Spark + Tableau

 

Khi tiếp cận thực hiện Triển khai Dữ liệu Lớn, có nhiều lựa chọn và khả năng khác nhau, từ các nguồn dữ liệu mới và các kết nối đến lớp hiển thị cuối cùng, đi qua cụm và các thành phần của nó để lưu trữ và xử lý dữ liệu.

 

Cách tiếp cận tốt đối với giải pháp Big Data là sự kết hợp của Apache Spark để xử lý trong các nhóm Hadoop sử dụng dữ liệu từ các hệ thống lưu trữ như HDFS, Cassandra, Hbase hoặc S3, và Tableau như phần mềm trực quan sẽ làm cho thông tin có thể kết thúc Người dùng.

 

Spark đã chứng tỏ sự cải thiện lớn về hiệu năng so với mô hình MapReduce của Hadoop. Nó cũng nổi bật như giải pháp một thành phần cho xử lý dữ liệu lớn, với sự hỗ trợ cho ETL, truy vấn tương tác, phân tích tiên tiến và luồng trực tuyến. Kết quả là một công cụ thống nhất cho dữ liệu lớn, nổi bật trong các ứng dụng độ trễ thấp và tính toán lặp đi lặp lại, đòi hỏi phải có hiệu năng nhanh, như xử lý lặp, truy vấn tương tác, tính toán hàng loạt, tính toán trực tuyến hoặc biểu đồ. Tableau đang phát triển rất nhanh và đã chứng tỏ là một trong những công cụ trực quan hóa dữ liệu mạnh mẽ nhất. Nó có các kết nối đến gần như bất kỳ nguồn dữ liệu như Excel, kho dữ liệu của công ty hoặc SparkSQL. Nhưng khi Tableau thực sự nổi bật là khi chuyển đổi dữ liệu thành bảng điều khiển hấp dẫn và tương tác và hình ảnh hóa thông qua giao diện người dùng trực quan của nó.

 

Sự kết hợp của Apache Spark với Tableau nổi bật lên như một giải pháp Big Data hoàn chỉnh cuối cùng, dựa vào khả năng của Spark để xử lý dữ liệu và chuyên môn của Tableau để hình dung. Lồng ghép Tableau với Apache Spark cho phép phân tích trực quan dữ liệu lớn một cách dễ dàng và thân thiện với doanh nghiệp, không cần mã Spark SQL ở đây.

 

Kết nối Tableau với Apache Spark

 

Kết nối Apache Spark với Tableau là một trong những phương pháp tốt nhất để xử lý và hiển thị dữ liệu lớn. Vậy giải pháp này hoạt động như thế nào? Chúng tôi đã làm việc với công nghệ này, và tự hào cho thấy một cuộc biểu tình của Tableau kết nối với Apache Spark.

 

Điều kiên tiên quyết:

 

- Tableau Desktop bất kỳ phiên bản nào hổ trợ Spark SQL connecter

 

- Cài Apache Spark

 

Lấy dữ liệu phân tích

 

Có thể sử dụng một kết nối SparkSQL cụ thể, giao tiếp với Spark Thrift Server để sử dụng công cụ Apache Spark.

upload_2017-8-21_8-32-15.png

 

Software components

 

Thiết lập môi trường

 

Cài đặt Tableau Desktop và Apache Spark nằm ngoài phạm vi của bài viết này. Tôi giả định bạn đã cài đặt Tableau Desktop và Apache Spark.

 

Apache Spark cần phải được xây dựng với sự hỗ trợ của Hive, tức là thêm -Phive và -Phive-thriftserver profiles để xây dựng các tùy chọn của bạn. Chi tiết hơn ở đây. https://spark.apache.org/docs/latest/building-spark.html

Cài Đặt Apache Spark Driver cho ODBC với SQL Connector

Cài đặt trình kết nối Apache Spark từ trang web Simba http://www.simba.com/drivers/spark-jdbc-odbc/.

 

upload_2017-8-21_8-38-28.png

 

Họ đang cung cấp một thời gian dùng thử miễn phí có thể được sử dụng để làm theo bài hướng dẫn này.

 

Nó có một phương pháp làm cho việc cài đặt một quá trình trở nên đơn giản.

 

Cấu hình và bắt đầu Máy chủ Apache Spark Thrift Server

 

Configuration files

Spark Thrift Server sử dụng Hive Metastore theo mặc định trừ khi một cơ sở dữ liệu khác được chỉ định. Chúng ta cần phải sao chép tập tin cấu hình hive-site.xml từ thư mục Hive sang Spark conf.

 

cp /etc/hive/hive-site.xml /usr/lib/spark/conf/

 

Spark cần truy cập thư viện Hive để kết nối với Hive Metastore. Nếu những thư viện này không có trong biến Spark CLASSPATH, chúng cần được thêm vào.

 

Thêm dòng sau vào /usr/lib/spark/bin/compute-classpath.sh

 

CLASSPATH=“$CLASSPATH:/usr/lib/hive/lib/*”

 

Start Apache Spark Thrift Server

Chúng ta có thể start Spark Thrift Server với các command sau:

 

./sbin/start-thriftserver.sh --master <master-uri>

 

<master-uri> might be yarn-cluster if you are running yarn, or spark://host:7077 if you are running spark in standalone mode.

 

Additionally, you can specify the host and port using the following properties:

 

 

./sbin/start-thriftserver.sh \

 

--hiveconf hive.server2.thrift.port=<listening-port> \

 

--hiveconf hive.server2.thrift.bind.host=<listening-host> \

 

--master <master-uri>

 

Để kiểm tra xem Spark Thrift Server đã bắt đầu thành công hay không, bạn có thể xem nhật ký của máy chủ lưu trữ Thrift. <Thriftserver-log-file> được hiển thị sau khi bắt đầu Spark Thrift Server trong giao diện điều khiển.

 

tail -f <thriftserver-log-file>

 

Spark Thrift Server đã sẵn sàng để phục vụ các yêu cầu ngay khi tệp nhật ký cho biết các dòng sau:

 

INFO AbstractService: Service:ThriftBinaryCLIService is started.

 

INFO AbstractService: Service:HiveServer2 is started.

 

INFO HiveThriftServer2: HiveThriftServer2 started

 

INFO ThriftCLIService: ThriftBinaryCLIService listening on 0.0.0.0/0.0.0.0:10000

 

Connect Tableau using SparkSQL connector

Start Tableau và chọn tùy chọn để kết nối với Spark SQL.

 

Chọn Loại thích hợp tùy thuộc vào phiên bản Spark và Xác thực phù hợp tùy thuộc vào tính bảo mật của bạn.

upload_2017-8-21_8-38-56.png

 

Các bước tiếp theo là chọn lược đồ, bảng và các mối quan hệ mong muốn, giống như khi sử dụng bất kỳ trình kết nối Tableau nào khác. Bây giờ bạn có thể chạy phân tích của riêng bạn về dữ liệu lớn được hỗ trợ bởi Spark!

upload_2017-8-21_8-39-19.png

Trang tổng quan ở trên đã được tạo trong Bảng 9.0 sau khi thực hiện theo các hướng dẫn được cung cấp. Apache Spark được sử dụng bởi Tableau để thu thập và thực hiện minh bạch dữ liệu trên dữ liệu của chúng tôi được lưu trữ trong HDFS. Chỉ cho chúng tôi chụp màn hình và báo cáo của Spark. Chia sẻ với chúng tôi những ấn tượng của bạn về Spark và Tableau của Apache trong phần nhận xét ở phía dưới.

Truong Dai

Giới thiệu JSON

Posted by Truong Dai Dec 12, 2017

JSON (JavaScript Object Noattion) là 1 định dạng hoán vị dữ liệu nhanh. Chúng dễ dàng cho chúng ta đọc và viết. Dễ dàng cho thiết bị phân tích và phát sinh. Chúng là cơ sở dựa trên tập hợp của Ngôn Ngữ Lập Trình JavaScript, tiêu chuẩn ECMA-262 phiên bản 3 - tháng 12 năm 1999. JSON là 1 định dạng kiểu text mà hoàn toàn độc lập với các ngôn ngữ hoàn chỉnh, thuộc họ hàng với các ngôn ngữ họ hàng C, gồm có C, C++, C#, Java, JavaScript, Perl, Python, và nhiều ngôn ngữ khác. Những đặc tính đó đã tạo nên JSON 1 ngôn ngữ hoán vị dữ liệu lý tưởng.

 

JSON được xây dựng trên 2 cấu trúc:

 

  • Là tập hợp của các cặp tên và giá trị name-value. Trong những ngôn ngữ khác nhau, đây được nhận thấy như là 1 đối tượng (object), sự ghi (record), cấu trúc (struct), từ điển (dictionary), bảng băm (hash table), danh sách khoá (keyed list), hay mảng liên hợp.
  • Là 1 tập hợp các giá trị đã được sắp xếp. Trong hầu hết các ngôn ngữ, this được nhận thấy như là 1 mảng, véc tơ, tập hợp hay là 1 dãy sequence.

Đây là 1 cấu trúc dữ liệu phổ dụng. Hầu như tất cả các ngôn ngữ lập trình hiện đại đều hổ trợ chúng trong 1 hình thức nào đó. Chúng tạo nên ý nghĩa của 1 định dạng hoán vị dữ liệu với các ngôn ngữ lập trình cũng đã được cơ sở hoá trên cấu trúc này.

 

Trong JSON, chúng có những thứ trên các định dạng:

 

1 đối tượng là 1 hổn độn của các cặp tên và giá trị. 1 đối tượng bắt đầu bởi dấu ngoặc đơn trái { và kết thúc với dấu ngoặc đơn phải }. Từng tên được theo sao bởi dấu 2 chấm :và các cặp tên/giá trị được tách ra bởi dấu phẩy ,.

 

[IMG]

 

1 mảng là 1 tập hợp các giá trị đã được sắp xếp. 1 mảng bắt đầu bởi dấu mở ngoặc vuông [ và kết thúc với dấu ngoặc vuông phải ]. Các giá trị được cách nhau bởi dấu phẩy ,.

 

[IMG]

 

1 giá trị có thể là 1 chuỗi string trong những trích dẫn kép hay là 1 số, hay true hay false hay null, hay là 1 đối tượng hay là 1 mảng. Những cấu trúc này có thể đã được lồng vào nhau.

 

[IMG]

 

1 chuỗi string là 1 tập hợp của zero hay ngay cả mẫu tự Unicode, được bao bọc trong các dấu trích dẫn kép ("), dùng để thoát ra dấu chéo ngược. 1 ký tự đã được hiển thị như là 1 chuỗi ký tự đơn độc. 1 chuỗi string rất giống như là chuỗi string C hay là Java.

 

[IMG]

 

1 số rất giống 1 số C và Java, trừ định dạng bát phân và hex là không thể dùng.

 

[IMG]

 

Khoảng trắng có thể chèn vào giữa bất cứ các cặp của các dấu hiệu. Trừ các chi tiết 1 vài mã hoá, mà hoàn toàn mô tả ngôn ngữ.

Các bước tạo Pie chart trên Map trong tableau

B1: Định nghĩa Province

upload_2015-12-9_8-43-40.png

 

B2: Kéo province vào Detail

upload_2015-12-9_8-44-14.png

 

B3: Edit location

upload_2015-12-9_8-44-54.png

upload_2015-12-9_8-45-23.png

 

B5: Trong thẻ Mark chọn Pie

upload_2015-12-9_8-45-52.png

 

B6: Kéo channel vào color, sales vao size

upload_2015-12-9_8-46-55.png

 

B7: Phóng to pie bằng Size

 

B8: Đưa các thông tin thêm vào Tooltip

Mục tiêu của Tableau là cung cấp khả năng phân tích dữ liệu một cách đơn giản và dễ dàng cho người sử dụng. Tableau tìm được cách làm việc dễ dàng hơn với dữ liệu bằng chính ý tưởng của người dùng. Chúng tôi không chỉ giúp bạn phân tích dữ liệu mà còn khiến bản cảm thấy hứng thú khi làm công việc đó. Và với chủ đề như vậy, tôi gọi bài viết này với cái tên “Nhanh, dễ dàng và đẹp”

Nhanh, Dễ dàng

Với bất kể công việc nào, thì các công cụ được sử dụng cần phải là một công cụ dễ dàng sử dụng để chúng ta có thể tập trung vào mục tiêu chính của công việc thay vì phải học cách sử dụng công cụ đó.

Các trường dữ liệu trong cửa sổ Data bây giờ đã có thể đưa ra các thông tin phản hồi trên hover để có thể làm rõ đối với các trường hợp khác nhau, trường hợp nào có thể kéo thả vào báo cáo, cũng như các dấu hiệu hình ảnh để bạn có thể chỉnh sửa thuộc tính của từng trường

datawindow.png

Nói về cửa sổ Data. Một phần quan trọng trong quá trình xử lí dữ liệu là bạn cần phải giữ cho cửa sổ Data luôn có tổ chức, dễ theo dõi và sử dụng. Và với Tablea, bạn có thể thực hiện nhóm các trường dữ liệu vào trong cùng một thư mục, cho dù dữ liệu đó là dữ liệu về thời gian, địa lý hay một kiểu dữ liệu nào khác.

Ngoài ra, với Tableau, chúng ta có thể Copy nội dung dữ liệu giữa các workbook khác nhau kể cả trong trường hợp Data source không tồn tại ở workbook đích. Vô cùng dễ dàng để có thể đưa một Dashboard từ workbook này sang một workbook khác chỉ với một vài cú nhấp chuột thay vì phải xây dựng lại toàn bộ từ đầu

Đẹp

Cuối cùng, nói về sự tự do thiết kế và tùy biến. Thiết kế tốt có thể là nền tảng tốt cho sự phân tích, Tableau sẽ cung cấp nhiều sức mạnh thiết kế vào tay người dùng. Dữ liệu dạng văn bản và hình ảnh sẽ rất rõ ràng khi kéo thả chúng lên các nội dung khác với chức năng như “Float”

dashboardbeautiful.png

Chúng tôi cũng mở rộng thêm sự linh hoạt khi thiết kế các chủ đề khác nhau như sử dụng các bộ lọc filter. Người dùng có thể dễ dàng điều chỉnh chúng để chúng phù hợp hơn với phong cách thiết kế trong mỗi Dashboard. Thậm chí người dùng có thể trải nghiệm bộ lọc nhiều giá trị (multiple-value)

Cuối cùng, để nói về sự “Nhanh, dễ dàng và đẹp” của Tableau, chúng tôi sẽ nói về tính năng giúp bạn có thể show-off sản phẩm của mình: Chế độ trình chiếu. Tableau tập trung vào nội dung chính và loại bỏ đi các UI và thay vào đó là các nền trắng. Điều này khiến cho người xem tập trung vào nội dung báo cáo của bạn hơn là các chi tiết khác

R là một ngôn ngữ thống kê phổ biến đã được sử dụng để thực hiện các phân tích dự báo và phân tích thống kê phức tạp như mô hình hóa tuyến tính và phi tuyến, các kiểm định thống kê, phân tích chuỗi thời gian, phân loại, phân nhóm,…
Theo một số nhà nghiên cứu, ngôn ngữ lập trình R đang phát triển rất nhanh trong cộng đồng phân tích số liệu, vượt qua cả các gói ứng dụng phổ biến xưa nay như SAS, SPSS và MATLAB. R là ngôn ngữ lập trình chức năng, nguồn mở, được thiết kế chuyên cho điện toán dữ liệu và đồ họa. Theo IDC, ngôn ngữ R trở nên phổ biến một phần là vì nó là nguồn mở, miễn phí và các nhà nghiên cứu có thể tải nó về để bắt đầu một dự án nào đó mà không phải tốn tiền.
Tableau giải pháp phân tích số liệu hàng đầu thế giới, với mục tiêu đơn giản là giúp người dùng nhìn và hiểu được dữ liệu của mình.
R có những thế mạnh của riêng nó, Tableau cũng có những thế mạnh của riêng mình. Vậy câu hỏi đặt ra là khi tích hợp R với Tableau sẽ có được những lợi ích gì? Sự phát triển ngôn ngữ R với Tableau, với các thao tác kéo thả của visual và phân tích số liệu giúp bạn nhanh chóng có được nhiều góc nhìn khác nhau của số liệu thống kê.
Bài viết này sẽ giúp bạn có thêm hiểu biết về những lợi ích khi tích hợp Tableau với R và hướng dẫn bạn cách tích hợp Tableau với R.

 

Hướng dẫn cài đặt
1. Cài Đặt R Server
- Phần mềm Rserve (Binary R Server) mã nguồn mở có sẵn cho nền Unix, Linux và Windows.
- Sử dụng Rserve trên Unix hoặc Linux được khuyến khích cho các mục đích sản xuất do các hạn chế với phiên bản Windows.
- Phiên bản Windows của Rserve chỉ hoạt động trong chế độ hợp tác, có nghĩa là chỉ có một kết nối tại một thời điểm được phép và tất cả các kết nối tiếp theo chia sẻ cùng không gian tên.

 

1. 1 Unix/ Linux

Để biết thêm chi tiết cách cài đặt, truy cập tại đây:
ở đây mình chỉ hướng dẫn trên window thôi nhé

1.2 Windows

Nếu bạn muốn sử dụng Rserve trên Windows với Dundas BI (ví dụ để thử nghiệm hoặc phi mục đích sản xuất), trước tiên hãy tải xuống và cài đặt R cho Windows trên máy chủ Dundas BI của bạn.
upload_2017-9-1_9-42-46.png
Gói cài đặt này sẽ cài đặt các chương trình R vào một thư mục tương tự như: C:\Program Files\R\R-3.4.1\bin\x64
Khi R được cài đặt, thêm đường dẫn thư mục trên vào biến môi trường đường dẫn Windows của bạn. Điều này sẽ cho phép chương trình Rserve xác định R.dll.

 

Tiếp theo, vào menu Start Programs và mở thư mục R đã được cài đặt mới.
[IMG]
Nhấp vào R x64 3.4.1 (hoặc tương tự) để khởi chạy R Console.

 

upload_2017-9-1_9-45-57.png

 

Trong R Console, gõ lệnh dưới đây để tải về và cài đặt Rserve (đây là máy chủ R) và chạy chương trình.

 

 

install.packages("Rserve")
library(Rserve)
Rserve()

 

[IMG]

 

Vậy là xong phần cài đặt R !

 

Bây giờ đến kết nối với tableau
upload_2017-9-1_10-9-44.png

 

test connection

 

upload_2017-9-1_10-10-9.png
Click Ok thế là xong@@

 

 

 

Trước khi làm việc và thao tác với Tableau Desktop bạn cần phải connect tới database của bạn. Với Tableau hỗ trợ bạn connect với đa dạng các loại database, có 2 dạng dữ liệu
Thực hiện vài thao tác đơn giản sau đây để connect data

 

1. Chọn loại datasource mà bạn cần connect tới, trong ví dụ sau đây mình chọn data từ Microsoft SQL Server.
tableau_connectdata1.png

 

2. Nhập các thông số đăng nhập vào server
tableau_connectdata2.png

 

3. Chọn Database muốn sử dụng
tableau_connectdata3.png

 

4. Chọn các bảng muốn sử dụng
tableau_connectdata4.png
Có 4 kiểu Join các bảng được hỗ trợ

 

Cho phép chỉnh sửa mối quan hệ giữa các bảng bằng cách điều chỉnh các khóa chính giữ các bảng
tableau_connectdata5.png
5. Xem dữ liệu
tableau_connectdata6.png
6. Cách select bảng bằng câu lệnh SQL
Chọn New custom SQL
tableau_connectdata7.png
7. Join bảng custom với các bảng khác, xem dữ liệu
tableau_connectdata8.png

 

Ngoài ra, các bạn có thể xem cách kết nối đến Excel tại đây.

 

Để có thể làm việc hiệu quả và đạt được những thành quả trong công việc, cuộc sống có rất nhiều cách thức, biện pháp khác nhau, đồng thời cũng có nhiều bí quyết giúp bạn có thể đạt được thành công. Một trong những bí quyết giúp bạn thành công chính là bí quyết quản lý thời gian hiệu quả. Vậy làm sao để quản lý thời gian hiệu quả, tableau sẽ giúp bạn tạo ra một thời gian biểu để quản lý thời gian của mình.

Để tạo ra một thời gian biểu trên tableau, bạn cần chuẩn bị file excel gồm các nội dung:

 

Activity(những hoạt động bạn cần phải làm theo ngày)

 

Start Date ( Thời gian bắt đầu hoạt động đó)

 

End Date (Thời gian kết thúc hoạt động đó)

 

Các thao tác tạo ra thời gian biểu trên tableau:

 

Bước 1: Mở giao diện tableau desktop, chọn file dữ liệu của bạn. Tại đây, bạn import dữ liệu bằng cách click chuột vào Excel >> chọn file dữ liệu của bạn.

View attachment 11201

upload_2016-5-30_14-13-19.png

 

Bước 2: Tại màn hình visualize của tableau, kéo End vào Columns, tại đây click chuột chọn Exact Date.

upload_2016-5-30_14-13-29.png

Bước 3: Kéo Start vào Columns, tại đây click chuột chọn Exact Date.

upload_2016-5-30_14-14-1.png

Bước 4: Tạo 1 Calculated Duration có công thức:

upload_2016-5-30_14-14-17.png

Bước 5: Tại thẻ Mark của Start, kéo Duration vào size, Activity vào Color.

upload_2016-5-30_14-14-36.png

Bước 6: Tại End, click chuột chọn tính năng Dual Axis

upload_2016-5-30_14-15-3.png

Bước 7: Click chuột vào trục End, chọn Synchronize axis

upload_2016-5-30_14-15-20.png

Bước 8: Tại thẻ Mart của End, chọn kiểu chart Circle, vào size tăng kích thước cho chart.

upload_2016-5-30_14-15-44.png

Bước 9: Click chuột vào trục End, bỏ chọn Show header

upload_2016-5-30_14-16-2.png

Bước 10: Kéo Start vào Rows, click chuột chọn More >> Custom >> Weekdays.

upload_2016-5-30_14-22-22.png upload_2016-5-30_14-22-39.png

Bước 11: Bạn kéo Start vào Filter >> Weekdays >> Chọn Monday >> OK.

upload_2016-5-30_14-23-51.png upload_2016-5-30_14-24-3.png

Bước 12: Tại thẻ Mart của End, kéo Activity vào Label.

upload_2016-5-30_14-28-15.png

Lúc này, bạn sẽ có được chart thể hiện thời gian biểu của ngày Monday.

upload_2016-5-30_14-29-1.png

Bước 13: Tiếp theo bạn sẽ tạo thời gian biểu cho các ngày còn lại trong tuần.

Để tạo thời gian biểu cho ngày Tuesday, tại Sheet Monday, click chuột chọn Duplicate sheet, chọn Tuesday >> đổi tên sheet Tuesday. Lúc này, bạn sẽ có thời gian biểu cho ngày Tuesday.

upload_2016-5-30_14-29-40.png upload_2016-5-30_14-29-58.png

Bước 14: Bạn thực hiện thao tác tương tự để có được thời gian biểu cho các ngày còn lại.

upload_2016-5-30_14-33-38.png

Bước 15: Với các sheet thể hiện thời gian biểu của các ngày, bạn sẽ đưa chúng vào một dashboard.

upload_2016-5-30_14-33-53.png

Bước 16: Chỉnh sửa, định dạng dashboard. Lúc này bạn sẽ có một thời gian biểu cho các ngày trong tuần.

upload_2016-5-30_14-34-42.png

Dựa vào chart trên, bạn sẽ biết được mỗi ngày bạn tốn thời gian nhiều nhất vào công việc nào( được thể hiện qua độ dài của chart), màu sắc của chart thể hiện những công việc khác nhau mà bạn phải làm trong ngày. Nếu trong ngày hôm đó, tại một thời điểm nào đó bạn có một sự kiện đặc biệt nào đó, bạn cũng có thể đánh dấu lên trên chart này.

Với kiểu chart như thế này bạn có thể áp dụng để lên làm việc theo từng ngày trong tháng. Bạn cũng có thể áp dụng kiểu chart này để lên lịch làm việc cho các ngày trong tháng.

Ngày nay, việc bán hàng online đã trở nên phổ biến. Bất cứ ai cũng có thể bắt đầu tham gia bán hàng online trên mạng. Nếu bạn có một sản phẩm hoặc một ý tưởng độc đáo, bạn có thể tìm thấy một cách để bán hoặc trao đổi trên mạng.

Bạn là chủ của một trang web bán hàng online. Bạn muốn theo dõi theo từng ngày số lượng người truy cập vào trang web của bạn là bao nhiêu, trong số đó có bao nhiêu người mua hàng và xu hướng mua hàng của họ là như thế nào? Với tableau, chỉ với những thao tác kéo thả đơn giản, ngay lập tức, bạn có thể theo dõi được những thông tin đó theo từng ngày, để mà từ đó bạn có thể đưa ra một chiến lược phát triển quảng bá trang web của mình nhằm nâng cao hiệu quả kinh doanh.

Bạn cần chuẩn bị file dữ liệu gồm các nội dung như sau: tên khách hàng, ngày truy cập vào trang web, thời gian khách ghé thăm trang web (tính theo phút, giây), kết quả mua hàng theo từng loại sản phẩm.

upload_2016-5-30_14-41-37.png

Các thao tác thực hiện:

Bước 1: Mở giao diện tableau, thực hiện import dữ liệu từ file excel.

upload_2016-5-30_14-42-49.png

upload_2016-5-30_14-43-24.png

Bước 2: Kéo Date vào Rows >> chọn Exact Date >>Discrete.

upload_2016-5-30_14-43-45.png

Bước 3: Chuyển Product Type thành Dimensions

upload_2016-5-30_14-44-46.png

Bước 4: Kéo Product Type vào Columns.

upload_2016-5-30_14-45-17.png

Bước 5: Tạo một Calculated có công thức:

upload_2016-5-30_14-46-14.png upload_2016-5-30_14-46-18.png

Bước 6: Kéo Calculated Time Remainning vừa mới tạo vào Columns, chọn dạng Exact Date.

upload_2016-5-30_14-47-2.png

Bước 7: Tạo Calculated có công thức như sau:

upload_2016-5-30_14-47-28.png

Bước 8: Kéo Outcome vào Rows >> Tại thẻ Mark chọn chart Bar >> Giảm size xuống mức thấp nhất.

upload_2016-5-30_14-49-50.png

Bước 9: Kéo Result vào Color.

upload_2016-5-30_14-50-3.png

Bước 10: Kéo Outcome vào Rows. Tại thẻ Mart, chọn chart Circle, tăng kích thước của chart.

upload_2016-5-30_14-50-21.png

Bước 11: Tại Outcome thứ 2, click chuột chọn tính năng Dual Axis.

upload_2016-5-30_14-50-43.png

Bước 12: Click chuột vào Axis Outcome thứ 2, chọn tính năng Synchronize axis.

upload_2016-5-30_14-50-59.png

Bước 13: Click chuột vào Axis Outcome thứ 2 vào, bỏ chọn Show header.

upload_2016-5-30_14-51-33.png

upload_2016-5-30_14-51-51.png

Bước 14: Bạn có thể lựa chọn ngày bạn muốn theo dõi tình hình bán hàng trang web của mình bằng cách kéo Date vào trong Filter >> chọn Individual dates >> lựa chọn ngày bạn muốn theo dõi. Sau đó, bạn chọn Show Filter để show bộ lọc ngày cho phép bạn lựa chọn ngày bạn muốn theo dõi.

upload_2016-5-30_14-52-14.png upload_2016-5-30_14-52-19.png

Bước 15: Kéo Customer Name vào Tooltip. Lúc này bạn đã có một chart theo dõi tình hình mua hàng trên trang web của mình.

upload_2016-5-30_14-52-37.png

Dựa vào chart này, bạn có thể theo dõi được xu hướng mua hàng theo từng ngày (Trong ngày hôm đó, khách hàng chủ yếu ghé thăm vào thăm vào trang web của bạn và mua loại sản phẩm nào là nhiều nhất). Bạn cũng có thể theo dõi được số khách hàng ghé thăm, trong đó có bao nhiêu khách hàng mua hàng, có bao nhiêu khách hàng ghé thăm nhưng không thực hiện mua hàng, từ đó bạn có thể tìm hiểu nguyên nhân tại sao khách hàng không mua hàng tại trang web của mình.

Ngoài ra, với kiểu chart này, bạn có thể theo dõi xu hướng mua hàng của khách hàng theo các ngày trong tuần.

 

Để tạo chart theo dõi xu hướng mua hàng theo các ngày trong tuần, bạn thực hiện các bước sau:

 

Bước 1: Chọn Duplicate Sheet bạn vừa tạo.

upload_2016-5-30_14-59-34.png

Bước 2: Remove bộ lọc Date >> Tại Rows, click chuột chọn More >> Custom >> Weekdays.

upload_2016-5-30_15-0-25.png upload_2016-5-30_15-0-29.png

Bước 3: Kéo Date vào Filter để chọn tháng bạn muốn theo dõi.

upload_2016-5-30_15-0-56.png upload_2016-5-30_15-1-1.png

Lúc này, bạn đã có một chart theo dõi xu hướng mua hàng của khách hàng theo các ngày trong tuần.

upload_2016-5-30_15-1-41.png

Dựa vào chart này, bạn có thể biết được:

- Khách hàng chủ yếu mua sản phẩm của trang web bạn vào ngày nào trong tuần, và chủ yếu là mua sản phẩm nào?

- Theo mỗi ngày trong tuần, xu hướng mua hàng của khách hàng là gì?( Khách hàng chủ yếu mua loại sản phẩm nào?)

Từ đó bạn có chiến lược phát triển nhằm nâng cao cải thiện tình hình trang web bán hàng online của bạn ngày một tốt hơn.