Skip navigation
2018

Bài viết hướng dẫn các bạn hiển thị số liệu chi tiết và số liệu tổng lên cùng một đồ thị trong Tableau.

Ví dụ:
Bạn tạo một đồ thị thể hiện doanh thu của các nhóm sản phẩm và tổng doanh thu của chúng.

 

Các bước thực hiện:

  • Bước 1: Bạn tạo đồ thị lấy doanh thu của các dòng sản phẩm qua các năm bằng cách kéo Order date và Columns và Sales vào Rows, Category vào Color.

 

Tableau Showing Summary and Detail Together.png

  • Bước 2: Bạn tiếp tục kéo Sales vào Rows

 

Tableau Showing Summary and Detail Together1.png

  • Bước 3: Ở mục Mark, bạn chọn một lớp mark và bạn remove Category


Tableau Showing Summary and Detail Together2.png

  • Bước 4: Bạn click vào Sales ở Rows bạn chọn Dual Axis


Tableau Showing Summary and Detail Together3.png

  • Bước 5: Bạn tiếp tục click vào Sales Axis và chọn Synchronize Axis


Tableau Showing Summary and Detail Together4.png

 

Sau khi hoàn thành các bước trên các bạn sẽ một đồ thị hiển thị doanh thu của từng dòng sản phẩm và doanh thu tổng của các dòng sản phẩm đó.

 


Tableau Showing Summary and Detail Together45.png

Bài viết sẽ hướng dẫn bạn các tính năng tương tác trong Dashboard của Tableau. Giả sử bạn đang có Dashboard bên dưới.

 

tableau1.png

- Thêm Filter: Bạn có thể thêm các filter vào cho worksheet của bạn. Nếu trong worksheet của bạn chứa các dimension này.

 

tableau2.png

 

- Dùng chung các Filter. Chọn vào Filter >> chọn các worksheet dùng chung filter

 

upload_2015-10-22_11-16-16.png

 

- Lấy các biểu tượng màu sắc

 

upload_2015-10-22_11-18-52.png

 

- Trở lại khung làm việc worksheet

 

upload_2015-10-22_11-20-57.png

 

- Cố định khung hình worksheet trong dashboard

 

upload_2015-10-22_11-23-15.png

 

- Lấy caption

 

upload_2015-10-22_11-24-25.png

 

- Lấy thanh công cụ phóng to thu nhỏ

 

 

upload_2015-10-22_11-25-58.png

- Chọn tất cả trong worksheet . Nhấn phải chuột> Select all

upload_2015-10-22_11-30-15.png

 

- Xem dữ liệu >> View Data

 

upload_2015-10-22_11-31-20.png

 

- Copy

 

upload_2015-10-22_11-33-6.png

 

- Đánh dấu >> Annotate

 

upload_2015-10-22_11-35-55.png

Bước 1: đăng ký vào trang https://www.mapbox.com. Sau khi đăng ký bạn login vào trang mapbox và trang web hiển thị thông báo wellcome

 

Mapbox1.png

 

Bước 2: click vào Designer -> Click Let's Go!
Bước 3
: Click chọn Got it -> Let's do this

 

Map2.png

 

Bước 4: Click vào Account đã đăng nhập

 

Mapbox3.png

 

Bước 5: Click chọn API Access tokens -> Copy APIs

 

Map4.png

 

Bước 6: Quay lại Open Tableau Desktop version 9.2 -> chọn Map -> Background Map -> chọn Map services

 

Mapbox5.png

 

Bước 7: Xuất hiện màn hình click button Add -> chọn Mapbox Map.
Bước 8
: Thực hiện nhập các thông tin trong màn hình

  • Style name: tên mà bạn muốn đặt
  • API Access token: địa chỉ API mà bạn copy từ trang Mapbox

Map6.png

 

Bước 9: từ đây bạn có thể chọn các lớp mà bạn muốn thể hiện trên bản đồ map của bạn bàng cách chọn như hình dưới

 

Mapbox7.png

 

Bạn sẽ có kết quả như sau, bản đồ Việt Nam của bạn có nhiều layer thể hiện trên bản đồ thật phong phú và đa dạng, ngoài ra từ trang Mapbox bạn có thể tự mình design các layer của bạn đồ theo nhu cầu cần thiết và đưa những layer của chính bạn vào tableau desktop thành bộ thư viện map box của bạn một cách dễ dàng.

 

Dưới đây là một số layer mặc định của mapbox cung cấp cho bạn.

 

Mapbox02.png

 

bản đồ map thể hiện chi tiết theo từng địa điểm đường đi

mapbox.jpg

 

Mapbox8.png

Tableau hỗ trợ nhiều tính năng, giúp người dùng dễ dàng xây dựng các cảnh báo KPI. Ví dụ như bạn có doanh thu thực tế so với kế hoạch và muốn đưa ra cảnh báo để theo dõi như hình bên dưới.

 

Nội dung cảnh báo: Chia các mức cảnh báo theo các trường hợp:

1: khi doanh thu thực tế vuợt kế hoạch

2: % doanh thu thực tế nằm trong khoảng 80%-100% so với kế hoạch

3:% doanh thu thực tế nằm trong khoảng 50%-80% so với kế hoạch

4:% doanh thu thực tế nằm trong khoảng 0%-50% so với kế hoạch

Tableaukpi1.png

 

Bạn thực hiện các hướng dẫn sau:

 

Bước 1: Giả sử dữ liệu của bạn có dạng như sau:

Tableaukpi2.png

 

Bước 2: Kết nối Tableau desktop đến dữ liệu

 

Bước 3: Tính %Actual theo công thức: %Actual=Actual/Target

Tableaukpi3.png

>> Định dạng format dạng %

 

Bước 4:Định dạng bảng màu cho các trường hợp, Tính ColourIndicator theo công thức

IF [%Actual]>=1 then 'Blue'

ELSEIF [%Actual]<1 and [%Actual]>=0.8 then 'Green'

ELSEIF [%Actual]<0.8 and [%Actual]>0.5 then 'Yellow'

ELSE 'Red'

END

Tableaukpi4.png

 

 

Bước 5: Kéo Product vào Columns, %Actual vào Rows

 

Tableaukpi5.png

 

Bươc 6: kéo ColourIndicator vào Color

Tableaukpi6.png

 

Bước 7: Thêm mản màu làm nền: Nhấn pahir chuột vào Axis %Actual >> Add Reference line

Tableaukpi7.png

Bước 8: Chọn Band, chọn dạng là Constant

Sau đó nhập các mảng nền từ 0.8-1

Tableaukpi8.png

 

tương tư như bước này bạn có thể thêm nhiều mảng phân tích như hình bên dưới bằng cách thên Add Reference Line.

 

Tableaukpi9.png

 

Bước 9: Bạn có thể thêm giá trị %Actual hiển thị trên mỗi sản phẩm bằng cách thêm Add reference line như hình bên dưới.

Tableaukpi10.png

 

 

Chúc thành công !

Trong bài này hướng dẫn cài đặt tableau desktop, sau khi các bạn download source tableau desktop tại đây.
Thực hiện cài đặt như sau:

 

1. Click chọn source cài đặt -> chọn Run . Xuất hiện màn hình và chọn Install

 

cdtableau01.png

 

2. Sau khi click Install -> tableau xuất hiện màn hình

 

DownloadingProducts_ServerInstall.png

 

3. Tiếp theo click next -> tableau xuất hiện màn hình :
- Chọn activate khi bạn có key kích hoạt.
- Chọn start trial để sử dụng thử

 

DownloadingProducts_ActivateDialog.png
4. Start trial bạn sẽ nhập thông tin đăng ký với tableau desktop

 

DownloadingProducts_RegisterFieldsDialog.png

 

Sau khi đăng ký xong thì bạn có thể sử dụng tableau desktop 14 ngày. Chúc các bạn thành công

 

Như Đã giới thiệu với các bạn ở bài ‘Tạo nút để liên kết với link, trang web ngoài Tableau thì sau đây BSD sẽ giới thiệu thêm về các cách để chạy nút này.


Bước 1:
Sau khi tạo nút liên kết với web bên ngoài website. Để chỉnh sửa lại cách thể hiện của nút, chọn Dashboard > Actions > Chọn action ‘Go To Website’ > Edit …

 

upload_2017-7-20_9-23-18.png upload_2017-7-20_9-23-23.png

 

Bước 2: Để thay đổi các cách chạy nút, có 3 cách sau:

 

upload_2017-7-20_9-23-45.png

 

Cách 1: Hover là khi bạn rê chuột đến nút liên kết, thì liên kết sẽ ngay lập tức được thực hiện.

 

Cách 2: Select là khi bạn chọn vào nút liên kết, bạn sẽ đến trang web.

 

Cách 3: Menu là khi bạn chọn vào nút liên kết, khi đó sẽ xuất hiện bảng tooltip và bạn chọn vào từ liên kết trong bảng để đến trang web có liên kết.

 

upload_2017-7-20_9-24-6.png

 

Chúc bạn thành công!

Hiệu suất bán hàng hằng năm cho một danh sách các nhà quản lý khu vực.

 

upload_2017-7-24_15-0-52.png

 


Như được mô tả trong Làm thế nào lọc dựa trên người dùng, nếu bạn muốn thực hiện cách tiếp cận này, cơ sở dữ liệu phải bao gồm trường bạn muốn sử dụng để lọc.

 

Đối với ví dụ này, dữ liệu bao gồm một bảng tham chiếu gọi là People, chứa hai cột: Region and Manager. Tên trong trường Trình quản lý khớp với tên người dùng trên bảng hoặc Người dùng Trực tuyến và chúng tôi sẽ sử dụng trường này để lọc.

 

Bạn có thể làm theo cùng bằng cách sử dụng dữ liệu Superstore đi kèm với Tableau Desktop mặc dù các trường và giá trị không khớp chính xác.
Kết nối với dữ liệu và thiết lập bộ lọc người dùng

1. Trong Tableau Desktop, mở workbook bạn muốn thêm bộ lọc người dùng vào hoặc tạo một workbook mới, kết nối với dữ liệu bạn muốn lọc.
Trong ví dụ này, chúng ta sử dụng một bảng gọi là Orders.
2. Trên trang Data Source, thêm reference table. Tạo kết nối left join. Ở đây chúng ta thêm bảng People và tạo một kết nối trái vào trường Region.
3. Đi tới worksheet, chọn Analysis > Create Calculated Field và tạo ra các trường sau:

- Name: người dùng là manager
- Công thức (Formula): USERNAME () = [Manager]
[IMG]
Trường đúng / sai mới này xuất hiện trong ngăn Dimension. Công thức trả về TRUE nếu tên người dùng của người đăng nhập vào máy chủ tồn tại trong cột người quản lý.

 

        4. Thêm Người dùng là một trường quản lý vào ngăn xếp Filters.

5. Trong hộp thoại Filter, chọn True, sau đó bấm OK.

Đặt bộ lọc để chỉ những người quản lý mới có thể xem dữ liệu trong chế độ xem.
Nếu bạn không được liệt kê trong trường Trình quản lý, chế độ xem của bạn có thể xuất hiện dưới dạng một khung trống.

 

6. Xem các chế độ xem dành cho người cụ thể: ở góc dưới bên phải, mở menu Bộ lọc làm người dùng và chọn người mà bạn biết là người quản lý.
Hình ảnh dưới đây cho thấy cách hiển thị được hiển thị trước đó sẽ hiển thị nếu Andrew Allen đã đăng nhập.
[IMG]
Cũng như bộ lọc người dùng thủ công, bạn cần thực hiện các bước để Bảo vệ bộ lọc người dùng trên nội dung được xuất bản.

 

Thao tác tạo sankey chart để phân tích chi phí.

Gồm 4 phần:

Phần 1: Hướng dẫn tạo file dữ liệu excel cho Sankey chart

Tạo 2 Sheet:

Sheet 1: chứa các Field như sau: Link, T, Path, Sen. Mỗi một Field sẽ có 98 dòng.

Trong đó:

-       Link chỉ chứa giá trị link, tương ứng 98 dòng link.

-       T chứa các giá trị từ -6 đến 6, qua mỗi một dòng sẽ tăng một lượng 0.25.

-       Sen chứa 2 giá trị Min, Max. Mỗi giá trị Min, Max sẽ có 49 dòng.

-       Path: tương ứng với 48 giá trị Min của Sen, Path sẽ có giá trị từ 0 đến 48. Tương ứng với 48 giá trị Max của Sen, Path sẽ có giá trị từ 97 đến 49.

Tương ứng với T chạy từ -6 đến 6, qua mỗi dòng sẽ tăng một lượng 0.25, tương ứng sẽ có 49 dòng Min của Sen và Path có giá trị từ 0 đến 48.

Tương ứng với T chạy từ -6 đến 6, qua mỗi dòng sẽ tăng một lượng 0.25, tương ứng sẽ có 49 dòng Max của Sen và Path có giá trị từ 97 đến 49.

Sheet 2: Sort dữ liệu:

Bước 1: Tạo bộ lọc cho các Field.

Bước 2: Sort dữ liệu cho mỗi Fields.Ví dụ, file dữ liệu có 3 Fields, ta sẽ sort dữ liệu cho 3 fields.

 

Phần 2: Chuẩn bị dữ liệu.

Bước 1: Kết nối dữ liệu.

Bước 1.1: Kết nối dữ liệu Excel File.

Bước 1.2: Kéo 2 bảng vào phân tích. Thực hiện thao tác Join dữ liệu bằng một khóa chính.

Bước 2: Tạo các Calculated Field

Bước 2.1: Tạo Calculated Field Group 1:

Bước 2.2: Tạo Calculated Field Group 2:

Bước 2.3: Tạo Calculated Field Group 3:

Bước 3: Tạo các cây Hierarchy như sau:

Bước 4: Tạo Calculated Field Sigmoid có công thức:

Bước 5: Tạo Calculated Field Poids du chemin A

Bước 5.1: Tạo Calculated Field Poids du chemin A có công thức như hình bên dưới >> Chọn Default Table Calculation.

Bước 5.2: Tại cửa số Table Calculation [Poids du chemin A] >> chọn Advanced >> Chọn Group 01, Group 2 như hình >> OK.

Bước 5.3: Tại Table Calculation [Poids du chemin A], lựa chọn các giá trị như hình.

Lúc này, ta sẽ có được Calculated Field như hình vẽ.

Bước 6:  Tạo Calculated Field Min Position 1

Bước 6.1: Tạo Calculated Field Min Position 1 có công thức  như hình vẽ >> Chọn Default Table Calculation.

Bước 6.2: Tại cửa số Table Calculation [Min Position 1] >> chọn Advanced >> Chọn Group 01, Group 2 như hình >> OK.

Bước 6.3: Tại Table Calculation [Min Position 1], lựa chọn các giá trị như hình.

Lúc này, calculated Field Min Position 1 có công thức như hình vẽ.

Bước 7: Tạo Calculated Field Max Position 1

Bước 7.1: Tạo Calculated Field Max Position 1 có công thức  như hình vẽ >> Chọn Default Table Calculation.

Bước 7.2: Tại cửa số Table Calculation [Max Position 1] >> chọn Advanced >> Chọn Group 01, Group 2 như hình >> OK.

Bước 7.3: Tại Table Calculation [Max Position 1], lựa chọn các giá trị như hình.

Lúc này, calculated Field Max Position 1 có công thức như hình vẽ.

Bước 8: Tạo Calculated Field Min Position 2.

Bước 8.1: Tạo Calculated Field Min Position 2 có công thức như hình vẽ >> Chọn Default Table Calculation.

Bước 8.2: Tại cửa số Table Calculation [Min Position 2] >> chọn Advanced >> Chọn Group 2, Group 01 như hình >> OK.

Bước 8.3: Tại Table Calculation [Min Position 2], lựa chọn các giá trị như hình.

Lúc này, calculated Field Min Position 2 có công thức như hình vẽ.

Bước 9: Tạo Calculated Field Max Position 2

Bước 9.1: Tạo Calculated Field Max Position 2 có công thức  như hình vẽ >> Chọn Default Table Calculation.

Bước 9.2: Tại cửa số Table Calculation [Max Position 2] >> chọn Advanced >> Chọn Group 2, Group 01 như hình >> OK.

Bước 9.3: Tại Table Calculation [Max Position 2], lựa chọn các giá trị như hình.

Lúc này, calculated Field Max Position 2 có công thức như hình vẽ.

Bước 10: Tạo Calculated Field Poids du chemin B.

Bước 10.1: Tạo Calculated Field Poids du chemin B có công thức như hình vẽ >> Chọn Default Table Calculation.

Bước 10.2: Tại cửa số Table Calculation [Poids du chemin B] >> chọn Advanced >> Chọn Group 2, Group 3 như hình >> OK.

Bước 10.3: Tại Table Calculation [Poids du chemin B], lựa chọn các giá trị như hình.

Lúc này, calculated Field Poids du chemin B có công thức như hình vẽ.

Bước 11: Tạo Calculated Field Min Position 2 Bis.

Bước 11.1: Tạo Calculated Field Min Position 2 Bis có công thức như hình vẽ >> Chọn Default Table Calculation.

Bước 11.2: Tại cửa số Table Calculation [Min Position 2 Bis] >> chọn Advanced >> Chọn Group 2, Group 3 như hình >> OK.

Bước 11.3 : Tại Table Calculation [Min Position 2 Bis], lựa chọn các giá trị như hình.

Lúc này, calculated Field Min Position 2 Bis có công thức như hình vẽ.

Bước 12: Tạo Calculated Field Max Position 2 Bis.

Bước 12.1: Tạo Calculated Field Max Position 2 Bis có công thức như hình vẽ >> Chọn Default Table Calculation.

Bước 12.2: Tại cửa sổ Table Calculation [Max Position 2 Bis] >> chọn Advanced >> Chọn Group 2, Group 3 như hình >> OK.

Bước 12.3: Tại Table Calculation [Max Position 2 Bis], lựa chọn các giá trị như hình.

Lúc này, calculated Field Max Position 2 Bis có công thức như hình vẽ.

Bước 13: Tạo Calculated Field Min Position 3.

Bước 13.1: Tạo Calculated Field Min Position 3 có công thức  như hình vẽ >> Chọn Default Table Calculation.

Bước 13.2: Tại cửa số Table Calculation [Min Position 3] >> chọn Advanced >> Chọn Group 3, Group 2 như hình >> OK.

Bước 13.3: Tại Table Calculation [Min Position 3], lựa chọn các giá trị như hình.

Lúc này, calculated Field Min Position 3 có công thức như hình vẽ.

Bước 14: Tạo Calculated Field Max Position 3.

Bước 14.1: Tạo Calculated Field Max Position 3 có công thức  như hình vẽ >> Chọn Default Table Calculation.

Bước 14.2: Tại cửa số Table Calculation [Max Position 3] >> chọn Advanced >> Chọn Group 3, Group 2 như hình >> OK.

Bước 14.3: Tại Table Calculation [Max Position 3], lựa chọn các giá trị như hình.

Lúc này, calculated Field Max Position 3 có công thức như hình vẽ.

Bước 15: Tạo Calculated Field Curve Min A.

Bước 16: Tạo Calculated Curve Max A.

Bước 17: Tạo Calculated Field Curve Min B.

Bước 18: Tạo Calculated Field Curve Max B.

Bước 19: Tạo Calculated Field Curve Polygone A.

Bước 20: Tạo Calculated Field Curve Polygone B.

Bước 21: Tạo Calculated Field Poids de la Page.

Phần 3: Xây dựng Sankey A

Bước 1: Kéo Group 1 vào Color và Detail.

Kéo Group 2 vào Detail.

Kéo Sen vào Detail.

Tại thẻ Mark , chọn kiểu chart Polygon. Kéo Path vào Path.

Bước 2: Kéo T vào Columns. Chuyển sang dạng Dimensions.

Bước 3: Kéo Curve Polygone A vào Rows.

Bước 4: Click phải chuột vào Axis của Curve Polygone A >> Edit Axis >> chọn Fixed >> thực hiện thao tác giống như hình bên dưới. Sau đó, click chuột vào Axis Curve Polygone A, bỏ chọn Show header.

Bước 5: Click chuột vào Axis T >> chọn dạng Fixed như hình vẽ. Sau đó, bỏ chọn Show header tại Axis T.

Bước 6: Định dạng Poids du chemin A dạng %.

Bước 7: Kéo Poids du chemin A vào Tooltip. Định dạng Tooltip.

Lúc này ta có chart Sankey A như hình vẽ:

Ta thực hiện thao tác tương tự để có được Sankey B.

Phần 4: Xây dựng WorkSheet Step 1

Bước 1: Chuyển Poids de la Page sang dạng %.

Kéo Poids de la Page vào Rows.

Kéo Group 1 vào Color và Label. Định dạng lại Label như hình vẽ.

Bước 2: Edit Axis Poids de la Page >> Bỏ chọn Show header.

Lúc này, có được chart Step 1 như hình bên dưới:

Thực hiện thao tác tương tự để xây dựng chart Step 2, Step 3.

Với những Sheet đã tạo ở trên, lúc này ta có thể xay dựng được một dashboard Sankey – Dòng chảy chi phí như sau:

Bước 1: Kéo các Sheet vào dashboard.

Bước 2.1: Click vào Dashboard >> Actions… >> Highlight

Bước 2.2: Lựa chọn các giá trị như hình

Lúc này ta sẽ có được Sankey Diagram.

Pentaho Data Integration (also known as Kettle) là một trong những giải pháp tích hợp mã nguồn mở hàng đầu. Với PDI / Kettle, bạn có thể lấy dữ liệu từ nhiều nguồn, biến đổi dữ liệu một cách đặc biệt và load data vào hệ thống mục tiêu.

 

Đối với hướng dẫn này, tôi muốn chứng minh làm thế nào để chuyển đổi một tệp XML có chứa loại dữ liệu vào tệp tin Category Impex sử dụng Pentaho Data Integration.

 

Để minh họa thêm nhiều tính năng và tính năng của Pentaho, tôi quyết định sử dụng cấu trúc XML toàn diện cung cấp dữ liệu trong mô hình Entity-Attribute-Values (EAVs).

 

<?xml version="1.0" encoding="UTF-8" standalone="no"?>

 

<table>
<columns>
<column number="1">
<name>PRODUCT_CATEGORY_ID</name>
</column>
<column number="2">
<name>NAME</name>
</column>
<column number="4">
<name>PARENT_ID</name>
</column>
</columns>
<rows>
<row rowNumber="0">
<value columnNumber="1">1</value>
<value columnNumber="2">My Category_A</value>
<value columnNumber="4"></value>
</row>
<row rowNumber="1">
<value columnNumber="1">11</value>
<value columnNumber="2">Category_A11</value>
<value columnNumber="4">1</value>
</row>
<row rowNumber="2">
<value columnNumber="1">12</value>
<value columnNumber="2">Category A12</value>
<value columnNumber="4">1</value>
</row>
<row rowNumber="3">
<value columnNumber="1">2</value>
<value columnNumber="2">Category B</value>
<value columnNumber="4"></value>
</row>
<row rowNumber="2">
<value columnNumber="1">22</value>
<value columnNumber="2">Category A22</value>
<value columnNumber="4">2</value>
</row>
</rows></table>

Định dạng mục tiêu là ImpEx. Đối với XML ở trên, kết quả sau được mong đợi:

$productCatalog=Default
"$catalogVersion=catalogversion(catalog(id[default=$productCatalog]), version[default='Online'])[unique=true,default=$productCatalog:Online]";;;;;
"$lang=en";;;;;
"INSERT_UPDATE Category";"code[unique=true]";" supercategories(code, $catalogVersion)";"name[lang=$lang]";"$catalogVersion";"allowedPrincipals(uid)[default='customergroup']"
;"H_ROOT";;"Root Category";;
;"H_1";"H_ROOT";"My Category_A";;
;"H_11";"H_1";"Category_A11";;
;"H_22";"H_2";"Category A22";;
;"H_2";"H_ROOT";"Category B";;

 

Xin lưu ý rằng ID danh mục bắt đầu bằng "H_". Đó là một sự thay đổi tùy chọn, chỉ để chứng minh năng lực Pentaho của Mapper Value Mappers. Trong các dự án thực, chuyển đổi các ID cũng rất quan trọng, nhưng thuật toán có thể phức tạp hơn.

 

Các nút gốc được đại diện bởi các giá trị rỗng trong XML. Trong định dạng đích, chúng ta cần đặt chúng dưới một nút gốc (gọi là H_ROOT).

 

Sau khi áp dụng Impex này, hybris tạo một cây danh mục:

 

upload_2018-1-18_8-22-28.png

 

Vì vậy, mục tiêu của chúng tôi là chuyển đổi XML gốc sang tệp ImpEx này. Trong bài trước tôi đã chỉ ra cách triển khai nó mà không cần sử dụng bất kỳ phần mềm nào. Hôm nay tôi sẽ cho bạn biết về giải pháp luân phiên. Giải pháp này là một cấu hình cho Pentaho, một nền tảng tích hợp dữ liệu.

 

Pentaho configuration

Hãy bắt đầu từ dưới lên và xem kết quả cuối cùng. Trong hướng dẫn này chúng ta sẽ đi đến quá trình sau:

 

upload_2018-1-18_8-22-55.png

 

Quá trình này bao gồm 19 bước (sau mỗi bước tôi đặt một bảng với các kết quả của bước):

 

1. Đọc các definitions từ XML. Đọc các giá trị cột. Phần XML này không chứa các tên cột, chỉ chứa các ID. Vì vậy, giai đoạn tiếp theo là joining cùng nhau.

 

upload_2018-1-18_8-23-32.png

 

2. Đọc các giá trị từ XML. Đọc các giá trị cột. Phần XML này không chứa các tên cột, chỉ các ID của họ. Vì vậy, giai đoạn tiếp theo là tham gia cùng nhau.

 

upload_2018-1-18_8-23-51.png

 

3. Join Rows. Hai bộ dữ liệu trước đó đã được tham gia vào id = columnNumber.

 

upload_2018-1-18_8-24-9.png

 

4. Sort rows. Sắp xếp theo rowNumber.

 

upload_2018-1-18_8-24-23.png

5. Denormalize. Pentaho tạo các cột bổ sung (PARENT_ID, PRODUCT_CATEGORY_ID, NAME) sử dụng các giá trị của trường "value".

 

upload_2018-1-18_8-24-38.png

6. Chuyển đổi ID thành ID hybris. Theo nhiệm vụ, chúng tôi thêm "H_" vào ID gốc.

 

upload_2018-1-18_8-24-54.png

7. Chuyển đổi các nút gốc thành H_ROOT.

 

upload_2018-1-18_8-25-7.png

 

8. Loại bỏ các lĩnh vực không sử dụng (cột).

 

upload_2018-1-18_8-25-22.png

 

9. Nối thêm a Root category:

A. Đầu tiên, tạo một root category.

upload_2018-1-18_8-27-40.png

B. Hợp nhất nó với dữ liệu từ tập dữ liệu được lấy từ tệp tin XML:

upload_2018-1-18_8-27-59.png

10. Thêm một cột vào đầu.

A, Thêm một cột số không có giá trị:

upload_2018-1-18_8-28-16.png

B, Tham gia nó vào bộ dữ liệu được lấy từ tệp tin XML:

upload_2018-1-18_8-28-27.png

11. Thêm một vài trường.

 

A, Chuẩn bị một đối tượng với các cột sau:

upload_2018-1-18_8-28-39.png

B, Tham gia chúng vào bộ dữ liệu từ bước trước:

upload_2018-1-18_8-28-51.png

12. Thêm IMPEX Section Header.

 

A, Chuẩn bị IMPEX Section Header

upload_2018-1-18_8-29-4.png

B, Hợp nhất nó với dữ liệu từ trước
13. Áp dụng một mẫu từ tệp tin văn bản bên ngoài. Về cơ bản, mẫu định nghĩa một Impex Header:

A, Chuẩn bị mẫu
B, Hợp nhất tiêu đề này vào một tập dữ liệu từ trước
14. Chuyển đổi các dữ liệu này thành tệp CSV.


Đọc các định nghĩa từ XML

Bước này cung cấp khả năng đọc dữ liệu từ bất kỳ loại tệp XML nào bằng cách sử dụng các thông số kỹ thuật XPath. Nó sử dụng các bộ phân tích cú pháp DOM cần trong xử lý bộ nhớ và thậm chí việc tẩy các phần của tệp không đủ khi các phần này rất lớn. Nếu bạn cần phải xử lý các tệp tin khổng lồ, Pentaho có một thành phần phân tích cú pháp XML khác là XML Input Stream (StAX).

 

Có ba tab chính:

File

Content

Fields

File. Tên tệp được lưu trữ dưới dạng tham số dự án, vì vậy tôi tham chiếu đến biến bằng tên của nó thay vì sử dụng tên tệp trực tiếp.

upload_2018-1-18_8-31-16.png

XML1 là một hằng được xác định trong cấu hình dự án. Bạn cũng có thể sử dụng một tên tập tin thay vì tham chiếu biến.

 

 

Content. "Loop XPath" xác định nút gốc để xử lý. Công việc này xử lý tiêu đề, vì vậy tôi lọc phần tiêu đề (xem XML ở trên).

upload_2018-1-18_8-31-40.png

Fields. Phần này định nghĩa những gì XML tag / thuộc tính giá trị nên được ánh xạ với những gì lĩnh vực. Các quy tắc dưới đây nói: đặt một giá trị từ thẻ tên vào một cột đầu tiên (được gọi là "columnname") và một giá trị của thuộc tính vào biến "id".

 

upload_2018-1-18_8-31-50.png

Kết quả là, chúng ta có một danh sách các thuộc tính category cũng như các mã của chúng:

 

upload_2018-1-18_8-32-0.png

Nó sử dụng cùng một thành phần, nhưng với cấu hình hơi khác:

 

 

XPath is /table/rows/row/* .

 

Field configuration:

upload_2018-1-18_8-32-11.png

 

Kết quả như sau:

 

upload_2018-1-18_8-32-20.png

 

Đối với một số loại, không có danh mục gốc, vì vậy các giá trị của thuộc tính # 4 (PARENT_ID) trống cho chúng.

 

 

Join Rows

 

Đối với nhiệm vụ này, thành phần " Joins/Join Rows (cartesian product) " đã được sử dụng.

 

 

Ở bước này, hai bộ trước đó được hợp nhất trong một. Điều kiện kết nối là id = columnnumber. Cả hai lĩnh vực có nghĩa là cùng một điều, một tên trường id.

 

upload_2018-1-18_8-32-38.png

 

Bảng kết quả là:

 

upload_2018-1-18_8-32-52.png

Sorting rows

 

Để chuẩn bị cho việc Denormalization, chúng ta cần phải sắp xếp các hàng bằng rowNumber, đưa cùng các thuộc tính liên quan đến cùng loại.

 

upload_2018-1-18_8-33-14.png

 

Kết quả:

upload_2018-1-18_8-33-24.png

Denormalization

Thành phần này chuyển đổi dữ liệu EAV vào các trường, một cho mỗi thuộc tính EAV.

Có ba điều chúng ta cần phải cấu hình:

Key field, lĩnh vực từ bảng mã nguồn có chứa một tên thuộc tính.

Group field, mã nguồn duy nhất trong trường hợp của chúng tôi

Target fields, một quy tắc lập bản đồ cho mỗi thuộc tính được sử dụng trong các giá trị key field.

upload_2018-1-18_8-37-36.png

Kết quả:

 

upload_2018-1-18_8-37-50.png

Chuyển đổi ID thành ID hybris

 

Theo nhiệm vụ, chúng tôi thêm "H_" vào ID gốc. Tôi đã sử dụng một thành phần gọi là "Transform / Replace in String" và các biểu thức thông thường. Đã tạo hai trường mới, HYBRIS_CODE và HYBRIS_PARENT_ID.

 

 

upload_2018-1-18_8-38-2.png

 

Kết quả:

 

upload_2018-1-18_8-40-12.png

Chuyển đổi các nút gốc thành H_ROOT

 

upload_2018-1-18_8-40-43.png

 

Xóa các trường không sử dụng (columns)

 

Một số trường không còn được sử dụng nữa và cần được loại bỏ khỏi đầu ra. Tôi đã sử dụng một thành phần "Select / Rename values" cho nhiệm vụ này.

 

upload_2018-1-18_8-40-55.png

Truong Dai

Format Scale Numbers

Posted by Truong Dai Jan 16, 2018

Để Format Scale Number của Axis trong Tableau bạn cần thực hiện các bước sau:

 

Bước 1: Click chuột phải vào Axis và chọn Format.


upload_2017-5-11_15-33-12.png

Bước 2:
Sau khi chọn format có các thông tin trong Numbers như sau:

 

- Automatic: Tableau tự động chọn kiểu thể hiện phù hợp với dữ liệu hiện có.

- Number(standard): Số (theo tiêu chuẩn)

upload_2017-5-11_15-33-51.png

 

 

- Number (Custom): Số theo tùy chỉnh như sau

 

upload_2017-5-11_15-34-5.png

 

+Decimal place: Số chữ số thập phân.

+Negative values: Cách hiển thị giá trị âm

 

upload_2017-5-11_15-34-38.png

 

+Units: Lựa chọn đơn vị hiển thị: Thousands (K), Million (M), …

upload_2017-5-11_15-34-58.png

 

+ Prefit/Suffit: Thêm giá trị ở đầu/cuối.

 

+Include thousands separators: dấu phẩy cho số liệu trên ngàn.

 

- Currency (Standard): Đơn vị tiền tệ( chuẩn)

 

- Currency (Custom): Đơn vị tiền tệ tùy chỉnh (tương tự như Number (Custom))

 

upload_2017-5-11_15-35-16.png

 

- Scientyfic: đơn vị e (8.00e+05)

 

- Percentage: Phần trăm.

 

- Custom: Format theo cách như bạn mong muốn

 

(Link một số dạng custom: https://support.office.com/en-us/article/Number-format-codes-5026bbd6-04bc-48cd-bf33-80f18b4eae68 )

 

upload_2017-5-11_15-35-34.png

Truong Dai

UNION YOUR DATA

Posted by Truong Dai Jan 16, 2018

Bạn có thể union data của mình để kết hợp hai hoặc nhiều bảng bằng cách nối các giá trị (dòng) từ bảng này sang bảng khác. Để union data của bạn trong data source của Tableau, các bảng phải đến từ cùng một kết nối.

 

Nếu data source của bạn hỗ trợ union, tùy chọn New Union sẽ hiển thị ở khung giao diện bên trái của trang data source sau khi bạn kết nối với data của mình. Bạn cũng có thể tham khảo danh sách dưới đây để xác minh rằng data source của bạn hỗ trợ union:

upload_2018-1-16_15-36-53.png

Để có kết quả tốt nhất, các bảng mà bạn sử dụng union phải có cùng cấu trúc. Tức là, mỗi bảng phải có cùng một số fields và các fields liên quan phải có tên field và kiểu dữ liệu phù hợp.

 

Ví dụ: giả sử bạn có thông tin mua hàng của khách hàng được lưu trữ trong ba bảng, được phân tách theo tháng. Tên bảng là "May2016", "June2016" và "July2016".

upload_2018-1-16_15-37-8.png

Union các bảng này tạo ra một bảng đơn sau đây có chứa tất cả các dòng từ tất cả các bảng.

 

Union

upload_2018-1-16_15-37-26.png


Union tables manually (Union thủ công)

Sử dụng phương pháp này để union thủ công các bảng riêng biệt. Phương pháp này cho phép bạn kéo các bảng riêng biệt từ khung giao diện bên trái của trang data source vào hộp tương tác Union.

 

To union tables manually

 

1. Trên trang data source, double-click vào New Union để thiết lập union.

upload_2018-1-16_15-37-52.png

2. Kéo bảng từ khung giao diện bên trái vào hộp tương tác Union.

upload_2018-1-16_15-38-36.png

3. Chọn bảng khác từ khung bên trái và kéo nó trực tiếp xuống dưới bảng đầu tiên.

upload_2018-1-16_15-38-59.png

Tip: Để thêm nhiều bảng vào union cùng một lúc, nhấn Shift hoặc Ctrl (Shift hoặc Command trên máy Mac), chọn các bảng mà bạn muốn union trong khung bên trái, và sau đó kéo chúng trực tiếp xuống dưới bảng đầu tiên.

 

4. Click Apply hoặc OK để union.

Union tables using wildcard search (Union sử dụng tìm kiếm theo ký tự đại diện)

Sử dụng phương pháp này để thiết lập các tiêu chí tìm kiếm để tự động bao gồm các bảng trong union của bạn. Sử dụng ký tự đại diện, là dấu hoa thị (*), để phù hợp một dãy hoặc mẫu ký tự trong Excel và tên worksheet. Tên Google Sheets workbook và worksheet, tên text file, tên JSON file,tên .pdf file, và tên bảng database.

Khi làm việc với Excel, text file data, JSON file, .pdf file data, bạn cũng có thể sử dụng phương pháp này để union các files trên các folder và các worksheets trong các workbooks. Tìm kiếm được chia thành các kết nối được chọn. Kết nối và bảng có sẵn trong một kết nối được hiển thị ở khung bên trái của trang Data sourse.

 

To union tables using wildcard search (Union bảng bằng cách sử dụng tìm kiếm theo ký tự đại diện)

1. Trên trang data source, double-click vào New Union để thiết lập union.

upload_2018-1-16_15-40-18.png

 

2. Click vào Wildcard (automatic) trong hộp tương tác Union.

upload_2018-1-16_15-40-48.png

3. Nhập tiêu chí tìm kiếm mà bạn muốn Tableau sử dụng để tìm các bảng để include trong union.

upload_2018-1-16_15-41-3.png

Ví dụ: bạn có thể nhập * 2016 vào text box Include để union các bảng trong Excel kết thúc bằng "2016" trong tên của chúng. Các tiêu chí tìm kiếm như thế này sẽ đưa ra kết quả union của các bảng May2016, June2016, và July2016 (Excel), từ kết nối đã chọn. Trong trường hợp này, kết nối được gọi là Sales và kết nối được thực hiện với Excel chứa các worksheets bạn muốn có trong folder quarter_3 trong danh mục sales (ví dụ: Z: \ sales \ quarter_3).

4. Click Apply hoặc OK để union.

Expand search to find more Excel, text, JSON, .pdf data (Mở rộng tìm kiếm để tìm thêm data Excel, text, JSON, .pdf)

Các bảng ban đầu có sẵn để union được mở rộng đến kết nối mà bạn đã chọn. Nếu bạn muốn union nhiều bảng nằm bên ngoài folder hiện tại (đối với các files Excel, text, JSON, .pdf) hoặc trong một workbook khác (cho worksheets Excel), hãy chọn một hoặc cả hai check boxes trong hộp tương tác Union để mở rộng tìm kiếm của bạn.

Ví dụ, giả sử bạn muốn union tất cả các worksheets Excel, kết thúc với "2016" trong tên của nó bên ngoài folder hiện tại. Kết nối ban đầu được thực hiện cho một workbook Excel nằm trong cùng một danh mục trong ví dụ trên, Z: \ sales \ quarter_3.

upload_2018-1-16_15-41-47.png

· Include: Nếu bạn nhập * 2016 vào text box Include và cho phép các tiêu chí tìm kiếm còn lại của hộp tương tác như cũ, Tableau sẽ tìm tất cả các worksheets Excel kết thúc bằng "2016" trong tên của nó bên trong folder hiện tại.


Trong sơ đồ bên dưới, mục được highlighted màu vàng tượng trưng cho location hiện tại, đó là workbook Excel mà bạn đã tạo một kết nối đến trong "quarter_3". Hộp màu xanh lá cây đại diện cho các bảng thuộc workbooks và sheets được union như là kết quả của các tiêu chí tìm kiếm này.

upload_2018-1-16_15-55-37.png

 

· Include + Expand search to subfolders: Nếu bạn nhập * 2016 vào text box Include và chọn check box Expand search to subfolders, Tableau thực hiện như sau:

 

o Tìm tất cả các worksheets Excel kết thúc bằng "2016" trong tên của chúng trong folder hiện tại "quarter_3".

 

o Tìm các worksheets Excel bổ sung kết thúc bằng "2016" trong tên của chúng được đặt trong các workbooks Excel trong các subfolders của folder "quarter_3".

 

Trong sơ đồ bên dưới, mục được highlighted màu vàng tượng trưng cho location hiện tại, đó là workbook Excel mà bạn đã tạo kết nối đến trong folder "quarter_3". kết hợp với kết quả của các tiêu chí tìm kiếm này. Hộp màu xanh lá cây đại diện cho các bảng thuộc workbooks và worksheets được union như là kết quả của các tiêu chí tìm kiếm này.

 

upload_2018-1-16_15-56-7.png

 

· Include + Expand search to parent folder: Nếu bạn nhập * 2016 vào text box Include và chọn check box Include + Expand search to parent folder, Tableau thực hiện như sau:

 

o Tìm tất cả các worksheets Excel kết thúc bằng "2016" trong tên của chúng trong folder hiện tại "quarter_3".

 

o Tìm các worksheets Excel bổ sung kết thúc bằng "2016" trong tên của chúng được đặt trong folders tương đồng của folder "quarter_3". Trong ví dụ này, "quarter_4" là folder tương đồng.

 

Trong sơ đồ bên dưới, mục được highlight màu vàng tượng trưng cho location hiện tại, đó là workbook Excel mà bạn đã tạo kết nối đến trong folder "quarter_3". Các hộp màu xanh lá cây đại diện cho các bảng thuộc workbooks và worksheets được union như là kết quả của các tiêu chí tìm kiếm này.

 

upload_2018-1-16_15-56-49.png

 

· Include + Expand search to subfolders + Expand search to parent folder: Nếu bạn nhập * 2016 vào text box Include và chọn tất cả check box Expand search to subfolders Expand search to parent folder, Tableau thực hiện như sau:

 

o Tìm tất cả các worksheets Excel kết thúc bằng "2016" trong tên của chúng trong folder hiện tại "quarter_3".

 

o Tìm các workbooks Excel bổ sung được đặt trong các subfolders của folder hiện tại, "quarter_3".

 

o Tìm các workbooks Excel bổ sung được đặt trong folder tương đồng và các subfolders của folder "quarter_3". Trong ví dụ này, "quarter_4" là folder tương đồng.

 

Trong sơ đồ dưới đây, mục được highlight màu vàng tượng trưng cho location hiện tại, tức là workbook Excel mà bạn đã tạo kết nối. Hộp màu xanh lá cây đại diện cho các bảng thuộc workbooks và worksheets được union như là kết quả của các tiêu chí tìm kiếm này.

 

upload_2018-1-16_15-57-3.png

Giả sử rằng, bạn có một file dữ liệu bằng excel, bạn đưa nó vào Tableau Desktop thiết kế ra các chart giúp ích trong việc phân tích của bạn.

 

upload_2017-7-4_10-8-3.png

Khi số dòng trong dữ liệu của bạn tăng lên, bạn có thể refresh lại hoặc bạn có thể dẫn lại đường dẫn, lúc đó các chart bạn đã thiết kế sẽ cập nhật dữ liệu tương ứng. Thế nhưng, trong trường hợp, bạn đổi tên một cột bất kỳ trong file excel của bạn hoặc bạn dẫn một đường link khác nhưng có một số cột bị đổi tên khác đi. Lúc này, khi bạn dẫn đường dẫn tới file đó hoặc refresh data thì các Field trước khi bị đổi tên sẽ báo lỗi, ví dụ tên Field ban đầu là ID sau đó được đổi thành Customer ID, lỗi sẽ báo như hình dưới đây:

 

upload_2017-7-4_10-3-34.png

 

 

upload_2017-7-4_10-3-48.png

 

Để xử lý vấn đề này, bạn chỉ cần thực hiện một thao tác đơn giản như sau:

Bước 1: Click chuột phải vào Field bị lỗi, sau đó chọn Replace References...

 

upload_2017-7-4_10-4-33.png

 

Bước 2: Chọn tên Field thay thế, sau đó chọn OK

 

upload_2017-7-4_10-4-49.png

 

Cuối cùng, bạn chỉ cần xoá Field cũ bị lỗi là đã hoàn thành việc Replace References rồi.

 

upload_2017-7-4_10-5-9.png

Các bước tạo Pie chart trên Map trong tableau

B1: Định nghĩa Province

upload_2015-12-9_8-43-40.png

 

B2: Kéo province vào Detail

upload_2015-12-9_8-44-14.png

 

B3: Edit location

upload_2015-12-9_8-44-54.png

upload_2015-12-9_8-45-23.png

 

B5: Trong thẻ Mark chọn Pie

upload_2015-12-9_8-45-52.png

 

B6: Kéo channel vào color, sales vao size

upload_2015-12-9_8-46-55.png

 

B7: Phóng to pie bằng Size

 

B8: Đưa các thông tin thêm vào Tooltip

 

Truong Dai

Reversed Axis

Posted by Truong Dai Jan 9, 2018

Tính năng này giúp bạn xoay chiều chart, để thiết kế Butterfly, Population Pyramid, Funnel chart ...

Trong bài viết này Team Tableau sử dụng data Sample SuperStore để minh họa.

 

Bước 1: Kéo SalesCost vào Columns; Sub Category vào Rows

 

upload_2017-7-6_9-46-22.png

 

Bước 2: Click phải vào trục số, chọn Edit Axis và click vào Reversed

upload_2017-7-6_9-46-41.png

Kết quả của quá trình trên:

upload_2017-7-6_9-47-9.png

Các bước trong phần này mô tả cách đơn giản nhất để kết hợp lọc dựa trên người dùng. Phương pháp này có thể phù hợp nếu bạn có một nhóm hoặc một nhóm nhỏ người dùng thì khá dễ để quản lý.

1. Trong Tableau Desktop, mở một workbook hoặc tạo mới và kết nối với dữ liệu bạn muốn filter.
2. Chọn Server > create User Filter . Sau đó chọn trường mà bạn muốn lọc. Ví dụ này là chọn Region.
3. Nếu được yêu cầu bạn cần đăng nhập vào tableau server hoặc Site.
upload_2017-7-17_11-47-13.png

4. Trong hộp thoại User Filter nhập tên cho bộ qui tắt bạn đang tạo.
- Trong ví dụ tôi chọn Regional_Filter.
5. Trong danh sách bên trái, chọn người dùng hoặc nhóm người dùng. Ở bên phải, chọn từng thành viên của trường mà bạn đã chọn trước đó và bạn muốn người dùng đã chọn có thể xem.
- Ví dụ: chọn user quyennv là người quản lý của khu vực East và South. Vì vậy trong danh sách trường bạn sẽ chọn East và South.
upload_2017-7-17_11-49-7.png
- Lặp lại quá trình này cho mổi người dùng hoặc nhóm và nhấn OK khi bạn đã mapping người dùng với các giá trị. Sau khi bạn tạo bộ lọc người dùng (User Filter) nó sẽ xuất hiện trong sets area của bảng Data.
6. Kéo User Filter sang ngăn Filter
upload_2017-7-17_11-49-33.png
Bộ lọc sẽ trở thành một bộ lọc ngữ cảnh và chế độ xem điều chỉnh để hiển thị dữ liệu mà bạn được phép xem.

 

7. Thực hiện bất kỳ điều sau đây để kiểm tra bộ lọc
- Nếu chế độ xem xuất hiện dưới dạng một khung trống, bạn cần cho phép mình hoặc một nhóm bạn là thành viên của để xem khu vực. Trong vùng Sets của bảng Data, mở trình đơn thả xuống trên bộ lọc người dùng, sau đó chọn Edit Set.
- Để xem trước cách bộ lọc hoạt động trong chế độ xem đã xuất bản, ở góc dưới bên phải của bảng tính, mở trình đơn Lọc khi sử dụng, và chọn người dùng hoặc nhóm từ danh sách.
upload_2017-7-17_11-49-58.png
upload_2017-7-17_11-50-3.png

 

Truong Dai

Dumbbell Chart in Tableau

Posted by Truong Dai Jan 7, 2018

Giả sử bạn muốn thể hiện sự khác biệt về doanh số bán hàng giữa năm trước và năm nay của các loại sản phẩm, thì Dumbbell chart cũng là một hình thức bạn có thể lựa chọn để minh hoạ cho sự thay đổi giữa 2 điểm dữ liệu này.

 

upload_2017-7-17_14-52-18.png

 

Dưới đây là hướng dẫn cách vẽ chart Dumbbell trong Tableau:

  • Bước 1: Đưa Sub-category vào Rows, Sales vào Columns và chỉnh kiểu chart Line
  • Bước 2: Kéo Order Date vào thẻ Path:

upload_2017-7-17_14-52-56.png

 

  • Bước 3: Kéo tiếp Sales vào Columns để tạo lớp chart thứ 2. Sau đó chọn kiểu chart Circle trên thẻ Mark và chỉnh YEAR(Order Date) vào thẻ Color

upload_2017-7-17_14-54-3.png

 

  • Bước 4: Do dữ liệu đang có 4 năm, anh/chị muốn so sánh giữa 2 năm nào thì chỉ cần kéo Order Date vào thẻ Filter, lọc chọn 2 năm.

upload_2017-7-17_14-54-28.png

 

  • Bước 5: Ở measure Sales thứ 2, chọn Dual Axis.

upload_2017-7-17_14-54-52.png

 

Vậy là việc tạo Dumbbell Chart đã hoàn thành.

Có thể nói, trong các giai đoạn xây dựng Data warehouse, giai đoạn hiện thực và kiểm soát quá trình ETL là giai đoạn vất vả, gian khổ nhất đối với đội ngũ tham gia phát triển các giải pháp Business Intelligence. Tuy nhiên, với sự hỗ trợ mạnh mẽ của Microsoft SQL Server Integration Services và các dịch vụ khác có liên quan, mọi việc giờ đây đã trở nên đơn giản hơn rất nhiều. Hiện tại, SSIS có thể xem như 1 môi trường hoàn hảo nhất của Microsoft để thực hiện mọi tác vụ liên quan đến nhu cầu tích hợp dữ liệu.

 

Đầu tiên chúng ta cần khởi động Microsoft SQL Business Intelligence Development Studio tạo SSIS project: trong pane Solution Explorer (gốc trên trái), chọn SSIS packages, nhấn phải chuột và chọn chức năng SSIS Import and Export Wizard...

 

Màn hình đầu tiên giới thiệu về Import và Export Wizard hiển thị như sau:

 

upload_2017-12-28_8-34-5.png

 

Sau khi nhấn nút Next, chúng ta cần xác định thông tin dữ liệu nguồn bao gồm

- Loại dữ liệu nguồn

- Nguồn dữ liệu tương ứng với loại đã chọn

- Hình thức xác thực (nếu có) để hệ thống thiết lập kết nối

- CSDL nguồn chứa dữ liệu cần lấy

Trong hình minh hoạt sau đây, dữ liệu nguồn được chỉ định lấy từ CSDL của Microsoft SQL Server ở máy chủ có tên TEEMO\MSSQLSERVER2016 này được chỉ định tên là AdventureWorks2016CTP3 và hình thức xác thực kết nối là Windows Authentication

 

upload_2017-12-28_8-36-13.png

 

Tiếp theo ở màn hình xác nhận dữ liệu đầu ra, trong tình huống minh họa này chúng tôi chọn kết xuất dữ liệu sang định dạng Excel với tên workbook là Timetables.xlsx.

 

upload_2017-12-28_8-38-9.png

 

Tiếp theo sau, hệ thống sẽ yêu cầu chúng ta xác nhận hình thức lấy dữ liệu. Cụ thể chúng ta phải chọn 1 trong 2 hình thức:

1. Dữ liệu sẽ được chép từ nội dung của bảng hoặc nội dung của view trong CSDL nguồn

2. Dữ liệu sẽ được lấy thông qua 1 câu truy vấn trên dữ liệu nguồn

 

upload_2017-12-28_8-39-15.png

 

 

Nếu chọn giải pháp 1 nêu trên, hệ thống sẽ hiển thị tiếp hộp thoại cho chúng ta chọn các bảng và các views cần lấy dữ liệu.

 

upload_2017-12-28_8-40-19.png

 

Để đảm bảo, chọn đúng bảng và view để lấy dữ liệu từ, hệ thông cho phép chúng ta xem nhanh nội dung của bảng và view ngay trên dialog này bằng cách nhấn nút Review.

 

upload_2017-12-28_8-41-11.png

 

Khi đã chọn 1 bảng hoặc 1 view nào đó để kết xuất, nếu cần thiết chúng ta hoàn toàn có thể thiết lập lại tên Worksheet tương ứng để chứa dữ liệu được kết xuất ra này ở cột Destination. Ví dụ như sau

 

upload_2017-12-28_8-42-29.png

 

Nhưng có lẽ phần tùy biến mạnh mẽ nhất của công cụ này nằm ở phần Edit Mappings...vì nó cho phép chúng ta tùy biến nội dung chuyển từ dữ liệu nguồn sang dữ liệu đích một cách linh hoạt

 

upload_2017-12-28_8-43-19.png

 

Trong hộp thoại này, phần đầu tiên cần để ý là nút Edit SQL... vì phần này sẽ giúp chúng ta chốt lại cấu trúc của dữ liệu đích đến. Nếu muốn thay đổi tên cột, kiểu dữ liệu cho từng cột, hay thậm chí là thêm, bớt cột, chúng ta hoàn toàn có thể chỉ định được thông qua cửa sổ sau đây

 

upload_2017-12-28_8-44-0.png

 

Nút Auto Generate trên cửa sổ này sẽ yêu cầu hệ thống tự tạo cấu trúc cho dữ liệu đích dựa trên cấu trúc của dữ liệu nguồn đã xác định.

Quay trở lại cửa sổ Column Mappings, chúng ta có thể thực hiện 1 số thao tác chuyển đổi dữ liệu quan trọng trực tiếp ngay trên đó như: Đặt lại tên cho các cột ở dữ liệu đích (nếu cần thiết)

 

upload_2017-12-28_8-44-49.png

 

 

Chuyển đổi kiểu dữ liệu áp dụng cho cột dữ liệu tương ứng trên dữ liệu đích. Ví dụ: theo hình bên dưới, chúng ta đang chuyển kiểu dữ liệu Long Text trong dữ liệu nguồn ở SQL Server thành kiểu dữ liệu VarChar (để có thể tùy biến lại độ rộng cho trường đó ở dữ liệu đích thông qua giá trị xác định ở cột Size)

upload_2017-12-28_8-50-27.png

 

Tương tự với kiểu dữ liệu Decimal, chúng ta có thể xác định được độ chính xác ở phần nguyên, phần thập phân...bằng các cột Precision và Scale

 

upload_2017-12-28_8-52-8.png

 

Sau khi đã chọn xong các bảng và view cần lấy dữ liệu đồng thời xác định hình thức chuyển đổi dữ liệu chi tiết tới từng cột qua các bước trên, giai đoạn tiếp theo là xác nhận hướng xử lý nếu trong quá trình import/export có xảy ra sự cố. Các tình huống gây ra lỗi có thể có như lỗi dữ liệu kiểu ngày do nhập liệu sai trong dữ liệu nguồn, dữ liệu đổ vào đích đến bị trùng khóa chính, hay hệ thống không ghi dữ liệu lên đích đến được,...thì có thể chọn hướng xử lý là Fail (hủy toàn bộ giao tác) hoặc Ignore (lờ lỗi đi và tiếp tục thực hiện phần còn lại)

Click Next

Hộp thoại cuối cùng của Wizard sẽ hiển thị thông tin xác nhận các bước sẽ thực hiện trong package, vị trí lưu package thành file .dtsx trên hệ thống.

Click Finish

Sau đó hệ thống sẽ tiến hành các thao tác kiểm tra package để đảm bảo không còn lỗi do quá trình thiết kết thông qua các bước trong Wizard trước khi lưu lại.

Sau cùng để thực hiện package, chúng ta cần trở lại Solution Explorer, right click trên package vừa tạo và chọn Execute Package