Có thể nói, trong các giai đoạn xây dựng Data warehouse, giai đoạn hiện thực và kiểm soát quá trình ETL là giai đoạn vất vả, gian khổ nhất đối với đội ngũ tham gia phát triển các giải pháp Business Intelligence. Tuy nhiên, với sự hỗ trợ mạnh mẽ của Microsoft SQL Server Integration Services và các dịch vụ khác có liên quan, mọi việc giờ đây đã trở nên đơn giản hơn rất nhiều. Hiện tại, SSIS có thể xem như 1 môi trường hoàn hảo nhất của Microsoft để thực hiện mọi tác vụ liên quan đến nhu cầu tích hợp dữ liệu.

 

Đầu tiên chúng ta cần khởi động Microsoft SQL Business Intelligence Development Studio tạo SSIS project: trong pane Solution Explorer (gốc trên trái), chọn SSIS packages, nhấn phải chuột và chọn chức năng SSIS Import and Export Wizard...

 

Màn hình đầu tiên giới thiệu về Import và Export Wizard hiển thị như sau:

 

upload_2017-12-28_8-34-5.png

 

Sau khi nhấn nút Next, chúng ta cần xác định thông tin dữ liệu nguồn bao gồm

- Loại dữ liệu nguồn

- Nguồn dữ liệu tương ứng với loại đã chọn

- Hình thức xác thực (nếu có) để hệ thống thiết lập kết nối

- CSDL nguồn chứa dữ liệu cần lấy

Trong hình minh hoạt sau đây, dữ liệu nguồn được chỉ định lấy từ CSDL của Microsoft SQL Server ở máy chủ có tên TEEMO\MSSQLSERVER2016 này được chỉ định tên là AdventureWorks2016CTP3 và hình thức xác thực kết nối là Windows Authentication

 

upload_2017-12-28_8-36-13.png

 

Tiếp theo ở màn hình xác nhận dữ liệu đầu ra, trong tình huống minh họa này chúng tôi chọn kết xuất dữ liệu sang định dạng Excel với tên workbook là Timetables.xlsx.

 

upload_2017-12-28_8-38-9.png

 

Tiếp theo sau, hệ thống sẽ yêu cầu chúng ta xác nhận hình thức lấy dữ liệu. Cụ thể chúng ta phải chọn 1 trong 2 hình thức:

1. Dữ liệu sẽ được chép từ nội dung của bảng hoặc nội dung của view trong CSDL nguồn

2. Dữ liệu sẽ được lấy thông qua 1 câu truy vấn trên dữ liệu nguồn

 

upload_2017-12-28_8-39-15.png

 

 

Nếu chọn giải pháp 1 nêu trên, hệ thống sẽ hiển thị tiếp hộp thoại cho chúng ta chọn các bảng và các views cần lấy dữ liệu.

 

upload_2017-12-28_8-40-19.png

 

Để đảm bảo, chọn đúng bảng và view để lấy dữ liệu từ, hệ thông cho phép chúng ta xem nhanh nội dung của bảng và view ngay trên dialog này bằng cách nhấn nút Review.

 

upload_2017-12-28_8-41-11.png

 

Khi đã chọn 1 bảng hoặc 1 view nào đó để kết xuất, nếu cần thiết chúng ta hoàn toàn có thể thiết lập lại tên Worksheet tương ứng để chứa dữ liệu được kết xuất ra này ở cột Destination. Ví dụ như sau

 

upload_2017-12-28_8-42-29.png

 

Nhưng có lẽ phần tùy biến mạnh mẽ nhất của công cụ này nằm ở phần Edit Mappings...vì nó cho phép chúng ta tùy biến nội dung chuyển từ dữ liệu nguồn sang dữ liệu đích một cách linh hoạt

 

upload_2017-12-28_8-43-19.png

 

Trong hộp thoại này, phần đầu tiên cần để ý là nút Edit SQL... vì phần này sẽ giúp chúng ta chốt lại cấu trúc của dữ liệu đích đến. Nếu muốn thay đổi tên cột, kiểu dữ liệu cho từng cột, hay thậm chí là thêm, bớt cột, chúng ta hoàn toàn có thể chỉ định được thông qua cửa sổ sau đây

 

upload_2017-12-28_8-44-0.png

 

Nút Auto Generate trên cửa sổ này sẽ yêu cầu hệ thống tự tạo cấu trúc cho dữ liệu đích dựa trên cấu trúc của dữ liệu nguồn đã xác định.

Quay trở lại cửa sổ Column Mappings, chúng ta có thể thực hiện 1 số thao tác chuyển đổi dữ liệu quan trọng trực tiếp ngay trên đó như: Đặt lại tên cho các cột ở dữ liệu đích (nếu cần thiết)

 

upload_2017-12-28_8-44-49.png

 

 

Chuyển đổi kiểu dữ liệu áp dụng cho cột dữ liệu tương ứng trên dữ liệu đích. Ví dụ: theo hình bên dưới, chúng ta đang chuyển kiểu dữ liệu Long Text trong dữ liệu nguồn ở SQL Server thành kiểu dữ liệu VarChar (để có thể tùy biến lại độ rộng cho trường đó ở dữ liệu đích thông qua giá trị xác định ở cột Size)

upload_2017-12-28_8-50-27.png

 

Tương tự với kiểu dữ liệu Decimal, chúng ta có thể xác định được độ chính xác ở phần nguyên, phần thập phân...bằng các cột Precision và Scale

 

upload_2017-12-28_8-52-8.png

 

Sau khi đã chọn xong các bảng và view cần lấy dữ liệu đồng thời xác định hình thức chuyển đổi dữ liệu chi tiết tới từng cột qua các bước trên, giai đoạn tiếp theo là xác nhận hướng xử lý nếu trong quá trình import/export có xảy ra sự cố. Các tình huống gây ra lỗi có thể có như lỗi dữ liệu kiểu ngày do nhập liệu sai trong dữ liệu nguồn, dữ liệu đổ vào đích đến bị trùng khóa chính, hay hệ thống không ghi dữ liệu lên đích đến được,...thì có thể chọn hướng xử lý là Fail (hủy toàn bộ giao tác) hoặc Ignore (lờ lỗi đi và tiếp tục thực hiện phần còn lại)

Click Next

Hộp thoại cuối cùng của Wizard sẽ hiển thị thông tin xác nhận các bước sẽ thực hiện trong package, vị trí lưu package thành file .dtsx trên hệ thống.

Click Finish

Sau đó hệ thống sẽ tiến hành các thao tác kiểm tra package để đảm bảo không còn lỗi do quá trình thiết kết thông qua các bước trong Wizard trước khi lưu lại.

Sau cùng để thực hiện package, chúng ta cần trở lại Solution Explorer, right click trên package vừa tạo và chọn Execute Package