Skip navigation

Vietnam

2 Posts authored by: ANH NGUYEN

Chiết xuất dữ liệu Tableau (TDE) là gì ?


Chiết xuất dữ liệu của Tableau là một ảnh chụp nhanh của dữ liệu được lưu trữ trên đĩa và được nạp vào bộ nhớ theo yêu cầu để hiển thị Tableau viz.


C
ó hai khía cạnh của thiết kế TDE làm cho chúng trở nên lý tưởng cho việc hỗ trợ phân tích và phát hiện dữ liệu. Đầu tiên TDE là một dữ liệu dạng cột. Tôi sẽ không đi vào chi tiết về các dữ liệu dạng cột - có rất nhiều tài liệu tốt đã làm điều đó.


Tuy nhiên, ít nhất hãy tạo ra sự hiểu biết chung rằng cơ sở dữ liệu dạng cột sẽ lưu các giá trị cột lại với nhau thay vì giá trị hàng. Do đó, họ giảm đáng kể đầu vào / đầu ra cần thiết để truy cập và tổng hợp các giá trị trong một cột. Đó là những điều rất tuyệt vời mà họ tạo ra cho phân tích và phát hiện dữ liệu.

 

Hình 1 - Một cơ sở dữ liệu dạng cột giúp bạn nhanh chóng vận hành các giá trị trong bất kỳ cột nào

 

Khía cạnh quan trọng thứ hai của thiết kế TDE là cách chúng được cấu trúc ảnh hưởng đến cách chúng được tải vào bộ nhớ và được sử dụng bởi Tableau. Đây là một phần rất quan trọng của cách TDE được "kiến trúc nhận thức". Về cơ bản, kiến trúc nhận thức có nghĩa là TDEs sử dụng tất cả các bộ phận của bộ nhớ máy tính, từ RAM tới đĩa cứng và đặt từng phần để phù hợp nhất với các đặc tính của nó.

Để hiểu rõ hơn khía cạnh này của TDE, chúng ta sẽ đi qua cách TDE được tạo ra và sau đó được sử dụng làm nguồn dữ liệu cho một hoặc nhiều hình ảnh hóa.

Khi Tableau tạo ra một trích xuất dữ liệu, đầu tiên nó định nghĩa cấu trúc cho TDE và tạo ra các tệp tin riêng cho mỗi cột trong nguồn cơ bản.
(Đây là lý do tại sao lợi ích của việc giảm thiểu số cột dữ liệu được chọn để trích xuất).

Khi Tableau truy xuất dữ liệu, nó sắp xếp, nén và thêm các giá trị cho mỗi cột vào tệp tương ứng của chúng.
Với phiên bản 8.2, việc sắp xếp và nén xảy ra sớm hơn trong quá trình so với các phiên bản trước, tăng tốc hoạt động và giảm lượng không gian đĩa tạm dùng để trích xuất.

Mọi người thường hỏi liệu một TDE có được giải nén khi nó đang được nạp vào bộ nhớ?
Câu trả lời là không! Việc nén được sử dụng để giảm các yêu cầu lưu trữ của một TDE để làm cho chúng hiệu quả hơn chứ không phải là nén tập tin.

Thay vào đó, một số kỹ thuật khác nhau được sử dụng, bao gồm nén từ điển (nơi các giá trị cột phổ biến được thay thế bằng các giá trị mã thông báo nhỏ), chạy mã hóa chiều dài , khung mã hóa tham chiếu và mã hoá đồng bằng. Tuy nhiên, nén tập tin cũ tốt vẫn có thể được sử dụng để tiếp tục giảm kích thước của một TDE nếu bạn đang lập kế hoạch để gửi email hoặc sao chép nó đến một địa điểm từ xa.


Hình 2 - Kỹ thuật nén được sử dụng để tối ưu hóa cơ sở dữ liệu dạng cột TDE. Mỗi cột trở thành tệp tin được ánh xạ bộ nhớ trong TDE


Để hoàn tất việc tạo ra một tệp TDE, các tệp cột cá nhân được kết hợp với siêu dữ liệu để tạo tệp tin được ánh xạ trên bộ nhớ hoặc để chính xác hơn, một tệp có chứa nhiều tệp tin ánh xạ bộ nhớ riêng lẻ vì có các cột trong nguồn dữ liệu cơ bản . Đây là mấu chốt cho sự thiết kế về kiến trúc – nhận thức của nó.

Bởi vì TDE là một tệp được ánh xạ trên bộ nhớ, khi Tableau yêu cầu dữ liệu từ một TDE, dữ liệu được tải trực tiếp vào bộ nhớ của hệ điều hành. Tableau không phải mở, xử lý hoặc giải nén TDE để bắt đầu sử dụng nó. Nếu cần thiết, hệ điều hành tiếp tục di chuyển dữ liệu vào và ra khỏi RAM để đảm bảo rằng tất cả các dữ liệu được yêu cầu được cung cấp cho Tableau. Đây là điểm mấu chốt rất quan trọng - có nghĩa là Tableau có thể truy vấn dữ liệu lớn hơn RAM hiện có trên máy!

Chỉ có dữ liệu cho các cột được yêu cầu nạp vào RAM. Tuy nhiên, cũng có một số tối ưu hóa khác. Ví dụ, một sự tối ưu hóa mức hệ điều hành điển hình dễ nhận ra được khi truy cập vào dữ liệu trong một tệp tin được ánh xạ trên bộ nhớ đó gọi là sự tiếp giáp, và do đó,nó sẽ đọc trước để tăng tốc độ truy cập. Các tệp tin được ánh xạ bộ nhớ cũng chỉ được tải một lần bởi một hệ điều hành, bất kể có bao nhiêu người dùng hoặc hình ảnh hóa truy cập vào nó.

Vì không cần phải tải toàn bộ nội dung của TDE vào bộ nhớ để chúng được sử dụng, các yêu cầu phần cứng nên do đó chi phí của việc triển khai Server Tableau được giữ hợp lý.

Cuối cùng, nhận thức về kiến trúc không dừng lại ở bộ nhớ - TDE hỗ trợ hệ điều hành Mac OS X và Linux ngoài Windows, và có khả năng tương thích 32 và 64 bit. Nó không có được sự tốt hơn nhiều so với Windows và sự xử lý nhanh chóng trong bộ nhớ dữ liệu động cơ.

TDE đã tạo ra một bước ngoặt đột phá về mặt kỹ thuật và nó sẽ còn được phát triển nhiều và rộng hơn nữa.


Đ.M.H
Nguồn: Sưu tầm
Link :
https://www.tableau.com/about/blog/2014/7/understanding-tableau-data-extracts-part1?__src=liftigniter&__widget=blog-widget&li_source=LI&li_medium=blog-widget

Business Intelligence là gì?

Business Intelligence (BI) là một công cụ giúp doanh nghiệp tăng hiệu quả khi đưa ra các quyết định bằng cách theo dõi, xử lý, lưu trữ và phân tích dữ liệu. Người sử dụng có thể sử dụng các dữ liệu được phân tích để đưa ra các quyết định kịp thời, giảm chi phí, xác định được các cơ hội kinh doanh mới và tăng hiệu quả sản xuất kinh doanh.

Vậy chúng ta có cần Business Intelligence?

Có!

Chúng ta đang sống trong thế giới mà các doanh nghiệp thu thập và lưu trữ số lượng dữ liệu rất lớn. Nếu dữ liệu đó không được sử dụng để phục vụ kinh doanh với mục đích rõ ràng thì nó sẽ trở nên rất nặng nề và là khoản chi phí chìm khổng lồ của doanh nghiệp. Và với lượng dữ liệu rất lớn như vậy, nếu không có phương pháp phân tích đúng thì chúng ta cũng rất dễ mất phương hướng, lạc đường trong quá trình phân tích tốn thời gian và mệt mỏi như vậy. Với BI, quá trình đó được tối ưu hóa, tự động hóa và với công cụ như Tableau, nó còn đơn giản hóa cách sử dụng. Người dùng có được thông tin để ra quyết định chỉ với hai cú click chuột.

Không chỉ các doanh nghiệp lớn mới cần BI, doanh nghiệp nhỏ cũng cần!

Hầu hết các doanh nghiệp coi BI chỉ dành cho các công ty lớn, bởi vì việc áp dụng các phần mềm phân tích đòi hỏi phải xây dựng các trung tâm dữ liệu, thuê các chuyên gia IT tư vấn và vận hành.

Nhưng nếu BI giúp doanh nghiệp lớn đưa ra được các quyết định tốt hơn, thì nó cũng có khả năng giúp các doanh nghiệp nhỏ.

Hiện nay, công cụ BI dành cho doanh nghiệp nhỏ đang phát triển với sự thay đổi rất nhanh. Công nghệ hiện tại giúp đưa cả thế giới vào túi chúng ta bằng các điện thoại thông minh, máy tính bảng và đồng thời chi phí cho giải pháp phân tích cũng được giảm đáng kể. Hiện tại, các doanh nghiệp nhỏ có khả năng áp dụng BI cho các mục đích khác nhau, như phân tích hiệu suất kinh doanh, dự đoán xu hướng tương lai…

Các thành viên trong những nhóm của bạn được quyền xem cùng một dữ liệu từ nhiều địa điểm và cùng thực hiện các quyết định dựa vào dữ liệu đó. BI cho doanh nghiệp nhỏ không đòi hỏi bất kỳ kiến thức lập trình nào và cũng không cần phải đầu tư vào các khóa đào tạo. Tất cả việc cần làm là tạo ra những dashboard (bảng điều khiển) cho mọi người. Thu thập dữ liệu có tính chính xác và có khả năng phân tích được không chỉ phải làm một lần, doanh nghiệp phải định kỳ đánh giá lại các mục tiêu của mình để xác định xem các dashboard BI đã xây dựng có giúp đạt được các mục tiêu đã định hay không. Việc cho phép các nhân viên sử dụng đúng thông tin và chia sẻ dữ liệu sẽ giúp mọi người trong cùng một nhóm nắm bắt được dữ liệu một cách thống nhất, không phụ thuộc vào hoàn cảnh, từ đó sẽ nâng cao hiệu suất làm việc và có các quyết định kinh doanh kịp thời để giúp đạt được các mục tiêu đã đề ra.

Việc mô tả dữ liệu một cách trực quan là phương pháp tốt nhất để tìm hiểu dữ liệu, đặc biệt là khi trình bày với khách hàng hoặc nhà đầu tư. Để trình bày dữ liệu một cách dễ hiểu và có tính thuyết phục, lại không làm người nghe mất sự tập trung, phương pháp được khuyến khích sử dụng là dùng các biểu đồ thông tin. Đây là sự lựa chọn tốt nhất cho BI dành cho doanh nghiệp nhỏ. Với giải pháp thông minh này, doanh nghiệp có thể xem được dữ liệu một cách toàn diện, từ các hoạt động nội bộ với hoạt động kinh doanh mà không cần tốn nhiều thời gian và việc trình bày, thiết kế dữ liệu.

Ngoài ra, BI cũng giúp phát triển doanh nghiệp. Các công cụ BI thông minh có thể giúp doanh nghiệp nhìn ra những xu hướng về hiệu suất trong quá khứ mà có thể chưa được nhận ra. Chủ doanh nghiệp có thể xác định xu hướng quan trọng trong dữ liệu và có tiềm năng phát triển cơ hội kinh doanh mới. Bằng cách phân tích hiệu suất trong quá khứ tại ngữ cảnh phù hợp và hiểu được những yếu tố ảnh hưởng tới kết quả, chủ doanh nghiệp có thể tìm ra chìa khóa quan trọng để tăng trưởng.

Tuy nhiên, xin lưu ý.

Khi các doanh nghiệp nhỏ tìm kiếm giải pháp BI, đây là tín hiệu tốt cho doanh nghiệp vì người quản lý có quan tâm tới phương pháp quản trị tốt hơn. Việc có tất cả dữ liệu được tích hợp và sẵn sàng cho người dùng có vẻ là giải pháp tốt, và các nhà quản lý có thể nghĩ rằng hệ thống họ mua nên đáp ứng mọi nhu cầu trong lương lai, khi doanh nghiệp phát triển hơn. Tuy nhiên, thực tế là giải pháp đơn giản, dễ quản lý có thể áp dụng hiệu quả và thành công trong dài hạn.

Tất nhiên, những người bán hàng nói chuyện ngọt ngào bán sản phẩm từ các nhà cung cấp giải pháp khác nhau cũng đóng một vai trò trong việc gây nhầm lẫn cho người ra quyết định và khiến họ phải lúng túng trước những nhu cầu trực tiếp của họ, và họ bán một hệ thống phức tạp, quá rộng mở cho một doanh nghiệp nhỏ mà về cơ bản chỉ cần phân tích ít dữ liệu.

Do đó, cách tiếp cận tốt nhất cho một doanh nghiệp nhỏ là xem xét một bộ BI cung cấp kết nối dữ liệu tốt nhất cho dữ liệu quan trọng nhất của họ. Các giải pháp BI với các yêu cầu kết hợp trực tiếp và tác động trực tiếp, là một sự thay thế tốt hơn cho các công ty nhỏ.

 

P.X.T(Sưu tầm)

Nguồn: http://www.huffingtonpost.com/laiza-king-/how-business-intelligence_1_b_11207388.html