2 Replies Latest reply on Sep 23, 2018 6:43 AM by JIE GUO

    Tableau sever 数据提取速度在一个时间点之后突然速度变慢,急!

    名氏 无

      先上图:

      数据提取时间变化图.png

      在7月26日之后,数据提取的速度开始猛增,之前的速度很平稳的维持在200多秒

      再上图,是tableau sever的进程程序

      tableau sever进程截图1.pngtableau sever进程截图2.png

       

      附件里面是2018年8月13日backgrounder日志文件里面的数据。

        • 1. Re: Tableau sever 数据提取速度在一个时间点之后突然速度变慢,急!
          Michael Gao

          既然是Tableau Server连接CDH,那么问题可能:

          1. Tableau Server出了问题

          2. Cloudera Hadoop那端出了问题

          3. Tableau Server和Hadoop之间的接口出了问题,包括网络问题,或者驱动程序问题。

           

          逐项分析如下:

          1. 如果是Tableau Server出了问题,那么我们换用另一台Tableau Server机器去进行连接测试,应该得到正常的性能情况(7月20日之前的水平认为是正常水平)。我建议做一下这个测试,安装一个Tableau Server也是很快捷方便的。

           

          2. 在没有进行上面的测试的情况下,我们曾用另一台电脑,使用Tableau  Desktop去连接那个CDH服务器,结果也是很慢很慢,最终也没成功看到数据。从这个现象看,Desktop端连接也有问题,说明不是Tableau Server的问题。

           

          3. 是不是接口的问题呢?我们做2项测试的时候,网络条件不存在问题,连接CDH的驱动接口也是用的Cloudera Hive ODBC驱动。况且我也用该驱动程序连到过我们外网的CDH测试环境,性能正常。所以我认为可以排除网络原因,或者驱动程序原因。

           

          4. 似乎是CDH那端的问题了?怎么验证呢?很简单,另外找一个CDH的测试环境,用某台机器上的Tableau Desktop/Tableau server同时去连两个CDH环境,如果一个慢,一个正常,那么可以肯定是CDH端的问题。如果都一样慢,那么再回头来怀疑Tableau端的问题。

           

          以上建议,请做测试。

           

          此外:

          1. 在Tableau Server上观察到后台有很多Tabspawn.exe进程,这个进程是用来清理Hang住的其他Server服务进程,并创建新的进程。如果Tableau Server在连接CDH过程中一直连不上或者反复通信,那么可能就会出现Hang的状态,被杀掉重启。

          3. 从SQL执行的情况看,只要能连接上CDH,最终还是能够提取出数据来的,所以我怀疑主要问题在于连接建立过程出了问题。

          2. 建议检查CDH那一端的日志,看连接过程中究竟发生了什么。

           

          有测试结果请回来此处更新。

          • 2. Re: Tableau sever 数据提取速度在一个时间点之后突然速度变慢,急!
            JIE GUO

            图中的提取刷新时间是日均值,从现象上看是比之前有较大幅度提升,不过并没有分析到问题根源,应该先看 一下那段时间的后台提取任务,是不是每个时间都比之前的相同计划有了大幅的性能下降,还是因为个别任务的长时间执行,拉升了整体任务的平均执行时间。另外需要特别注意的是,需要关注一下延迟执行时间和实际的任务执行时间,判断到底是因为执行队列过长,等待时间过长导致的,还是单个任务的执行效率降低导致的问题。