12 Replies Latest reply on Jan 19, 2020 9:55 PM by Hideki Tamura

    ヒストグラムのビンについて

    Hideki Tamura

      初めまして、最近Tableauを使用し始めたヒヨッコです。

       

      早速、掲題の件について、質問させて下さい。

      メジャーを利用し、ヒストグラムを作成したところ、ビンがメジャーの最大値に設定されて表示されました。

      作成方法が間違えているのでしょうか?そもそも、ヒストグラムの概念について認識を間違えているのでしょうか?

       

      ちなみに、計算フィールドを作成し、ヒストグラムの幅は算出しているのですが、この値は手打ちで設定するしかないでしょうか?

        • 1. Re: ヒストグラムのビンについて
          shuhei saito

          できればスクリーンショットでも付けていただけると、どの部分についての話なのか分かりやすいです。

           

          メジャーからビンを作成するときにこのような画面が表示されますが、

          ビンのサイズ(図内の赤枠で囲んだところ)がデータ上の最大値になってしまうということでしょうか?

          • 2. Re: ヒストグラムのビンについて
            Hideki Tamura

            saito様

             

            コメントありがとうございます。

            申し訳ありません、最大値になってしまうというのは勘違いでした。

            下のスクリーンショットみたいになってしまいます。

             

            20200116.png

            • 3. Re: ヒストグラムのビンについて
              shuhei saito

              ビンを使ってヒストグラムを作成するときは次のようにビンを列に、カウントを行に置きます。

              ヒストグラムの作成 - Tableau

               

              同じように配置しても単一のビンしか表示されないでしょうか?

              • 4. Re: ヒストグラムのビンについて
                Hideki Tamura

                ご返信ありがとうございます。

                 

                そうですね。

                作成方法としては、左にあるメジャーのリストから項目を選択し、右の表示形式からヒストグラムを選択すると、先ほど挿入したスクリーンショットになります。

                選択した項目のデータがおかしいのでしょうか?

                個人的な認識では、いくらデータがおかしくても、数値の幅、データ量がある程度あれば、1本にはならないと思っているのですが。。。

                • 5. Re: ヒストグラムのビンについて
                  shuhei saito

                  先のスクリーンショットを見るに、おそらくビン(階級)の数は52個くらいあるはずです。

                  データがフィルタリングされているか、ビュー内に別の粒度が紛れ込んでいることが考えられます。

                   

                  ワークブックを添付していただくか、画面全体のスクリーンショットでもいただければもっと詳しいことが分かると思います。

                  • 6. Re: ヒストグラムのビンについて
                    Hideki Tamura

                    フィルタはかけていますが、関係してくるんですか?

                    フィルタリングされたデータから、ビンを作ってくれる訳ではないのでしょうか?

                    • 7. Re: ヒストグラムのビンについて
                      shuhei saito

                      関係します。

                      ビンはデータソース内のメンバーを階級に分類しますので、例えばこんなビンを作った後に

                       

                      こんなフィルターをかけると

                       

                      こうなります。

                      • 8. Re: ヒストグラムのビンについて
                        Hideki Tamura

                        では、そのせいかと思います。

                        FIXEDを使ったりすれば、出来るものなのでしょうか?

                         

                        また、ビンのサイズは手打ちのみでしょうか?

                        項目の値を設定することは出来ないでしょうか?

                        • 9. Re: ヒストグラムのビンについて
                          shuhei saito

                          実現したいことがよく理解できていないので、できるかできないか・FIXEDが適切なのかはなんとも言えません。

                           

                          ヒストグラムはひとつの定量データ(メジャー)の分布を見るためのものです。

                          分布、すなわち散らばり具合を見ようとしているのであれば、まずはフィルタリングせずに全体を見るべきだと思います。

                          そのうえで特定の階級(ビン)に着目するのであればその階級のみにフィルタリングし、必要であればビンのサイズを縮小して掘り下げていくという考え方もあります。

                           

                          現時点でフィルタリングがなされており、その中でヒストグラムを作るのであれば、ビンのサイズを縮めてはいかがでしょうか。

                           

                          また、

                          また、ビンのサイズは手打ちのみでしょうか?

                          項目の値を設定することは出来ないでしょうか?

                          については、ビンのサイズは人間が任意の定数を入力します。パラメーターを参照させることはできますが、パラメーターも人間が入力するので同じことです。

                          定数ではなく何かしらの計算結果を自動的に適用することは、通常のビンの機能ではできません。

                          これをやりたいときは、標準のビンの機能をつかうのではなく、計算フィールドによって階級分け(動的グルーピング)を行います。

                           

                          次の図は計算フィールドによって階級分けを行った一例です。

                          上のグラフは通常のビン機能で作成しています。これは幅が固定されているため、フィルター範囲が狭まるほど相対的に大きくなり表示される階級数が減ります。

                          対して下のグラフはビンのサイズをフィルター範囲に応じて変動するような計算式で作成しています。そのため、数学的に提案される階級数を採用します。

                           

                          gifgif (8).gif

                          1 of 1 people found this helpful
                          • 10. Re: ヒストグラムのビンについて
                            Hideki Tamura

                            saito様

                             

                            twbxまで添付していただきありがとうございます。

                            フィルタに関しては、種類で分けたく使用しています。

                            スーパーストアのデータでいえば、売上でカテゴリ別に見たいときになるのですが

                            添付していただいた、動的ヒストグラムなら見れそうです。

                             

                            添付していただいたファイルについて質問させて下さい。

                            作成していただいた項目で

                            階級幅:

                            ROUND(

                                ({MAX([売上])} - {MIN([売上])}) /

                                (3 + LOG({COUNTD([売上])}, 2) * LOG({COUNTD([売上])}))

                            )

                            がありますが、分子の「{MAX([売上])} - {MIN([売上])}」は範囲を求めていると思いますが

                            分母の「(3 + LOG({COUNTD([売上])}, 2) * LOG({COUNTD([売上])}))」はどういった計算になりますでしょうか?

                            「(1 + LOG({COUNT([売上])}, 2)」なら、スタージェスかな?と思うのですが...

                             

                            また、COUNTDを使用されていますが、COUNTではないのでしょうか?

                             

                             

                            長々と申し訳ないですが、よろしくお願い致します。

                            • 11. Re: ヒストグラムのビンについて
                              shuhei saito

                              階級幅は一例として載せただけなので、スタージェスの公式を採用したいのであれば、そのように任意の計算をすればよいと思います。

                               

                              前の投稿に掲載した式は、Tableauがビンサイズの提案を行う際に計算している式をそのまま記述しています。

                              下図の式中の n は「表に含まれる不連続行の数」と書いてあってちょっと意味不明ですが、これは Distinct count of the field を指しています。

                              そのため、COUNTではなくCOUNTDを使用しています。

                               

                              連続メジャーから連続の bin を作成する - Tableau

                              2 of 2 people found this helpful
                              • 12. Re: ヒストグラムのビンについて
                                Hideki Tamura

                                saito様

                                 

                                返信ありがとうございます。

                                 

                                よくよく考えてみると、ビンの幅を決めることろですもんね

                                countではなく、distinct countですね。

                                 

                                長々とすみませんでした。とりあえず、再チャレンジしようと思います。

                                ご親切にありがとうございます。わかりやすくて、大変助かりました。