5 Replies Latest reply on Apr 17, 2017 7:20 AM by Shinichiro Murakami

    重複したデータを削除する方法

    Kazuya Niikura

      こんにちは、にいくらと申します。

      どなたかご存知の方はご教授お願いいたします。

       

      現在総務省のデータを用いて、世帯数及び該当する世帯の人口を作成しました。

      これらと市区町村のポリゴンデータを用いて以下のようなLocalIDを結合句とした共有結合を行っています。

      世帯数・世帯人員のキャプチャ.JPG

       

      この状態で世帯数と人口に関してビジュアライズを行っていたのですが、値が重複していることから以下のように正確な結果が出ません。

      世帯数・世帯人員のキャプチャ2.JPG

      この状態から、正しい集計結果が出す方法を教えてください。

      お手数をお掛けしますが、よろしくお願いいたします。

       

      メッセージ編集者: Kazuya Niikura

        • 1. Re: 重複したデータを削除する方法
          Shinichiro Murakami

          にいくらさん

           

          政府の統計データは本当に、これでもかってくらいにユーザーアンフレンドリーで笑ってしまいますよね。

           

          で、これはタブローのテクニック云々の話ではなく、統計データの説明を見ないとわかんないですね、

           

          18歳未満には当然6歳未満が含まれますし、一般には全部入ってるのか、一般自体が独立してるのか?

          市町村の区切りのほうも重複がありそうですし。。

           

          元の統計資料を特定してもらったら調査することもできますが。

           

          むらかみ

          • 2. Re: 重複したデータを削除する方法
            Kazuya Niikura

            むらかみさん

             

            政府の統計データはTableauで分析しやすいビジュアライズを考える時間より、Tableauに取り込むためにデータを整える時間が掛かりますね。

             

            整える前のデータをアップロードしました(世帯人員、6歳未満・18歳未満世帯員の有無.csv.zip)

            このデータから、世帯数と世帯人員数を2つのシートに分割しています。

            • 3. Re: 重複したデータを削除する方法
              Shinichiro Murakami

              にいくらさん

               

              ご気分を悪くされたら申し訳ないですが。。

              作業の下請け的なことは避けたいのですが、具体的には何をお望みでしょうか。

              私の認識としては、ここではTableauに関わる技術的な質問と解答に限った方が良いと考えてます。

              もちろん多少周辺のことは含まれますが、これはちょっとヘビーそうなのと、下請け感を感じてしまいます。

              時間があれば見てみますが、取り掛かるのにはちょっと躊躇します。

               

              むらかみ

              • 4. Re: 重複したデータを削除する方法
                Kazuya Niikura

                むらかみさん

                 

                この統計データで重複を排除するためにどのようなことをしたら良いかアドバイスをもらいたいと思いアップロードしました。

                私が努力するべきところを押し付ける真似をしてしまい、心よりお詫び申し上げます。

                今回の件は私自身で何とかできないか、いろいろ試していきたいと思います。

                今後はより質問する内容を吟味した上で投稿していきます。

                 

                失礼なことをしてしまい、大変申し訳ありませんでした。

                 

                にいくら

                • 5. Re: 重複したデータを削除する方法
                  Shinichiro Murakami

                  にいくらさん

                   

                  お気にされることはありません。要はバランスでして。。。私の書き方のほうがちょっと適切でなかったかも知れません。申し訳ありません。

                  厳密にこれはOKで、これはNGって線は引きにくいんですよね。正直こちらも、その時に余裕があればできてしまう時もありますし。。

                  ただ、先に書いたとおり、テクニカルなところから距離があるものは、避けさせていただきました。(ほかの人がトライされるかもしれませんが)

                   

                  統計データの中身に関しては、直接総務省に問い合わせるのも一手かと思います。

                  あちらもデータに関してはプロなので、それなりの回答が得られると思います。(少数ではありますが過去の経験から)

                   

                  今後とも、ご遠慮なく質問投稿してください。

                   

                  むらかみ