-
1. Re: 地図機能について。元のデータソースが「●●県△△市☆☆町1丁目1-2」と1列で記録されている場合の地図マッピング表示方法
M.Ikeda01 Oct 28, 2019 9:26 PM (in response to nori_nori)はじめまして。
分割なし、かつ、丁目-番地-号 建物 まである場合、そのままではマッピングできないように思われます。
(郵便番号は情報として持っていませんよね)
過去に、似たような質問がありましたが、下記での対応は難しいでしょうか。
ご査収お願いいたします。
-
2. Re: 地図機能について。元のデータソースが「●●県△△市☆☆町1丁目1-2」と1列で記録されている場合の地図マッピング表示方法
LM Seven Nov 1, 2019 7:27 PM (in response to nori_nori)LM-7です。
質問の趣旨としては、緯度経度に変換せずにTableauの地理的役割を使いたいのではないかと推測しました。
100%は無理ですが、ある程度正規表現を使えば住所から都道府県や市区町村を抜き出すことができます。
参考にしたのは次のサイトです。
なるべく短い正規表現で住所を「都道府県/市区町村/それ以降」に分けるエクストリームスポーツ - Qiita
さて、では[住所]からそれぞれ抽出するにはどうすればよいかと言うと、
[都道府県]
REGEXP_EXTRACT([住所], '(...??[都道府県])')
//都道府県だけを抽出するには過剰だったので修正。
[市区町村]
REGEXP_EXTRACT_NTH([住所], '(...??[都道府県])((?:旭川|伊達|石狩|盛岡|奥州|田村|南相馬|那須塩原|東村山|武蔵村山|羽村|十日町|上越|富山|野々市|大町|蒲郡|四日市|姫路|大和郡山|廿日市|下松|岩国|田川|大村)市|.+?郡(?:玉村|大町|.+?)[町村]|.+?市.+?区|.+?[市区町村])(.?)', 2)
読み仮名データの促音・拗音を小書きで表記するもの - zip圧縮形式 日本郵便
の12万件の住所を読み込んで見ました。それなりに上手くいってそうですね。
地理的役割に割り当ててみました。
91箇所ほど不明になっていますが、12万中91件だけと考えるとそこそこ使えるのではないでしょうか?
頑張って正規表現を洗練させればより精度も上がると思います。
-
住所抽出.twbx 2.2 MB
-