Tableau 9.2で郵便番号の特性を地図で可視化してみる


Tableau 9.2から郵便番号地図が表示可能に

弊社ではデータ分析ツールのTableauを利用しています。オーディエンスデータの重複を分析したり、デモグラフィック属性を表示したりするなどデータの可視化に役立ちますTableauでは9.2から日本の郵便番号を用いて地図を可視化できるようになりました。現状では3桁までの郵便番号に対応してます。

郵便番号はCRM連携情報としてはもちろん、位置情報などからも変換可能ですし、郵便番号ごとのマーケティングデータや統計データの販売も多いため、比較的取り回しのしやすいセグメントです。そこで今回はTableau 9.2で郵便番号ごとの特性を地図で可視化してみることにしました

テスト購買データの作成

表示対象を東京全域としてExcelを用いてランダムのテスト購買データを生成します。
現実にはCV時点でタグから連携したり、TSVファイルなどとしての連携することを想定しています。

東京にある郵便番号はおおむね100~20Xに分布していますので以下の数式で生成します。

=CEILING(RAND()*109,1) + 100

購買金額については10,000円~50,000円とします。

=CEILING(RAND()*40000,1) + 10000

郵便番号

これを数千行作成してCSVファイルとして保存します。

TableauでCSVファイルの取り込み

TableauはデータソースとしてCSVファイルを直接扱うことができます。

「データ接続」からCSVファイルを選択

データ接続

郵便番号を数値として認識させると正しく変換できないので「文字列」に指定

データ接続2

地理的役割で「郵便番号」を指定

データ接続3

郵便番号ごとの特性をTableauで可視化

ここまでで郵便番号ごとのデータを集計する準備が整いました。
さっそく郵便番号ごとの特性をTableauで可視化しましょう。

「マーク」で色塗りマップを指定

データ接続4

「マーク」に郵便番号と購買金額合計を追加して色分け
ヒートマップのように表示するには「色の編集」から「温度の分化」を選びます

データ接続5

平均購買金額を追加してフィルター化

データ接続6

まとめ

以上の操作で指定以上の平均購買金額をもつ郵便番号だけが抽出できます。所有しているデータによって例えば車への興味が強い地域や売り上げの高い地域などを可視化することで、位置情報を用いたオンライン広告配信やオフラインのエリアポスティングなどへの活用が考えられます。

インターネットは全世界から接続されるものではありましたが、地域に根差した広告配信も必要です。リアル行動ターゲティングや地域プロファイルなどエリアを用いた配信を効果的に行うために郵便番号データの可視化が役立つのではないでしょうか。


DACエンジニア採用情報

  関連記事

heatmap
巨大データベースのスケールアップと引越作業

はじめに ビッグデータ解析部でオーディエンスデータ解析基盤の開発、運用を担当している Mike です。 弊社ではインターネット広告配信ログをはじめとする「ビッグデータ」と呼ぶにふさわしいデータボリュームを扱うオーディエンスデータ解析基盤を構築しています。今秋、そのうちの1構成要素である、データサイズ …

Hivemall_Minhash_pic1_thum
HivemallでMinhash!〜似てる記事を探し出そう。〜

こんにちは。俺やで。 前回の投稿に続き(間が空きましたが)、 ビッグデータに対応したHiveで使える機械学習ライブラリ、 「Hivemall」の使い方、第2弾となります。 今回はMinhashという手法について書きたいと思います。 ※前回 【超入門】Hivemallで機械学習 〜Treasure D …

【超入門】Hivemallで機械学習_サムネイル
【超入門】Hivemallで機械学習 〜Treasure Dataでロジスティック回帰編〜

こんにちは。俺やで。 ビッグデータとかデータサイエンティストとかいう言葉が未だブームですね。 (「データサイエンティスト」は下火か。) ビッグデータ扱えるエンジニアも、 統計解析ができるアナリストも、 どっちもできるスーパーマンも世の中にはたくさんいますが、 ビッグデータも統計解析も扱えるインフラは …

6914441342_605f947885
Treasure Dataの新機能(Data Tank)をAudienceOneのレポート機能で利用した話

Data Tankとは? Treasure Dataの新機能でTreasure Dataのプラットフォーム上に構築されたデータマートです。 Tableau等のBIツールとの接続を想定されており、AWSでいうところのRedshift的なものだと考えるとわかりやすいかと。 Data TankはPostg …

logomono-tableau-software-mono
Tableauを利用してMySQLとRedshiftのクロスDBジョインを実現する

はじめに RedshiftやTreasureDataなどのデータマート用のDBにはID単位の解析結果が格納され、ローカルのMySQLにはIDに紐づいた名称マスタが管理されている構成の場合、データマートのクロス集計結果に対してIDに紐づいた名称を付与したいことがあります。 データマート用に用意したDB …

Screen Shot 2014-11-17 at 9.33.19 PM
Amazon ElastiCache/Redisのパフォーマンス確認

はじめに こんにちは、AudienceOne開発部です。AudienceOne開発部ではいわゆるビッグデータと呼ばれる大量のデータをアドホックあるいは定常的に日々ETLだの集合演算だのをする一方で、様々な大規模データ処理ソリューションを継続的に検証しております。 本記事は、その中でもユーザが保持して …

11396380473_26f323b1e4_z
Google BigQuery / Tableauを使ってみた

TableauからGoogle BigQueryへ接続してみました。 弊社で利用しているTreasureDataからデータ出力してBigQueryへロード、Tableauから接続まで実際に行った手順について記載します。 TreasureDataからAmazonS3へデータ出力 まず、データが蓄積され …

tf
ディープラーニングで「顔が似ているAKB48のメンバーを教えてくれるbot」を構築

概要 こんにちは、システム開発部の中村です。 今回は、Facebook Messenger APIを利用して、 画像をアップロードすると、似ているAKB48のメンバーを教えてくれるbotを実装しました。 尚、ディープラーニングやTensorFlowそのものの解説というより、 「エンジンとしてディープ …

sqlカクテル
【入門編】TreasureDataでサイトのアクセス解析をしてみた~第2弾!~

今回もやります、集計クエリ解説シリーズ第2弾!! 前回は、Webログからセッション単位のデータを作成するだけでした。 第2弾では作成したテーブルを元に、より実践的なアクセス解析、サイト分析で使えるHiveQLについて、実際に使用したクエリとともに解説していきたいと思います。 今回やったこと 利用した …

toadstool
【Hivemall入門】RandomForestで毒キノコ推定モデルを作る

こんにちは。俺やで。 今回も前回から間が空いてしましたが、ビッグデータに対応したHiveで使える機械学習ライブラリ、 Hivemallの使い方について、書かせていただければと思います。 なお今回はQiitaのTreasure Data / Advent Calender 2015の12/3日分として …