D3.jsとその活用事例について


D3.jsとは?

D3とは「Data Driven Document」の略で、データに基づいてドキュメントを操作するための JavaScript ライブラリです。

ご存知の方も多いと思いますが、ちょっとだけD3.jsの基本的な使い方、そして弊社プラットフォームでの利用についてご紹介したいと思います。

D3.jsの基本的な使い方

D3.jsはHighChartsGoogleChartsのようにぽんっとデータを渡せばいい感じのグラフを出してくれるようなライブラリではありません。
もっと低レイヤーのライブラリで、学習コストはそれなりに高いと思います。
が、覚えるととても便利です。(まだまだ僕も使いきれていませんが)

では、さっそく基本的な使い方です。

データをhtmlとして書き出してみましょう。

[code language=”javascript”]
var data = [1,2,3,4];
d3.select("body")
.selectAll("p")
.data(data)
.enter()
.append("p")
.text(function(d) {return "データ: " + d});
[/code]

これを実行すると以下のようにhtmlが生成されます。

d3sample1

  • d3.select(“body”).selectAll(“p”)
    まずD3.jsのメソッドでbodyを選択し、HTML内のすべてのpタグを取得しています。
    ※ただし、この時点ではpタグ存在せず、追加するタグになります。
    ※セレクタの使い方はjQueryとほとんど同じです。

  • .data(data).enter()
    データセットをバインドし、enter()メソッドでデータを保存します。

d3.select(“body”).selectAll(“p”).data(data).enter()
まで実行した場合の戻り値を見てみると、

[code language=”javascript”]
[
0 : {
__data__ : 1
},
1 : {
__data__ : 2
},

]
[/code]

と「__data__」にデータが保存されていることがわかります。

  • .append(“p”).text(function(d) {return “データ: ” + d});
    pタグを挿入し、pタグ内のテキストとして、function(d) {return “データ:” + d}を挿入しています。
    function内のdにはバインドした値が入ってきます。今回は”データ”という文字列を付与してreturnしていますので、
    さきほどの画像のように表示されます。

ヒートマップを作ってみる

基本的な使い方からかなり飛んでいるような気もしますが、D3.jsを使ってヒートマップを作ってみたいと思います。

  • データ

曜日/時間帯ごとのPV数のデータを用意しました。

[code language=”javascript”]
[
{
"week" : "月",
"time" : 0,
"pv": 43605
},
{
"week" : "月",
"time" : 1,
"pv": 24782
},….
{
"week" : "日",
"time" : 23,
"pv": 24782
}
]
[/code]

  • コード

[code language=”javascript”]
var dataset = [{"week" : "月","time" : 0,"pv": 43605}, …];
// カラースケール作成のためdatasetのmax,min,medianを取得
var max = d3.max(dataset, function(d){ return Number(d.pv) });
var min = d3.min(dataset, function(d){ return Number(d.pv) });
// カラースケールを作成
var colorScale = d3.scale.linear().domain([min, max]).range(["#fefcfc","#f8696b"]);

// ヒートマップのテーブルを追加
var tbl = d3.select("body").append(‘table’);

// 横軸の0~23時の配列を生成
var hours = d3.range(24);

// 生成したtableにtheadを追加
var thead = tbl.append(‘thead’);

// theadに0~23時の横軸を入れる
tbl.append(‘th’);
tbl.selectAll(‘class’)
.data(hours)
.enter()
.append(‘th’)
.text(function(d){ return d + " 時" });

// 縦軸のデータを生成する(曜日をキーにする)
var weekdata = d3.nest().key(function(d){ return d.week; }).entries(dataset);
// tbodyを生成し、tbodyにtrを追加する
var tbody = tbl.append(‘tbody’);
var tr = tbody.selectAll(‘tr’)
.data(weekdata)
.enter()
.append(‘tr’)
tr.append(‘th’).text(function(d){ return d.key;});

// 実際のデータをtdに入れる
tr.selectAll(‘td’)
.data(function(d){ return d.values} )
.enter()
.append(‘td’)
// 作成したカラースケールから背景色を設定
.style("background-color", function(d){ return colorScale(d.pv); })
// td内に数値を入れる(3桁区切りでカンマを入れる)
.text(function(d){
var num = new String(d.pv).replace(/,/g, "");
while(num != (num = num.replace(/^(-?\d+)(\d{3})/, "$1,$2")));
return num
})
[/code]

これを実行するとこんな感じになります。
d3sample2

まあ、内容はコメントに書いてあるとおりで、割りと簡単に作れます、と言いたかったのです。

活用事例

最後にD3.jsの活用事例について紹介します。

弊社が提供しているAudienceOne®では、今回紹介したD3.jsを使って、オウンドサイトのリーセンシー/フリークエンシー毎のユニークユーザ数をヒートマップを使って直感的に可視化できる機能を提供しています。

AoneCapture

また、今回のサンプルでは実装しませんでしたが、Javascriptのイベントも自由に設定することができるため、ドラッグ操作で任意の範囲選択の数値を出力といったことも分析できます。

気になる方は、ぜひお問い合わせください。AudienceOne®


【2015/08/27 追記】
DAC AD TECH BLOGで、AudienceOne®について詳しく紹介しております。
ぜひご一読ください。顧客を可視化し、データドリブンなマーケティングを支援/「AudienceOne」


DACエンジニア採用情報

  関連記事

HivemallでMinhash!〜似てる記事を探し出そう。〜

こんにちは。俺やで。 前回の投稿に続き(間が空きましたが)、 ビッグデータに対応したHiveで使える機械学習ライブラリ、 「Hivemall」の使い方、第2弾となります。 今回はMinhashという手法について書きたいと思います。 ※前回 【超入門】Hivemallで機械学習 〜Treasure D …

Treasure Dataで大規模なマスタデータを扱う際にはtimeカラムインデックスを活用しよう

DACではTreasure Dataを利用して各種データの蓄積や集計を行っています。Treasure Dataは時系列のデータを扱うのに特にすぐれたアーキテクチャなのですが、セグメントIDとユーザーIDの組み合わせといった大量のマスタデータを利用した計算にも利用することもできます。そのような場合にt …

トレジャーデータの新機能「Data Connector」でクライアントレスなビッグデータ連携を実現する

トレジャーデータは、スキーマレスな大量のデータ(ビッグデータ)をパブリッククラウド上に保管して集計や抽出をするためのサービスなのですが、他システムからの連携データをトレジャーデータのテーブルに格納するまでが一苦労でした。 他システムとの外部連携を行う場合、一般的にローカルサーバー内のストレージを外部 …

初心者がRailsで開発 – deviseでユーザー認証設定 –

こんにちは、2年目のYukaです。 開発部所属でありながら実は、、 実際に自分で手を動かして開発する機会がなかなかありませんでした。。 しかしついに、、、 開発初心者がRailsでWebアプリの開発に挑戦します!! 今回のゴールは社内でも使用しているGoogleアカウントで簡単にログインができるよう …

【入門編】TreasureDataでWEBログ分析をしてみた

この記事は Treasure Data Advent Calendar 2015 – Qiita の24日目の記事です。 こんにちは。 今回はWEBログの集計や解析をする際によく使うHiveQLのクエリと、UDF(User Defined Functions)について実際の集計クエリを使 …

【未経験からのRuby on Rails – 第2回】Rubyのプログラムを書いてみる(Mac)

こんにちは。新卒1年目のmatsuariです。 前回はRubyとは何か、簡単にご紹介をしましたが、 今回は実際にRubyファイルを作成して、プログラムを書いてみるところまでご紹介していけたらと思います。 Mac環境のプログラミング初心者向けです。 はじめに、Rubyのプログラムを書くためのファイルを …

【小ネタ】JSで要素の組み合わせを列挙する

下記のような、キーの数や要素数が可変のデータの組み合わせを、列挙するjavascriptコードです。 pythonにはitertoolなどの順列・組み合わせ計算を行う定番ライブラリがあるようです。 やっている事ですが、イメージとしては組み合わせを数列に置き換えています。 1桁目が2進数、3桁目が3進 …

【Hivemall入門】RandomForestで毒キノコ推定モデルを作る

こんにちは。俺やで。 今回も前回から間が空いてしましたが、ビッグデータに対応したHiveで使える機械学習ライブラリ、 Hivemallの使い方について、書かせていただければと思います。 なお今回はQiitaのTreasure Data / Advent Calender 2015の12/3日分として …

Tableauを利用してMySQLとRedshiftのクロスDBジョインを実現する

はじめに RedshiftやTreasureDataなどのデータマート用のDBにはID単位の解析結果が格納され、ローカルのMySQLにはIDに紐づいた名称マスタが管理されている構成の場合、データマートのクロス集計結果に対してIDに紐づいた名称を付与したいことがあります。 データマート用に用意したDB …

Treasure Dataの新機能(Data Tank)をAudienceOneのレポート機能で利用した話

Data Tankとは? Treasure Dataの新機能でTreasure Dataのプラットフォーム上に構築されたデータマートです。 Tableau等のBIツールとの接続を想定されており、AWSでいうところのRedshift的なものだと考えるとわかりやすいかと。 Data TankはPostg …