いま必要なのは「アナリティクスアプローチ」

     - ビッグデータ, マーケティング  


こんにちは。
ビッグデータ解析部のakiです。

解析部で、Markezineでの連載をはじめましたのでご紹介です。

いま必要なのは「アナリティクスアプローチ」、ビッグデータ活用の課題とこれから
(http://markezine.jp/article/detail/21293)

マーケターのかた向けに、今後のビッグデータ活用についてデータサイエンティストの立場から説明していく連載です。
上記では第1回目として把握しておくべきビッグデータ活用の現状と課題、今後目指すべき方向性を紹介しています。

第1回の概要としては以下のような流れ。

■まずビッグデータ活用の現状把握

  • 「いまビッグデータの活用はどのくらい進んでいるのか。」
  • 「レベルでいうと、一般的にどのくらいなのか。」
  • 「そして今のレベルには、どんな課題があるのだろうか。」

ということを簡単に整理しています。

■アナリティクスアプローチ

そしてこれから。

  • 「次のレベルは、どんな状態なのか。」
  • 「いまのレベルから、次のレベルにステップアップするには。」

といったことについて解析部の考えを説明しています。

■すごくサマリ

いいたいことは、
従来のヒューリスティックなデータ活用も大事だけど、ちょっと視点の違う方法論としてアナリティクス・アプローチも今後ますます重要ですよね。
ということです。

これまでも多くの企業でそういう研究や取り組みはされてきているし、よく記事などでも拝見しますが、それが本格化していく環境が整いつつあると思います。

■本格化のきざしは、例えばここに見える

まず、インフラの発達。
解析基盤、ネットワーク、クラウドストレージなど。
「技術的には可能なんだけど、やりたいんだけど、インフラコストが…」といった事が急速に解消されつつあります。

次に、活用事例。
活用事例が増えてくると活用イメージが持てるようになって、トライしてみる企業が加速的に増加していきます。
イノベーター理論でいうと、アーリーアダプターに相当する企業がこれまでかなりトライを重ねてきて、アーリーマジョリティがいま積極的に検討を始めている。
そんな段階に入ってるな、と感じています。

そして、やらなければ負けるビジネス環境。
自社はどんな価値を市場や顧客に提供するのか、という大上段の差別化がもちろん企業としては存在意義を問われるところですけれど、それとは別の次元で、活用できる資産をちゃんと活用する。持っているデータや入手できるデータをちゃんと使いこなす。
というところでの戦いも激化している中で、遅れをとればナレッジが得られるのが遅れる、ノウハウの蓄積が遅れる。
提供したい価値を市場や顧客により良く届けるために、いまデータに取り組むべき段階になってきています。

こんな要素が織り重なって、いまがまさに、劇的にビッグデータ活用が進んでいくパラダイムシフトのときだと感じます。
ビッグデータ解析部としても、我々がそのリーダーシップをとっていくのだという気概でがんばっていきたいと思います。

■おわりに

…ちょっと固い話になりましたけど。

Markezine連載、月に1回くらいのペースで投稿していきますので、こちらともども、どうぞよろしくおねがいします。

いま必要なのは「アナリティクスアプローチ」、ビッグデータ活用の課題とこれから
(http://markezine.jp/article/detail/21293)

DACエンジニア採用情報

  関連記事

PyStanによるはじめてのマルコフ連鎖モンテカルロ法

はじめに こんにちは。システム開発部の中村です。 社内で行っている『データ解析のための統計モデリング入門』(所謂緑本)の輪読会に参加した所、 大変わかりやすい本だったものの、Macユーザには悲しい事に実装サンプルがWinBUGSだったため、 9章の一般化線形モデルのベイズ推定によるアプローチをPyt …

HivemallでMinhash!〜似てる記事を探し出そう。〜

こんにちは。俺やで。 前回の投稿に続き(間が空きましたが)、 ビッグデータに対応したHiveで使える機械学習ライブラリ、 「Hivemall」の使い方、第2弾となります。 今回はMinhashという手法について書きたいと思います。 ※前回 【超入門】Hivemallで機械学習 〜Treasure D …

トレジャーデータの新機能「Data Connector」でクライアントレスなビッグデータ連携を実現する

トレジャーデータは、スキーマレスな大量のデータ(ビッグデータ)をパブリッククラウド上に保管して集計や抽出をするためのサービスなのですが、他システムからの連携データをトレジャーデータのテーブルに格納するまでが一苦労でした。 他システムとの外部連携を行う場合、一般的にローカルサーバー内のストレージを外部 …

D3.jsとその活用事例について

D3.jsとは? D3とは「Data Driven Document」の略で、データに基づいてドキュメントを操作するための JavaScript ライブラリです。 ご存知の方も多いと思いますが、ちょっとだけD3.jsの基本的な使い方、そして弊社プラットフォームでの利用についてご紹介したいと思います。 …

Tableauを利用してMySQLとRedshiftのクロスDBジョインを実現する

はじめに RedshiftやTreasureDataなどのデータマート用のDBにはID単位の解析結果が格納され、ローカルのMySQLにはIDに紐づいた名称マスタが管理されている構成の場合、データマートのクロス集計結果に対してIDに紐づいた名称を付与したいことがあります。 データマート用に用意したDB …

巨大データベースのスケールアップと引越作業

はじめに ビッグデータ解析部でオーディエンスデータ解析基盤の開発、運用を担当している Mike です。 弊社ではインターネット広告配信ログをはじめとする「ビッグデータ」と呼ぶにふさわしいデータボリュームを扱うオーディエンスデータ解析基盤を構築しています。今秋、そのうちの1構成要素である、データサイズ …

【Hivemall入門】RandomForestで毒キノコ推定モデルを作る

こんにちは。俺やで。 今回も前回から間が空いてしましたが、ビッグデータに対応したHiveで使える機械学習ライブラリ、 Hivemallの使い方について、書かせていただければと思います。 なお今回はQiitaのTreasure Data / Advent Calender 2015の12/3日分として …

【入門編】TreasureDataでサイトのアクセス解析をしてみた~第2弾!~

今回もやります、集計クエリ解説シリーズ第2弾!! 前回は、Webログからセッション単位のデータを作成するだけでした。 第2弾では作成したテーブルを元に、より実践的なアクセス解析、サイト分析で使えるHiveQLについて、実際に使用したクエリとともに解説していきたいと思います。 今回やったこと 利用した …

【超入門】Hivemallで機械学習 〜Treasure Dataでロジスティック回帰編〜

こんにちは。俺やで。 ビッグデータとかデータサイエンティストとかいう言葉が未だブームですね。 (「データサイエンティスト」は下火か。) ビッグデータ扱えるエンジニアも、 統計解析ができるアナリストも、 どっちもできるスーパーマンも世の中にはたくさんいますが、 ビッグデータも統計解析も扱えるインフラは …

GoogleスプレッドシートからTreasureDataへデータを取り込む

AudienceOneの開発を担当しています。skryoです。 またまたTreasureDataネタですが、今回はGoogleスプレッドシートからGoogleAppsScriptを使ってTreasureDataへデータを取り込む手順を紹介したいと思います。 なぜ? Googleスプレッドシート上でマ …