ビックデータを統計手法で分析

テーマ
ビッグデータサイエンス

大槻ゼミ

分類
専門研究>産業経営学科>経営情報プログラム
担当教員
大槻 明 Akira OTSUKI
ゼミサイト
http://bigdata55.web.fc2.com/
ゼミの内容
  • 情報
  • 数学・統計
ゼミの特徴
  • じっくり研究型

Q. ゼミではどんなことを研究していますか?

ビッグデータには、TwitterなどのSNSデータ・センサーデータ・経済データおよびLOD(Linked Open Data)などさまざまなものが含まれます。当ゼミでは、これらのデータを、統計手法などを用いて分析し、有意な知見などを導出することを主な研究コンセプトとしています。

参考までに本ゼミ生が取り組んでいる研究テーマの一例を以下にご紹介します。

  • 「暇」ツイートテキストマイニングによるサイレントカスタマー分析
  • 災害前兆ワードを用いた防災警報マップの開発
  • トラッキングデータとSNSセンチメント特徴量の重回帰分析によるサッカー嗜好分析
  • 発生周期、地盤の状態、火災・倒壊によるハザード係数
  • 新語辞書LOD(Linked Open Data)の構築
  • 宮崎県が取り組むべき地域づくりのビジョン試案
  • メディアミックスの効果測定法に関する研究
  • 47都道府県から見る幼稚園・保育園の格差分析
  • 日大経済卒業生データベースの研究開発
  • 若者のコメ離れを防ぐための調査分析

Q. ゼミの様子は?

当ゼミでは、次に示すような学修ステップ(イメージ)で卒論執筆まで目指します。
1)2年生前期:データ収集および分析に関する基礎技術や知見などについて学びます。さらに、先輩の研究発表やディスカッションに参加することで、研究の進め方などについても学びます。夏期休暇期間中には、個人の研究テーマ案を考えます。
2)2年生後期~3年生前期:1)の継続に加え、個人の研究テーマ案に基づいた研究を開始します。数週間に1度程度のペースで、研究進捗を発表形式(プレゼンテーション)で報告し、他のゼミ生とディスカッションします。また、このときに教員が研究・プレゼンなどの指導を行います。
3)3年生後期:3年前期までに1)の基礎技術・知見への学びが終わり、3年後期からは本格的に個人研究に入ります。
4)4年生:3)の個人研究を継続するとともに、研究成果の出た学生から順次学会発表を行い卒業論文の執筆に入ります。

Q. ゼミの特徴は?

「ビッグデータ」という用語自体は世間でもかなり認知されるようになりましたが、そのビッグデータを分析するデータアナリストの人材はかなり不足しているといわれています。当ゼミはこのデータアナリストを養成するゼミです。

また、当ゼミに入室した段階でICT(情報通信技術)や統計の知識がなかった人でも、真面目でやる気のある人は皆、学会全国大会で発表できるほどの研究成果を残すまでに成長しています。当ゼミの研究活動はハードかもしれませんが、教員の指導にきちんと従い、真面目かつ主体的に研究に取り組めば、社会で活躍するための武器を身に付けることができます。

これまでの卒業論文・研究論文のテーマ例
2015年度からの開講のため、まだありません。

1年間の主なイベントスケジュール

04月 新ゼミ生歓迎会
05月 学会参加(合宿に代わるもの)および当該者の発表
07月 研究テーマ報告会(2年生)
01月 ICT系企業訪問(実施しない年度もあります)
03月 学会参加(合宿に代わるもの)および当該者の発表・卒業生送別会

学会参加は、5月または1月に行う予定です。

OB・OGの就職業界TOP3

1期生は2019年に卒業予定です。

取得者の多い資格

  • MOS試験(マイクロソフト オフィス スペシャリスト)
  • ITパスポート試験

学生へのメッセージ

やる気があり真摯に取り組めば、必ず成果を残すことができます。最後まで責任をもって主体的にやり遂げることができる学生と共に学びたいと考えています。

研究成果

Twitter APIを用いて数十万件のツイートを取得し、これらのツイートから、「どこで何を買ったか」という情報と、「位置情報(市区町村情報)」を抽出して、この2つの情報をコレスポンディング分析(数量化理論第Ⅲ類)することで、都道府県ごとに多く見られる購買傾向を分析しました。この分析結果を行列表にまとめたイメージが図1です。図1では行が市区町村情報を、列の最上段が「どこで」、その下の段が「何を買ったか」という購買情報を表わしています。今回のイメージでは、「何を買ったか」はケーキで統一しています。こうすることで、「ケーキをどこで買う傾向があるか?」といった視点で類似地域をクラスタリングすることができるようになります。これを図示したものが図2です。

図1コレスポンディング分析のイメージ

図2 クラスタリングのイメージ

さらに、図2の結果を日本地図や市区町村地図にマッピングしたものが図3になります。図3のマップを用いて類似地域を分析することで、例えば、「クリスマス商戦のケーキ販売戦略において、他の市区町村と同じ戦略を展開できるかもしれない」、といったマーケティング分析が行えるようになるかもしれません。

図3 類似地域を可視化したイメージ

→日本大学 研究情報データベース


ゼミ生の学会発表の様子1(日本災害情報学会第18回学会大会)


ゼミ生の学会発表の様子2(情報知識学会第24回年次大会)


ゼミ生の学会発表の様子3(情報知識学会第24回年次大会)