講義名 データ管理論 ≪◇学部≫
講義開講時期 前期
曜日・時限 木4
単位数 2

担当教員
氏名
佐良木 昌

学習目標(到達目標) ITパスポート等の資格試験でも出題されるデータベースに関する知識を,基本から実践まで体系的に身につけることができる。

対応DP及びCP:4,5,8
授業概要(教育目的) 企業はコンピュータを使ってさまざまデータを管理しており,データ管理・活用・分析能力がビジネスの生命とも言える。この講義では,データを管理するデータベース技術について,その考え方,基礎的な知識,利用事例,最新動向を解説する。また,データベースに関係するWeb関連の最新知識についても説明する。
情報技術論を履修しているか,同等の知識を持っていていることを前提とし,また,ワープロ,表計算ソフトの基本機能を利用できるスキルを要する。
授業計画表
 
項目内容
第1回データと情報情報処理におけるデータの定義および情報および情報量の定義と意味について学びます。データ形式(CSV)の知識を習得しデータを自分で作成します。
【準備学習】90分 Excelの基本操作および関数が使えるかどうかについて、自己検証をしてくること。なお十分でないときには、授業開始までに修得を完了してくること(90分×3~6)。
【事後学習】60分 データ形式についての理解を徹底します。
第2回データベースの活用事例データベースを利用した代表的なサービスについて説明します。住所や地図情報を入手してデータ形式を整える実習を行います。
【準備学習】90分 配布プリントNo. 1の第1章を熟読しデータベースついての理解を深めます。
【事後学習】60分 前回に入手したCSVデータの正規化を試みてくること。
第3回データベースの種類と表現法高速にアクセスでき,整合性のあるデータの表現法を学び、そのデータを分析する手法を実践します。
【準備学習】120分 CVSを表計算ソフトに読み込み数値化し集計や分析のツールを使って分布や傾向を見える形にしておくこと。
【事後学習】180分 分析結果(数値集計およびグラフ作成を含む)をレポートⅠとしてまとめます。
第4回関係データベースの基本的な仕組み一般的なデータベースとして,最もよく使われる表現法について学び、関係演算の基礎を理解します。主キーや関係表の基本概念も学びます。
【準備学習】120分 配布プリントNo. 1の第2章を読んでくること。
【事後学習】60分 CSVデータを関係データベースにインポートしてくること。
第5回関係データベースとSQL関係演算の結果をテーブル間の関係で確認します。SQL記述の初歩を学びます。
【準備学習】120分 SQL記述の解説箇所(配布プリントNo. 1)を熟読しステートメントの構成について理解しておくこと。
【事後学習】120分 配布プリントNo. 1第2章のSQLプログラム例を参照して演習課題に取り組みます。
第6回データベースソフトの利用データベース専用ソフトを用い,実際のデータベース操作を経験します。データの整合性とリレーションシップに関連させてクエリ操作ができるところまで実習を繰り返します。
【準備学習】90分 Accessの起動とデータベースファイルの初期作成・外部データのインポートを体験してくること。
【事後学習】120分 配布プリントNo. 1第2章の演習課題に関係する箇所を熟読して課題をやり遂げます。
第7回データベースの検索関係演算および論理演算と検索条件の設定について学びます。
【準備学習】90分 配布プリントNo. 1の第3章を熟読します。クエリにおける条件設定の仕方およびリレーションシップの形成について復習してくること。
【事後学習】90分 フィールド内検索を実行してクエリにおける条件設定を、SQLの記述で確認してくること。
第8回データベースソフトによる問題解決例題を通して,データベースで問題解決します。条件抽出、リレーションシップの設定方法について実習で学びます。演算結果を、分析し、集計表やグラフで表現する技法について実習します。
【準備学習】90分 配布プリントNo. 1の第4章を熟読すること。
【事後学習】180分 クエリによる抽出データから知見を引き出してみること。分析結果(クエリおよびグラフ作成を含む)をレポートⅡとしてまとめます。
第9回データベースとデータウェアハウス大規模データベースの利用法、データハウスウェアの運用について解説します。
【準備学習】90分 配布プリントNo. 1の第5章を熟読すること。
【事後学習】60分 政府統計局の大規模データベースにアクセスしデータのダウンロードを試してみること。
第10回データマイニングの基礎大量のデータやテキストから情報を発見したりテキストの数量化技術を概観します。
【準備学習】60分 配布プリントNo. 2を熟読すること。
【事後学習】120分 テキストエディタの正規表現ツールを使って情報抽出のスクリプトを記述してデータ発見を体験してみること。
第11回データマイニングの応用大量のデータから必要とするデータの抽出方法と有益な知見を得る方法を学びます。集計技術やABC分析・ディケイド分析については事例研究を紹介します。
【準備学習】120分 配布プリントNo. 2の演習課題に関連する箇所を熟読すること。
【事後学習】90分 配布データをインポートしてグループ化を実施し、またピ゚ボットテーブルを作成します。
第12回Web上のデータベースとXMLによる記述電子図書館でのデータベース利用・地図情報システムおよびそれらの記述方法を外観します。
【準備学習】60分 学術情報センターの蔵書検索システムにアクセスし文献検索を経験してくること。配布プリント第5章を熟読してくること。
【事後学習】60分 XMLによるデータ処理についての実例をWebで体験すること。
第13回検索の高速化技術大量のデータを実用的な速度で利用する仕組みを学びます。正規表現による高速検索について解説します。
【準備学習】120分 配布プリントNo. 3の正規表現関連を熟読すること。
【事後学習】90分 検索ロジックの組み合わせについて実際の検索作業に応用してみること。
第14回データベースの応用データベースに関する最新の話題をとりあげます。ビッグデータやAI(機械学習とデータベース依存)との関連も採り上げます。
【準備学習】90分 配布プリントNo. 3のビッグデータに関連する箇所を熟読すること。
【事後学習】120分 紹介したビッグデータの実例を参照すること。機械学習の数理的手法について調べること。
第15回まとめと総復習

小テスト
学んだ項目を整理し達成度を検証し自らの到達点を確認します。
【準備学習】240分 配布プリント・学習ノートを読み返してくること。
授業形式 基本の知識については講義形式で進め,必要に応じてコンピュータを用いた実習を行う。
評価方法
定期試験 レポート 小テスト 授業への
参画度
その他 合計
0% 20% 20% 40% 20% 100%
評価の特記事項 授業への参画度および課題提出を重視します。
テキスト 佐良木昌・新田義彦『正規表現とテキストマイニング』明石書店 2,800円+税
オフィスアワー(授業相談) 木曜 12:35~12:55 実習室にて
事前学習の内容など,学生へのメッセージ 【注意事項】

「Excelの基本、特に関数の使い方」は履修済みであること。授業をフォローするためには必ず履修済みであることを要します。

関数の基本ができていないうちに受講して授業について行けないという事態をさけるために、特に留意してください。