一、课程基本信息
开课单位 信息与网络工程学院 课程类别 个性拓展课程 课程编码 开课学期 GT28301 7 课程名称 大数据分析技术(Big data analysis technology) 开课对象 学时/学分 36(24+12)/2 先修课程 多元统计分析、最优化技术、云计算技术 课程简介:(350字以内) 信息与计算科学 大数据给数据分析和处理带来了前所未有的机遇和挑战。本课程介绍大数据分析中一些算法:数据的稀疏和低秩表达,压缩感知,数据降维,机器学习和数据挖掘算法,随机优化算法,并行计算等。 其中,数据降维占重要角色。涉及到八种分类方法:主成分分析(PCA)、线性判别分析(LDA)、等距映射(Isomap)、局部线性嵌入(LLE)、Laplacian 特征映射、局部保留投影(LPP)、局部切空间排列(LTSA)、最大方差展开( MVU)等 作为大数据技术入门课程,旨在为学生搭建起通向“大数据知识空间”的桥梁和纽带,以“构建知识体系、阐明基本原理、引导初级实践、了解相关应用”为原则,为学生在大数据领域“深耕细作”奠定基础、指明方向。课程将系统讲授大数据的基本概念、大数据分析处理模型、数据可视化以及大数据在相关领域的应用,使学生掌握大数据关键技术。
二、课程教学目标
大数据分析技术是分析和处理大数据的手段和方法,当今大数据作为信息的重要载体在信息化社会扮演着重要的角色。通过研究有关信息获取、信息传输、信息处理与信息控制等核心基础,掌握运用现代计算机工具高效求解科学与工程问题的数学理论与方法。
通过本课程的学习,学生们能够:
从大数据中获取有用的信息; 提高信息素养; 获得驾驭大数据的能力。
三、教学学时分配
《大数据分析技术》课程理论教学学时分配表
学时 章次 教学主要内容 分配 大数据分析中的最优化理论与算法介绍、第一章 机器学习和数据挖掘概述 第二章 第三章 第四章 高维数据降维、压缩感知与稀疏优化 聚类分析、推荐系统 大规模机器学习 9 6 6 讲练结合 讲练结合 讲练结合 大作业 大作业 大作业 3 课堂讲授 随堂提问 教学方法或手段 评价方式 * 理论学时包括讨论、习题课等学时。
《大数据分析技术》课程实验内容设置与教学要求一览表
学序实验项目名称 号 实验内容 教学要求 分配 矩阵特征值、奇异操1 高维数据降维 值分解、稀疏表示、压缩感知 大数据聚类图可2 聚类分析 视化输出 机器学习、推荐系3 统 填充 支持向量机、矩阵理解 6 作 合 掌握 3 作 操证 业 综1 告 报操验1 作掌握 3 作 证 业 大验1 作类别 类型 人数 方式 方式 大时 实验 实验 每组 教学评价四、教学内容和教学要求
第一章 大数据挖掘分析概述(3学时)
(一)教学要求
通过本章内容的学习,使学生了解高维海量数据挖掘技术等。 (二)教学重点与难点 教学重点:数据挖掘技术
教学难点:大数据降维理论与方法 (三)教学内容 第一节 大数据概述 第二节 数据降维基本原理 第三节 数据挖掘的起源与发展
第二章 数据降维(12学时)
(一)教学要求
通过本章内容的学习,使学生掌握高维数据降维的基本理论与方法等。 (二)教学重点与难点
教学重点:常见的数据降维算法的特点
教学难点:常见的数据降维算法的原理以及性能 (三)教学内容
第一节 线性与非线性降维技术 第二节 监督与非监督式降维算法 第三节 基于全局与局部方法的数据降维 本章习题要点:大数据降维技术。
第三章 聚类分析及其应用(9学时)
(一)教学要求
通过本章内容的学习,使学生掌握常见聚类算法及其在大数据分析中的应用等。 (二)教学重点与难点
教学重点:聚类算法基本原理、及其归类
教学难点:常见聚类算法的优缺点及适宜的数据集、高维数据的聚类结果的有效性
(三)教学内容
第一节 层次聚类(Hierarchical Clustering)
1.合并法 2.分解法 3.树状图 第二节 非层次聚类
1.划分聚类 2.谱聚类
本章习题要点:聚类算法及其应用。
第四章 大规模机器学习(12学时)
(一)教学要求
通过本章内容的学习,使学生掌握大规模机器学习算法及其在大数据分析中的应用等。 (二)教学重点与难点 教学重点: 教学难点: (三)教学内容
第一节 最大边缘分类器 第二节 支持向量机 第三节 大数据统计学习
本章习题要点:大数据的机器学习算法及其应用。
五、教学方法或手段
结合本课程的特点,采用讲授法、启发式、讨论式、案例式、探究式、互动式、自学辅导式、网上助学式和合作式学习方式,借助于多媒体、优质网络课程资源等教学手段,占100%比重。
六、考核方式及评价要求
采用多元化评价方式,过程性考核与终结性考核相结合。平时综合表现(40%)+作品制作(60%),采用制作作品、设计项目、实现工程等的考试形式,使学生在掌握基本原理后,
自己动手进行设计制作,从而达到理论知识应用到实际中的效果,真正锻炼学生的动手技能,使学生在考试中感觉到的不仅仅是压力,更多的是理论转化为成果后的喜悦,极大提高学生的学习兴趣。
七、教材及教学主要参考书
推荐教材:
《大数据技术原理与应用——概念、存储、处理、分析与应用》 林子雨编著,人民邮电出版社,2015年8月第1版。
参考书目:
《数据挖掘:概念与技术》,(美)韩家炜(Han,J.)等主编,范明 等译,机械工业出版社出版社,2012年8月第3版。
因篇幅问题不能全部显示,请点此查看更多更全内容