一、课程基本信息
课程名称 数据分析与挖掘 DataAna1ysisAndMining 课程代码 开课院部 数学与计算科学学院 授课学期 5 理论学时 课内学时 56 实习 0 其他 40 实验学时 课程性质 课程负责人 学分/学时 必修 3.5/56 实训(含上机) 0 16 适用专业 数据科学与大数据技术 授课语言 中文 对先修的要求 具备一定的编程能力,己修《概率论与数理统计》、《python程序设计》、《多元统计分析》课程 对后续的支撑 学会数据分析的预处理、可视化、回归模型、预测算法等,作为在后续课程《数据分析与挖掘课程设计》必要的理论和实践基础。 通过在教学中讲授数据科学的分析和挖掘理论和算法,培养学生要具有专业数据的敏感性,以及务实进取、爱好科学和技术的良好态度,为国家和社会的进一步发课程思政设计 展做出贡献。 创新创业教育设计 在大数据时代,数据无处不在,在课程教学中,结合时代对数据分析与挖掘的人才需求,在教学中贯穿培养创新思维和创新创业能力,从具体实例中启发和教育学生的创新思维,以及结合专业技术寻找创新创业设计。 课程定位:数据分析与挖掘是数据科学与大数据技术专业在学习高等数学、线性代数和概率论与数理统计等课程之后的一门学科必修课,为后续的数据分析与挖掘课程设计提供数据模型、分析理论与分析技术等能力的支撑。 主要学习内容:该课程主要通过数据分析软件使用,讲授数据的收集、整理数据描述、统计图形与可视化技术、线性回归与回归模型的估计和预测等内容,让学生具备对数据进行基本分析能力,掌握必备的数据模型以及对数据进行深度挖掘的技能,达到将数学、统计知识应用到实际问题中建立合适的模型并设计合适算法解课程简介 决实际问题的能力。 核心学习结果:使学生获得以下能力与素养:1)用数学、统计的知识、方法来理解数据、建立数据模型;2)会借助软件调用模型、算法对数据进行挖掘分析,也能自己设计算法解决数据的建模和求解问题,提升数据分析或数据挖掘的能力和素质。 主要教学方法:本课程主要采取理论与实践教学相结合,通过先讲授理论,再进行上机实验,并结合具体案例实践让学生提高分析和解决实际问题 的能力。 二、课程目标及对毕业要求指标点的支撑
序号 课程目标 目标1:学会理解数据,学会用统计、3.2能够通过数据采集、数据数学的思想来分析存储、数据预处理、数据分析数据,学会建立数和数据挖掘、数据的可视化,据模型,掌握数据分析、研究和解决大数据科学分析与挖掘的主要领域复杂问题。 步骤和具体实现方法。 支撑毕业要求指标点 毕业要求 3.问题分析:能够应用数学、自然科学和数据科学与大数据技术的基本理论和方法,通过数据采集、数据存储、数据预处理、数据分析和数据挖掘、数据的可视化,分析、研究、解决信息科学和数据科学领域复杂问题,并通过实践来验证解决方案的准确性和合理性,获得有效结论。 1 43利用信息科学和数据科学的4.建模与问题求解:能够设计合理有目标2:使学生能专业知识、针对实际问题的具效的数据模型以满足特定问题,通过设计数据分析与挖体情况、结合文献资料对模型数据挖掘获得有效信息,能使用先进2 掘算法,培养学生进行分析,采用恰当的方法、的仪器设备、数据分析软件并结合文应用理论知识解决仪器设备、数据分析软件对特献资料对信息科学和数据科学领域实际问题的能力。 定问题的数据模型进行算法优复杂问题进行算法优化、实践和设计化,并能够写出规范的分析报新的算法模型,并能够在设计新的算告和解决方案。 目标3:具备在数据分析实践经验,3 对研究热点问题有敏锐性,能快速跟踪相关技术的发展方向。 法模型中体现创新意识。 6.使用现代工具:能够针对大数据领6.2能够针对复杂大数据工程问题,开发与使用恰当的技域复杂的工程问题,开发或选择适当的技术、资源、现代仪器设备和术、资源、现代工程工具和信信息技术工具,并能使用现代的仪息技术工具,对复杂工程问题器设备和数据分析软件对免杂工程进行预测和模拟。 问题进行预测及模拟,并能够理解其局限性。 三、教学内容及进度安排 序号 教学内容 学生学习 预期成果 课内 学时 教学方 式 支撑 课程目标 数据分析软件介绍重点:anaconda简介难点:的使用创新创业教育:使用专业技术设计个性化数据分析软件 数据的收集与整理 重点:数据类型、收集、 2 管理 难点:PythOn数据管理 了解数据分析的集中常用软件,如Sas、Spss、R、2 JupterNotebook的基本使用方法。 讲授、自学、创新目标1、2 创业教育 1 Jupyternotebook数据分析平台EviewsxPythOn等,掌握理解数据按尺度、时间的两种分类特点,掌握横向与纵向数据的收集方法、以及数据的管理方法。 6 讲授、自学、上机 目标1、2 Python数据分析编程重点:数值分析numpy库、数据分3 析pandas库难点:数据框DataFrame的使用 创新创业教育:利用编程技术设计数据分析软件 数据的探索性分析、直观分析 思政:鼓励学生利用好专业技术,服务民生,为国家和社会做出贡献。 4 重点:数据的描述分析、统计绘图、分组分析;seaborn统计绘图、ggp1ot绘图、pyecharts动态绘图 难点:ggp1ot绘图 创新创业教育:根据数据特点设计可视化方法 统计分析及可视化 重点:随机变量及分布图、统计量及分布图、统计推断5 方法 难点:参数的估计方法、假设检验、推断的可视化 掌握一维、二维数组的操作语句;掌握pandas的两种数据结构:Series序列与DataFrame数据框的操作。 6 讲授、自学、上机、创新创业教育 目标1>2 学会计数数据、计量数据、描述性的汇总统计;会使用Hiatp1ot1ib'pandas的常用绘图;能进行groupby分组分析及绘图 6 课程思政、 讲授、自学、上机、创新创业教育 目标2、3 能绘制函数图、气泡图、三维散点图、三维曲面图,能使用seaborn>ggp1ot、6 pyecharts绘图,能进行统计分析的可视化 讲授、自学、上机 目标2、3 数据的模型分析及可视化重点:线性相关模型、线性回归能使用线性相关分析、回归6 模型、分组可视化模型分析 模型、分组可视化模型对数难点:线性回归模型 创新创业教育:使用数据框对模型结果进行显示 数据的预测分析 7 重点:动态数列的预测分析 难点:时间序列数据的可视化分析 数据的决策分析 点:概率型风险分析 掌握三种决策分析方法:确6 风险分析,能应用python进行可视化分析 据建模,并进行可视化 8 讲授、自学、上机、创新创业教育 目标2、3 能对动态数列,特别是时间序列数据进行预测分析 8 讲授、自学、上机 目标2、3 8 重点,不确定性决策分析难定性分析、不确定性分析、讲授、自学、上机 目标2、3 实际数据的案例分析、挖掘 思政:一定要依法用数据,将学会应用获取或爬取网页数据用得好能造福大众。 数据,学会应用 8 9 重点:数据的获取、分析难点:AR1MA模型对时间序列建数据的分析、建模、评价、改模、分析;了解其他领域进 创新创业教育:基于数据思维,设计更专业的数据挖掘算法和人性化的结果呈现,将数据思维在行业里进行创新。 的数据挖掘流程 课程思政、 讲授、自学、上机、创新创业教育 目标2、3 注:“学生学习预期成果”是描述学生在学完本课程后应具有的能力,可以用认知(定义、列举、复述、界定)、理解(解释、辨别、诠释、论证、概括)、应用(应用、实施、执行、解决、计算、展示、使用)、分析(分析、辨别、划分、比较、推断)、综合(设计、整理、组织、创造、发展)、评判(评价、批判、演绎、辩护、支持)等描述预期成果达到的程度。 四、课程考核
该课程采用平时成绩(含考勤、课堂表现)(20%)+上机(实验课作业、表现)(20%)+期末考试成绩(60%)的考核。
课程目标 序号 评价依据及成绩比例(%) 平时 成绩比例(%) 上机 考试 目标1:熟悉和掌握jupytcrnotebook的使1 用。了解数据的类型,掌握相应的数据收集和整理方法,学会使用numpy、pandas库在数据分析中的常用操作。 (支持毕业要求指标点3.2) 目标2:掌握数据的探索性分析、直观分2 析、统计分析、模型分析、预测分析、决策分析。 (支持毕业要求指标点4.3) 目标3:能对实际案列进行数据分析与挖掘,具备数据分析实践经验,对研究热3 点问题有敏锐性,能快速跟踪相关技术的发展方向。 (支持毕业要求指标点6.2) 合计 15 25 60 100 5 5 10 20 5 10 25 40 5 10 25 40 五、教材及参考资料
[1] Py1hon数据分析基础教程,王斌会,电子工业出版社,2023年1月,ISBN:9787121402777 [2] Python数据挖掘方法与应用,王斌会,电子工业出版社,2019年3月,ISBN:9787121344954 主要参考书:
[1]PythOn数据分析与数据挖掘实战,张良均等,机械工业出版社,2016年1月, ISBN:9787111521235
[2]数据分析方法,梅长林,范金城,高等教育出版社,2018年10月,ISBN:9787040501247[3]数据挖掘:概念与技术(原书第2版),JiaweiHan,Miche1ineKan1ber著,范明,孟小峰译,机械工业出版社,2016年9月,ISBN:9787U1391401 六、教学条件
需要使用多媒体教室授课,授课电脑安装了WindoWS7、OffiCe2010、Python3.5.1以上版本的正版软件;需要安装了授课系统及WindOWS7、OffiCe2010、AnaeOnda软件的电脑进行上机实训。
附录:各类考核评分标准表
上机评分标准 评分标准 教学目标要求 90-100 目标1:熟悉和掌握jupyternotebook的使用。了解数据的类型,掌握相应的数据收集和整理方法,学会使用能熟练、正确使能用数据分析的分numpy>pandas库在数据常用库,按时或一掰分析中的常用操作。 者提前完成任完乐(支持毕业要求指标点务 3.2) 使用数据分析各种库和编程时,不正确、不能使用数据分析合理或者不能的常用库,需要延解决数据分析时完成上机任务。 问题。不能按时完上机任务。 80-89 60-79 0-59 权重(%) 10 目标2:掌握数据的探索性分析、直观分析、统计能熟练、正确使斜分分析、模型分析、预测分用数据分析的模各种模型和方析、决策分析。 桀(支持毕业要求指标 法,按时或者提完前完成任务 羯点4.3) 使用数据分析各种模型和方能使用数据分析法时,不正确、的各种模型和方不合理或者不法,需要延时完成能解决数据分上机任务。 析问题。不能按时完上机任务。 ⅛, 10 目标3:能对实际案列进行数据分析与挖掘,具备进行数据挖掘能进行数据时,不正确、不能熟练、正确进ys数据分析实践经验,对研jJΛU,j¾yΛvV⅞能进行数据挖掘,合理或者不能行数据挖掘,按JJ∖,B匕1.女需要延时完成上解决数据分析究热点问题有敏锐性,能时或者提前完时完成上机 机任务。 问题。不能按快速跟踪相关技术的发展成任务 1±yT0 时完上机任方向。 务。 (支持毕业要求指标点6.2) 5 考试评分标准 教学目标要求 评分标准 90-100 80-89 60-79 基本熟悉 python 0-59 权重(%) 目标1:熟悉和掌 numpy、 握 jupyter pyecharts、 matp1ot1ib pandas、 notebook的使 用。了解数据的类 库、StatSmOdeI pyechartsΛ 型,掌握相应的数 库、seaborn 库、ggp1ots库 据收集和整理方 熟悉python的 比较熟悉 numpy、pandas、 python的 不熟悉python 的 的numpy、 numpy>pandas> pandas 、 pyecharts、 pyecharts、 matp1ot1ib matp1ot1ib 、 Statsmode1 库、seaborn 库、ggp1ots库 的常用命令, 不熟悉数据分 析的基本命令,有较多错误。 库、StatSmode1 库 matp1ot1ib 库 、 库、seaborn 库、ggp1ots库 法,学会使用的常用命令,熟 Statsmode1 库、seaborn 的常用命令,掌 numpy>pandas库在练掌握了数据 分析的基本命 库、ggp1ots 握数据分析的 数据分析中的 令,几乎没有错 库的常用命 基本命令,熟练 常用操作。 误。 程度一般。 (支持毕业要求 令,掌握了大部3) 分数据分析的基本命令。 25 F1标2:掌握数据 熟悉数据的探 能掌握数据 索性分析、直观 的探索性分 析、直观分 析、统计分 析、模型分 基本掌握数据 不熟悉数据的 的探索性分析、 探索性分析、 直观分析、统计 直观分析、统 分析、模型分 计分析、模型 析、预测分析、 分析、预测分 析、决策分析 等的常用方法 的探索性分析、直观分析、统计分 析、模型分析、 分析、统计分析、模预测分析、决策 型分析、预 分析等的常用 方法和命令,对 测分析、决策分析。 分析结果能很 (支持毕业要求 好理解。 4) 析、预测分 决策分析等的 析、决策分析 常用方法和命 25 等的大部分 令,对分析结果 和命令,对分 常用方法和命有一定理解,但不析结果能不能理令,对分析结果能深入。 解。 能理解。 针对具体数 针对具体数据 据类型、具体 类型、具体问 适的数据分 目标3:能对实际 针对具体数据 案列进行数据分 类型、具体问 析与挖掘,具备数 题,选择非常高 据分析实践经验, 效的数据分析 对研究热点问题 工具、数据模 有敏锐性,能快速 型,并给出很好 展方向。 (支持毕业要求 6) 确。 针对具体数据 类型、具体问 问题,选择合 题,能使用数据 题,能使用的 分析工具、数据 数据分析工 析工具、数据 模型进行分析, 具、数据模型 10 模型,并给出 结论基本合理。 进行一定的分 跟踪相关技术的发的分析,结论正较好的分析。 析,结论不合理。
因篇幅问题不能全部显示,请点此查看更多更全内容