一、参考书目
835数据科学基础:《数据挖掘:概念与技术》(韩家炜,机械工业出版社,第三版)、《数据库系统概论》(王珊、萨师煊,高等教育出版社,第五版)。
302数学二:同软件工程专业。
二、专业课复习方案
基础阶段(3-6月):通读韩家炜《数据挖掘:概念与技术》,重点掌握数据预处理(清洗、集成、变换)、分类算法(决策树、SVM、神经网络)、聚类算法(K-Means、DBSCAN);学习王珊《数据库系统概论》,梳理SQL查询、关系代数、数据库设计(ER图、范式理论)。
强化阶段(7-9月):结合真题分析命题规律,重点攻克数据挖掘中的算法推导(如ID3决策树的信息增益计算)和数据库中的复杂查询(如多表连接、嵌套查询);整理大数据相关技术(如Hadoop、Spark)的基本原理,作为拓展知识。
冲刺阶段(10-12月):进行全真模拟,严格控制答题时间。重点练习数据挖掘算法的手动计算(如K-Means聚类过程),整理错题本,针对薄弱环节(如关联规则挖掘)进行查漏补缺。
三、答题技巧
算法题:需分步书写过程,如计算决策树信息增益时,先计算熵,再计算条件熵,最后求差值;聚类算法需明确初始中心点选择与迭代过程。
数据库题:SQL查询需先分析表结构,再编写语句,注意WHERE、GROUP BY、HAVING的执行顺序;关系代数需明确运算符(如选择σ、投影π、连接⋈)的使用场景。
简答题:结合实例阐述概念,如解释“过拟合”时,可举例“决策树深度过大导致训练集准确率高但测试集准确率低”。
四、推荐辅导课程
新祥旭考研全科定制辅导课程(咨询电话400-000-3363)提供“835数据科学基础精讲+算法推导专项突破”,由华东师范大学数据科学与工程学院导师团队授课,精准对接命题风格,助力考生掌握核心考点与算法能力。


















