这三个支柱不对称:前两个支柱共同代表了核心方法论和数据科学中使用的技术,而第三个支柱则是该方法论所应用的应用领域。在该计划中,核心数据科学培训侧重于前两个支柱,以及在应用其技能来解决应用程序领域问题方面的实践。
该学校将所需的数据科学技能分为两类:统计技能(例如统计和生物统计学部门教授的技能)和计算技能(例如计算机科学与工程部门和信息学院的技能)。该计划的设计是要求每个学生在这两个领域接受均衡的培训。
从每个能力中选择1。学生不得对多个类别的课程进行重复计算。选修课必须包括至少两个高级研究生课程。
密歇根大学计算机科学与工程:核心课程
MATH 403:离散数学简介
EECS 402:科学家和工程师编程
EECS 403:科学家和工程师的数据结构
选择1个
BIOSTATS 601:概率和分布
425号公报:概率概论
STATS 510:概率和分布
选择一门
BIOSTATS 602:生物统计推断
STATS 426:理论统计导论
STATS 511:统计推断
所有学生必须参加以下核心课程:
EECS 409:数据科学讨论会
密歇根大学计算机科学与工程:专业知识
选择一门
EECS 484:数据库管理系统
EECS 584:高级数据库系统
选择一门
EECS 485:Web系统
EECS 486:信息检索和Web搜索
EECS 549 / SI 650:信息检索
SI 618:数据处理分析
STATS 507:使用Python进行数据科学分析
数据科学技术专长
选择一门:
BIOSTAT 650:应用统计I:线性回归
STATS 500:统计学习I:线性回归
STATS 513:回归和数据分析
选择一门:
STATS 415:数据挖掘和统计学习
STATS 503:统计学习II:多元分析
EECS 545:机器学习
EECS 476:数据挖掘
EECS 576:高级数据挖掘
SI 670:应用机器学习
SI 671:数据挖掘:方法和应用
BIOSTAT 626:健康科学的机器学习
密歇根大学计算机科学与工程:选修课
1.数据科学原理
BIOSTAT 601(概率和分布理论)| BIOSTAT 602(生物统计推断)| BIOSTAT 617(示例设计)| BIOSTAT 626(健康科学机器学习)| BIOSTAT 680(随机过程)| BIOSTAT 682(贝叶斯分析)| EECS 501(概率和随机过程)| EECS 502(随机过程)EECS 505(计算数据科学和机器学习)| EECS 551(用于信号处理,数据分析和机器学习的矩阵方法)| EECS 553(数据压缩的理论和实践)| EECS 564(评估,过滤和检测)| SI 670(应用机器学习)| STATS 451(贝叶斯数据分析简介)| STATS 470(实验设计简介)| STATS 510(概率和分布理论)| STATS 511(统计推断)| STATS 551(贝叶斯建模和计算)
2.数据分析
BIOSTAT 645(时间序列)| BIOSTAT 651(广义线性模型)| BIOSTAT 653(纵向分析)| BIOSTAT 665(人口遗传学)| BIOSTAT 666(人类遗传学中的统计模型和数值方法)| BIOSTAT 675(生存分析)| BIOSTAT 685(非参数统计)| BIOSTAT 695(分类数据)| BIOSTAT 696(空间统计)| EECS 556(图像处理)| EECS 559(高级信号处理)| EECS 659(自适应信号处理)| STATS 414(应用数据分析的主题| STATS 501(相关数据的统计分析)| STATS 503(统计学习II:多变量分析)| STATS 509(财务数据统计)| STATS 531(时间序列分析)| STATS 600(线性型号)| STATS 601(多元和分类数据分析)| STATS 605(建模和数据分析的高级主题)| STATS 700(应用统计主题)
3.计算方式
BIOSTAT 607(数据分析中的基本计算)| BIOSTAT 615(统计计算)| BIOSTATS 625(使用大数据计算)| EECS 481(软件工程)| EECS 485(网络系统)| EECS 486(信息检索和网络搜索)| EECS 490(编程语言)| EECS 493(用户界面开发)| EECS 504(计算机视觉)| EECS 542(计算机视觉高级主题)| EECS 549 / SI 650(信息检索)| EECS 548 / SI 649(信息可视化)| EECS 586(算法设计和分析)| EECS 587(并行计算)| EECS 592(人工智能)| EECS 595 / SI 561(自然语言处理)| SI 608(网络)| SI 618(数据处理和分析| SI 630(自然语言处理(算法和人员))| SI 671(数据挖掘:方法和应用)STATS 406(统计和数据科学中的计算方法)| STATS 507(使用Python的数据科学分析)| STATS 506(统计中的计算方法和工具)| STATS 606(统计计算)| STATS 608(统计中的蒙特卡洛方法和优化方法)