探索数据的奥秘
- 学校:南京大学
- 集数:50
- 课程简介:伴随当今数据采集、传输、存储以及互联网技术的大力发展,社会生活中的方方面面每天都产生、积累着大量数据。对这些数据的有效处理与及时应用需求带来对传统的数据分析领域的新的挑战。针对上述挑战,近年来以互联网为代表的工业界带领了数据科学的热潮。然而,随着数据科学在业界的流行,一些由于基本概念不清晰或应用不规范而带来的结论误导(如有偏样本搜集、p值操纵等),也开始日益凸显,并进而引起了学术界的关注。数据科学是应用科学的方法、流程、算法和系统从多种形式的结构化或非结构化数据中提取知识和洞见的交叉学科,其内容跨越数学、计算机、信息学、系统科学等多领域,难以采用传统分门别类的方法进行介绍。因此,本课程立足于数据科学中的“科学”性,从学术的严谨性追求出发,着重为学生确立数据科学中的各种基本概念与原理,建立数据科学的完整的规范化流程。具体,将遵照严谨的科学探索流程,按“问题提出-目标制定-数据收集-探索性数据分析-建立模型-评价模型-结果展示”的规范化步骤为学生依次介绍各环节的关键概念、原理和准则,并佐以丰富的案例分析和模拟项目训练,启发学生主动思考,培养学生在实践中树立严谨的科学思维方式及规范的数据科学流程,对于指导可靠的数据分析具有重要意义。本课程所有的代码都基于Python语言编写,课程中也会有专门一章介绍Python的使用,确保没有Python基础的同学也能快速理解并使用课程中的具体代码。本课程力求简洁、易懂,包含了丰富的案例,所以,适合所有对数据科学有兴趣的大专院校学生和社会人士学习。
相关推荐
评论沙发是我的~