天津农学院始建于1976年。2001年经天津市政府批准,天津市城乡经济学校并入天津农学院。1982年获学士学位授予权,2006年获硕士学位授予权。1996年首批通过国家教委本科教学合格评价,2007年在教育部进行的本科教学工作水平评估中获得“优秀”。学校以农科为主体,农学、工学、管理学、理学、经济学、文学、艺术学协调发展。经过多年的办学实践,形成了紧贴区域经济社会发展,服务于现代都市型农业的鲜明办学特色。
数据科学与大数据技术专业是天津农学院计算机与信息工程学院2020年新设置的专业。本专业以计算机科学和数据科学理论为基础,着重掌握大数据的采集、处理、分析与应用系统设计、开发技术与核心技能。通过理论学习和实践训练,使学生具有扎实的计算机、数学、统计学等多学科的理论和专业知识,具有创新能力、较强的工程实践能力和团队协作能力,能在IT企业和企事业单位的信息技术与管理部门从事大数据的采集与处理、存储与管理、分析挖掘、展现和软件开发、应用与运维等工作,适应现代化建设和未来社会科技发展的需要。
天津农学院数据科学与大数据技术专业本学期数据科学与大数据技术专业两个班学生需要开展两周的项目实训教学活动。
天津农学院21级数据科学与大数据技术专业2个班62名学生。
针对学校线上实训教学的需求,匹配数据实验楼的“个人信用风险评估项目”、“电商数据分析项目”、“Python数据分析项目”为课程提供实训平台和项目资源。
2007-2008年的全球金融危机凸显了透明度和严密性在银行业务中的重要性。由于信贷供应受到了限制,所以银行正日益紧缩其贷款体系,转向机器学习来更准确地识别高风险贷款。通过构建自动化的信用评分模型,以在线方式进行即时的信贷审批能够为银行节约很多人工成本。
个人信用评估实训项目,首先读取德国信用数据集,并查看数据的基本统计信息。其次借助Python第三方库,使用可视化工具绘制多个图表对德国信用数据集进行探索性分析,展示变量的取值分布以及变量间的相互联系,以及各变量与标签之间的相关性大小。然后对数据进行预处理,构建模型并评估。最后对数据进行特征工程,再次构建模型进行训练并评估,查看模型提升后的效果。通过实训,学生将进一步夯实Python语言的编程能力,掌握Pandas库的基本使用,理解基本的数据预处理方法,掌握通过Sklearn库进行分类模型构建以及评估的操作。
电子商务的发展,极大的便利了人们的生活,如今,电子商务已经成为人们生活中不可缺少的一部分。对电子商务平台数据进行分析,可以充分了解客户的消费行为以及偏好,方便平台发掘潜在客户同时为现有客户提供个性化的服务。构建用户标签体系和用户画像,可以了解用户的价值,同时也为平台精准营销、用户研究、个性服务、业务决策提供支持。
电商数据分析项目实训首先读取某电商平台数据集,查看数据的基本统计信息,并对数据进行清洗,包括缺失值处理、异常值处理等。其次对数据进行探索性分析,借助Python第三方库,使用可视化工具绘制多个图表,查看变量的取值分布以及变量间的相互联系。然后通过时间序列模型对每日进行订单量和订单金额进行预测。最后构建用户标签体系和绘制用户画像,形象化展示用户。通过实训,学生将进一步夯实Panda库的基本使用,掌握基本的数据预处理方法,掌握时间序列模型的原理和步骤,同时学生将了解用户标签体系的构建和用户画像。
本实训首先使用NumPy读取UBER股票数据集,进行相关数据计算等操作对数据进行分析;其次,利用Pandas读取学生在考试中的表现数据集,并对该数据集进行探索性分析,完成数据转换与融合等操作;然后,读取州际公路交通量数据集,进行基础的时间序列分析;然后,读取超市数据集,借助Matplotlib工具,通过绘制各种类型的图表展示超市的销售数据;最后,读取泰坦尼克号的数据,利用Seaborn绘图工具,可视化展示泰坦尼克号乘客船票价格与性别、年龄等的关系。通过实训,学生将进一步夯实Python数据分析能力,掌握Python处理数据的能力,学习数据可视化的基本方法。
本项目从五个数据集出发,实现Python数据分析的基本操作。本项目首先使用了UBER股票数据集,该数据集记录了UBER股票的价格信息,通过了解股票的成交量及收益情况,利于考虑选股、择时、仓位管理和止盈止损;其次,读取学生在考试中的表现数据集,探索学生成绩的相关影响因素;然后,对州际公路交通量数据集,进行基础的时间序列分析,了解道路交通流量,便于后续的流量预测;然后,读取超市数据集,通过Matplotlib绘制各种类型的图表可视化展示超市的销售情况,及时掌握超市经营情况;最后,对于泰坦尼克号的数据,针对其生存与遇难的人的数据,主要使用乘客数据(即姓名,年龄,性别,社会经济舱等)来分析“什么样的人更有可能生存?”。
学校使用后反馈,项目运行比较流畅,平台使用简单,方便,满足了学校实训的需求。
数据实验楼iDataCoding是由博雅数智自主研发的数据科学和人工智能综合项目实验实训平台,服务于高校大数据人工智能实训室建设。平台提供企业级项目,覆盖公共卫生、健康医疗、金融、电商、营销、交通等多个行业。通过真实项目、实际业务数据、实际项目分析流程,培养学生使用大数据和人工智能技术解决具体行业的实际问题的能力。学习项目分析思维,根据不同的项目背景使用相应的技术和方法解决问题,不断地积累项目经验,为将来走向社会岗位奠定基础。
已有爱数科或爱数课账号的用户,可以直接登录体验。申请教学或科研使用,请联系电话和微信13693290406