当前位置:大学毕业论文> 论文范文>材料浏览

关于数据挖掘方面毕业论文开题报告范文 跟关联算法在排课数据挖掘中的应用类毕业论文格式范文

主题:数据挖掘论文写作 时间:2024-03-25

关联算法在排课数据挖掘中的应用,本文是关于数据挖掘方面毕业论文格式范文和数据挖掘和课数据挖掘和关联相关论文参考文献范文.

数据挖掘论文参考文献:

数据挖掘论文参考文献 科学课杂志大学生就业指导结课论文数据挖掘论文结课论文

摘 要:科学的进行课程安排,合理规划课程实施是关系教学效果提升和人才质量培养的重要途径.在分析典型Aprior关联算法的基础上,对某院校的排课信息进行离散化预处理,使用Aprior关联算法研究高职老师的授课倾向问题,得出高职授课规律并提出合理排课建议.

关键词:排课管理;Aprior关联算法;数据预处理;离散化

一、前言

排课管理是高校教学管理的一项重要事务,是合理配置师资力量的核心手段,如何科学的进行课程安排,合理规划课程实施是关系教学效果提升和人才质量培养的重要途径.在对高校排课信息数据进行预处理的基础上,研究典型的Aprior 关联算法,并据此对排课数据进行挖掘,重点研究高级职称老师的授课倾向问题,发现各开课单位的排课趋势和特点,拟定合理化建议,从而优化师资配置,对推动高校教学管理信息化、智能化建设,提升教学质量与效果具有重要意义.

二、 Apriori 算法

Apriori 算法是一种经典的频繁模式分析算法,该算法最早是由R.Agrawal 和R.Srikant 于1994 年提出,它利用的是布尔关联规则,核心内容是递推与关联[1].

Apriori 算法首先对频繁项进行分析,而这些频繁项被分析出的必要条件是频繁程度高于自己的设定,然后,对这些频繁项之间的强关联规则进行分析,同样的,频繁程度也需要满足前提条件:高于自己的设定.由频繁项集产生期望的规则,而且产生只包含集合项的所有规则.

Apriori 算法主要分为三个关键点[2,3]:一是候选项集的计数,对每个候选项集对应到事务数据库中,建立一棵树,把每个事务中所包含的k 维项集存储到树,进而查找候选项集树的结构,若发现目标,则进行累加,循环遍历;二是生成候选项集,将所有的属性进行频繁度分析,相互组合,循环遍历; 三是生成频繁项集,在上一步的基础上进行筛选,挑选满足置信度要求的项集,生成频繁项集[28].Apriori 算法描述如下:

1)L1等于{ 大项目集1 项集};

2) for( k 等于2; Lk-1 ≠? ;k++)do begin

3) Ck等于apriori-gen( Lk-1) ; // 构造候选项目集

4) for all a ∈ D do begin

5)Ca等于subset(Ck,a);

6)for all c ∈ Ca do begin

7)c.count++; // 计算支持数

8) end for

9)Lk 等于{c ∈ Ck |c. count ≥ minsupport_count };

// 得到k 阶大项集10)end for

11) 答案等于 ;

在此过程中只要找出频繁项集,并且满足最小置信度和最小支持度的条件在此过程中只要找出频繁项集,并且满足最小置信度和最小支持度的条件,即可产生强关联规则.但是Apriori 算法还是存在两个缺点[4,5],首先,需要很大的I/O负载,由于Apriori 算法运行过程中需要对每次循环进行扫描数据库,因为进行多次扫描事务数据库;第二,便是在算法运行过程中会产生大量的候选集,对存储空间要求较高.为解决上述缺点,研究人员提出很多方法进行改进:有利用基于散列技术产生频繁项集算法,有压缩未来迭代扫描的事务数进而提高效率,还有将数据划分应用到关联规则挖掘中,进而改善关联规则挖掘的适应性,还有牺牲精确性来换取有效性的基于采样的方法.

三、 Apriori 算法在排课数据中的应用

关联算法是通过对几个属性之间的进行计算比对进而得出属性与属性之间的支持度,然后根据属性之间支持度的大小来进行分类的.该方法在教育教学领域的成绩分析,教学评价中已有较多运用[6,7],本文从师资管理角度出发主要研究教员的职称等级与其他教学因素之间的关系,所以将职称等级作为主属性,将其与其他教学相关属性作关联度分析.

3.1 样本数据预处理

选取了某高校2016 学年的课程管理信息作为应用数据集,该数据集涵括了30 余万条样本数据,包括了基本属性集合为{ 开课单位、课程性质、合班人数、学时学分},目标属性为{ 职称}.

对样本数据进行数据预处理后,属性集合数据均调整为标称属性[8].其中,开课单位有将零散的、授课任务少的直属院系等合并为一项,即直属单位进行研究讨论;对于教员的职称等级,在本系统中有高职、中职、初职,鉴于初职的数据信息较少,本文进行关联算法处理时划分成高职与非高职;关于合班人数,定义为离散集合{‘小’,‘中’,‘大’}三个层次,分别为“小班”为30 人及以下,“中班”为31人至50 人中班,“大班”为51 人及以上;关于课程性质,本文在研究学校课表的基础上,将所有课程划分为选修课和必修课进行研究讨论;课程学时与学分相关联,所以在讨论时仅对学时作讨论分类,学时定义为离散集合{‘多’,‘中’,‘少’},较少学时课程,小于等于40 学时;中等学时课程,41 与50 之间;较多学时课程,大于等于51 学时.

因此,经过预处理得到各属性在全体样本数据集D 上离散取值为:

开课单位等于{ 基础部,电子学院,动力机械学院,电力电气学院,直属单位}

课程性质等于{ 必修,选修}

合班人数等于{ 大,中,小}

学时学分等于{ 多,中,少}

职称等于{ 高职,非高职}.

3.2 Apriori 算法的应用

对职称等级与各属性进行关联置信度分析,其中高职数据有142630 条,中职与初职数据有160210 条,其他数据为课程教员不确定,无法确定职称等级.

首先进行开课单位与职称的关联进行支持度分析,信息见表1:

在课表信息众多的属性中,与高职匹配发现频繁项集支持度大于0.3 的只有三项,从高到低分别为必修课、小班、少学时,而进行三项频繁项集支持度分析时,发现小班、必修课和少学时、必修课与高职之间的支持度仍较大,所以我们得出结论:

职称为高职更倾向于选择属性为必修课、小班、学时较少的课程.除此之外,在分析课程信息的两项属性时我们可以发现,{ 小班,必修课} 和{ 少学时,必修课} 这一属性的课程也更被高职教员所青睐.

根据上述结论,向教务课程管理人员提出以下决策建议:

增加职称为高职的教员教授属性为{ 大班}、{ 学时数多}和{ 选修课} 的课程.

四、结语

通过对排课数据的基于Apriori 算法的关联挖掘,研究高级职称老师与其他教学因素之间的关联程度,发现高职老师更倾向于选择属性为必修课、小班、学时较少课程的规律特点,为后期优化师资配备提供了科学数据支撑,对提高教学管理信息化、智能化水平,提高教学质量具有重要意义.

本文评论:该文是关于数据挖掘和课数据挖掘和关联方面的相关大学硕士和数据挖掘本科毕业论文以及相关数据挖掘论文开题报告范文和职称论文写作参考文献资料.

课程排课问题算法综述
摘要以高校课程排课问题为研究对象,分析了常见的几类排课问题求解算法以及算法应用情况,并对课程排课算法的未来发展提出展望   关键词课程排课;局部搜索算法;人工智能方法  中图分类号G712文献标志码A.

基于线性链表的关联规则数据挖掘技术在数字图书馆中的应用
数据挖掘(Data Mining) 是通过分析每个数据,从大量数据中寻找其规律的技术,一般是指从大量的数据中自动搜索隐藏于其中的有着特殊关系性(属于Association rulelearning)的.

基于数据挖掘技术解决业务指标预测的方案
摘要信息中心目前涉及的业务有固定电话、宽带、GPS、无线市话、信息服务、数字电视、IPTV电视、无线 宽带…… 每年的基础收入将近1亿,随着经营压力不断增加,能否准确预测下一年的收入成为关键问题 如何.

美国中学复杂的排课、选课和计分制度
一个中国学生来美国留学,常常会被美国中学复杂的排课、选课和计分制度搞蒙 先说说排课 在中国,学校一般都是按照自然的星期来排课,例如每天有数学和语文,周一有化学,周二有物理……,简单且易记 而在美国,许.

论文大全