当前位置:大学毕业论文> 本科论文>材料浏览

关于企业招聘方面函授毕业论文范文 与随机森林算法在企业招聘需求预测模型中的应用相关函授毕业论文范文

主题:企业招聘论文写作 时间:2024-02-11

随机森林算法在企业招聘需求预测模型中的应用,本文是关于企业招聘方面论文范文集与需求预测和企业招聘和森林算法有关论文范文集.

企业招聘论文参考文献:

企业招聘论文参考文献 企业文化期刊企业管理论文5000字企业文化杂志社企业文化的论文

摘 要:在全球化的市场竞争过程中,如何在企业招聘中利用企业优势,聚天下英才而用之,是企业在招聘过程中遇到的主要问题.随着大数据时代的到来,针对企业招聘需求预测引起企业的广泛关注.本研究针对企业招聘过程中正负样本数量不平衡以及数据量大的特点,将平衡随机森林算法进行了改进,并将其应用于企业招聘需求预测模型中.研究发现相对于传统的预测算法,该算法兼具抽样技术以及代价敏感学习的优势,在处理大数据集以及不平衡数据时具有一定的优势,精确度更高.

关键词:随机森林算法;企业招聘;需求预测模型

为了能在激烈的市场竞争中得以生存,留住人才,许多企业采用数据挖掘技术来对企业招聘分析[1].国外已有部分学者针对企业招聘问题,应用决策树、支持向量机、遗传算法、人工神经元网络等建立了预测模型,虽然取得了一定的应用效果,但这些算法仍存在一些局限性.为了弥补上述算法的局限性,本研究将平衡随机森林方法进行了改进,很好的解决了不平衡数据问题得到了较好的预测效果.现介绍如下.

一、企业招聘需求预测模型分析

企业招聘人才直接影响到企业发展,通过建立企业招聘需求预测模型,企业可以针对适合的人才有目的的招聘,后续采取相应的挽留措施,留住人才,助推企业发展.企业招聘需求预测模型数据中包括多个静态属性以及动态行为数据,企业招聘需求预测模型一般采用决策树、支持向量机、神经元网络、回归分析以及生存分析等,本研究所采取的企业招聘需求预测模型是对随机森林方法进行的改进,分析企业招聘过程中存在的问题,以期为企业分析提供相应的理论依据.

二、随机森林算法

1.随机森林算法

由树形分类器{h(x,θk),k等于1……}所组成的集合, 其中x、θk依次为输入向量、独立同分布的随机向量.对于每一个输入向量x,根据简单的多数的方式决定分类结果.

2.改进随机森林算法

2.1 现有的改进随机森林算法

随机森林算法虽然具有较好的应用效果,但本身亦具有其局限性,并不能适用于全部类型的数据集,需根据不同数据集对算法进行改进:⑴基尼系数采用采用ReliefF来代替,可有效解决基尼系数因不能对属性间强的条件相关性进行检测而导致的分类器性能低下问题;⑵采用带权重的机制取代平等的机制.目前学者们多采用平衡随机森林算法以及权重随机森林算法来解决随机森林算法中数据集不平衡的问题.

2.2 改进平衡随机森林算法

为了结合以上两种算法的优点,本研究提出了改进平衡随机森林算法,引入区间变量m和d(m和d分别代表区间的中点和长度),α是属于区间[(m-d)/2,(m+d)/2]分布变量,对迭代中不同类的样本分布产生起决定作用.引入该变量的目的是保持每次迭代过程中随机分布不同类,增加该算法的抗噪性.

将本研究的改进平衡随机森林算法与人工神经网络、决策树、CWC-SVM模型进行对比试验,研究结果发现该算法具有较好的性能,同时与平衡随机森林算法以及权重随机森林算法进行比较发现本研究的改进平衡随机森林算法具有更高的识别力.

3.算法实验

3.1 数据来源

某企业人力资源部招聘简历经处理后作为本研究的实验数据.数据集共有400多条记录,每条记录包含数值型和文本型共16个属性,数据中有20%左右属于容易中止招聘并造成企业损失的人才,将其定义为负类样本,其余80%定义为正类样本,该数据集为不平衡数据集.

3.2 数据预处理

3.2.1 属性选择

数据集每条记录共有16个属性,将与分类预测明显无关的属性加以去除,如求职简历ID、等,我们将该类属性去除.缺失属性定为>30%,经处理后,共包含年龄、教育情况、职业、有无工作经验、是否应届毕业生、婚姻状况等9个属性.

3.2.2 属性值处理与数值归一化

将非数值属性的进行数值化.对于改进平衡随机森林算法来说,若属性值之间的差距较大会直接影响结果的准确性,因此需对其进行归一化处理,使每个属性值的取值范围都在[0,1].

3.2.3 类别聚合

完成数据的整理工作后,从400多条数据集中随机抽取227例样本作为本研究实验数据,每个样本包干9个属性和一个标签.进行随机分组后训练包括正类样本178例、负类样本49例;测试集包括正类样本182例、负类样本45例.

3.3 实验结果分析

三、结论

本研究结果表明改进平衡随机森林算法比人工神经网络、决策树、CWC-SVM模型等算法具有更高的预测精度,在在对不平衡大数据集进行分析时具有明显优势.接下来研究的重点是对该算法的效率以及泛化能力进行深入研究.改进平衡随机森林算法是用区间变量来决定样本的分布.在本研究中的算法性能对变量值的变化敏感性不高,因此在以后的试验中可以考虑对变量值增加一些限定条件以提高其的预测效率.同时在以后的工作中可进一步探讨该算法的成本效益.总之,招聘人才问题不仅局限于企业,该现象也应引起其他用人单位的广泛关注.

归纳总结,此文为一篇关于经典企业招聘专业范文可作为需求预测和企业招聘和森林算法方面的大学硕士与本科毕业论文企业招聘论文开题报告范文和职称论文论文写作参考文献.

基于BP神经网络的城市物流需求预测模型
文培娜(京东方科技集团股份有限公司,北京 100176)摘要城市物流需求是城市物流规划的重要内容和首要前提,但城市物流需求的复杂性导致难以对其进行精确预测 文章从货运量的角度出发,分析影响货运量的社.

基于GA-SVM的物流园区物流需求预测与分析
摘要文章基于支持向量机模型对物流园区物流需求进行预测,相较于传统的网格式搜索对支持向量机参数寻优,使用遗传算法对支持向量机参数寻优,能在实数集内连续地寻找最优参数组合,构建出GASVM物流需求预测模型.

基于偏最小二乘回归的吉林省电力需求预测分析
摘要文章结合偏最小二乘回归和模糊时间序列对吉林省电力需求进行中长期预测分析 偏最小二乘法较好地克服了电力需求影响因素间严重的多重共线性问题,拟合效果较好,预测精度较高 分析发现,国内生产总值,第一产业.

基于随机森林的粮仓气密性评价模型
摘 要通过采用以粮仓仓型、门窗密封措施、单仓自然通风口个数、单仓轴流风机口个数和单仓环流熏蒸孔个数……16 个影响因素作为自变量,500 Pa 压力半衰期为因变量,运用随机森林算法建立了粮仓气密性评价.

论文大全