当前位置:大学毕业论文> 本科论文>材料浏览

关于创造相关论文范文例文 跟威廉斯创造力测验的信效度检验方面论文范文文献

主题:创造论文写作 时间:2024-02-16

威廉斯创造力测验的信效度检验,本文是关于创造相关论文范文数据库与威廉斯和信效度检验和创造力有关在职研究生论文范文.

创造论文参考文献:

创造论文参考文献 微信投稿平台俄狄浦斯王论文微信投稿小福尔摩斯杂志

刘晓陵1,刘路l,邱燕霞1,金瑜2,周 隽3

(1.华东师范大学心理与认知科学学院,上海200062;2.华东师范大学特殊教育学系,上海200062;3.上海市格致中学,上海200001)

摘 要:成廉斯创造力测验从人格倾向和思维活动两个取向全面评估学生的创造力,然而在我国大陆的研究和运用几乎只限于创造性倾向量袁,创造性思考活动的研究鲜有问津.本研究的目的在于研究创造性倾向量表和创造性思考活动的信效度及其关系.研究以上海市某高中约120名高一学生为被试样本,同时施测创造性倾向量袁和创造性思考活动,1年后重测,分别基于经典测验理论和概化理论对测验信度进行多方面检验,并初步分析测验效度和考察两个测验的关系.结果表明,两个测验的信度总体说来良好,其结构效度得到了一定证据支持;两测验有一定关系,但并不紧密,结合使用两个测验才能全面评估学生的创造力.

关键词:创造性倾向量袁;创造性思考活动;信效度;经典测验理论;概化理论

中图分类号:G449.6 文献标识码:A doi: 10.3969/j.issn.1005-2232.2016.03.007

收稿日期:2016-03-16

作者简介:刘晓陵,华东师范大学心理与认知科学学院副教授;刘路,华东师范大学心理与认知科学学院研究生;邱燕霞,华东师范大学心理与认知科学学院2010级学生;金瑜,华东师范大学特殊教育学系教授;周隽,上海市格致中学高级教师.

通讯作者:金瑜,yjin@ spe.ecnu.edu.cn

1前言

21世纪,创新成为一个国家的核心竞争力.中国政府早就提出,要深入实施科教兴国战略和人才强国战略,加快建设创新型国家.创新型国家的建设需要创新型人才来承担,学校作为培养人才的摇篮,有义务也有条件培养学生的创造力、不断向社会输送富有创新精神和创造能力的创新型人才.然而,要培养学生的创新精神、提升学生的创造力,就需先对其创造力情况进行了解,这样才能制定针对性的教学策略,收到事半功倍的效果.因此,有效识别和评价学生的创造力是进行创造力教育的前提和基础.

创造力是人类所独具的特质,其和智力一样,凡人皆有之,仅多寡程度之不同,并非有或无之别.识别和评价创造力的途径之一是创造力测验.优秀的测验均有一定的理论逻辑基础,创造力的理论研究目前有两种取向:创造性人格特征取向和创造性思维特征取向.受理论驱动,有些创造力测验测量创造性人格特征,例如创造才能团体调查表;而有些测验则测量创造性思维特征,例如著名的托兰斯创造思维测验.这些测验为创造力评估提供了相对便捷有效的工具,在不同程度上得到了研究者和教学实践者的认可.然而,将两种取向相结合的测验相对较少,威廉斯创造力测验包( Creativity Assesent Packet,CAP)则恰恰是这样的一种测验.该测验由美国学者Frank.E.Williams原创,经台湾学者林幸台和王木荣两次修订而得.它由三个测验组成,分别名之为威廉斯创造性倾向量表(下文简称倾向量表)、威廉斯创造性思考活动(下文简称思考活动)和威廉斯创造性思考和倾向评定量表.前两个测验由学生回答问题或完成任务,分别测量学生创造力的情意特征和认知特征;第三个测验则由家长或教师对学生的创造力诸特征进行评定,该测验所得结果可与上述两种测验结果相互比较.经检验,测验的信效度合乎要求,适合六岁至十八岁的男女生使用.与其它创造力测验相比,威廉斯创造力测验因同时测量人格和思维两个方面而为识别和评价学生的创造力提供了更为全面、客观的证据.

笔者对威廉斯创造力测验在中国大陆的研究进行了文献检索,发现:一方面关于倾向量表的研究和应用相对较多,其信效度在一些研究中得到检验;另一方面,思考活动的研究和应用则极少,有的研究试用了这一测验,但未对其信效度指标进行检验,这让我们无从得知该测验在本土的施测结果是否具有足够的稳定性和有效性.鉴于大多数研究在运用威廉斯创造力测验测量创造力时,使用的是倾向量表,那么它能否替代思考活动,从而测得同时使用倾向和思考两个测验时可获得的创造力结果?如果能,研究者们或许就不必施测两个测验,仅用一个测验即可,能够节省不少时间和人力.要回答这一问题,就必须先弄清两个测验之间的关系.

综上,本研究对上海市某高中的学生施测了倾向量表和思考活动①.研究拟重点分析测验的信度:首先在经典测验理论的框架下,检验测验的内部一致性信度和重测信度;其次考虑到实际使用时,思考活动往往由不同评分者评分,且采用非等级评分,故运用概化理论对初次施测思考活动进行研究设计,并估计相应的概化指标.当有不同的评分人员对相同被试的数个活动进行评分时,一般都会引起评分者之间、活动之间的差异,也就是说,测验分数的不一致会受到多方面因素的影响.此时,就有必要把误差方差中与各侧面影响因素相对应的方差分量分解出来,概化理论(相较于经典测验理论而言)更适合于这项工作.它是在经典测验理论基础之上,通过引进实验设计和方差分析的技术而发展起来的、与项目反映理论同等重要的现代测量理论,广泛运用于包括评分者信度估计在内的多种研究中.

此外,对测验效度进行初步分析、考察倾向量表和思考活动的关系.

2研究方法

2.1被试

研究从上海市某高中高一年级抽取3个班的学生作为被试样组进行初次施测,隔1年,对这三个班的学生进行再次施测,两次测验都参与了的被试人数为112.被试的性别和人数分布情况如表1所示.

2.2研究工具

倾向量表,由五十个三选一的题目组成,每个题目都以陈述句的形式表示.整个测验分为冒险性、好奇性、想象力和挑战性四个维度,可得四个维度分数及一个总分.

思考活动,包括12幅待完成的图形,即活动.被试需在规定的时间内,利用各图中的线条,尽可能画出与众不同或有趣的图,并为每幅图命名.每幅图均可得流畅力、开放性、变通力、独创力、精密力和标题六个维度的分数.

2.3施测

初次施测,以班级为单位对上海市某高中高一年级的3个班进行团体施测,1个班级有一名主试.在主试的指导下,学生先做思考活动,规定时间为20分钟;20分钟后,所有学生停笔,待全部收回测验纸后,发放倾向量表.此测验不限时间,学生做完即可离开.

再次施测,隔1年,仍由三名主试对这3个班的学生施测相同的测验,测验程序与上次相同.

2.4记分

倾向量表采用客观记分.包括正向题和反向题,正向题计分规则是:完全符合记3分、部分符合记2分、完全不符合记1分.反向题则相反.

思考活动采用主观记分,需从流畅力、开放性、变通力、独创力、精密力和标题六个方面对十二幅图进行评分:(1)流畅力,每画一图即给1分;(2)开放性,根据是否封闭、是否加上内容、所加内容的位置及意义等来给分,给分标准有四种情形,分别给予O至3分;(3)变通力,测验指导手册上的记分方法是将图画分类后计算一共出现几类图画,即得总分,但却无法得出各图画的“变通力”分数,为便于记分和数据分析,研究对此记分方法进行了一些调整——从未出现的类别记1分,重复出现的类别记0分,使得每个被试的每幅图画均有变通力得分;(4)独创力,查阅图形所引起的反应在《独创力分数加权表》中对应的比例,根据比例给分,分数范围为0至3分;(5)精密力,以图画是否对称为记分标准,可给O至3分;(6)标题,依所用词汇之内容与复杂度来记分,每幅图画最低O分,最高3分.

3数据处理

数据汇总后,用SPSS17.O对数据进行描述性统计分析;估计两个测验的内部一致性系数、重测系数和思考活动的概化系数、信噪比;分别计算两个测验的内部相关,列出矩阵;计算思考活动和倾向量表各维度的两两相关.

4结果

4.1 描述性统计结果

对两次施测的数据分别进行描述性统计分析,计算被试在两份测验各维度上的得分平均值和标准差,如表2、表3所示.

4.2信度

4.2.1倾向量表的信度检验

研究基于经典测验理论,估计了测验的两种信度系数.一种为内在一致性信度,其反映的是测验内部的一致性,即项目同质性[8]151.当受测者在同一测验里的题目间表现一致时,我们就可以称该测验具有项目同质性.研究将Cronbach的a系数作为内部一致性信度指标.另一种为重测信度,也称稳定系数,是一组被试在不同时间用同一测验测量两次(两次测验间隔一段时距),两次测验分数的相关系数.

从两次施测数据得出,威廉斯创造力倾向量表各维度及总量表的内部一致性系数(a系数)介于0.525~0.884之间,间隔1年的重测系数介于0.593~0.702之间,均在0.01水平显著,详见表4.

4.2.2思考活动的信度检验

与倾向量表相似的是,研究也检验了思考活动的内部一致性信度和重测信度.此外,研究还在概化理论的框架下对思考活动初次施测数据进行了分析,获得相应的信度指标.

内部一致性信度和重测信度

在两次施测中,变通力的a系数值都较低,而其他各维度的a系数则介于0.490~0.788之间;间隔1年的重测系数介于0.134~0.411之间,除流畅力外,其余各维度皆在0.01水平显著,详见表5.

基于概化理论的信度

概化理论的研究涉及概化研究(简称G研究)和决策研究(简称D研究).G研究的主要工作是用方差分析等方法来估计方差分量,为D研究提供分析数据;D研究则运用G研究提供的方差分量估计值估计各种可能的设计方案相应的误差方差和G系数或中系数,以进行决策或解释.

初次施测的设计情境是由3名评分者共同给随机选出的30名被试的12个活动评分.由于思考活动不计总分,这意味着6个维度可能是相对独立的.因此,把被试在各维度上的表现分别作为测量目标,分别进行概化研究(简称G研究)、决策研究(简称D研究).根据研究设计,G研究共有评分者和活动两个侧面,属于完全随机双面交叉设计,即p XiXr设计(P代表被试、i代表活动、r代表评分者),其中评分者数量(nr)为3,活动数量(ni)为12,被试数量(np)为30.

首先作G研究,计算思考活动六个维度的各个变异来源的方差分量估计值,如表6所示.

然后进行D研究.因为思考活动采用常模参照解释,所以D研究采用相对解释,即以相对误差、概化系数和相对信噪比作为信度指标.D研究依然采用p Xi Xr设计,根据测验实际,活动数量(n’t)为12,评分者数量(n’r)为3,被试数量(n’p)为1.将表6中符号为负且绝对值很小的变异分量赋值为零,用公式(1)计算评分者相对误差σ2Rel:

用公式(2)计算评分者概化系数E2p:

用公式(3)计算评分者相对信噪比S/NRel:

结果见表7.除变通力外,其余五个维度的概化系数值均高于0.6.

4.3效度分析

测验各维度的相关矩阵

分别计算倾向量表和思考活动内部各维度之间的相关系数.在两次施测中,倾向量表各维度之间的相关介于0.472~0.668之间,各维度与总量表之间的相关皆高于0.7,均达到0.01显著水平.思考活动精密力与流畅力、变通力在两次测试中均无显著相关,变通力与独创力、标题之间的显著相关仅出现在初次施测数据中,而开放性与变通力、独创力之间的显著相关则仅出现在再次施测数据中,其余各维度间的相关(介于0.183~0.553之间)在两次测试中皆显著.为节省篇幅,此处仅呈现再次施测的相关数据,见表8、表9.

4.4倾向量表与思考活动的关系

两测验各维度间的相关系数共计15个.分析发现在再次施测数据中,仅有思考活动的精密力与倾向量表的好奇性、想象力及总量表之间存在显著正相关( r1等于 .239,P1<0.01;r2 等于.225,P2< 0.05;r3 等于.215,p3< 0.05),其它12个相关系数不显著;而在初次测试中,除去上述显著相关外,思考活动的开放性与倾向量表的冒险性、好奇性、想象力及总量表之间亦显著正相关(r1等于 .217,p1<0.05;r2等于 .280,P2< 0.01;r3 等于.249,p3 <0.01;r4等于 .285,p4< 0.01),其它8个相关系数不显著.综上,在各维度的两两相关中,不足1/2的相关达到显著性水平,且相关的绝对值未超过0.3.

5讨论

5.1 测验的信度

倾向量表各维度及总量表的内部一致性信度和重测信度良好(a系数和重测系数皆高于0.5),其中又以总量表的信度水平最高(a系数在0.8左右,重测系数为0.702).该结果与林幸台和王木荣于1999年对倾向量表进行的信度检验的结果(各维度之a系数0.401~0.780,总量表之a系数0.765~0.877,重测相关系数0.489~ 0.810)基本一致.这体现了倾向量表信度的跨文化一致性.同时,良好的信度水平说明量表涉及的四种特质之间具有一致性,而且这四种特质具有跨时间的稳定性.

思考活动除变通力外,其他各维度的内部一致性信度较好(a系数均超过0.4),但各维度的重测信度水平普遍较低.1999年,林幸台和王木荣在台湾地区以国小五年级、国中一年级和国中三年级学生为样本,进行重测信度考验,两次间隔时间为4~5周,所得之相关系数介于0.438~0.679.本研究与之相比,被试来源单一(同一学校的同一年级),测验分数变异随之变小,而且两次施测间隔时间长达1年,因此测验的重测信度水平下降.未来若条件许可,可选用跨学校、跨年级的样组进行较短时距的施测,思考活动的重测信度会有所提高.

运用概化理论对思考活动进行的信度分析结果表明,除变通力的概化系数和信噪比较低外,其他各维度皆具有良好的信度.进一步分析发现,在变通力上,被试与活动间交互效应所引起的变异相对较大,误差变异也就相应变大;另外,本研究样组来自同一年级,被试在此维度上的水平差异较小.这导致被试本身所引起变异远小于误差变异,进而使得变通力的信度指标值偏低.

5.2测验的效度

从效度的初步分析结果可以看出,倾向量表内部各维度间中等相关,各维度与总量表的相关则处于中高水平;而思考活动各维度间大多呈低相关.1999年,林幸台和王木荣对两个测验进行效度分析得出,思考活动各维度间大多呈中等相关( 0.183~ 0.756);倾向量表各维度之相关介于0.502~0.588,各维度与总量表之相关介于0.778~0.839.两次研究结果相似,与倾向量表各维度得分可合并为一总分、而思考活动只给出相对独立的各维度分数这一记分特点一致,体现了测验的结构效度.

5.3倾向量表和思考活动的关系

倾向量表与思考活动各维度两两相关中显著的不足1/2,且相关值均低于0.3,可能说明两测验间确实有一定关系,但并不紧密.如前所述,倾向量表测量创造性人格特征,思考活动测量创造性思维特征.就本次研究而言,两个测验的相关不紧密就意味着创造性人格特征与创造性思维特征间的关系不够密切.那么或许可以认为,即使个体具有高创造性人格特质,他也不一定能够出色完成创造性思维任务,反之亦然.无论如何,正如Williams所说,在教学情境中,认知和情意的行为对启发创造潜能有重大影响,如能配合使用评估认知和情意行为的工具,必能了解学生创造力的进步情形.测验实施者们要想得到全面而有说服力的创造力评估结果,就应视思考活动和倾向量表为同等重要,不可偏废其一.

5.4测验的应用

威廉斯创造力测验可用于评估学生的认知情意行为,即学生的创造性思考和创造性倾向程度.根据测验结果,学校可筛选出具有特殊才能与创造能力的学生.在发展创造力项目或资优教育项目中,该测验结果也可作为甄选学生的标准之一.

而且,威廉斯创造力测验可绘出学生测验结果的个人剖面图,分析比较个体在创造力不同维度上的优势与弱势方面,用以帮助学生在创造力发展上作自我探索和合理规划.此外,相关教育研究者们可以借助此套工具来考察目标对象的创造力情况,为下一步的分析和研究提供数据.

但是,值得注意的是,创造力测验所测得的创造力结果是根据测验编制者对创造力的定义,所以不同的创造力测验测量的是创造力的不同方面,尤其不能全面地显示出个人在不同情境、不同领域中的创造力水平,威廉斯创造力测验亦是如此.

6结论

研究得出以下结论:倾向量表的信度令人满意,思考活动大部分维度的信度良好;两个测验的内部相关分析结果在一定程度上支持了它们的结构效度;两测验有一定关系,但并不紧密,结合使用两个测验才能全面评估学生的创造力.

上文结论,这是一篇适合威廉斯和信效度检验和创造力论文写作的大学硕士及关于创造本科毕业论文,相关创造开题报告范文和学术职称论文参考文献.

信效度评价在住院患者体验量表设计中的应用
【摘要】目的引入信度和效度对住院患者体验量表进行评价,为量表的设计改进和推广使用提供理论依据 方法采用自行设计的体验式量表进行现场调查,使用SPSS13 0软件对量表的内部一致性、分半信度、结构效度和.

英国人威廉林赛的三十载长城梦
自小时候在学校的地图集看到中国的万里长城,英国人威廉·林赛就对中国长城感到着迷不已 在空中拍摄长城是他从小到大的梦想,而林赛去年开始采取行动,逐步实现儿时梦想 林赛“长城是奇.

现代性经验中的灵魂窥视者评王威廉的小说创作
王威廉身为“80后”作家,却与通俗概念中的“80后”有着云泥之别,正如王威廉这个名字一样,看似为英译名,带有“洋范儿”,却来自传.

冈比亚英语文学简论一以威廉康顿、伦里彼得斯、萨拉赫为例
引 言口头文学是西非地区特有的一种文学形式,有近1 500年的历史,是黑非洲最古老的文学艺术形式 口头文学是以说唱方式表达的,由于西非各族人民长期以来一直只有语言而无文字,所以自古形成一种口头文学 .

论文大全