2创造力的含义及评估

书名:情境中的创造力 作者:(美) 阿马比尔 字数:340251 更新时间:2019-11-27

  The Meaning and Measurement of Creativity

  人们常常会指责那些研究创造力的学者,19说他们并不知道自己在说什么。长期以来,创造力应该如何定义、如何评估,在心理学家中总是达不成一致的看法。虽试图通过不同的办法以建立一个标准来解决这个问题,但至今仍没有满意的结果。一些人认为,创造力可以通过某些具体的成果特性、个人特征或思维过程中的特质来予以认定。也有人提出,创造力应该通过观察者对成果的反应特征来定义。还有人认为,创造力根本就不可能被定义,因为它不为人知,也不可知。本章中,我将从不同的角度来讨论这些不同的观点,它们或许都有助于解决创造力研究中的标准问题。

  科斯林(Kosslyn,1980)曾说:“没必要为了研究,一开始就对研究实体下一个经得起推敲的定义……如果对一样东西知之甚少,给它下定义是很困难的。”(p469)很显然,有关创造力的研究情况正是如此。当然,鉴于对富有创造力的个体人格特征的研究已相当丰富,说我们对创造力的认识很少可能并不那么合适,但要对创造力下一个准确且普遍适用的定义,我们知道的确实还不够。比如,我们还拿不出一份特质清单,说具有这些特质的人所做的事情就一定有创造性;我们也列举不出一套客观具体的特征描述,以此就可以分辨出所有创造性成果;当然,我们也勾画不出创造性思维过程所包含的重要特征。不过,毋庸置疑的是,就算对研究实体还没有一个广泛接受的客观定义,也可以引导对这一实体进行科学研究。

  当然,这并不是说,可以把给创造力下定义这件事情无限期地推延下去,开始任何一项研究前,都必须弄清楚三个最基本的问题,而“定义”对其中回答任何一个问题都很重要。这三个问题是:(1)我们讨论的是什么?要准确地回答这一问题是非常困难的。但正如我之前所说,准确的答案并不那么至关重要。只要对研究实体的辨识能达成相当高的共识,就有理由对这一实体进行科学的测试。在本章后面的内容里我会证明,对于识别创造力,这种广泛的共识其实是存在的。20(2)如何研究?要回答这一问题,就要提出一个操作性定义,一个可以系统重复的研究方法。(3)怎么做?要完整地回答这一问题,则需要一套综合的过程理论。而要获得这样的理论构想,对研究实体就得有一个至少是行得通的概念界定。就目前的情况,我们必须从有关创造性成果特性、创造性个体特征和创造性过程特质的概念着手。

  在本章中,我将评述一些学者在定义和评估创造力方面所做的尝试,提出大多数研究者都努力而未能将创造力标准客观化的问题。然后,我会基于主观判断法给创造力提出一个操作性定义,并提出具有指导意义的概念性定义。这些定义是理论性概念的基础,而这些理论性概念则会在第四章全面阐述。

  以往创造力定义的思路

  最早针对创造力提出的许多定义都主要关注创造过程。这些定义都基于这样一种看法:经由这样的过程所产生的任何结果都可以被认为是具有创造性的。约翰·沃森(John Watson)提出的定义或许是最为著名的过程性定义了:

  新事物是怎样产生的?人们常会问这样一个问题:我们怎样获得语言上的创新,比如一首诗或一篇才华横溢的文章?答案就是:我们处理词汇,变换它们,直到偶然间出现新的模式。(Watson,1928,p198)

  凯斯特勒(Koestler)在评价人类创造力的行为主义观点时,说“代之于对老鼠的拟人视角,美国心理学家采用了对人类的拟老鼠视角”(p560)。凯斯特勒提出,创造性牵涉“双关过程”(bisociative process),而不是随机联系。也就是将两个过去没有关系的思维模块(matrices of thought)有意识地联系起来,以此产生一个新的视角或创意。照凯斯特勒的说法,这一过程包括“将注意力转移到过去未被注意的事物上。在过去这一事物属于无关事物,但在新的背景下这一事物则是有联系的,接下来就是发现隐藏着的相似性”。(1964,p119)

  其他理论学家在定义创造力时,也将注意力放在思维过程上。格式塔(Gestalt)心理学家(eg,Wertheimer,1945)认为,找到问题的重要特征及其与最终解决办法之间的关系时,所谓的创造性和顿悟就出现了。纽厄尔等(1962)则认为,“创造性活动显然由一系列问题解决活动构成,这些活动的特征是:新颖、打破常规、持续,且难以将问题定式化”(p66)。一些发展心理学家(eg,Feldman,1980;Gruber & Barrett,1974)认为,创造性思维与皮亚杰的转换理论(Piagetian transformations)有许多共同的特征。

  人们普遍认为,21吉尔福德(JPGuilford)1950年在美国心理学会所作的演讲,对创造力的心理学研究具有很大的推动作用。在演讲中,吉尔福德从个体的角度定义创造力。他的观点不但主导了20世纪50年代创造力心理学的研究,成为当时研究的焦点,也常见于当今的许多研究中:

  狭义上讲,创造力就是富有创造性的人物所具有的能力特点……换句话说,心理学家要解决的就是创造性人格问题……我常常将个体的人格定义为其独有的特质构成模式。特质是相对持久的,它使某一个体区别于其他个体。心理学家对行动中展示出来的特质,即行为特质尤其感兴趣。行为特质可归入广泛的范畴,包括资质、兴趣、态度和气质……创造性人格,就是富有创造性的个体中特有的特质构成模式。(1950,p444)

  尽管并没有多少人从个体角度明确提出过创造力的定义,事实上它却引导了大部分有关创造力的实验性研究。(Nicholls,1972)

  虽然创造力研究隐晦地强调个体,大多数定义却明确地将创造性成果作为创造力的区分标志。比如,杰克逊和梅西克(Jackson and Messick,1965)提出,创造性产品会引发观察者的一系列审美反应:惊奇、满意、鼓舞、享受。同杰克逊和梅西克一样,布鲁纳(Bruner,1962)也关注创造性产品所引发观察者的反应。他认为,创造性产品是任何可以引发观察者“深刻印象”的事物,除了能引起“认知震荡”(shock of recognition)外,该成果在新颖的同时,还要完全合理。大多数对创造性成果的定义都要求具有新颖性和合理性这样的特点。巴伦(Barron,1995a)认为,具有“原创性”的解决方案,(1)“应该在被研究的特定群体中有不同寻常的地方”,(2)“必须在某种程度上适应现实”(pp478479)。也就是从发生率来说必须是稀有的,而且该反应还必须在一定的程度上能解决相应的问题。麦金农(Mackinnon,1975)曾与巴伦合作,对富有创造性的个体进行过一项深入的研究。麦金农在采纳巴伦关于创造性成果的两个标准的基础上,增加了第三个标准:“真正的创造是一个持续的过程,包括从原创性的洞见,在此基础上的评估、细化,及其发展完善。”(p68)。基于独创性和合理性这一基本观点,斯坦(Stein,1974)也提出:创造力产生具有新颖性的成果,该成果有用、合理或令人满意,相对已经存在的东西,是一种真正的“飞跃”。

  尽管以前许多关于创造力的定义或隐或明地提出:个人的创造力或成果的创造性应该是一个连续量(continuous quantity),但在许多外行甚至心理学家眼里,将创造性视为一个二分变量(dichotomous variable)却是一个更为明智的做法。比如,吉尔福德(1950)在讨论创造性个体时就隐含了这一观点。而盖斯林(Ghiselin,1963)在明确创造力的标准时曾明确地提出这一观点:

  可识别、可定义的独创性,要么全部呈现,要么全然没有。22我们所研究的成果,不像一个物体可以浸染不同饱和度的颜色,并不总是或多或少地具有创造性。思维的产物,要么在这个或那个方面具有创造性,要么在任何方面都不具有创造性。(p37)

  此外,一些理论学家提出创造力具有不同类型:科学创造力、音乐创造力、艺术创造力和言语创造力。这种假设为某些理论奠定了哲学基础,如凯斯特勒(1964)的双关理论(bisociative theory)和吉尔福德(1967)的智力结构理论(intelligence structure theory)。有关创造力的基本维度和不同领域创造力的相似性的问题是很重要的,这些将在本章后面的部分进行详尽讨论。

  总之,个体观主导了大多数之前有关创造力的研究,但基于人格特质和基于创造过程特征的正式定义都很少。在严肃的著作中,创造性成果定义普遍被认为对创造力研究来说是最为适用的定义,即便是那些针对创造性人格和创造过程的研究亦如此。虽然有些评估方法遵循对创造性成果的明确定义,可在关于创造力的研究中却很少被采用。

  以往创造力评估的手段

  针对创造力的大多数实验研究都采用了以下三种评估方法中的一种:一些研究者试图对成果进行客观分析,还有一些研究者对成果或个体进行主观评价,而大多数研究者采用创造力测试。应用最为普遍的创造力测试在形式和操作上都与传统的智力测试相似。在考虑其他的测试方法是否可以采用时,有必要从启发法价值(heuristic value)、应用范围和局限性等方面,对这三种评估方法进行相应的考察。

  创造力测试

  在创造力实验研究中,创造力测试的使用最广泛。这类测试可以分为三大类:人格测试(personality tests)、传记调查(biographical inventories)和行为评估(behavioral assessment)。

  人格测试。这类测试首先包括传统的人格测试,事实上所谓的“创造力量表”(creativity scales)就源于这些测试。比如高夫(Gough,1957)的“加利福尼亚心理调查表”(California Psychological Inventory,Helson,1965)、卡特尔(Cattell)和埃伯(Eber)(1968)的“16种人格因素测试”(Sixteen Personality Factor Questionnaire,Cattell & Butcher,1968)、高夫和海尔布伦(Heilbrun)(1965)的“形容词检测表”(Adjective Check List,Gough,1979)以及海斯特(Heist)和扬(Yonge)(1968)的“多项人格调查”(Omnibus Personality Inventory,Heist,1968)。此外,还有一些对富有创造性个体的典型特质的专项测试。比如,“你怎样思考?”测试(“How Do You Think?”test,23Davis & Subkoviak,1975)、“发现创造才能的团体调查表”(“Group Inventory for Finding Creative Talent”,GIFT,Rimm,1976;Rimm & Davis,1976)和“你是哪种人?”测试(“What Kind of Person Are You?”test,Torrance & Khatena,1970)。

  高夫(1979)的“创造性人格形容词检测表”(Creative Personality Scale for the Adjective Check List)是上面第一类人格测量的代表。为了开发设计该量表,研究者在不同领域选取了12个样本共1701人进行研究,而相应领域的专家对这些人的创造性进行了可靠的评估。这些人自我报告中出现的300个形容词形成了形容词检验表。高夫从中选取了30个形容词形成了一个分量表,这些词在创造性高的个体和创造性低的个体之间存在差异。在这30个词中,18个与创造力呈正相关,它们是:能干、聪明、有信心、自我、幽默、个人主义、不拘礼节、有洞察力、聪颖、兴趣广泛、善于发明、别出心裁、沉思、机智、自信、性感、势利和不拘传统。有12个词与创造力呈负相关,它们是:易受影响、谨慎、普通、保守、传统、抱怨、老实、兴趣少、彬彬有礼、真诚、顺从和多疑。托兰斯(Torrance)和卡特纳(Khatena)(1970)的“你是哪种人?”测试属于专门针对创造力的典型人格测试。测试中,调查对象按既定要求选择一些形容词来描述自己。通常情况下,创造性高的个体会选择利他、好奇、主动来描述自己,而不会选谦恭、自信和顺从。

  传记调查。第二类创造性人格评估方法是传记量表调查(eg,Cattell,1959;Ellison,1960;Holland & Astin,1961;McDermid,1965;Owens,Schumacher,& Clark,1957)。这类调查的设计大部分先以一定的直觉为基础,然后选择一些被认为具有高创造性、低创造性或一般水平的样本进行测试,对设计进行校正和优化。“阿尔法传记调查表”(the Alpha Biographical Inventory)(Institute for Behavioral Research in Creativity,1968)就是在对美国航天局(NASA)的科学家和工程师进行大量测试的基础上发展而来的(Taylor & Ellison,1964)。谢弗(Schaefer)的“传记调查表创造力分表”(The Biographical Inventory:Creativity,Schaefer,1969)有关创造力的项目有165个,分为五类,即家庭史、教育史、休闲活动、身体特征和其他。泰勒(Taylor,1963)对圣地亚哥海军电子实验室的94名研究员进行了一项包括50个条目的传记调查,并将测查结果与其主管对他们创造性和生产力的评级进行对比。该研究揭示,高创造性的个体和低创造性个体间有的差异非常有意思。高创造性的人在大学里更喜欢数学、物理、电子、通信和其他自然科学(低创造性的个体则喜欢无线电、电力、电气实验和工程)。他们在大学约会的次数也更多(或者在大学时就结了婚)。在他们小的时候,家里装配有工作台和工具(低创造性的则没有)。而且24他们读的书也更多,最后,他们在其职业生涯中更雄心勃勃。

  行为测试。如果要求描述一种典型的创造力测试,大部分熟悉创造力文献的人都会提到某种行为评估,比起人格测试或传记调查来,这些评估更具有测试色彩。大部分这类测试都包括一连串的测试,这些测试在操作和形式上都与传统的智力测试很相似。吉尔福德提出了智力结构理论(structureofintellect theory,1956),为探测其中发散思维的构成,他设计了不少测试(1967),后来,这些测试成为许多创造力测试的模板。比如,吉尔福德的“非常规用途”测试(“Unusual Uses”test),该测试要求测试对象给一个普通物体(如一块砖)想出尽可能多的用处。不过,使用最为广泛的系列测试还是“托兰斯创造思维测试”(the Torrance Tests of Creative Thinking)(TTCT,也叫作“明尼苏达创造思维测试”[the Minnesota Tests of Creative Thinking,Torrance],1962)。许多其他测试的设计者都以该测试为标准来确证自己的测试。

  托兰斯创造思维测试(TTCT)包括口答测试、笔答测试、作图测试,测试结果可以按类分别进行评分,当然,其结果有时会被汇总,作为某人某项创造力的得分。测试需要遵循一个标准程序。儿童(测试原本是为他们设计的)往往在老师的安排下进行分组测试,测试有严格的时间限制。给儿童的指示语是不同寻常且聪明的回答才是合适的。测试对象针对测试条目作出回答,其结果从创造力的四个方面进行评分(主要基于吉尔福德的理论),即:(1)流畅性,有大量的想法产生;(2)灵活性,反应涉及许多不同的类型;(3)精致性,反应的演进、润色和充实;(4)新颖性,反应在统计中少有,不平淡无奇与老套。

  托兰斯创造思维测试可以分为三类:非词语测试、非言语刺激型词语测试和言语刺激型词语测试。非词语作业中有一项测试叫“圆圈任务”(Circles Task),在这项任务里,要求儿童用36个同样的空心圆圈画出尽可能多的物体,并给每一幅图一个标题。然后依据使用圆圈的总数对流畅性进行评分,依据所画物体的“不同种类”数对灵活性进行评分,在新颖性方面,作品在5%少数范围获得1分,在2%少数范围获得2分。最后,依据画图中所表现出的“恰当细节”数量来对精细性评分。非言语刺激型词语测试中,有一项测试叫“产品改进”,在这一测试中,向儿童展示一个玩具狗,然后要求他们“尽量想出最聪明、最有趣也最不寻常的方式来改变这只玩具狗,从而可以让孩子们玩起来更有意思”。在言语刺激型词语作业中,有一项测试叫作“后果”测试。在这项测试中,要求测试对象在五分钟内针对某一问题写出答案,如“假设人能随意变成隐形的会怎样?”大部分测试都会从四个方面来进行评分:流畅性、灵活性、新颖性和精致性。

  其他大部分创造力测试在形式、内容、25操作和计分上都与托兰斯创造思维测试(TTCT)相似。比如,沃勒克与科根的测试(Wallach and Kogan,1965)。尽管作者强调施测过程不做评价、不计时、像游戏一样,但该测试在形式、内容和计分上都与托兰斯创造思维测试(TTCT)没有本质差别。沃勒克和科根的测试包括五个分测试,每项测试都要求儿童对一系列问题用语言形式进行回答。在“举例”测试中,要求儿童“列举所有你能想到的圆形物体”或“列举所有你想到的会发出噪音的物体”等等。“不同用途”测试与吉尔福德和托兰斯设计的“非常规用途”测试在本质上是一样的。“相似性”测试要求孩子尽可能多地列举出两个物体之间的相似点,例如土豆与胡萝卜、收音机与电话。“图形意义”与“线条意义”测试则要求儿童在观察一些特定的抽象图案或线条画时,尽可能多地列出他们所能想到的东西。对每一项测试,根据在该测试组中儿童做出的属于独特的回答数来评定其“独特性”,“数量”分则根据其所有回答的数量来评定。

  一些学者试图针对创造过程来设计创造力测试,只是这样的设计为数不多。盖斯林、龙佩尔(Rompel)和泰勒(1964)曾设计一个“创造过程检测表”(Creative Process Checklist),用来评估科学家在获得创意那一瞬间的专注点和情感状态。他们让科学家回忆这样的瞬间,对在“形成新想法”或“解决问题”之前、之时或之后的状态,选出符合他们当时体验的形容词。在他们所认为的“创造性”科学家(创造性高而物质成就低)和“物质成功”科学家(创造性低而物质成就高)之间,两者在此过程中的体验存在明显的两极分化。以此将科学家分为两类,盖斯林和他的同事们发现,在开始思考一个问题时,“有创造力的”科学家常用“扩散的”和“搜索的”这样的词来描述他们的注意状态,“物质成功的”科学家则使用“集中的”和“鲜明的”之类的语言。在领悟之后,“有创造力的”科学家更易感到“高兴”,“物质成功的”科学家则更易感到“欣慰”、“满意”、“得意”、“充实”和“激动”。

  一个人在创造力测试上获得高分(或低分),这究竟意味着什么呢?将得高分的人等同于“有创造性的人”合适吗?可能许多创造力测试的设计者和使用者都认为这样去给一个人贴标签是合适的,但仍有学者告诫应该更慎重地处理这样的解释。沃德(Ward,1974)就认为,不应将测试的分数作为创造力的指标,而应该少赋予它所代表的意义,让这些测试更准确地反应测试中所涉及的某些特定能力。我的看法与沃德一样。在本书的第四章,我会指出创造性表现来自三个部分,它是先天的本领、学习获得的能力和对待任务的态度三者结合的表现。一项创造力测试可以测试其中的一种或几种能力或性情,26但一个单一的测试一般不可能将这三个方面都测试出来。因此,要更好地预期创造性结果,一项至关重要的工作就是:明确一项测试究竟测试了哪个领域的创造力以及创造力的哪个因素。

  环境对测试结果的影响。尽管有证据表明创造力测试确实能测量人相对稳定的特性和能力,但有趣的是,这些测试也让人们注意到各种社会和环境因素也会影响测试的结果。一些研究发现,仅仅告诉测试对象他们正在接受创造力测试,就可以提高测试分数。在一项研究中(Speller & Schumacher,1975),一些男孩和女孩接受吉尔福德(1963)“非常规用途”测试(砖头、扫帚、瓶子、报纸、衣架和轮胎),其中一部分孩子被告知他们进行的是“创造力练习”,另一部分则被告知进行的是“单词练习”。这些孩子的流畅性分数明显受到指导语的影响:被告知进行“创造力练习”的孩子的分数明显高于被告知进行“单词练习”的孩子。在另一项研究中(Manske & Davis,1968),当告诉测试对象要“有独创性”时,他们的独创性分数就增高;告诉他们要“注重实用”时,他们的“实用性”分数就增加;告诉他们要“不受限制”时,他们回答的总数就增加。如果让他们既注重实用又要有独创性时,他们的回答总数减少,但各项分数与没有特别要求的测试对象的分数没有差异。而在一项“形容词检测表”(Gough & Heilbrun,1965)测试中,当要求测试对象以一个有创造性的人的身份去完成测试时,比起那些仅仅要求完成测试而未做特别要求的测试对象,这些测试对象明显地更具有创造性 (Ironson & Davis,1979)。

  测试环境对创造力测试的结果可能也存在影响。对此,沃勒克和科根(1965)曾建议,创造力测试应在“不会因为学术评价或担心犯错后会如何而带来压力”的环境中进行(p321),而且,测试环境还应该“消除诸如时间限制等带来的压力”。沃勒克和科根的这些建议基于两个方面的研究结果:一是对测试对象在不同时间的创造力测试表现进行分析,二是有杰出创造力个体的自省报告。尽管有些学者的研究结果与沃勒克和科根的结果相矛盾(cfHattie,1977),但大量的研究表明,在不同的测试条件和时间限制下,获得的创造力测试分数会存在差异(eg,Adams,1968;Boersma & OBryan,1968;Christensen,Guilford,& Wilson,1957;Dender & Maclder,1964;Dewing,1970;Lieberman,1965;Mednick,Mednick,& Jung,1964;Murphy,1972;Nicholls,1972;Van Mondfrans,Feldhusen,Treffinger,& Ferris,1971;Wilner,1974)。

  更有意思的是,有些研究证明,测试环境中的语境线索会影响创造力测试的结果。在一项有关灵巧性的实验中,格卢克斯堡(Glucksberg,1964)让被试完成一个电路连接的任务。由于提供的电线太短,不能直接连接线路。完成这个电路连接的唯一方法,是嵌入一把螺丝刀来连接电线。呈现给一部分被试的螺丝刀刀口的颜色和亮度与电线相似,手柄看起来也像线路板27上的接线柱,呈现给另一部分人的螺丝刀则没有这些相似特征。结果发现,获得具有相似性螺丝刀的人更快地完成了这一任务。

  希金斯和谢尔斯(Higgins and Chaires,1980)让一些被试解决东克尔(Duncker)(1945)功能固着问题(functional fixedness problem):仅利用蜡烛和一些图钉,把蜡烛留在屏幕上。解决这一问题的唯一办法,是将图钉从盒子里倒出来,把盒子作为平台。在完成这一任务前,其中一些被试学习以“一致结构”方式(undifferentiated constructions)来记忆成对的事物(如一盘西红柿),另外一些被试则学习以“差别结构”方式(differentiated constructions)来记住同样的事物(如盘子和西红柿)。结果发现,之前学习“一致结构”性记忆的被试在解决东克尔功能固定时明显地更加困难。画一幅图也许算不上是真正的“创造力测试”,但有一项研究却发现一些有意思的结果:先前的环境刺激会影响绘画的创造性。研究者先让被试看两张幻灯片,然后让他们画一幅画。在呈现幻灯片时,对其中一些被试分别呈现两张幻灯片,对另一些人则重叠呈现 (Sobel & Rothenberg,1980)。结果发现,那些幻灯片重叠呈现的人所画的画,创造性评级明显高于幻灯片分开呈现的人。

  可以看出,社会和环境会影响创造力测试的结果,但想通过某一个理论框架来解释所有这类研究结果显然是不大可能的。在此我要强调的是,这些测试所评估的不仅仅是创造能力和态度方面稳定的个体差异,即使是在那些专门评估这些差异的测试里,社会和环境因素有时对测试结果可能起着决定性的作用。

  对创造力测试的批判。尽管有证据显示,情景和环境因素会影响创造力测试的结果,但仍有许多理由让我们相信,创造力测试并不能广泛地适用于创造力社会心理学的研究。创造力测试的某些问题限制了它们在实验研究中的广泛使用。第一,尽管有一些研究表明,创造力测试对某些品质的评估结果与现实中的创造性表现相当(eg,Torrance,1962,1972a),但若同考虑不同测试过程的聚合效度(convergent validity)时(cfHocevar,1981),近期的实验研究对许多测试的建构效度(一致效度和预测效度)提出了严重的质疑(cfBastos,1974;Goolsby & Helwig,1975;Holland,1968;Jordan,1975;Kazelskis,1972)。由于许多创造力测试相互矛盾,效度问题显得特别麻烦。

  第二,正如之前提到的,许多创造性力测试所评估的能力范围非常狭窄,将某一项测试表现笼统地贴上“创造性”指标的标签则是不合适的。有证据表明,托兰斯创造思维测试中的“独创性”分数主要受言语流畅性的影响(Dixon,1979;Hocevar,1979a,1979b,1979c)。虽然作为一种技能,言语流畅性对相应领域的创造力有着重要的影响,但将该项分数贴上“独创性”的标签,恐怕会误导人们的理解。

  第三,许多创造力测试声称其评分程序是客观的,28但事实上它们基本上都是主观的。从一些评分过程看,其结果必然基于评分者对什么是创造力的直观认识。即使评分指南列举的评分细则已足够详细,让评分者几乎没有主观解释的余地,测试实施者基于什么是创造力的直觉判断对测试表现进行评定,而不是针对新颖性、适宜性和满意度等的客观标准。也许是受客观测试在智力测试中所取得成功的推动,研究创造力的学者太急于将创造力评估方法客观化。许多创造力测试的确能测试一些能力和天性,这些能力和天性对表现出创造性来说可能也很重要,但将这样的测试结果直接标识为“创造力”这种更为全面的品质,则是不恰当的。我认为这样的判断终究只是主观的。

  所以,在实验研究中采用创造力测试有许多固有的障碍。发展创造力社会心理学有其特定的目的,而创造力测试最主要的特征是为了研究个体差异而发展出来的研究工具。测试的设计者特别强调测试能敏感地反映个体差异,如在诸多领域个体表现上的差异,或某些特殊人格特质方面的个体差异。大量的研究证据也表明,许多这样的测试所评估的的确是相对稳定的个体差异(eg,Gakhar & Luthra,1973;Holland,1968;Torrance,1972a,1972b)。尽管这些测试能精确地检测细微的个体差异,但并不适合用在有关社会和环境因素对创造力的影响的实验研究中(Feldman,1980)。通常情况下,为了更容易地侦测实验操作引起的组间差异“信号”,在测量关键的自变量时社会心理学家会控制或尽可能消除个体(组内)差异造成的变化(Carlsmith,Ellsworth,& Aronson,1976)。所以,在发展创造力社会心理学的道路上,依赖针对稳定个体差异而设计的测试技术是不明智的。

  我对创造力测试所作的这些批评或许会让人感到奇怪,因为在本书的好几个地方我都采用了创造力测试得出的研究结果来支持我的观点。我采纳这些研究结果的原因是:首先,一些研究实际上就是要调查个体差异,创造力测试当然非常适合这样的研究;其次,强烈的社会心理因素明显地对创造力测试结果有显著影响;最后,在采用这些研究结果时,我会谨慎考虑测试的效度问题。尽管这些测试存在问题,但如果大量的创造力测试都指向某一个特定的结论,且结果与采用其他方法的研究结果一致,那么基于这些测试得出的结果就可以被认为是有用的。

  创造力成果的客观分析

  评估创造力的第二个方法,是对成果进行客观分析。这种方法使用得并不多。如盖斯林(1963)认为,通过客观分析成果的内在品质来确定它们是否具有创造性,这样做是行得通的。不过盖斯林并没有对此提出任何具体方法上的指导。但他对这一方法的乐观期待仍强烈地感染着其他人。什么品质使成果具有创造性?如果真有一种方式可以将这些品质量化,再通过客观的手段来测量这些品质,创造力标准的问题也就永久性地解决了。几乎没有研究者提出清晰的创造力量化指标,但下面这项研究在这一方向上做了一丝不苟的努力,值得我们关注。

  在一项关于音乐的名气与其原创性关系的研究中(见第八章),西蒙顿(1980b)采用一种完全可靠、客观的方法来量化原创性。他从两本音乐曲目辞典中挑选创作日期和作者生辰都清楚的曲目,总共选出479个古典乐曲作者的15618个曲目。西蒙顿以每个曲目的前6个音符来确定作品的原创性。他将每个音符与其后的音符配对而得到五个双音符变调(twonote transitions)。他用电脑分析各曲目的双音符曲调及其音程,基于它们在所有双音符结构中的稀有程度来确定其原创分数。再将各双音符结构的原创分数相加,便得到一个曲目的原创总分数。

  显然,西蒙顿采用了简洁却客观严谨的操作定义,其方法让人振奋。不过,尽管这一方法可能非常有用,但把它作为对创造力进行客观评估的最终办法来接受则并不合适。这是因为将这一评估技术用于其他领域会相当困难,因为很多领域的产品不像音乐那样容易精确地描述。更为重要的是西蒙顿的办法并不能区分创造性与纯粹的怪诞。前面我们说过,除了新颖性外,几乎所有关于创造力的概念性定义都涵盖了价值判断,或称为适当性。事实上,西蒙顿(1980b)自己也暗示,他的独创性测试必须结合作品在大众接受方面的评估才构成创造力评估。“因此,相对于整个古典曲目,随着作品独创性的增加,其演奏频率增加到一个峰值后就开始下降。结果是最不流行的作品最具独创性。总的说来,创造力是独创性的曲线函数。”(p981)

  后面介绍我自己的研究结果时,还会回到界定创造性产品的客观特征是否可行这个问题。在这里我先提出一个后面还会论证的看法:仅仅通过简单的客观分析根本不可能完成对创造力的评估,但某些主观的评估却是必要的。

  主观评价

  主观评价的使用没有创造力测试那么常见,但用以评估个人或成果创造性的历史却很长。高尔顿(Galton)在《遗传的天才》(1870)一书中,通过传记辞典挑选杰出的学者和科学家,这种技术手段显然基于高尔顿以及辞典编撰人的主观判断。卡斯特尔(Castle,1913)曾对杰出的男性和女性进行研究,他利用传记辞典选出最初的样本,再从另外三个资料来源中筛选样本里出现过并占据最大篇幅的人作为研究对象。卡特尔(JCattell)(1903)也曾依据传记辞典上所占篇幅的大小排列出杰出历史人物名单。考克斯(Cox,1926)对300名天才的人格进行研究时,则从卡特尔(1903)编写的1000位最杰出的历史人物名单中选取自己的样本,收集这些天才的数据。在一项社会与文化因素对创造力影响的研究(1975a)中,西蒙顿把史料、文集和传记辞典对人物的引用频率作为创造力的评价指标。

  有些研究先挑选一组专家,再让这些专家评估特定个体的创造力。罗(Roe,1952)让四个学科的专家组分别选出其领域最杰出的人物,比如,她让6名生物学家给来自国家科学院(National Academy of Science)或美国哲学学会(American Philosophy Society)的同行排名。在一项有关音乐创造力影响因素的研究中,西蒙顿(1977a)依据美国音乐协会会员做出的排名(Farnsworth,1969)选出10位杰出的经典作曲家。

  这种专家提名程序在麦金农及其同事对创造性建筑师的研究中得到了最彻底的应用。这项研究在伯克利的人格评估与研究所(the Institute for Personality Assessment and Research)进行。他们要求加利福尼亚大学建筑学院的院长及其4名同事提名40位美国最有创造力的建筑师并给他们排名。他们被告知创造力的定义是:“构造上的独创性,适当的时候能撇开常规/程序,有效且开创性地设计出满足建筑学主要要求的设计的天赋及独特想法。”(p137)根据以上等级评定和他本人对建筑师作品简介的主观评价,麦金农对86名建筑师进行了排序。

  一些研究对特定成果的创造性进行主观评价,而不是去评价个体的创造力。比如,索贝尔(Sobel)和罗滕伯格(Rothenberg)(1980)让被试先看幻灯片,再画速写。放幻灯片采用分别呈现和重叠呈现两种方式。最后,他们让两名技艺精湛的艺术家对这些速写进行评级,并向他们说明评级应基于以下三个维度:

  1速写的新颖性:速写所表现的一个新鲜、新颖、新奇的设计、结构、形象或概念。

  2速写的价值:31指速写的艺术价值。它由以下因素决定:作品的效果,看起来是否有趣或视觉表现力,协调性或和谐性,可理解性,情感冲击力,“表达”或“传递”了某种东西。

  3艺术成果的整体创造潜力:指成果既新颖又有价值的程度。(p957)

  评判专家首先对每一幅速写的整体创造潜力做出评价,然后给每一个作品打分。作品的最低分为1分,最高分为5分。1分指速写很糟糕,即缺乏新颖性和价值,或者不管是在内容上还是技巧上都算不上是艺术作品;5分则指速写非常棒,即作品的新颖性和价值都很高。(pp957958)

  在另一项研究中,被试在实验室完成艺术作品(Getzels & Csikszentmihalyi,1976)。四个评判组(包括两个专家组和两个非专业组)从三个方面对图画作品进行评级。三个评价方面分别是:新颖性,技艺水平和整体美学价值。不过,研究中并没有就这三个方面的概念向评判者进行具体说明,而是让他们按自己的主观标准来对作品进行评价。

  关于采用主观评价是一个有趣但仍旧没有得到回答的问题,那就是:当评判者声称某种东西有“创造性”时,他们究竟指的是什么?成果的哪些特征会让他们做出相应的反应?而什么样的现象学回应状态(phenomenological response states)让他们给作品贴上这样的标签?很少有研究提及评判者对创造力所下的定义,刘易斯和马森(Lewis,Mussen,1967)算是其中这样做的研究者。他们发现,当问及对他们做出的儿童艺术评级的看法时,教师们说“原创性艺术”是当代的、抽象的和自发的,而有“艺术价值”的艺术是古老的、具象的、阴沉的,主要是使人感到愉悦。

  在一篇有趣的理论性文章中,杰克逊和梅西克(Jackson,Messick,1965)认为做出“杰出创造力”判定需要同时出现四种审美反应。(1)惊奇(surprise),即对成果的不同寻常做出的审美反应,通过与同类成果的一般标准对比做出判断。(2)满意(satisfaction),即对成果的合理性做出的反应,根据成果的背景做出判断。(3)启发(stimulation),即对成果的变异性做出的反应,依据是成果打破了接受为典型的环境束缚。(4)享受(savoring),即对成果凝练度的反应,对成果的概括能力或以一种简明优美的方式凝聚大量智慧或情感的能力做出判断。不幸的是几乎没有人对杰克逊和梅西克的理论进行实验性的研究,实际上针对任何有关创造力主观评价理论框架的实验研究都很罕见。尽管有研究证明,评判者可以依据“转换能力”来评价成果(Feldman,Marrinan,& Hartfeldt,1972),但当评判者可以使用自己的方式评价成果时,是否真正使用了“转换能力”(transformational power)(或其他要求的标准)来做评价却尚未得到证实。

  采用主观评价的研究避免了之前提到的一个问题,在采用评判者的评级时,这些使用了评估技术的研究测量的32主观性本质是显而易见的,这与看似客观的创造力测试不同。不过,以往采用的主观评价法在其他许多方面仍旧存在着诸多困难。首先,许多主观评价在区分成果的创造性和其他的特性上是无能的,比如技术上的正确性或审美上的吸引力(cfHocevar,1981)。其次,研究者在一些研究中将他自己对创造力的定义提供给评判者,或者事先对评判者进行培训从而使他们的观点达到一致(eg,Eisner,1965;Rivlin,1959;Wallen & Stevenson,1960)。对于这些研究,评判者之间的信度就成了一个问题。当然,对于那些只有一个评判者的研究,评判者的信度无从谈起,评价的意义就更成问题。最后,一些研究依据在历史记录中的突出性来评价创造性,由于个人的、政治的或其他与创造力不必然相关的因素干扰,结果会出现偏差(cfStein,1974;Wallach,1970)。

  最重要的是,前面谈到的主观评价法或许并不适用于社会心理学研究。基于某个人的终身成就来评价其创造力,更适合检测某些相对稳定的特征,因此更适用于人格研究,而不是社会心理学研究。在研究稳定社会因素(如家庭结构)的影响时这些技术可能派上用场,但要研究不那么稳定社会因素(如临时的工作条件)的影响就不合适了。

  即使是那些对单个成果进行评级的办法,可能也对大的和稳定的个体差异过分敏感。第四章我们将讨论创造力的理论框架,其中会谈到创造力表现基于三个要素,即与特定领域有关的技能、与创造性思维相关的技能和针对特定任务的动机。在这一概念化过程中,社会心理因素主要对任务动机产生影响。显然,如果控制或消除领域相关技能和创造力相关技能的影响,创造力评估就会对任务动机的作用十分敏感。所以,如果要求测试对象完成的任务像之前大部分主观评价法中的任务那样需要相当高的特殊才能和经验技术,那么这些测试对社会心理因素的作用就不敏感。最后,采用创造力测试的研究,同那些采用主观评价的研究没有关于创造力的明确操作性定义一样,也深受其害。因为研究者们要么没有明确阐述指导他们研究的创造力定义,要么给出的概念性定义与评估方法没有直接联系。33目前几乎所有的创造力定义都是概念性的而非操作性的,并不能转换成实际的评价标准。因此,尽管已有感觉合理的创造力定义,但这些定义与目前的评估技术并没有多大的联系。

  目前采用的创造力评估方法有着各种各样的问题。那些意图客观识别成果创造性特征的方法适用范围不广,最终不能作为创造力的唯一指标。创造力测试虽然看起来客观,事实上却基于对创造力的主观判断。更为重要的是,大部分这样的测试都对个体差异敏感,而并不适用于社会心理学的研究。那些直接的主观评估办法可靠性往往存在问题;或者因为抽样原因使它们同样对个体差异过分敏感。最后,所有这些创造力评估方法,都缺乏明确的操作性定义作为其设计基础。这一问题非常关键,要改善创造力评估技术,必须从解决这一问题入手。

  我认为,要解决创造力指标问题,首先得采用两个相互补充的关于创造力的定义。一个是操作性定义,用于实验研究。另一个是根本的概念性定义,用于创造过程理论的构建。

  创造力的共识性定义

  我在研究项目中所使用的创造力评估办法,基于创造力的共识性定义。这是一个明确的操作性定义,大部分主观评价法都蕴含了这一含义(cfAmabile,1982b):

  说一个成果或回应具有创造性,是指适当的观察者独立地认为在相当程度上它们具有创造性。在这里,适当的观察者是指对成果或回应所属领域熟悉的人。因此,可以将创造力看作是产品或反应的品质,这些品质被适当的观察者判断为具有创造性,也可以将其看作是被判断为具有创造性的产品和回应的产生过程。

  和目前大多数创造力定义一样,共识性定义也基于创造性成果,而不是创造性过程或有创造性的个人。就目前的心理学理论和研究方法,要提出一个基于创造性过程的定义并不可行。尽管目前的研究在这方面已取得一些进展(eg,Newell et al,1962),但还不可能理出一个清晰且详尽的创造性过程。更重要的是,要辨别一个思维过程或子过程是否有创造性,最终得依赖这一过程所产生的结果,即一个成果或一些回应。同样,即使我们能清晰地列出一组人格特质而将极具创造性的个体区别开来,这些人格研究如果是有效的也仍然在一定程度上基于他们作品的特性。因此,最可能适用于经验研究的定义,应该是基于对成果的检测。

  正如我之前提到的那样,34一些理论家(eg,Ghiselin,1963)认为,提出可清楚界定且易转换为评估方法的创造力标准是可行的。但勾勒出清晰客观的创造力标准的希望至今都没能实现。事实上我认为,清楚地提出一个可以判定成果具有创造性的客观标准是不可能的。就像对喜欢程度的态度评估(Thurstone & Chave,1929)或对某人“外表吸引力”的识别(Walster,Aronson,Abrahams,& Rottman,1966)都是主观评判一样,对创造性的评估亦复如是。当观察者评判喜爱程度、外表吸引力和创造性时,他们一定会关注态度声明、个人或作品的某些特征。但对这些特征的选择却是一个主观过程。

  为了能进行经验研究,似乎有必要搁置对客观创造力标准的期待,而去采用一个基于明确主观标准的定义。这就是我前面提出共识性定义的目的所在。共识性定义通过测试在概念上标识创造力。它也许确实能识别那些与主观判断和相关成果客观特征之间的相互关系,或详细说明这些判断的主观关联,但这一概念并不需要事先弄清楚那些客观特征或主观判断方面的特性。

  在应用这一操作性定义时,我们针对创造力的本质和创造力评估做了一些重要的假设:首先,我认为,成果或可观察的回应必然是创造力的标志,不可能事先推定新成果的哪些客观特征将会被认为“有创造性”。正如社会心理学研究中采用的大多数概念(cfGergen,1982)一样,创造力标准也要求一个社会历史背景的限定。

  其次,尽管很难说清一个成果的创造性特征,也很难弄清观察者对创造性成果反应表现出的现象学特征(Feldman,1980),但我仍旧认为创造性能够被人们识别且往往能达成共识,即使在没有提供指导性定义的情况下也能做到这一点(Barron,1965)。

  再次,和之前的理论家一样(eg,Simon,1967a),我也认为,创造力具有某种基本形式,创造性产品具有某种基本品质,当观察者认为某物“有创造性”时,他们所依据的就是这一基本特性,不管他们来自科学界还是艺术界,情况都如此。

  最后,我认为,创造力有程度之分,观察者可以对某些成果比另一些成果具有更高或更低创造性达成一定程度的一致。连续性假设在创造力心理学理论发展中非常普遍。比如卡特尔和布彻(Cattell,Butcher,1968)就提到,创造力“可能表现出不同水平,从发现原子结构到整理花园,都涉及创造力”。(p279)尼科尔斯35(Nicholls,1972)曾反对创造性人格特质的正态分布假设,但他承认在评价创造性成果时采用连续性假设(the assumption of continuity)是合理的。不过,仍有必要指出,尽管在创造力心理学研究中这一假设常常被明确地提出来,但仍有许多有关创造力的文献隐藏着创造性是一个二分变量的观点:要么某人具有创造力或某成果具有创造性,要么完全没有。

  创造力的概念性定义

  从研究需要的角度,有必要基于主观标准对创造力下一个操作性定义,但这一定义本身并不足以在某一创造力理论框架下使用。尽管目前在对人类创造力进行实验研究时还不能采用具体的标准来指认创造性成果,但任何有关创造力的理论构架都必须对这些标准及其特性做出推定。所以,为了给创造力的理论模型奠定基础,有必要对观察者反应的性质做出推定,即当他们说某事物“有创造性”时,他们反应的本质是什么。

  后面的章节会提到创造力理论框架,其基于这样一个创造力概念性定义,该定义包含两个基本要素:

  如果一个成果或反应(a)对任务来说新颖且合理、有用、正确或有价值,以及(b)该任务是启发式(heuristic)的而非运算式(algorithmic)的,就会被判断为具有某种程度的创造性。

  这一概念性定义与前面提到的大部分有关创造性成果的定义一样,将新颖性和合理性特征作为创造力的两个标志。但我们提出的这一定义,还要求任务必须是启发式的而不是运算式的(cfMcGraw,1978;Taylor,1960)。对运算式任务和启发式任务的经典解释是(eg,Hilgard & Bower,1975):运算式任务是指解决路径清楚且直接的任务,即对解决任务来说,已存在相应的运算法则;与之相反,启发式任务则是指那些没有清晰且易识别解决途径的任务,即需要先找到一个启发式方案才能解决问题。当然,这里是指研究者向测试对象呈现那些运算法则尚未被人们广为知晓的任务。“解决路径”在这里应该如大众所认识的那样理解为一系列认知和动作运行(cognitive and motor operation)过程,这一过程产生该领域可接受的回应或成果。根据定义,运算式任务有清晰且认可的目标,启发式任务则可能有也可能没有,重要的区别是:对于启发式任务而言,解决问题的路径不完全是直接的。事实上,在很多研究中,36启发式任务并没有规定明确的解决方案或目标,识别它们成为任务解决的一部分。正如许多理论家(eg,Campbell,1960;Getzels & Csikszentmihalyi,1976;Souriau,1881)提出的那样:发现问题是创造力活动的一个重要组成部分。

  为了阐明这一差异,我们在这里分析一个有关运算式和启发式任务的例子。如果一位化学家通过大家都熟悉的合成步骤,逐步合成出一种新的碳水化合物。根据以上概念性定义,即便他合成的东西是新颖的(在此之前没有被合成出来过)和合理的(能满足很好地解决问题的要求),他的工作也不能被认为具有创造性。只有他发展出另一个算法来完成合成,才能被认为有创造性。同样,如果一名艺术家遵从“画深色调背景里有着悲伤大眼睛的不同孩子”这一法则去作画,即便每一幅图都独特且技法纯熟,他的画也不能被认为有创造性。

  显然,有一大类任务既可能被看作是运算式的,也可能被看作是启发式的,这取决于特定的目标和任务执行者的知识水平。比如,如果任务的目标就是烤一个蛋糕,而且有相应的食谱可做参考,那么这个任务就是运算式任务。如果任务的目标是烤出一种新蛋糕,其食谱还有待发明,那么这个任务就是启发式的。当然,有些任务就只能是运算式的,如解决一个加法问题;另一些问题则只能是启发式的,如找到白血病的治疗方法,因为还没人知道它的解决途径。但大部分两者皆有可能。

  确定某一任务是运算式的还是启发式的,得看任务执行者对该任务的认知水平。即使已经存在解决问题的运算方式,如任务执行者并不知道,那么对他来说,这个任务仍然是启发式的。比如,如果一名学生独立地证明了一个著名的几何学定理,可以肯定,他完成的是一个启发式任务。如果他的证明在一定程度上新颖且正确,那么该学生的工作就可以被视为具有创造性。

  如果这样去界定任务是运算式的还是启发式的,对创造力评估来说,就提出了一个重要问题,即评估依据的是规范(normative)标准还是自比(ipsative)标准。创造力的概念性定义包含运算式启发式这一维度,似乎是基于自比标准。也就是说,如果任务对于任务完成者来说是启发式的,那么当他给出新颖且合理的解决方式时,他的成果或反应就可以被认为有创造性。共识性定义却与之相反,似乎基于规范性标准,因为它没有提到观察者对创造者本身知识的关注。

  我认为,尽管创造力评估首先基于规范性标准,但一定也在某种程度上基于自比标准。评估者必须对评估对象有所了解(或对此自行猜测)才能确定这一任务是否是启发式的,以及其反应的新颖性和合理性在对照群体中所达到的水平。显然,37艺术评估者在评判儿童拼贴画时所采用的评判标准与他们评判成熟艺术家作品的标准不同。在评价任务性质和对比人群的合理性时自比信息因此发挥作用,但是在此之后对创造力的评估就基于规范性标准了。

  在阐述共识性定义时,我认为创造力评估最终必然受文化和历史因素的制约。但这种制约究竟会涉及观察者判断的哪些方面呢?是对新颖性或合理性的判断,还是对任务是运算式抑或是启发式的判断?我认为以上各方面都会受到文化背景和历史阶段的影响。该领域过去已有什么样的成果和反应显然会对观察者产生影响。对新颖性的评价也正是通过这种途径来完成的。对新颖性进行回顾性评价也通过这种途径。在评价过去作品的创造性时,观察者会考虑作品产生时的社会历史背景。比如,在宣称电影《公民凯恩》(Citizen Kane)具有很高的创造性时,当代电影评论家不是依照现在的时代精神(Zeitgeist),而是参照影片出品时期的电影艺术水平在做判断。而且文化因素界定了什么合理什么不合理,从而对观察者产生影响。最后,观察者必须在一定程度上依赖他们对相应领域时代潮流的了解,来确定某一任务的解决方式是已经明确提出过(该任务是运算式的)还是尚不为人所知(该任务是启发式的)。

  尽管创造力的操作性定义与概念性定义起着不同的作用,它们却密切相关。概念性定义为第四章将讨论的理论框架打下基础。将创造力有效地概念化必须解决这样一个问题,即创造性成果的关键特征是怎样在任务解决过程中演化出来的?相应的观察者在对成果进行创造性评级时,他们参照的哪些特征是合理的?本质上,概念性定义是对此问题一个较好的推测。但是很显然,由于还不能客观描述“新颖性”(novelty)、“合理性”(appropriateness)或“明确性”(straightforwardness),定义中提到的特征也并不能直接套用适用于经验研究的定义。因此,尽管有必要给出一个概念性定义,一个有关创造力满意的操作性定义,仍旧必须回到创造力评估的最终判断标准上,即可靠的主观评价。

  在下一章中,我会报告一个研究项目。该项目基于我提出的操作性定义开发出一项对创造力进行主观评估的技术,并对该技术的合理性进行了测验。

  最近研究成果

  从概念角度,我们与这一领域中的大多数人一样,仍然赞同莫里斯·斯坦(Morris Stein,1953)38关于创造力定义里所蕴含的精神,他认为:“创造力就是一个产生新颖作品的过程,且该作品在特定时间被一些人认为是合理的、有用的或者令人满意的。”之前谈到我的创造力概念性定义有两个关键要素,即新颖性和可接受性或称为合理性,莫里斯·斯坦的定义也包含了这两个要素。除此以外,莫里斯·斯坦的定义也暗含了我们关于创造力操作性定义的用途,即基于某一时间某一社会群体而进行共识性评判。

  在本书的第一版中,我们认为,提出的概念性定义和操作性定义之间并没有直接的关联。提出操作性定义是为了开发出有用的创造力评估方法,如果相应的观察者认为某一成果具有相当程度的创造性,那么它就是有创造性的。提出概念性定义是为了构建创造力理论,根据这一定义,创造性是对启发式任务(或开放式)作出新颖且适宜的反应。本质上,概念性定义基于观察者因为某种东西而认为某成果具有很高创造性的假设。

  过去几年,我们收集观察者关于创造力标准的证据。在埃莉斯·菲利普斯(Elise Phillips)的一项研究中,她要求刚担任创造力评判的艺术专家对其他艺术家的作品进行创造性评价。然后,就作品传达的情感、背后的思想(主题)、作品的想象力、表现力、作品中的变化、令人兴奋的程度、色彩的运用、对称/不对称、复杂/简单、抽象性、写实性、采用的形式等品质要求这些专家根据每项品质在评价过程中的影响程度对其排序(Phillips,1993)。结果,专家们整体排序的一致性一般,但对最重要的品质却有更高的一致性。在10位专家中有7位认为“想象力”(新颖性)是他们评价创造力时最重要的指标。当然,这些研究数据仅仅是一个开始,要找到概念性定义与操作性定义之间确切的关联,还有大量的工作需要做。

  这里,有必要重申其他几个有关的假设,这些假设是我们当初定义的基础。自提出该定义后,许多其他的理论学家也重申了这些假设的作用。比如,我们认为,创造力评估必然受制于具体的社会、文化和历史背景。如果不知道相应时期某一领域还有其他什么东西就不可能对成果的新颖性做出评判,如果不了解相应背景下某一成果的作用或意义也不可能对它的合理性做出评价。所以,没有一定的文化、社会或历史背景,不可能评估产品的创造性,甚至不可能产生创造性成果本身。近几年,许多理论学家都强有力地提出了同样的观点,其中包括西蒙顿(1984)和奇克森特米哈伊(1988)。

  在1983年版中,我们认为创造性连续体假设是合理的,即存在从最低端的“花园多样化”到最高端的导致相应领域甚至社会转变(变迁)的创造,前者来自于普通人以合适的方式较为新颖地完成日常事务,后者则通过天才的著名成果。不过,针对这一假设,39还存在相当多的争议。一些学者像我们一样,完全接受连续性观念的作用(eg,Isaksen & Dorval,1993;Kirton,1976;Sternberg & Lubart,1991),但最近几个理论学家或明确或隐晦地表明,创造性是非连续变量,天才级别的创造无论在品质还是数量上都有别于该领域中其他所有的工作(eg,Feldman et al,1994;Gardner,1988;Gruber,1988)。由此,关于创造性的推论是:产生顶级作品的过程在品质上与其他过程不同,只有这样的过程才能被称作“创造性过程”。

  然而,我们却一再发现,无论是普通人的作品还是某领域高水平专家的作品,当我们把这些作品交给专家评估时,评估专家都能够确切地给出这些作品的创造性水平。我们甚至认为,由于对立的假设没有令人信服的证据,无论是对于创造性产品还是创造过程,创造性连续体假设的有效性都十分地显而易见。

  创造性作品的确常常显示出某种非连续性。与学艺术的新生相比,毕加索的作品在品质上的确有很大的不同。我们认为,这种不连续表现源于创造性的高偏度分布,即该领域几乎所有成果都没有创造性或仅表现出极低的创造性,而创造性水平越高其成果数量越少,即使是在高创造性成果与极高创造性成果之间,品质上也会有很大的明显的差异。

  此外,我们还认为,即使是创造性水平差异极大的成果,其产生的基本过程也可能是一样的。迄今为止,还没有明确的证据来终结这方面的争论。不过,比拟动力系统理论(dynamical system theory)方面的研究,对阐明同一基本过程怎样产生品质完全不同的成果,可能有所帮助(Amabile & Tighe,1993)。

  这个比拟是这样的:让一匹马站在均匀加速的跑步机上,跑步机开始慢速启动,这匹马开始走动。当跑步机的速度增加到某一水平,马的动作便出现质的变化,它开始急走,随后开始小跑,最后开始飞奔。跑步机速度的量变导致马的步态出现质的变化。对一个观察者来说,他所看到的马第一时段(走动)的活动,与他看到的第三时段(小跑)的活动非常不同。但尽管每一阶段的活动方式看起来都有质的不同,但产生这些活动表现的基本系统,无论是跑步机还是马,始终都是一样的。

  我们认为,随着创造性各要素(如能力或动机)量的变化,同一个基本过程可以产生出不同质的成果。不管成果在创造性上是否出现了质的变化(或显示出非连续性),其过程都是一个连续体。即便存在非连续性,我们仍然相信,40研究较低水平的创造力就可以说明天才级的创造力。

  要探讨社会心理因素对创造力的促进或阻碍作用,研究中间水平的创造力或许更有用。一方面,这样的研究对象很多很好找。另一方面,在找不到天才的情况下,个体可能更容易受社会因素的影响而表现出更多水平不同的创造力。我们既可以观察不同个体之间的这种差异(正如我们在大部分研究中所做的那样),也可以观察同一个体的变化。当然,评估个体内部差异与标准的创造性同感评估法(consensual assessment of creativity)有所背离,因为共识性评估是将某领域不同个体的成果进行比较。个体内的差异评估需要一种更具自比色彩(基于个体)的创造性同感评估法,也就是将某领域中某个体某时间的作品与另一时间的作品进行比较。这两种方法都能够并且也应该用于高水平和一般水平的创造力研究中。自比性创造力测试尤其适用于探讨社会因素对人的终身影响(在多大程度上一直拥有天资或专业技能)以及儿童创造力的发展。

  在本书的第一版中,我们对创造力测试提出了批评,认为它们不适合对创造力进行社会心理学研究,甚至不适合大多数其他目的的研究。在那之后,又有许多有关创造力测试新的批判性文章发表了。比如,霍西瓦和巴彻勒(Hocevar,Bachelor,1989)就曾对基于人格的创造力测试和发散思维测试进行了彻底的批评,并提倡将焦点放在创造性成就和成果上。尽管创造力测试因操作和计分的方便仍被广泛采用,但许多研究者已开始选择对创造性成果进行可靠的主观评估。当然,这也是我们将在第三章中讨论的测试方法。现在,我们认为:在创造力研究中,创造力测试和对成果进行主观评估有着各自不同的用处。创造力测试倾向于测量产生创造性的特定认知系统和技能(在我们的理论中名为“与创造力相关的过程”),共识性主观评估则适用于对成果的创造性进行广泛而全面的评价。

目录