机器可批高考作文?至少能有效背作文和套

作者: 来源: 本站整理 时间: 2018-04-27 阅读:

  正在高考评分中,做文往往是最花费工做量,也最具争议的一项。近年来,因为高考做文评价系统屡遭质疑,相关范畴的专家学者起头思虑使用机械评分,来代替精确度不高且耗时耗力的人工批改。11月26日,华东师范大学中文系副传授徐默凡,正在华东师范大学一场相关“招考做文写做质量的计量和计较”的研讨会上,就机械正在做文评分中的实现可能性进行了切磋,并对当下的招考做文评分进行了反思。

  据徐默凡引见,目前无望使用于机械评分的天然言语处置模子有三类,别离是基于法则识别、数据统计和神经收集的天然言语处置。

  所谓基于法则识此外天然言语处置,是基于必然的法则对做文进行句法阐发和语义阐发,从而控制对言语的理解和表达。徐默凡认为,这条对于做文机械评分是走欠亨的。由于起首,人类本身并未建构起精确的做文评分尺度;其次,做文评价尺度涉及到的要素比句子理解更多,思惟、逻辑、布局、言语等要素难以法则化。

  第二种模子则是基于神经收集的天然言语处置。它的道理正在于使用脑科学和仿生学,仿照人脑对消息的处置体例。然而正在徐默凡看来,这种模子也不适合用于机械评分。除了锻炼复杂度高,费时吃力之外,无法对它的消息处置过程进行探测和评估,因此成果的可注释性差。

  更主要的是,这种模子牵扯到了环节的智能伦理问题。AlphaGo的横空出生避世令人惊讶,而比拟围棋,做文更是人类智能的表现。若是将做文评分交给人工智能,很容易惹起伦理上的反感以至发急。高考这一事关良多人前途的严沉测验,若完全交由人工智能去判断评分,很有可能会形成“机械将会人类社会”的联想。

  于是比拟之下,基于数据统计的天然言语处置才是更适合机械评分的模子。这种数据统计的根基道理是,一个句子能否合理,不必领会它的句法语义,只需要调查它正在人类说过的话中呈现的可能性大小若何:呈现的可能性越大,即越合理;可能性越小,则越不合理。理论上,进行这种天然言语处置时,需要把人类讲过的所有话都统计一遍;然而正在现实中,进行词频统计就已绰绰不足。“词频统计现正在曾经是比力成熟的研究了,”徐默凡说,“正在现实中,也能够考虑到前后文的联系关系和影响。只是考虑的词越多,意味着计较也会越复杂。”

  徐默凡指出,数据统计能够无效背做文和套做文的行为。现在中高考已成为了背做文和套做文的沉灾区,统一个教师教出的学生了一样的范文,因此测验时写出类似的做文,这一遍及现象若依托人量是很难被察觉的。这里就是机械大显身手的处所了。它能够通过统计给出反复率百分比,并从动摘要出分歧考生所写的不异事例,再由人工判定能否是做弊。

  此外,做文的言语规范度也能够利用统计丈量。通过计较每篇做文的概率值,概率值越高申明言语用法越常规,以此就能够识别不规范的言语用法。“当然,概率低也有一种可能,那就是做文正在言语长进行了立异,利用了一些新鲜的表达。正在此利用统计法,至多能够挑出概率低的表达,进而进行人工筛查,沉点关心,再按照分歧类型的做文要求赋分。”徐默凡说。

  正在对现有的手艺正在实现机械评分的可行性长进行阐发会商后,徐默凡又引入了一个话题:做文实的能够丈量考生的语文程度吗?

  高中语文教员次要将精神用正在了总结应对高考做文的技巧上,只讲授生对付测验的方式,而疏忽了实正在语文能力的培育。由于学生只需控制了招考技巧,就可以或许正在高考做文中拿到高分,然而这并不脚以证明其语文能力的优良。从另一方面看,这也证了然现今的高考做文命题取评分机制正在权衡考生语文程度的凹凸上存正在必然的坚苦。因此做文可否表现语文程度,又是如何丈量语文程度的,成为了一个值得深思的话题。

  徐默凡暗示,良多人认为做文程度只能全体,因而机械无法胜任,人类也无法。但这一问题并非无解。他犀利地指出,既然目前的做文评价量表能够将考生的做文程度分化为言语表示、思惟内涵等等,为何不为每一项能力的评估特地设想一套试题?让做文从繁琐而恍惚的评分系统中开来,换以更清晰也更有针对性的试题,岂不更好?

  对于这一颇具性的建议,现场专家学者不尽附和。“能写出一篇篇幅较长的文章,就是对考生能力的最大必定。而且中国有漫长的写文章的保守,不成等闲中缀。”正在场的一位学者说。看来,相关招考做文的命题评分系统的,还有很长的要走。

欢迎访问爱写作网iixz.com

赞助商链接