找回密码
 立即注册
搜索
热搜: 活动 交友 discuz
查看: 192|回复: 1

Transformer自动纠语法、改论文,我们试了试这个免费英文 ...

[复制链接]

8

主题

17

回帖

49

积分

新手上路

积分
49
发表于 2023-2-27 07:26:42 | 显示全部楼层 |阅读模式
来历:知乎



来历:机械之心

Transformer自动纠语法、改论文,我们试了试这个免费英文 ...-1.jpg

在当前疫情下,我们已经离不开居家进修了,各类备考也得提到日程上。机械之心的读者大大都都是理科生,数学、计较机都还是有一些「天赋」。但是对于英语,貌似这些天赋帮不到我们什么,缺少「语感」的我们在写作文时经常会犯一些拼写、语法毛病。
英语阅读或听力等别的部分还好,有比力标准的对错判定标准。可是对于作文,极能够写了毛病句子,我们还真以为它完全没题目。
也许小伙伴们正在备考四六级或托福雅思,也许正在写机械进修论文,这篇文章将先容有道辞书中的 AI 作文批改,将我们写的英文传到 APP 上,它将自动批改打分,而且改正我们的语法、拼写等毛病。
AI 作文批改功用已经放到了最新版本的有道辞书 APP 中,我们先试用了一下雅思作文与 arXiv 上的论文。以下左侧是雅思作文,它会给作文整体打一个分数,并经过点评告诉你哪些地方需要增强,例如辞汇的丰富度、逻辑的联贯性等等。对于我们比力关心的语法,AI 作文批改也会给出点窜定见,例如「environment」就保举改成「environmental」。

Transformer自动纠语法、改论文,我们试了试这个免费英文 ...-2.jpg

此外,很多研讨者都需要做尝试写论文,但是机械进修范畴的论文根基都是英文,按我们的思绪写完论文后,中心会存在很多细节题目。如上机械之心在上传一段 arXiv 论文后,AI 作文批改确切能给出一些很好的点窜倡议。例如它让我们将「On the other hand」子句自力出来,确切在结构上有更好的可读性。
这么好的利用已经做出来了,而且还是免费的,有英文作文点窜需求的小伙伴还不赶紧翻开有道辞书,体验白嫖的快乐~
那末题目来了,要实现 AI 作文批改,它的思绪、道理又是什么样的?
看思绪,自动批改怎样解?
有道辞书 AI 作文批改的利用结果已经展现在这边了,从机械进修及从整体进程上来说,AI 作文批改可以分为评分、评语和纠错三大模块。其中评分会从辞汇、语法等角度打分;评语也会从辞汇、语法、结构等维度去斟酌,但同时还会供给同义辞汇、高级辞汇保举以及佳文保举等;纠错则需要识别并供给点窜定见。
评分与评语天生都可以归为评分框架,在此进程中,年级或作文作者的进修阶段需要充任条件。全部评分框架可以连系传统方式与深度进修方式,充实发挥它们各自的上风。
例如传统线性模子,我们可以在词、句、篇章维度上给出评分。作文的词数、辞汇丰富度、高级辞汇能否是充足?拼写、语法、句式把握能否是没题目?篇章的逻辑性、主题能否是都联贯?

Transformer自动纠语法、改论文,我们试了试这个免费英文 ...-3.jpg

这三个维度并不能概括整体的作文质量,我们还需要一个深度神经收集来从「作文整体」给出一个分数。
以下是有道打分模子的首要框架,其中 w_i 都是某个句子的「单词」,每一条句子会经过卷积神经收集编码为一个「句子语义向量」。这些语义向量终极会经过循环神经收集与留意力机制编码为一个作文的整体分数。

Transformer自动纠语法、改论文,我们试了试这个免费英文 ...-4.jpg

整体上,作文打分与评语天生的处理思绪比力轻易了解,可是要想模子能自动点窜语法毛病,这似乎就比力难处理了。
难道还用端到真个模子练习?我们真不能肯定深度神经收集能自己完成「纠错」这一功用,究竟,在我们的印象中,语法毛病的品种很是多,「语感」这一说法又比力缥缈。
有道的处理计划也很是成心机,首先对于简单一些的拼写纠错,我们可以按照命名实体识别(基于 BERT)及统计模子给出一个得分,根据辞书、编辑间隔等众多特征判定拼写能否是有题目。
前面临于重头戏语法纠错,有道尝试将其界说成序列到序列的天生题目,操纵 Transformer 的强大拟合才能与有道积累的数据量间接进修。

Transformer自动纠语法、改论文,我们试了试这个免费英文 ...-5.jpg

看起来语法纠错模子的思绪并不难,但重点在于 Transformer 的数据量需求很是大。难道我们真的能像机械翻译范畴那样找到海量有语法毛病的句子,及批改语法后的对应句子?
这里有道采用的是一种迁移与匹敌进修的方式,既然我们没有海量标注数据,那末基于真适用户毛病散布天生海量「伪语料」,用它先练习 Transformer 模子。前面由于语法纠错的实在标注数据很珍贵,我们可以在练习完 Transformer 后再用实在数据微调一番。采用这类练习形式,我们才有能够令 Transformer 学到怎样改错句。
上面就是有道自动改错的首要思绪了,假如将其利用到有道辞书这个 APP 上,还有很多需要克服的应战。有道也做了一系列优化,例如操纵常识蒸馏紧缩模子、操纵预练习 BERT 快速判定标点与句子对错等等。真正要做成好用的产物,现实应战远比我们设想中的多。
看结果,举个栗子
前面可以具体看看有道 AI 作文批改的功用与结果,我们也可以同时试试 Grammarly 等类似的工具。先不说结果,吐槽一下利用,别的工具不是要下载 Chrome 插件就是需要注册与登录,有道辞书的 AI 作文批改简直要方便很多。
在考试作文方面,AI 作文批改能按照分歧的常识水平与考试种别停止专业打分,它会从词、句、篇章的层面上停止点评,语法纠错也会给出更清楚的剖析。下图为 AI 作文批改给一篇高中作文打的分,它同时会天生对应的报告。

Transformer自动纠语法、改论文,我们试了试这个免费英文 ...-6.jpg

除了整体的报告与评分,AI 作文批改会具体分析具体哪些地方出现了题目,每一处毛病都能检察缘由及点窜定见。特别是我们中国人易犯的冠词利用毛病,利用这个批改软件可以较好地帮我们找出这些语法题目,非常方便。

Transformer自动纠语法、改论文,我们试了试这个免费英文 ...-7.jpg

虽然利用类似 Grammarly 这样的利用也能自动纠错,但相对而言,它们并没有打分功用,也没法判定用户的进修阶段和考试范例,更不会天生专业的点评报告。没法做到网易辞书 AI 作文批改这样的细化处置,针对分歧用户群体供给针对性的倡议。
还能间接 OCR
除了常规的复制粘贴或手动输入,有道辞书上的 AI 作文批改还支持 OCR,只需要拍张照就能转化为文本。可以看到,有道辞书对手写单词的识别还是比力准的,甚至连标点标记以及段落的位置都能正确识别出来。即使识别有些小毛病,手动改一改也就没题目了。

Transformer自动纠语法、改论文,我们试了试这个免费英文 ...-8.jpg

确认提交后就能停止分析,只不外 OCR 大大简化了手写作文的自动批悔改程,省去了我们自行手敲的懊恼。特别是身旁没有电脑时,这项功用给我们供给了极大的便当。
焦点功用:语法纠错
AI 作文批改的焦点功用,还是在于语法纠错,这是我们最轻易提升写作技术的地方。语法纠错并不是一个新才能,今朝有挺多产物都在做这样的工作。可是用 Transformer、BERT 等模子来做语法纠错,并连系传统方式的上风,这样的思绪听上去结果就不会差。
我们可以先经过一条不异的错句试试分歧语法纠错产物的结果:「On a cold morning, while I was watching a girl buy bread and milk in the fiont for me.」。
首先有道辞书可以检测出三个毛病,别离是拼写、冠词和介词毛病。我们放到微软爱写作平台后,它只能发现「fiont」存在拼写毛病,而且保举将「buy」换成「purchase」等更高级的词。Grammarly 免费版一样,它也只能识别出「fiont」存在拼写毛病。

Transformer自动纠语法、改论文,我们试了试这个免费英文 ...-9.jpg
图左为有道辞书 AI 作文批改成果,图右为 Grammarly 纠错成果。
从整体体验上来说,有道辞书挑出来的毛病更全一些,特别是当一句话中出现多种毛病时。而且由于 AI 作文批改采用了前沿的 DL 模子,它对高低文的感知会更强一些,对于较复杂语法题目、大概语篇标准上的时态题目,它都更有上风。
能够你会感觉单个例子不能说明什么,有道辞书也做了具体的野生测评。对于脱敏后的批改办事请求,测试职员从外洋辞书请求、考研用户请求、行业数据集随机采样一部分作为测试集,并评价分歧纠错办事的结果。全部测评进程算法同学都没有介入,根基能做到公允测评。

Transformer自动纠语法、改论文,我们试了试这个免费英文 ...-10.jpg

分歧产物的纠错结果对照。
其中,Precision 是语法检测与批改的切确率,Recall 暗示语法检测与批改的召回率。而 F0.5 为精度与召回率的和谐均匀,其值越高,凡是暗示算法性能越好。从上表我们可以明显的看到,有道辞书 AI 作文批改的三项目标均横跨同类先辈自动批改软件 5%~7%。
今朝大师已经都可以利用了,有道也暗示,AI 作文批改还会有别的一些提升,未来将延续优化润饰、范文保举、书面与口语气概转化等功用。有了这些新才能,作文备考、论文写作等更多的体验城市更顺滑一些。
接待大师加入未艾野生智能微信交换进修群的大师庭,希望大师积极讲话,一路交换、一路进修,一路进步!
进群需扫码加微信并备注:野生智能。

Transformer自动纠语法、改论文,我们试了试这个免费英文 ...-11.jpg
若何经过一个项目,7小时内快速把握Python焦点编程!看过才知很好,学过才知奇妙!




原文地址:https://zhuanlan.zhihu.com/p/127815176
免责声明:
1、文章部分图片源于收集,均为表示图;
2、一切文章、图片、音频视频文件等材料版权归版权一切人一切;
3、因非原创文章及图片等内容没法和版权者联系,如原作者或编辑以为作品不宜上网供阅读,或不应无偿利用,请实时告诉我们,以敏捷采纳适当办法,避免给双方形成不需要的经济损失;
4、本页面内容由爬虫法式自动收集于互联网,如无意中加害了媒体或小我的常识产权,请电邮【E-Mail:cb@yoyodoc.com】告之,我们将于24小时内删除。

2

主题

11

回帖

23

积分

新手上路

积分
23
发表于 2023-2-27 07:27:16 | 显示全部楼层
源代码有吗
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|Archiver|手机版|小黑屋|小悠文档创作分享社区 ( 粤ICP备11072215号 )|网站地图

GMT+8, 2024-11-24 23:29 , Processed in 0.293100 second(s), 25 queries .

Powered by Discuz! X3.5

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表