Turnitin查重报告解读

2021-05-26

一、查重规则:

Turnitin检测相似度的原理不同于字数字样的重复检测原理,它检验的是句子内部和句子之间在语法上的逻辑关系,这与单词是否重复基本无关,使用不同的逻辑来表达同一内容,即便单词重复很多也不会被检测为高相似度。

二、检测标准:

整个查重报告的相似率是由每一个匹配源的单独重复率累加所得。

简单来说,如果一篇论文相似率为20%,而相似率恰好由20个匹配源构成,此时每一组匹配文本就有1%的重复。

由CrossCheck数据库对SCI论文查重后给出的相似度数值大致可分为三个等级:

相似率低于10% - Not Likely to Be an Issue (Disregard) 这时文中检出的相似率一般来源于相对分散的匹配文本或常用短语,通常每一处匹配来源仅仅占据1%~3%的相似率,对认定论文是否抄袭的影响几乎可以忽略。

相似率在10%~50%之间 - Possible Issue (Review Briefly) 大部分文章的查重报告结果都处于该范围内,相似率在此范围内也意味着可能存在一部分完全摘抄的文本,此时判定文章是否抄袭就要查看单个匹配源的相似率是否超标。

对留学生来说,重复率在13%-15%就要引起注意,而高于20%就很危险了。

相似率高于50% - Probable Issue (Review Carefully) 这就说明有一处或多处单独匹配源存在高度重复,即大段语句与数据库中的某几篇文献一致,此时必须高度警惕。这种情况下,基本是会被判作抄袭的。

另外,我们还要注意,并不是相似度数值高就一定是抄袭,同样即使相似度数值偏低也未必没有抄袭可能。有两种特殊情况需要大家注意:

1、总体相似率高,但包含若干个低重复匹配来源。例如一篇论文的相似率超过了30%,也许会被认为有抄袭的嫌疑,但若仔细分析报告却发现每一处匹配来源的重复率均低于5%或更低,此时一般来说不会被指出抄袭,故作简单语言调整即可。

2、总体相似率很低,但仅包含一至两处的高重复率匹配来源。例如一篇相似率13%的论文仅具有两处分别为12%和1%的相似来源。那么这篇文章同样需要格外注意,12%重复的部分可能包含几处大段重复,即有抄袭嫌疑。

因此,阅读查重报告时,不能看了总相似率不高就万事大吉,还要仔细查看每一处单独匹配源的相似率数值。

三、报告组成

1、颜色解读

在系统出具的查重报告中,有从蓝到红五种高亮颜色带:

866433a7d14890b491da68f61d3541b

蓝色:表示没有检测出重复。

如果你的作业没有引用任何文献,那么呈现出来的就会是蓝色。还有一种情况,如果你上传的作业格式是Turnitin无法识别的,也会出现蓝色,这时候老师可能会仔细查你的作业是不是格式不规范。

绿色:表示重复率是1%-24%,这是一般最为常见的重复率。

但是如果你的重复率在24%附近,也是存在有抄袭(少量未规范引用)可能的。

:如果文本呈现黄色(重复率25%到49%)、橙色(重复率50%到74%)、红色(重复率75%到100%),对大家来说就非常危险了,即说明直接引用过多或有大量复制内容。

此外,Turnitin报告中还有一个颜色是紫色,这表明你用了student paper,就是课程作业论文或留学生eassy已经在系统中有入库记录的论文。

2、报告类型

60a7ef1b85499d1b1db60e5e466ae7b

系统会生成两版查重报告,分别是HTML(网页)版本和PDF版本,其中网页版本中引用的参考文献是参与查重的,而PDF版本则不参与,因此一般来说,PDF报告显示的重复率会低一些。

3、报告分区

查重报告整体分为三个主要区域。分别为——

论文信息区:报告页面的顶部显示了关于提交的论文的信息。这包括论文标题、提交学生的姓名和相似度指数。

61be32bc2791f5db42ce43981c145b9

论文文本区:报告页面正文显示了提交论文的原始格式。匹配的文本用与检测报告下方列出的匹配源对应的颜色高亮显示。

512fcdeb2ddfdc1434ebca19894edd7

匹配源区:报告页面的末尾显示了左侧高亮颜色标注文本对应的匹配源列表。

f74f036f66830b334462d5d0a694d2b

附:

Turnitin检测报告样例
【点击下载】Turnitin检测报告样例 (503.60 KB)