網(wǎng)絡(luò)作品“偽原創(chuàng)”花樣多:工具可自動生成文章


來源:法制日報   作者:張昊    時間:2017-05-09





  互聯(lián)網(wǎng)內(nèi)容生產(chǎn)市場的拼殺日趨白熱化,優(yōu)質(zhì)原創(chuàng)內(nèi)容可謂互聯(lián)網(wǎng)上的“兵家必爭之地”。在此背景下,不少平臺推出網(wǎng)絡(luò)作品申請原創(chuàng)功能,此舉既可以保護原創(chuàng)作者的合法權(quán)益,也推動優(yōu)質(zhì)內(nèi)容不斷出現(xiàn)。然而,有不少人卻瞄準(zhǔn)了原創(chuàng)市場,炮制出“偽原創(chuàng)”作品。“偽原創(chuàng)”手段有哪些?《法制日報》記者展開了調(diào)查。

 

  內(nèi)容生產(chǎn)無疑是當(dāng)前互聯(lián)網(wǎng)經(jīng)濟的一大“風(fēng)口”。不管是傳統(tǒng)媒體的轉(zhuǎn)型者,還是自媒體人,都將內(nèi)容生產(chǎn)視作互聯(lián)網(wǎng)經(jīng)濟的一個富礦,文字、視頻、音頻等產(chǎn)品不斷出現(xiàn)在各種網(wǎng)絡(luò)平臺。

 

  既然是內(nèi)容生產(chǎn),就涉及到內(nèi)容的版權(quán)問題,衍生出了網(wǎng)絡(luò)作品盜版侵權(quán)現(xiàn)象。不過,與傳統(tǒng)的盜版侵權(quán)相比,網(wǎng)絡(luò)原創(chuàng)作品還面臨一種新的侵權(quán)形式——“偽原創(chuàng)”,即通過各種手段將原作者的原創(chuàng)作品變成侵權(quán)者的“原創(chuàng)”。

 

  “偽原創(chuàng)”手段花樣百出

 

  劉思含目前在北京一家視頻新媒體公司市場部工作,主要業(yè)務(wù)是負(fù)責(zé)公司生產(chǎn)內(nèi)容的版權(quán)保護。

 

  “我們是做科普、知識類視頻的新媒體公司,在微信、微博等很多平臺上投放醫(yī)學(xué)、汽車等多個領(lǐng)域的內(nèi)容。我們制作的每一個原創(chuàng)內(nèi)容由三個部分組成,視頻和詳細(xì)的畫外音講解,還有相對精簡的文字。”劉思含說。

 

  一個原創(chuàng)內(nèi)容包含視頻、音頻、文字三部分,按理說是不容易被他人直接“拿走”的,但劉思含恰恰遇到了這種情況。

 

  2016年12月27日,劉思含所在的公司上傳了一篇關(guān)于汽車外觀的原創(chuàng)內(nèi)容。“今年2月中旬,某微信公眾號發(fā)出一篇文章,用了我們原創(chuàng)視頻的截圖,復(fù)制粘貼了文字版,把畫外音整理成文字。在這個基礎(chǔ)上,剽竊者給文章加了個開頭和從網(wǎng)上扒來的圖片。就這樣,對方把我們的原創(chuàng)內(nèi)容變成了他的原創(chuàng)作品。”劉思含說。

 

  劉思含在微信后臺與對方交涉,對方不承認(rèn)。之后,劉思含所在的公司向平臺投訴,并要求對方把稿子刪掉,對方回復(fù),“既然你們都投訴了,那就交給平臺方處理吧”。

 

  “被抄襲的不僅是我們的汽車公眾號,我們制作的其他領(lǐng)域的視頻,每周會發(fā)現(xiàn)并舉報幾次剽竊行為。”劉思含說。

 

  記者調(diào)查發(fā)現(xiàn),目前網(wǎng)上的“偽原創(chuàng)”抄襲方法還有不少。例如“洗稿”,就是把類似的幾篇文章拼在一起,之后申請“原創(chuàng)”。

 

  目前,常見的平臺審查機制主要由機器完成,即按文字內(nèi)容的比例來判斷是否存在抄襲。不過,機器審查存在一個弱點,就是很難識別視頻和漫畫。

 

  “我們公司以創(chuàng)作漫畫或視頻為主,抄襲者直接對視頻進行截屏,將原創(chuàng)文章中的文字內(nèi)容轉(zhuǎn)換成圖片,不使用文字,機器就很難識別出抄襲。”劉思含說,“我們與粉絲的互動是問答式的。在讀者留言中會有一些提問,我們在互動中作出相應(yīng)解答。我了解到,有的公號甚至抄襲我們和讀者互動的內(nèi)容,將這些問答內(nèi)容搬到自己的文章中。”

 

  在線自動生成“偽原創(chuàng)”

 

  記者在調(diào)查中發(fā)現(xiàn),除了劉思含提到的各種“偽原創(chuàng)”手法,還有一種模式——在線自動生成“偽原創(chuàng)”。

 

  記者通過閱讀多個“偽原創(chuàng)”工具的說明并試用,梳理出其制作過程和原理。“偽原創(chuàng)”的目標(biāo)是通過同義詞替換的方式,讓搜索引擎認(rèn)為是一篇原創(chuàng)文章,從而提高在搜索結(jié)果中的排名。“偽原創(chuàng)”工具或在線生成網(wǎng)站都有自己的同義詞庫,有的通過免費模式向用戶開放一部分,另一部分更大的同義詞庫則要用戶付費后才可以使用。

 

  “用‘偽原創(chuàng)’工具可以把在互聯(lián)網(wǎng)上復(fù)制的文章瞬間變成您自己的原創(chuàng)文章。”一個“偽原創(chuàng)”網(wǎng)站的說明這樣寫到。此類“偽原創(chuàng)”工具還可以在文章中隨意植入想被讀者看到的關(guān)鍵詞或網(wǎng)址,以達到宣傳作用。

 

  記者把原創(chuàng)文章復(fù)制粘貼到這樣的網(wǎng)站上,一鍵即可生成同義詞替換過的文章,被替換的詞通常用不同的字體和顏色標(biāo)記出來。

 

  在這個過程中,記者發(fā)現(xiàn),專業(yè)類文章替換較少;生活類的文章替換掉的詞較多;文章越長,替換率越高。在線“偽原創(chuàng)”工具還附帶相似度檢測、關(guān)鍵詞排序、關(guān)鍵詞統(tǒng)計、關(guān)鍵詞組合工具等在線工具,文章整體替換的比例在10%左右。替換后的文章可讀性降低,網(wǎng)站建議對文章進行人工修改提升可讀性。一個“偽原創(chuàng)”網(wǎng)站在說明中稱,“‘偽原創(chuàng)’文章最好將文章開頭和結(jié)尾用自己的語言組織,這樣的效果更好一些”。

 

  記者使用相似度檢測對原創(chuàng)和“偽原創(chuàng)”進行對比發(fā)現(xiàn),機器識別出相似度在85%至98%之間。

 

  記者在網(wǎng)站上看到一個生成記錄,內(nèi)容文本字符長度為734個字的文章,共替換了44個詞長度為90個字符,替換比率為12.26%。原文和替換之后的文章相似度為92.6%,如此高的相似度怎么辦?這些網(wǎng)站給出了進一步的“解決方案”。

 

  “在線生成文章,將其粘貼入前兩步已做好的‘偽原創(chuàng)’文章后一段即可”。記者點擊“在線生成文章”發(fā)現(xiàn),生成的并不是可讀的文章,而是一段看似是中文的亂碼。將這段亂碼貼在文章最后,相似度降低到84.3%。

 

  除了用亂碼降低相似度,這些網(wǎng)站介紹稱還可以在文章中插入圖片,建議用戶打亂文章順序等方法。

 

  此外,記者發(fā)現(xiàn),網(wǎng)上還可以搜索到大量關(guān)于“如何制作‘偽原創(chuàng)’”的教程。

 

  原創(chuàng)維權(quán)依然麻煩

 

  作者的原創(chuàng)內(nèi)容遭“偽原創(chuàng)”剽竊,將會有哪些損失?

 

  “就商業(yè)價值而言,一篇文章招廣告,賣價要看這個公眾號的粉絲量有多少。大一點兒的公眾號,一篇頭條文章去年的價格大約是5萬元;剽竊我們的公號,估計一篇頭條文章的賣價在幾千元到兩三萬元之間。保守估計也可以賣出幾千元。”劉思含說。

 

  劉思含告訴記者,從后臺數(shù)據(jù)來看,如果是關(guān)于熱點問題的原創(chuàng),剽竊的作品可能在至少一個星期時間內(nèi)對原創(chuàng)產(chǎn)生影響。對于科普內(nèi)容而言,大部分都是沒有時效性的,剽竊對于原創(chuàng)的影響時間持續(xù)更久。

 

  面對“偽原創(chuàng)”侵權(quán),原創(chuàng)者是否想過維權(quán)?又該如何維權(quán)?

 

  “對原創(chuàng)作者來說,他們需要投入大量精力去制作優(yōu)質(zhì)內(nèi)容,讓他們?nèi)プ鼍S權(quán)的事情非常消耗精力。特別對于個人原創(chuàng)者而言,或許這一天或者一個星期特別有靈感,能寫一篇特別好的文章,結(jié)果被抄襲的事情一鬧,可能這一段時間他什么也做不了了。”劉思含說。

 

  據(jù)劉思含介紹,對于公司而言,遭遇剽竊后的主要訴求就是讓對方把文章刪除。“我們會時不時在后臺搜一搜關(guān)鍵字,看是否有未經(jīng)授權(quán)的轉(zhuǎn)載。沒有經(jīng)過授權(quán)的,就算是有些人標(biāo)注了來自我們的公號,我們還是會聯(lián)系對方把文章刪掉。大部分抄襲的人都挺心虛,都會刪稿。遇到不刪除的,效率比較高的做法就是向平臺方舉報”。

 

  記者調(diào)查了解到,不同的平臺對原創(chuàng)舉報的處理周期不同。有的平臺,原創(chuàng)作者當(dāng)天投訴,過幾個小時就會出處理結(jié)果,有些平臺審核過程會比較麻煩。“尤其是公司機構(gòu),需要出示一個企業(yè)聲明,載明哪篇文章被抄襲,要加蓋公章,掃描,上傳。整個過程耗時短則兩三天,也可能更長。”劉思含說,“走法律途徑保護原創(chuàng)獲得賠償?shù)姆绞?對公司機構(gòu)而言太耗精力,不劃算。”

 

  劉思含所在的公司鋪設(shè)了“全網(wǎng)”運營渠道,不管在什么平臺上發(fā)現(xiàn)抄襲,都可以與平臺方聯(lián)系,將抄襲的文章刪掉。“但是,對于個人原創(chuàng)者,這個工程則無法完成。一是他們發(fā)作品平臺非常有限,不可能跟很多平臺合作保護自己的原創(chuàng)。二是他們沒有精力去溝通。”劉思含說。

 

  近期,有平臺推出一個叫做“維權(quán)賠付”的功能,意思是通過后臺與平臺方簽訂協(xié)議,如果遭遇抄襲由平臺幫原創(chuàng)者維權(quán)。平臺方先賠付50元,然后平臺再幫原創(chuàng)作者走訴訟途徑維權(quán)。訴訟成功后,再賠付100元。

 

  “不管被剽竊的是什么內(nèi)容,不管是視頻還是文字,都是同一個價格。簽訂這個協(xié)議,意味著平臺按照固定的價格賠付作者。然而,制作漫畫和視頻的成本高于純文字的內(nèi)容,我們認(rèn)為這個賠付金額太少了。如果不簽協(xié)議,我們確實不會走訴訟的途徑。”劉思含說。(記者張昊)

 



  版權(quán)及免責(zé)聲明:凡本網(wǎng)所屬版權(quán)作品,轉(zhuǎn)載時須獲得授權(quán)并注明來源“中國產(chǎn)業(yè)經(jīng)濟信息網(wǎng)”,違者本網(wǎng)將保留追究其相關(guān)法律責(zé)任的權(quán)力。凡轉(zhuǎn)載文章,不代表本網(wǎng)觀點和立場。版權(quán)事宜請聯(lián)系:010-65363056。

延伸閱讀

熱點視頻

第六屆中國報業(yè)黨建工作座談會(1) 第六屆中國報業(yè)黨建工作座談會(1)

熱點新聞

熱點輿情

特色小鎮(zhèn)

版權(quán)所有:中國產(chǎn)業(yè)經(jīng)濟信息網(wǎng)京ICP備11041399號-2京公網(wǎng)安備11010502003583