可以在一堆文章中按照某種標(biāo)準(zhǔn)(軟件里的篩選設(shè)置)篩選出原創(chuàng)文章來。
篩選過程是:隨機抽樣出一篇文章的指定數(shù)量的句子,然后使用百度搜索來判斷句子是否被收錄,最后綜合起來就可以判斷出是否原創(chuàng)文章。比如一般抽10句來篩選,然后設(shè)定判斷比例60%,(按未收錄率)也就是10句里有6句沒有收錄就判斷為原創(chuàng)。篩選出的原創(chuàng)文章的準(zhǔn)確性取決于篩選設(shè)置。
1.5 版開始新增聯(lián)眾自動打碼功能,可以 24 小時自動應(yīng)付百度驗證碼。試用版不能使用自動打碼功能,需手動打碼。
概念說明:
“按收錄率判斷”,只要被檢測的句子收錄比率達(dá)到設(shè)定值,即不是原創(chuàng)文章。
“按未收錄率判斷”,只要被檢測的句子未收錄比率達(dá)到設(shè)定值,即是原創(chuàng)文章。
句子的收錄比率或未收錄比率是相對于用于檢測的句子總數(shù)的百分比。
下面以“按收錄率判斷”為例:
隨機抽選 10 句,收錄率為10%,則只要有 1 句在百度中找到,就不是原創(chuàng)文章,同樣,若收錄率為20%,只要有2句在百度中找到就不是原創(chuàng)文章,3句(30%)、4句(40%)……
也就是說,設(shè)置的收錄率越低或未收錄率越高,判斷原創(chuàng)的要求就越高,原創(chuàng)精準(zhǔn)度就越高(但是也要適當(dāng)控制,否則可能導(dǎo)致檢測不到原創(chuàng)文章)。
您的評論需要經(jīng)過審核才能顯示
有用
有用
有用