據(jù)悉百度將今年推出原創(chuàng)星火計(jì)劃,重點(diǎn)整治互聯(lián)網(wǎng)上低質(zhì)量的垃圾內(nèi)容,并且提升內(nèi)容優(yōu)質(zhì)的原創(chuàng)網(wǎng)站,這對于站長界和SEO界來說似乎是一件天大的好事??梢钥隙ǖ氖前俣冗t早會推出這樣的計(jì)劃或者算法,谷歌在2011年推出了熊貓算法,意在打擊垃圾內(nèi)容,百度之前也推出過類似的算法,但圍繞原創(chuàng)和轉(zhuǎn)載之間的矛盾依舊得不到根治,事實(shí)上從技術(shù)的角度上很難去根治。例如:一篇文章在a站上先發(fā)表,百度還沒有收錄就被B站轉(zhuǎn)載,而B站的權(quán)重比a站高很多,這樣一來B站會先收錄,百度就誤以為文章屬于B站的原創(chuàng)。那么通過技術(shù)手段識別原創(chuàng)和轉(zhuǎn)載的方法有哪些呢
根據(jù)文章收錄的時(shí)間判斷<原則就是誰先被收錄判定誰是原創(chuàng),舉個(gè)例子:我寫了這篇文章先發(fā)布到自己的小站,然后再投稿到a5站長網(wǎng),但是a5站長網(wǎng)權(quán)重高,因此先收錄了這篇文章,這樣我自己的小站就成了轉(zhuǎn)載別人的文章了,顯然這是很不公平的,以往這種現(xiàn)象一種存在,站長們也是無可奈何。根據(jù)時(shí)間去判斷是否原創(chuàng)還要求百度蜘蛛的爬行速率更快,肯定要比現(xiàn)在快很多,當(dāng)然這對服務(wù)器的壓力肯定不小根據(jù)文章的標(biāo)題去判斷這種方法更簡單,根據(jù)互聯(lián)網(wǎng)上是否有相同標(biāo)題的文章,以此來判斷某篇文章是不是原創(chuàng)
平常用intitle這個(gè)命令就可以搜索到所有相同標(biāo)題的文章,但這種方法比第一種更草率,互聯(lián)網(wǎng)上同樣標(biāo)題不同內(nèi)容的文章實(shí)在太多了,也許可以再根據(jù)文章內(nèi)容的字節(jié)數(shù)來判斷。以上筆者說的兩種方法都很不靠譜,內(nèi)容的原創(chuàng)性實(shí)在很難去判斷,其實(shí)互聯(lián)網(wǎng)上有太多的轉(zhuǎn)載內(nèi)容,包括一些門戶類網(wǎng)站不也是經(jīng)常轉(zhuǎn)載別人的文章嗎,像新浪、網(wǎng)易等等。還有大量的小說網(wǎng)站和電影網(wǎng)站都涉及到侵權(quán)的,那些小說和視頻也都是無版權(quán)的,如果百度的原創(chuàng)星火計(jì)劃真的要趕盡殺絕,那恐怕就不光是百度技術(shù)的問題了,還牽涉到互聯(lián)網(wǎng)版權(quán)的問題
而且那么多站點(diǎn)都是會受到影響,被服務(wù)商關(guān)閉站點(diǎn),被百度K站。話說回來不一定原創(chuàng)的內(nèi)容就是用戶想要的東西,那些小說站和電影站都有存在的意義,百度重視用戶體驗(yàn),所以肯定不會這么干,我估計(jì)百度的原創(chuàng)星火計(jì)劃會針對某些行業(yè)下手。猜想一下會是哪些類型的站點(diǎn)呢個(gè)人感覺是中小型站點(diǎn),重點(diǎn)是企業(yè)站和SEO類的站點(diǎn)還有醫(yī)療行業(yè)的站點(diǎn)。這些類型的站點(diǎn)也許是百度星火計(jì)劃重點(diǎn)整治的對象,比方說為數(shù)眾多的企業(yè)站,可以說絕大多數(shù)企業(yè)站的內(nèi)容都比較垃圾
文章名稱:如何通過技術(shù)手段來識別原創(chuàng)和轉(zhuǎn)載呢
URL標(biāo)題:http://muchs.cn/news36/130686.html
成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供移動網(wǎng)站建設(shè)、Google、面包屑導(dǎo)航、商城網(wǎng)站、關(guān)鍵詞優(yōu)化、網(wǎng)站制作
廣告
聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請盡快告知,我們將會在第一時(shí)間刪除。文章觀點(diǎn)不代表本網(wǎng)站立場,如需處理請聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時(shí)需注明來源:
創(chuàng)新互聯(lián)