您是否正在尋找一種方法來防止垃圾郵件發(fā)送者和詐騙者使用內(nèi)容抓取工具竊取您的 wordpress 博客文章?
作為網(wǎng)站所有者,看到有人未經(jīng)許可竊取您的內(nèi)容,將其貨幣化,在 Google 中排名超過您,并竊取您的受眾,這是非常令人沮喪的。
在本文中,我們將介紹什么是博客內(nèi)容抓取、如何減少和防止內(nèi)容抓取,甚至如何利用內(nèi)容抓取器為自己謀取利益。
什么是 wordpress 中的博客內(nèi)容抓取?
博客內(nèi)容抓取是指從多個來源獲取內(nèi)容并在另一個網(wǎng)站上重新發(fā)布。通常,這是通過博客的?RSS feed自動完成的。
不幸的是,您的WordPress 博客內(nèi)容以這種方式被盜是非常容易且非常常見的。如果它發(fā)生在你身上,那么你就會明白它是多么的壓力和令人沮喪。
有時,您的內(nèi)容將被簡單地復制并直接粘貼到另一個網(wǎng)站,包括您的格式、圖像、視頻等。
其他時候,您的內(nèi)容將在未經(jīng)您許可的情況下重新發(fā)布,并注明出處和返回您網(wǎng)站的鏈接。雖然這可以幫助您的?搜索引擎優(yōu)化,但您可能只想將原始內(nèi)容保留在您的網(wǎng)站上。
為什么內(nèi)容抓取者會竊取內(nèi)容?
我們的一些用戶問我們為什么抓取工具會竊取內(nèi)容。通常,內(nèi)容盜竊的主要動機是從您的辛勤工作中獲利:
- 聯(lián)盟傭金:不誠實的聯(lián)盟營銷人員可能會使用您的內(nèi)容通過搜索引擎為他們的網(wǎng)站帶來流量,以推廣他們的利基產(chǎn)品。
- 潛在客戶開發(fā):律師和房地產(chǎn)經(jīng)紀人可能會花錢請人添加內(nèi)容并在社區(qū)中獲得權威,但沒有意識到這些內(nèi)容正在從其他來源被竊取。
- 廣告收入:博客所有者可能會抓取內(nèi)容,以“為了社區(qū)的利益”在某個特定領域創(chuàng)建知識中心,然后在網(wǎng)站上貼上廣告。
是否可以完全防止內(nèi)容抓取?
在本文中,我們將向您展示可以采取的一些步驟來減少和防止內(nèi)容抓取。但不幸的是,沒有辦法完全阻止頑固的小偷。
這就是為什么我們在這篇文章的最后一節(jié)介紹了如何利用內(nèi)容抓取工具。雖然您無法始終阻止小偷,但您也許可以通過他們從您那里竊取的內(nèi)容獲得一些流量和收入。
當您發(fā)現(xiàn)有人抄襲您的內(nèi)容時該怎么辦?
由于不可能完全阻止抓取工具,因此有一天您可能會發(fā)現(xiàn)有人正在使用他們從您的博客中竊取的內(nèi)容。您可能想知道發(fā)生這種情況時該怎么辦。
以下是人們在處理內(nèi)容抓取工具時采取的一些方法:
- 什么也不做:您可能會花費大量時間與爬蟲作斗爭,因此一些受歡迎的博主決定什么也不做。谷歌已經(jīng)將知名網(wǎng)站視為權威,但對于較小的網(wǎng)站而言并非如此。因此,我們認為這種方法并不總是最好的。
- 刪除:您可以聯(lián)系抓取者并要求他們刪除內(nèi)容。如果他們拒絕,那么您將提交刪除通知。您可以在我們的指南中了解如何輕松查找和刪除 WordPress 中被盜的內(nèi)容。
- 利用優(yōu)勢:雖然我們積極致力于將從 WPBeginner 抓取的內(nèi)容撤下,但我們也使用一些技術來獲取流量并從抓取工具中賺錢。您可以在下面的“利用內(nèi)容抓取器”部分了解如何操作。
話雖如此,讓我們來看看如何防止 WordPress 中的博客抓取。由于這是一本綜合指南,我們提供了一個目錄以便于導航:
- 您的博客名稱和徽標的版權或商標
- 讓您的 RSS 提要更難抓取
- 禁用 Trackback 和 Pingback
- 阻止爬蟲訪問您的 WordPress 網(wǎng)站
- 防止 WordPress 中的圖像被盜
- 阻止手動復制您的內(nèi)容
- 利用內(nèi)容抓取器
1. 博客名稱和徽標的版權或商標
商標和版權法保護您的知識產(chǎn)權、品牌和業(yè)務免受許多法律挑戰(zhàn)。這包括非法使用您的受版權保護的材料或您的品牌名稱和徽標。
您應該在您的網(wǎng)站上清楚地顯示版權聲明。雖然您的內(nèi)容自動受版權法保護,但顯示通知會讓您知道您的內(nèi)容受版權保護,并且他們不能將您受保護的財產(chǎn)用于商業(yè)目的。
例如,您可以將帶有動態(tài)日期的版權聲明添加到 WordPress 頁腳。這將使您的版權聲明保持最新。
這可能會阻止某些用戶竊取它。如果您確實需要發(fā)送停止函或提交 DCMA 投訴以刪除被盜內(nèi)容,它也會有所幫助。
您還可以在線申請版權登記。這個過程可能很復雜,但幸運的是,有低成本的法律服務可以幫助小企業(yè)和個人。
在我們的指南中了解如何為您的博客名稱和徽標注冊商標和版權。
2. 讓你的 RSS Feed 更難抓取
由于博客內(nèi)容抓取通常是通過博客的?RSS 源自動完成的,因此讓我們看一下可以對源進行的一些有用的更改。
不要在 WordPress RSS 源中包含完整的帖子內(nèi)容
您可以在 RSS 源中僅包含每篇文章的摘要,而不是完整內(nèi)容。這包括摘錄以及帖子元數(shù)據(jù),例如日期、作者和類別。
博客社區(qū)中肯定存在關于是否擁有完整 RSS 提要或摘要提要的爭論。我們現(xiàn)在不會討論這個問題,只是想說,只有摘要的優(yōu)點之一是它有助于防止內(nèi)容抓取。
您可以通過轉(zhuǎn)到WordPress 管理面板中的設置 ? 閱讀來更改設置?。您需要選擇“摘錄”選項,然后單擊“保存更改”按鈕。
現(xiàn)在,RSS 源將僅顯示您文章的摘錄。如果有人通過您的 RSS 源竊取您的內(nèi)容,那么他??們只會獲得摘要,而不是完整的帖子。
如果您想調(diào)整摘要,那么您可以查看我們關于如何自定義 WordPress 摘錄的指南。
優(yōu)化您的 RSS 提要以防止抓取
您還可以通過其他方法來優(yōu)化 WordPress RSS 源,以保護您的內(nèi)容、獲得更多反向鏈接、增加網(wǎng)絡流量等等。最好的方法之一是延遲帖子出現(xiàn)在 RSS 提要中。
這樣做的好處是,當您延遲帖子出現(xiàn)在 RSS 提要中時,您可以讓搜索引擎有時間在您的內(nèi)容出現(xiàn)在其他地方(例如爬蟲網(wǎng)站)之前對您的內(nèi)容進行爬網(wǎng)和索引。然后搜索引擎會將您的網(wǎng)站視為權威網(wǎng)站。
最安全、最簡單的方法是使用WPCode??,因為它有一個方法可以自動將正確的自定義代碼添加到 WordPress 中。
有關詳細說明,請參閱有關如何延遲帖子出現(xiàn)在 WordPress RSS 源中的指南。
3. 禁用 Trackbacks、Pingbacks 和 REST API
在博客的早期,?引用引用和 pingback?是博客相互通知鏈接的一種方式。當有人鏈接到您博客上的帖子時,他們的網(wǎng)站會自動向您的網(wǎng)站發(fā)送 ping。
然后,此 pingback 將出現(xiàn)在您博客的?評論審核?隊列中,并帶有指向其網(wǎng)站的鏈接。如果您批準,他們就會從您的網(wǎng)站獲得反向鏈接和提及。
這會激勵垃圾郵件發(fā)送者抓取您的網(wǎng)站并發(fā)送引用。幸運的是,您可以禁用 trackback 和 pingback,從而減少抓取者竊取您內(nèi)容的理由。
有關更多信息,請查看我們關于禁用所有未來帖子的引用的指南。您可能還想了解如何禁用現(xiàn)有 WordPress 帖子的引用和 ping。
禁用 WordPress REST API
除了 trackback 和 pingback 之外,我們還建議禁用 WordPress REST API,因為它可以讓垃圾郵件發(fā)送者更輕松地抓取您的內(nèi)容。
我們有關于如何禁用 WordPress REST API 的詳細指南。
您所需要做的就是安裝并激活免費的 WPCode 插件,并使用其預制片段來禁用 REST API。
4.阻止爬蟲訪問您的 WordPress 網(wǎng)站
阻止抓取工具竊取您的內(nèi)容的一種方法是取消他們對您網(wǎng)站的訪問權限。您可以通過阻止其 IP 地址來手動執(zhí)行此操作,但大多數(shù)用戶會發(fā)現(xiàn)使用安全插件(例如 Web 應用程序防火墻)更容易。
使用安全插件阻止抓取工具(推薦)
手動阻止刮刀非常棘手且需要大量工作。特別是因為許多黑客嘗試和攻擊都是使用來自世界各地的各種隨機 IP 地址進行的。要跟上所有這些隨機 IP 地址幾乎是不可能的。
這就是您需要Web 應用程序防火墻(WAF)(例如Wordfence 或 Securi)的原因。它們通過監(jiān)控您的網(wǎng)站流量并在常見的安全威脅到達您的 WordPress 網(wǎng)站之前阻止它們,充當您的網(wǎng)站和所有傳入流量之間的屏障。
對于 WPBeginner 網(wǎng)站,我們使用?Sucuri。它是一種網(wǎng)站安全服務,可使用網(wǎng)站應用程序防火墻保護您的網(wǎng)站免受此類攻擊。
基本上,您的所有網(wǎng)站流量都會經(jīng)過安全服務的服務器,并在其中檢查是否存在可疑活動。它們會自動阻止可疑 IP 地址完全訪問您的網(wǎng)站。了解 Sucuri 如何?幫助我們?在 3 個月內(nèi)阻止 450,000 次 WordPress 攻擊。
手動阻止或重定向抓取工具的 IP 地址
高級用戶可能還希望手動阻止抓取工具的 IP 地址。這需要更多工作,但是一旦您了解了抓取工具的地址,您就可以專門針對它。Web 開發(fā)人員Jeff Star在撰寫有關如何處理內(nèi)容抓取工具的文章時建議采用這種方法。
注意:?向網(wǎng)站文件添加代碼可能很危險。即使是一個小錯誤也可能會導致您的網(wǎng)站出現(xiàn)重大錯誤。這就是為什么我們只向高級用戶推薦此方法。
您可以通過訪問WordPress 托管帳戶的 cPanel 儀表板中的“原始訪問日志”來查找抓取工具的 IP 地址??。您需要查找請求數(shù)量異常高的 IP 地址并記錄它們,例如將它們復制到單獨的文本文件中。
提示:您需要確保最終不會阻止您自己、合法用戶或搜索引擎訪問您的網(wǎng)站。復制看起來可疑的 IP 地址并使用在線?IP 查找工具?來了解更多信息。
一旦您確信該 IP 地址屬于抓取工具,您就可以使用 cPanel“IP Blocker”工具或通過在根.htaccess文件中添加如下代碼來阻止它:
最好的部分是這些橫幅也會出現(xiàn)在抓取工具的網(wǎng)站上。
在我們的例子中,我們總是在 RSS 源的帖子底部添加一些免責聲明。通過這樣做,我們可以從爬蟲網(wǎng)站獲得原始文章的反向鏈接。
這讓谷歌和其他搜索引擎知道我們是權威。它還讓他們的用戶知道該網(wǎng)站正在竊取我們的內(nèi)容。
有關更多提示,請查看我們有關?如何在 WordPress 中控制 RSS 源頁腳的指南。
我們希望本教程能幫助您了解如何防止 WordPress 中的博客內(nèi)容被抓取。您可能還想查看我們的終極 WordPress 安全指南或?qū)<揖x的WordPress 最佳分析解決方案。