扒开老师双腿猛进入白浆小说,熟女人妻私密按摩内射,成人A片激情免费视频,亚洲欧洲AV无码区玉蒲区

在線客服與您一對(duì)一交流
當(dāng)前位置: 主頁(yè) > 行業(yè)新聞 > seo >

使用robots巧妙避免蜘蛛黑洞

  對(duì)于百度搜索引擎來(lái)說(shuō),蜘蛛黑洞特指網(wǎng)站通過(guò)極低的成本制造出大量參數(shù)過(guò)多、內(nèi)容類(lèi)同但url不同的動(dòng)態(tài)URL ,就像一個(gè)無(wú)限循環(huán)的“黑洞“,將spider困住。spider浪費(fèi)了大量資源抓取的卻是無(wú)效網(wǎng)頁(yè)。

  如很多網(wǎng)站都有篩選功能,通過(guò)篩選功能產(chǎn)生的網(wǎng)頁(yè)經(jīng)常會(huì)被搜索引擎大量抓取,而這其中很大一部分是檢索價(jià)值低質(zhì)的頁(yè)面。如“500-1000之間價(jià)格的租房”,首先網(wǎng)站(包括現(xiàn)實(shí)中)上基本沒(méi)有相關(guān)資源,其次站內(nèi)用戶和搜索引擎用戶都沒(méi)有這種檢索習(xí)慣。這種網(wǎng)頁(yè)被搜索引擎大量抓取,只能是占用網(wǎng)站寶貴的抓取配額,那么該如何避免這種情況呢?西安企業(yè)網(wǎng)站建設(shè)公司,西安網(wǎng)站設(shè)計(jì)公司推薦閱讀>>> robots.txt寫(xiě)法_怎么寫(xiě)robots,

  我們以北京美團(tuán)網(wǎng)為例,看看美團(tuán)網(wǎng)是如何利用robots巧妙避免這種蜘蛛黑洞的:

  對(duì)于普通的篩選結(jié)果頁(yè),使用了靜態(tài)鏈接,如:西安做網(wǎng)站,西安網(wǎng)站維護(hù)推薦閱讀>>> 百度站長(zhǎng)平臺(tái)robots工具升級(jí)公告,

  http://bj.meituan.com/category/zizhucan/weigongcun

  同樣是條件篩選結(jié)果頁(yè),當(dāng)用戶選擇不同排序條件后,會(huì)生成帶有不同參數(shù)的動(dòng)態(tài)鏈接,而且即使是同一種排序條件(如:都是按銷(xiāo)量降序排列),生成的參數(shù)也都是不同的。如:http://bj.meituan.com/category/zizhucan/weigongcun/hot?mtt=1.index%2Fpoi.0.0.i1afqhekhttp://bj.meituan.com/category/zizhucan/weigongcun/hot?mtt=1.index%2Fpoi.0.0.i1afqi5c

  對(duì)于美團(tuán)網(wǎng)來(lái)說(shuō),只讓搜索引擎抓取篩選結(jié)果頁(yè)就可以了,而各種帶參數(shù)的結(jié)果排序頁(yè)面則通過(guò)robots規(guī)則拒絕提供給搜索引擎。在robots.txt的文件用法中有這樣一條規(guī)則:Disallow: /*?* ,即禁止搜索引擎訪問(wèn)網(wǎng)站中所有的動(dòng)態(tài)頁(yè)面。美團(tuán)網(wǎng)恰是通過(guò)這種方式,對(duì)spider優(yōu)先展示高質(zhì)量頁(yè)面、屏蔽了低質(zhì)量頁(yè)面,為spider提供了更友好的網(wǎng)站結(jié)構(gòu),避免了黑洞的形成。西安網(wǎng)站公司,網(wǎng)站設(shè)計(jì)推薦閱讀>>> robots.txt文件詳細(xì)解說(shuō),禁止搜索引擎收錄的方法,

相關(guān)文章:

  • User-agent: * Disallow: / Allow: /complain/ Allow: /media_partners/ Allow: /about/ Allow: /user_agreement/ User-agent: ByteSpider Allow: / User-agent: ToutiaoSpider Allow: / 以上是今日頭條的robots.txt,禁止所有搜索引擎收錄,同時(shí)又...

  • 有同學(xué)問(wèn)百度站長(zhǎng)學(xué)院一個(gè)關(guān)于robots的問(wèn)題:我們有個(gè)站點(diǎn)的目錄結(jié)構(gòu)使用的是中文,這樣式兒的:www.a.com/冒險(xiǎn)島/123.html,那在制作robots文件和sitemap文件的時(shí)候,可以直接使用中文嗎?百度能...

  • robots文件是搜索生態(tài)中很重要的一個(gè)環(huán)節(jié),同時(shí)也是一個(gè)很細(xì)節(jié)的環(huán)節(jié)。很多站長(zhǎng)同學(xué)在網(wǎng)站運(yùn)營(yíng)過(guò)程中,很容易忽視r(shí)obots文件的存在,進(jìn)行錯(cuò)誤覆蓋或者全部封禁robots,造成不必要損失! 那...

  • 目前百度圖片搜索也使用了與百度網(wǎng)頁(yè)搜索相同的spider,如果想禁止Baiduspider抓取網(wǎng)站上所有圖片、禁止或允許Baiduspider抓取網(wǎng)站上的某種特定格式的圖片文件可以通過(guò)設(shè)置robots實(shí)現(xiàn):西安廣告...

  • robots是站點(diǎn)與spider溝通的重要渠道,站點(diǎn)通過(guò)robots文件聲明該網(wǎng)站中不想被搜索引擎收錄的部分或者指定搜索引擎只收錄特定的部分。請(qǐng)注意,僅當(dāng)您的網(wǎng)站包含不希望被搜索引擎收錄的內(nèi)容...

  • 親愛(ài)的網(wǎng)站管理員, 很高興的告訴大家,百度站長(zhǎng)平臺(tái) robots 工具全新升級(jí),升級(jí)后能夠?qū)崟r(shí)查看網(wǎng)站在百度中已生效的的robots文件,并支持對(duì)robots進(jìn)行語(yǔ)法及邏輯校驗(yàn),有助于站長(zhǎng)更清晰的...

  • 資料一 1.robots.txt文件是什么 robots.txt是一個(gè)純文本文件,是搜索引擎中訪問(wèn)網(wǎng)站的時(shí)候要查看的第一個(gè)文件。robots.txt文件告訴蜘蛛程序在服務(wù)器上什么文件是可以被查看的。每個(gè)站點(diǎn)最好建立...

  • robots.txt文件包含一條或更多的記錄,這些記錄通過(guò)空行分開(kāi)(以CR,CR/NL, or NL作為結(jié)束符),每一條記錄的格式如下所示: field:optional spacevalueoptionalspace 在該文件中可以使用#進(jìn)行注解,具體使...

  • 搜索引擎通過(guò)一種程序robot(又稱spider),自動(dòng)訪問(wèn)互聯(lián)網(wǎng)上的網(wǎng)頁(yè)并獲取網(wǎng)頁(yè)信 息。您可以在您的網(wǎng)站中創(chuàng)建一個(gè)純文本文件robots.txt,在這個(gè)文件中聲明該網(wǎng)站中不想被robot 訪問(wèn)的部分,這...

  • Robots.txt對(duì)于任何一個(gè)從事SEO研究工作的人都是至關(guān)重要的,因?yàn)橥高^(guò) Robots.txt 我們可以直接與搜索引擎蜘蛛進(jìn)行對(duì)話,告訴他們哪些可以抓取,哪些不可以抓取。 一、為什么設(shè)置Robots.txt? 在...

  • 公司:西安蟠龍網(wǎng)絡(luò)科技有限公司
  • 聯(lián)系人:張經(jīng)理
  • 手機(jī)/微信:
  • Q Q: 點(diǎn)擊這里給我發(fā)消息
  • 地址:西安市雁塔區(qū)唐延南路11號(hào)逸翠園i都會(huì)