Robots Txt

禁止搜索引擎抓取特定目录

1
2
3
4
User-agent: *
Disallow: /zh-cn/
Disallow: /en-us/
Disallow: /ja/

禁止爬取

1
2
user-Agent:*
Disallow: /

白名单 + 特定爬虫

1
2
3
4
5
6
User-agent:  Baiduspider  
Allow:  /article        
Allow:  /oshtml 
Allow:  /wenzhang
Disallow:  /product/ 
Disallow:  /  <!--除上面允许访问的部分,其他部分均不开放访问-->