说起隐藏网站内容,不少人就想起用robots.txt来屏蔽一下网页,或者使用别的手段方法来达到目的,但是使用robots.txt会流失权重,也就导致录入的文章几乎没有了要达到的作用,所以如何正确的隐藏网站内容是个不小的难题,下面我们通过文章的形式来看一看隐藏网站内容有什么方法,以及这些方法的利弊分析。
使用Flash
Google几年前就开始尝试抓取Flash内容了,简单文字性内容已经能抓取。Flash里面的链接也能被跟踪。
表格
Google蜘蛛也能填表,也能抓取POST请求页面。这个早就能从日志中看到。
JS/Ajax
使用JS链接一直以来被当作不搜索引擎友好的方法,因此可以阻止蜘蛛爬行,但两三年前我就看到JS链接不能阻止Google蜘蛛抓取,不仅JS中出现的URL会被爬,简单的JS还能被执行找到更多URL。
前几天有人发现很多网站使用的Facebook评论插件里的评论被爬、被收录,插件本身是个AJAX。这是个好消息。我的一个实验电子商务网站产品评论功能就因为这个费了不少心思,用Facebook comments插件好处大大的,具体什么好处以后有时间再说,唯一的问题就是评论是AJAX实现的,不能被抓取,而产品评论被收录是目的之一(产生原创内容)。我当时想了半天也没有解决方法,只好先傻傻地既放上Facebook comments插件又打开购物车本身的评论功能。现在好了,Facebook comments里的评论能被收录,就不用两套评论功能了。
Robots文件
目前唯一确保内容不被收录的方法是robots文件禁止。但也有个坏处,会流失权重,虽然内容是不能收录了,但页面成了只接受链接权重、不流出权重的无底洞。
Nofollow
Nofollow并不能保证不被收录。就算自己网站所有指向页面的链接都加了NF,也不能保证别人网站不给这个页面弄个链接,搜索引擎还是能发现这个页面。
Meta Noindex + Follow
为防止收录又能传递权重,可以在页面上使用meta noindex和 meta follow,这样页面不收录,但能流出权重。确实如此,也是个比较好的方法。也有一个问题,还是会浪费蜘蛛爬行时间。哪位读者有能防止收录、又没有权重流失、又不浪费爬行时间的方法,请留言,对SEO界功德无量。
怎样使页面不被收录是个值得思考的问题,没意识到严重性的童鞋可以想想自己网站上有多少复制内容、低质量内容、各种无搜索价值(但用户觉得方便、有用所以又不能拿掉)的分类、过滤URL。
长春网络公司千策网络科技有限公司怎么样。
长春千策网络科技有限公司,是致力于网络营销技术与信息化服务的高新技术企业,一直专注于网站建设,集创意、策划、设计制作、技术开发于一体的专业网络应用服务提供商。提供网站建设服务,网页设计,Flash动画设计,行业门户网站建设,网站改版维护,外贸公司专业多语种网站建设,网络营销策划,网站推广,域名注册和申请服务,400电话,网站优化以及提供各种高质量的国内外虚拟主机及企业邮箱等。
Copyright © 2014-2025 ccqiance.com. All Rights Reserved. 千策网络 版权所有 长春千策网络科技有限公司
工信部备案:吉ICP备2024015098号