Googlebot开始检索网站深层内容
日期:2008年4月17日 作者: 查看:[大字体 中字体 小字体]-
Google公司今天宣布,其Googlebot web信息采集系统将开始自动填写HTML表单,并记录反馈结果。
Google搜索引擎似乎在不顾一切的吞食来自互联网的数据,仅去年1年它就吞下了约100 Exabytes(1 Exabyte=1000000000 Gigabyte)的数据。之前Google并不触及大量的深层页面(也就是网站中被隐藏的内容,例如没有连接的页面,非文本的内容,或是动态内容返回的结果),但是从今天开始,Google将开始对这些页面进行检索。
据Google表示“对于文本框,我们的电脑会自动对网站上的表格进行填写,并会选择菜单,复选框,以及相应的按钮,然后索引有价值的HTML结果。”Google指出,对于动态表格所反馈的结果并不影响对网站的普通检索,排名或是其他的内容。并且Googlebot绝对会遵守robots.txt的规定不对禁止访问机器人访问的页面进行检索。
据估计,目前互联网上的深层页面要比目前公布的页面大几个数量级。而且有人指出,Google永远也不能把互联网上的所有内容都检索到,其Googlebot的爬行结果对于整个互联网来说只是管中窥豹。不过Google表示,对深层页面的索引只是为了找出更多动态页面之间的联系,而不仅仅是为了索引结果。(出处:http://www.hackhome.com/)
-
- Googlebot开始检索网站深层内容 相关文章:
- ·使用Microsoft Query检索Excel外部数据
- ·如何使用Oracle全文检索功能
- ·如何实现小型WEB搜索引擎(C#+SQL Server全文检索+Asp.net)
- ·SQLServer全文检索简介
- ·SQL全文本检索应用
- ·错误解决:ora-12638:身份证明检索失败
- ·闻欧学堂——重名检索与姓氏频率统计
- ·手工安装Oracle全文检索工具
- ·如何检索网上专利及获取说明书
- ·SQL循序渐进(3)-------数据检索
- Googlebot开始检索网站深层内容 相关软件
- ·NoteExpress文献管理与检索 V1.9.1.182 多国语言版
- ·二十五史全文检索阅读系统(完整版) V3.0
- ·中国专利数据库检索系统软件 V1.0
- ·资治通鉴电子版(全文检索阅读) 第二版
- ·移盘检索精灵 V4.1
- 特别声明:本站除部分特别声明禁止转载的专稿外的其他文章可以自由转载,但请务必注明出处和原始作
- 者.文章版权归文章原始作者所有.对于被本站转载文章的个人和网站,我们表示深深的谢意。如果本站转
- 载的文章有版权问题请联系编辑人员,我们尽快予以更正. 转载请注明来源:http://www.hackhome.com
精品推荐
热点TOP10
- ·Google中文地图开始支持我的地图
- ·google搜索原理论文上(内容枯燥但非常有用)
- ·Google的技术剖析:
- ·google maps api document 中文翻译
- ·Google的AdSense服务在中国的部分合作网站分布及流量
- ·Gmail手机端汉化版v1.5下载
- ·GOOGLE搜索高级技巧大集合
- ·google pr更新时间
- ·google的分析(analytics)js代码分析以及重写
- ·总结:Google使用技巧
- ·google 相关关键词查询
- ·搜索“涉黄” Google台湾站拒绝修改
- ·Google注册域名大全
- ·Google音乐搜索之高级攻略(图)
- ·《Google排名技巧》共十五课学习笔记
- ·两行代码在任意页面实现谷歌卫星图
- ·活学活用Google
- ·Google 的秘密- PageRank
- ·从Google 的目录中删除网页记录
- ·Google入门到精通
