- · 搜索引擎原理(二)
- [2008-06-18 21:19:41]
- 早在 Web 出现之前,互联网上就已经存在许多旨在让人们共享的信息资源 。那些资源当时主要存在于各种允许匿名访问的FTP 站点(anonymous ftp), 内容以学术技术报告、研究性软件居多,它们以计算机文件的形式存在,... [阅读全文]
- · 搜索引擎原理(七)
- [2008-06-18 21:15:07]
- 查询服务如前面所述,从一个原始网页集合S 开始,预处理过程得到的是对S 的一个子集的元素的某种内部表示,这种表示构成了查询服务的直接基础。对每个元素来说, 这种表示至少包含如下几个方面:... [阅读全文]
- · 搜索引擎原理(六)
- [2008-06-18 21:14:42]
- 随便取一篇网页的源文件(例如通过浏览器的“查看源文件”功能),我们可以看到其中的情况纷乱繁杂。除了我们从浏览器中能够正常看到的文字内容外, 还有大量的HTML标记。... [阅读全文]
- · 搜索引擎原理(五)
- [2008-06-18 21:14:31]
- 搜索引擎是不可能将Web上的网页搜集完全的,通常都是在其他条件的限制下决定搜集过程的结束(例如磁盘满,或者搜集时间已经太长了)。因此就有一个尽量使搜到的网页比较重要的问题,这对于那些并不追求很大的数量覆盖率的搜索引擎特别重要。研究表明... [阅读全文]
- · 搜索引擎原理(四)
- [2008-06-18 21:13:57]
- 本章介绍搜索引擎的基本工作原理和它作为一种网络应用软件的体系结构。 在后面的三章中,我们将以一个实际的例子,具体展开在这些原理基础上实现的 一种方案。通过这几章学习,读者将得到一个可实际运行搜索引擎的实现细节。... [阅读全文]
- · 搜索引擎原理(三)
- [2008-06-18 21:13:31]
- 在许多场合,也称Yahoo!之类的门户网站提供的信息查 找功能为搜索引擎。但从技术上讲,这样的门户中提供的搜索服务和前述搜索引 擎是很不同的。这样的门户依赖的是人工整理的网站分类目录,一方面,用户可 以直接沿着目录导航,定位到他所关心的信息;另一方面,用户也可... [阅读全文]
- · 搜索引擎原理(一)
- [2008-06-18 21:13:06]
- 信息的生产、传播、搜集与查询是人类最基本的活动之一。考虑以文字为载 体的信息,传统上有图书馆、相应的编目体系和专业人员帮助我们很快找到所需 的信息,其粒度通常是“书”或者“文章”。随着计算机与信息技术的发展,有了 信息检索(Information Retrieval,IR)学... [阅读全文]
- · Robots书写规则
- [2008-06-18 21:08:28]
- 搜索引擎使用 spider程序自动访问互联网上的网页并获取网页信息。spider在访问一个网站时,会首先会检查该网站的根域下是否有一个叫做robots.txt 的纯文本文件。您可以在您的网站中创建一个纯文本文件robots.txt,在文件中声明该网站中不想被robot访问的部分或者指定搜索... [阅读全文]
- · 站长必看:google搜索引擎研究
- [2008-06-11 00:07:54]
- 对Google而言,链接可是它的“命根子”,也是它成功的关键。所以Google一有机会就向你灌输这样的观念:出去找链接吧,不然你的网站是不会被我们接受的。Google曾在一次搜索引擎学术会议上说明了收录网站的最低标准,即当你向Google提交网址时,至少要保证已有一个外部链... [阅读全文]
第1页 共1页 首页 上一页 [1] 下一页 尾首 转到:
