网络营销

动态网页静态网页被搜索引擎收录原理

      我们知道每个网页都是一个存在于服务器的独立文件,无论用于访问与否,每个静态页面都被保存在网站服务器上,因此为搜索引擎在网上索引网页信息提供了方便。动态网页的内容是当用户有点击请求时才从数据库中调出返回给用户一个网页的内容,也就是说,这个动态网页实际上并不是一个存放在服务器上的独立文件,当没有用户请求时这个动态网页实际上是不存在的。这样,当搜索引擎的机器手(又称蜘蛛,spider,索引网页文件的程序)在网上漫游索引网页信息时,动态网页自然不容易被收录到了。

不过这并不意味着只要是静态网页就一定会被搜索引擎收录,而动态网页就一定不会被搜索引擎收录,实际上搜索引擎收录了大量的动态网页信息,那么这些动态网页怎样才能被搜索引擎收录呢?其实动态网页被搜索引擎收录和静态网页被收录的原理是一样的,只是因为两种网页表现形式的差异造成了搜索引擎索引这些文件的方式有所不同,动态网页只有通过链接关系被搜索引擎蜘蛛发现才可能被收录。我们知道,google、百度等技术性搜索引擎(通常被称为第二代搜索引擎)是基于超级链接检索的,搜索引擎是否收录一个网页,主要取决于是否有一个网页(已经被搜索引擎收录的网页)链接了那个新的、尚未被收录的动态网页网址。如果一个动态网页信息发布到服务器之后,没有任何一个网站/网页给出链接,那么这个动态网页几乎是无法被搜索引擎检索到的。

    新发布的网页信息没有被任何一个被搜索引擎已经收录,那么网页中所有的链接,即使网页是静态形式也不能被搜索引擎收录。既然如此,为什么说静态网页比动态网易容易增加搜索引擎的收录机会呢?其实还是由于网页之间的超级链接关系所决定的。在动态网页之间建立的链接关系,如同每个静态网页本身一样,都是固定存在的, 这样搜索引擎检索就很容易通过逐级链接收录所有相关网页,而动态网页内容中的链接关系这样的机会就比较少了,除非这个动态网页已经被搜索引擎收录,其中链接的其他网页才可能被收录。

..关闭..