搜索引擎优化 SEO 知识之一二

动态网页优化

动态网站是指网站内容的更新跟维护是通过一个带有数据库后台的硬件,即内容管理系统(CMS)完成。一般选用 ASP,PHP,Cold Fusion,CGI 等程序动态生成页面。动态页面在网路空间中实际并不存在,它们的大部分内容一般来自与网站相通的数据库,只有接到用户的恳求,在变量市中键入一个值之后就会生成。动态网页扩展名显示为.asp、.php、cfm 或.cgi,而不是静态网页的.html 或者.htm。其 URL 中一般出现“?”、“=”、“%”,以及“&”、“$”等符号。网站使用动态技术的弊端,除了提高网站交互功能,还具备容易维护跟更新的特点,因此为许多大中型网站辅以。

但大多数搜索引擎的蜘蛛程序都未能解析符号“?”后的字符。这就意味着动态网页很难被搜索引擎检索至,因而被用户找到的机会也大为减少。因此,建设网站之前首先要摆正思想,即才能选用静态表现的网页尽量不要用动态实现,重要的网页用静态表现。同时使用技术将动态网页转换成静态网页方式,使 URL 中不再包含“?”“=”等类似的符号。也可以通过对网站进行一些改动,间接降低动态网页的搜索引擎可见度。即坚持“动静结合,以静刹车”的原则。

不同技术的解决方案:

针对不同程序开发的动态网页有着相应的解决方案。以下是作者 Karen 编译的部份内容:

1、CGI/ Perl

如果你在网站中使用的是 CGI 或者 Perl搜索引擎优化seo知识完全手册,可用一个脚本拾取环境变量前的所有字符,再将URL 中剩余的字符形参给一个变量。这样,你就可以在 URL 中使用该变量了。

不过,对于这些外置了部份 SSI(Server-Side Include:服务器端嵌入)内容的网页,主要的搜索引擎都还能提供索引支持。那些以.shtml 为后缀名的网页也被解读成 SSI 文件,相当于一般的.html 文件。但若果这种网页在其 URL 中使用的是 cgi-bin 路径,则仍有或许不被搜索引擎索引。

2、ASP

ASP(Active Server Pages: Web 服务器端动态网页开发技术)被适于基于谷歌的网路服务器中。使用 ASP 开发的网页,一般后缀名为.asp。只要防止在 URL 中使用符号“?”,大多数搜索引擎都还能支持用 ASP 开发的动态网页。

3、Cold Fusion

如果你使用的是 Cold Fusion,那么你就须要在你的服务器端再次对其进行配置,使其才能将一个环境变量中的符号“?”用符号“/”代替,并将替换后的数值传给 URL。这样一来,最后抵达浏览器端的就是一个静态的 URL 页。当搜索引擎对该转化后的文件进行检索时,它不会遭到“?”,因而可继续对整个动态页的索引,从而让你的动态网页对搜索引擎依然具备可读性。

4、Apache 服务器:

Apache 是最流行的 HTTP 服务器硬件之一。它有一个称作 mod_rewrite 的重画模块搜索引擎优化seo知识完全手册,即 URL 重写转向功能。该模块才能让你将包含环境变量的 URL 转换为才能为搜索引擎支持的 URL 类型。对于这些公布后无须多少更新的网页内容如新闻,可选用该重画转向功能。

建立静态入口:

在“静动结合,以静刹车”的原则指导下,还可以通过对网站做一些更改,尽可能降低动态网页的搜索引擎可见度。如将动态网页编入静态主

页或网站地图的一个链接中,以静态目录的形式展现该动页面。或者为动态页面构建一个专门的静态入口页面(gateway/entry),链接至动态页面,然后将静态入口页面提交给搜索引擎。

对一些重要的、内容相对固定的页面制做为静态网页,如包含有丰富关键词的网站介绍、用户帮助,以及富含重要页面链接的网站地图等。网站首页尽量全部选用静态方式,并将重要动态内容以文本链接模式全部展现,虽然降低了维护工作量,但从 SEO 的角度看是值得的。 也可以考虑为你的重要动态内容争创静态的存盘网站。

付费登陆搜索引擎:

当然,对于整个网站都选用与数据库相通的内容管理系统(CMS)发布的动态网站而言,提高搜索引擎可见度的最直接方法就是进行付费登陆,直接递交动态网页至搜索引擎目录,或做关键字广告,保证网站被搜索引擎收录。

搜索引擎对动态网站支持的改进

搜索引擎仍然在增加自己对于动态页面的支持。到现在为止,GOOGLE、HOTBOT 和百度等开始尝试抓取动态网站页面(甚至包括 URL 带 “?”的页面)。但这种搜索引擎抓取动态页面时,为了防止”搜索机器人骗局”(spider traps,脚本错误,这种错误会使搜索机器人进行无限循环的

抓取,无法退出)”,都只抓取从静态页面链接过去的动态页面,而从动态页面链回去的动态页面都不再抓取,即不会对动态页面中的链接进行深入访问。

对于直接使用动态的 URL 地址,请注意:

文件 URL 中不要有 Session Id,同时不要用 ID 作为参数名称(特别是对于 GOOGLE);

如:下面这个 URL 地址:

,该页就不容易被调用。(搜索机器人基本对这些连结不进行检索,除非访问量非常大,或其他成因,比如目前的 Google Sitemap)

参数越少越好,尽量不要超出 2 个;

尽量不要在 URL 中使用参数,这样可以提高动态页面被抓取的深度跟数目。

附:Google 向网站管理员提供的信息:

百度常见站长问题:#2

待续……

(摘自胡宝介的《搜索引擎优化(SEO)知识完全手册》)

© 版权声明
THE END
喜欢就支持以下吧
点赞0
分享
评论 抢沙发

请登录后发表评论