谷歌SEO入门手册2018年版(一):Google抓取

谷歌SEO入门手册2018年版(一):Google抓取

[]

1.前言

如果您通过 Google 搜索营运、管理或推广在线内容,或通过在线内容赢利,则本手册对您适用。如果您是业务迅速发展的店家、拥有十几个网站的网站站长、网络代理方面的 SEO 专家,或者是对搜索模式具备强烈兴趣的 DIY SEO 达人,则本手册也适用于您。如果您有兴趣按照我们的最佳做法对 SEO 基础知识进行全面了解,那么本手册同样适用于您。本手册不会提供任何可使您的网站在 Google 中手动排位第一的绝招(抱歉!),但是假如您依照下边列举的最佳做法,则有望使搜索引擎更容易抓取、理解您的内容并将其编入索引。

搜索引擎优化 (SEO) 通常是指对网站的各个部份进行细微的更改。单独来看,这些更改或许也是逐渐细微的改进,但与其他优化结合上去后,则可能会对您的网站在自然搜索结果中的用户感受跟疗效形成明显影响。您或许已经熟悉本手册中的许多主题,因为他们是任何网页的基本要素,但您或许并未充分利用他们。

您应当对网站进行优化,以满足用户需求。您的其中一个用户便是搜索引擎,它可以帮助其他用户发觉您的内容。搜索引擎优化是指帮助搜索引擎了解跟展现内容。您的网站或许比我们的样例网站更简略或更复杂,并且展现的内容或许截然不同,但我们下边讨论的优化主题对于所有大小跟类别的网站均适用。我们希望本手册在怎么改进网站方面才能给您带给一些全新的观念,同时也希望您在 Google 网站站长帮助峰会1积极分享您的问题、反馈跟成功案例。

2.相关术语

以下简略术语表包含了本手册中使用的重要术语:

3.您的网站是否已被 Google 搜索引擎收录?

可在 Google 搜索引擎中对您的网站的首页网址执行“site:”搜索。如果您能看到结果搜索引擎优化seo知识完全手册,则阐明您的网站在索引中。如“site:”。

虽然 Google 可抓取数十亿网页的内容,但遗漏部份网站也在所难免。所以假如你的网站未被收录,可能是以下成因引起的:

4.如何使我的网站显示在 Google 搜索结果中?

让网站列入 Google 搜索结果完全免费,且操作简略,甚至不需要向 Google 提交网站。Google 是一个全手动搜索引擎,它使用网页抓取工具持续抓取网页,以便查找可添加至 Google 索引中的网站。实际上,显示在 Google 搜索结果中的大多数网站都不是自动递交供列入索引的,而是 Google 在抓取网页时找到并手动添加的。了解 Google 如何发觉、抓取跟展现网页。

我们提供了网站站长手册,以帮助网站站长建立便捷 Google 处理的网站。虽然我们没法保证我们的抓取工具一定就能找到某个特定网站,但依照某些手册应当可以让您的网站显示在我们的搜索结果中。

Google Search Console 提供了一系列工具,以协助您向 Google 提交内容,并检测您的网站/移动应用在 Google 搜索结果中的公布度。如果您乐意,当 Google 在抓取您网站的过程中发觉任何严重问题时,Search Console 甚至可以向您发送告诫。注册 Search Console5。

首先您还要问自己以下几个有关您的网站的基本问题。

您可以在 上找到其他入门信息

5.帮助 Google 发现您的内容

要使网站显示在 Google 搜索结果中,首要方法便是确保 Google 能够找到它。最好的方法是递交站点地图。站点地图是网站上的一种文件,可告知搜索引擎网站上新增了网页或有更新的网页。详细了解怎样建立跟递交站点地图。

Google 还会通过其他网页上的链接找到网页。

6.让 Google 知道不应抓取这些页面

最佳做法

若为非敏感信息,则可以使用 robots.txt 阻止不必要的抓取

“robots.txt”文件会告诉搜索引擎他们是否可以访问您网站的各个部份并执行抓取。此文件应当命名为“robots.txt”,且应坐落网站的根目录下。被 robots.txt 阻止的网页也可能会被抓取,因此您应使用更安全的方式保护敏感网页。

您或许不希望网站的这些页面被抓取,因为很多页面显示在搜索引擎的搜索结果中或许对用户无用。如果您希望制止搜索引擎抓取您的网页,Google Search Console 可提供方便的 robots.txt 生成器帮助您争创此文件。请注意,如果您的网站使用了子域名,并且您希望 Google 不要抓取特定子域名上的这些网页,那么您应当为该子域名单独争创一个 robots.txt 文件。

应避免的做法:

若为敏感信息,则请使用更安全的方式

要制止用户访问敏感或绝密信息,Robots.txt 并不是一个适当或有效的手段。它只会告知运行良好的抓取工具不要抓取相应网页搜索引擎优化seo知识完全手册,却不会阻挡您的服务器将某些网页发送给恳求他们的浏览器。其中一个成因是:如果互联网上的某处(例如举荐来源网址日志)恰好存在对准那些被严禁访问的网址的链接,那么搜索引擎一直就能引用那些网址(仅显示网址,但不显示标题或摘要)。此外,未同意遵照《漫游器排除标准》的不合规搜索引擎或流氓搜索引擎可能会违背您的 robots.txt 文件中的指令。最后,用户可能会出于好奇查看您的 robots.txt 文件中的目录或子目录,并推测您不想被看到的内容的网址。

在某些状况下,如果您仅仅希望网页不显示在 Google 中,则可使用 noindex 标记,无需怀疑任何用户会通过链接访问该网页。然而,为了做到真正的安全,您应当使用合适的授权方式(例如还要用户密码能够访问)或将网页从网站上彻底移除。

© 版权声明
THE END
喜欢就支持以下吧
点赞0
分享
评论 抢沙发

请登录后发表评论