阅读我们的文章

class="lazyload

.

搜索引擎优化技术并不局限于纠正404,它可以解决网站上的重大问题。请看在审计中需要控制的5个重要点。

1 – Google 能否完整地看到该网页?

近十年来,网站在生成页面时对JavaScript的依赖程度极高。谷歌能够加载包含所有资源的页面,但页面越轻量,被完整加载的可能性就越大。反之,如果页面过于臃肿,则存在遗漏页面关键元素(如内容区域、链接)的风险。

Search Console 的 URL 检查工具可用于验证 Google 是如何抓取该页面的:生成的 HTML 代码是否与浏览器中显示的内容一致?必要的资源(关键的 CSS 和 JS 文件)是否已成功加载?

URL 检查工具实际上提供了两项功能:

  • Google 索引:显示 Google 索引的页面。

  • 实时测试:展示 Google 在理想条件下如何呈现该页面,并加载尽可能多的资源。

因此,请务必通过适合您分析的版本来研究您的网页。

class="lazyload

2 – Google 是否只收录网站中有用的页面?

人们往往有种错误的观念,认为返回 HTTP 200 状态码的 URL 就是好事,而返回 HTTP 404 状态码的 URL 就是问题。正如 SEO 领域常有的情况,这并没有非黑即白的答案,我们需要退一步客观地看待问题。

以一个电子商务网站为例:它主要由商品列表页(分类页)和商品详情页组成。

分类(类别、子类别)列表页面可能会为用户提供一些用户体验选项,例如筛选(颜色)和排序(价格)。

由于选项的组合,这些选项通常会生成几乎无限的带参数URL(例如example.com/chemises?couleur=Bleu&taille=XS)。 其风险在于,这会让谷歌能够访问到数量无法控制的、对SEO无用的页面,因为这些页面质量较低(过滤条件过多导致产品数量过少)或存在重复(相同产品按不同顺序排列)。

请在搜索控制台中关注“有效”(绿色)页面的数量。更理想的是,如果您的网站地图配置得当,仅包含网站中已知且有用的页面,您将能够区分:

  • 已提交并收录——网站地图中的页面

  • 已被收录,但未通过站点地图提交——未包含在站点地图中但已被收录的页面

因此,危险其实在于这一类,尽管它的绿色看起来令人安心。

class="lazyload

另一方面,产品具有生命周期,这意味着它最终会从网站上消失。其页面自然会显示HTTP 404状态码,并被归入近期下架的其他产品之中——也就是Search Console中“覆盖率”报告里的“被排除的URL——找不到(404)”部分。 正如秋天树下积聚的落叶一样,这是网站的一种正常现象。总体而言,Google 发现 404 状态的 URL 会对您的网站造成什么风险?没有任何风险。

3 – Google 是否确实认为该网站支持移动设备?

谷歌在搜索引擎优化(SEO)领域对移动端的重视,最终促成了其移动索引的上线:网站在SEO方面的质量将根据其移动版本进行评估。特别需要注意的是,必须确保桌面版和移动版在内容及链接方面保持一致。

有时会遇到一种较为罕见但更为严重的问题:Google 可能会认为某个网站不支持移动设备。大多数网站都采用了响应式网页设计(RWD),使同一个网站既能在桌面端也能在移动端正常显示。但正是这项技术可能成为陷阱:它依赖于网站的资源文件(主要是 CSS),而这些文件可能会在无意中被 Google 屏蔽。

有时在 robots.txt 文件(该文件用于告知 Google 可以在网站上访问哪些内容)中,会出现阻止响应式设计所需资源的指令,这通常是由于旧版 CMS 遗留的问题(或由管理不同 CMS 下多个目录的 robots.txt 文件所致)。 此时,Google 只能使用不完整的样式表来生成网站页面,并会判定该网站不兼容。幸运的是,发现这个问题非常简单(Search Console 会报告该错误,也可以通过“移动端优化测试”检查页面),而且通常解决起来也相对较快。

4 – 您通过浏览器和工具看到的网站与谷歌显示的一样吗?

网页由Web服务器生成。该服务器会响应针对某个URL发出的请求,该请求包含请求方的信息,特别是:用于识别请求方类型(工具、浏览器、爬虫)的User-Agent,以及IP地址。 因此,服务器会返回一个 HTTP 响应,通常附带一个网页。HTTP 200 响应会附带所请求的网页,而 HTTP 404 或 HTTP 500 响应则不会。

简而言之,某些网站会根据请求者的身份做出不同的响应。这带来了两个主要问题:

  • Google 和您的工具看到的页面并不相同。分析工具(如爬虫工具 OnCrawl、Screaming Frog或 SEO 解决方案 SEMrush、ahrefs可能会被网站服务器有意屏蔽。 无论是通过其 User-Agent,还是在模拟 Googlebot 时通过其 IP 地址。根据工具的配置不同,它们对同一 URL 的请求所获得的响应可能并不一致。

class="lazyload
  • 谷歌看到的页面与您在浏览器中看到的并不相同。一个网站在谷歌和普通用户面前可能表现得截然不同。除了可能被谷歌视为欺骗性行为(谷歌要求网站对自身和用户展示完全一致的内容)的风险外,这也会使网站SEO表现的分析变得更加复杂。

一个常见的例子是页面在用户端显示的在线状态:对于谷歌而言,example.com 这一页面可能确实存在,但用户实际访问时,由于其浏览器的语言cookies 而谷歌的爬虫并不使用这些信息),该页面会被重定向至 example.com/fr_FR/。

5 – 结构化数据会对网站构成威胁吗?

与搜索引擎广告(SEA)的广告扩展功能类似,自然搜索结果也采用了多种视觉增强形式。结构化数据是一种元数据,它根据预定义的格式标识网页中的多个关键元素。其目的是让搜索引擎更好地解析这些元素,作为回报,搜索引擎会在搜索结果中生成丰富的摘要。 最具代表性的例子是产品相关的结构化数据:系统会识别产品的名称、价格、库存状况和平均评分,这些信息将在搜索结果中针对该页面显示出来。

尽管结构化数据的规范(由Schema.org和Google制定)非常精确,且有相应的实现测试工具,但错误仍然屡见不鲜,即便是市场上最先进的CMS也不例外。

在最佳情况下,错误的实现会导致这些功能部分失效——相关元素不会生成丰富摘要,但也不会阻碍其他元素的生成(标记规范的售价不会因平均评分有误而受阻)。

更严重的是,一种乍看之下有效的实现方式反而可能对网站造成损害。市面上某些内容管理系统(CMS)在标记方面显得过于“慷慨”:在产品页面中,不仅对主产品进行了标记,还对关联产品(交叉销售)进行了标记。 虽然主产品在页面其他部分(标题、H1标签)中被明确标识,但页面上却存在多个价格。谷歌在搜索结果中必须为该页面选择一个价格进行展示,而它选中正确价格的可能性微乎其微。因此,搜索结果页面(SERP)中显示的产品页面往往会出现错误价格:要么低于实际价格,要么高于实际价格,这会让用户感到失望。

最严重且不幸的是并不罕见的情况,涉及谷歌的手动处罚。如果网站在结构化数据方面的实现被视为违反了谷歌允许的规范,将导致该网站的丰富摘要被完全移除,直至问题解决并提交手动处罚复核申请(随后由人工审核员进行验证)。 近期的一些案例耗时两个月才获得重新审核,在此期间,相关网站在搜索结果页面(SERP)上相较于竞争对手处于劣势(仅视觉上,对排名无影响)。

class="lazyload

阅读我们的文章

class="lazyload

.