整理您的网站层次结构
了解搜索引擎如何使用网址
搜索引擎需要为每个内容提供唯一的URL,以便能够对该内容进行爬网和建立索引,并将用户引向该内容。不同的内容(例如,商店中的不同产品)以及修改后的内容(例如,翻译或区域变化)需要使用单独的URL,以便在搜索中正确显示。
URL通常分为多个不同的部分:
protocol://hostname/path/filename?querystring#fragment
例如:
https://www.example.com/RunningShoes/Womens.htm?size=8#info
Google建议所有网站尽可能使用https://。主机名是您网站的托管地,通常使用与电子邮件相同的域名。Google区分“ www”和“非www”版本(例如,“ www.example.com”或仅“ example.com”)。将您的网站添加到Search Console时,建议同时添加http://和https://版本以及“ www”和“非www”版本。
路径,文件名和查询字符串确定访问服务器中的哪些内容。这三个部分区分大小写,因此“ FILE”将产生与“ file”不同的URL。主机名和协议不区分大小写;大写或小写都不在那儿起作用。
片段(在这种情况下为“ #info”)通常标识浏览器滚动到页面的哪一部分。由于内容本身通常与片段无关,因此搜索引擎通常会忽略所使用的任何片段。
引用主页时,主机名后的斜杠是可选的,因为它会导致相同的内容(“ https://example.com/”与“ https://example.com”相同)。对于路径和文件名,斜杠将被视为不同的URL(对文件或目录进行信号传输),例如,“ https://example.com/fish”与“ https://”不同example.com/fish/“。
导航对搜索引擎很重要
网站导航对于帮助访问者快速找到所需内容很重要。它还可以帮助搜索引擎了解网站站长认为重要的内容。尽管Google的搜索结果是在页面级别提供的,但Google还希望了解页面在网站的整体形象中所扮演的角色。
根据您的主页计划导航
所有站点都有主页或“根”页面,该页面通常是站点上访问频率最高的页面,也是许多访问者浏览的起点。除非您的站点只有很少的页面,否则您应该考虑访问者如何从常规页面(您的根页面)转到包含更多特定内容的页面。在特定主题区域周围是否有足够的页面,可以创建一个描述这些相关页面的页面(例如,根页面->相关主题列表->特定主题)?您是否有数百种需要分类在多个类别和子类别页面下的不同产品?
使用“面包屑列表”
痕迹是页面顶部或底部的内部链接行,允许访问者快速导航回上一部分或根页面。许多面包屑将最通用的页面(通常是根页面)作为第一个,最左侧的链接,并在右侧列出更具体的部分。
为用户创建一个简单的导航页面
导航页面是您网站上的一个简单页面,显示您的网站结构,通常由您网站上页面的层次结构列表组成。如果访问者无法在您的网站上找到页面,则可以访问此页面。搜索引擎也会访问此页面,从而很好地覆盖了您网站上的页面,但它主要是针对人类访问者的。
最佳实践
创建自然流动的层次结构
使用户尽可能轻松地从常规内容转到他们想要在您的网站上获得的更具体的内容。合理添加导航页面,并将其有效地应用于内部链接结构。确保您站点上的所有页面都可以通过链接访问,并且不需要内部“搜索”功能。适当时链接到相关页面,以允许用户发现相似的内容。
避免:
· 创建复杂的导航链接网站,例如,将网站上的每个页面链接到其他页面。
· 对内容进行切片和切块变得过于繁琐(这样一来,需要20次点击才能从首页到达)。
使用文字导航
通过文本链接控制网站上页面到页面的大部分导航,可以使搜索引擎更轻松地爬网和理解您的网站。使用JavaScript创建页面时,请使用URL的“ a”元素作为“ href”属性值,并在页面加载时生成所有菜单项,而不用等待用户交互。
避免:
· 具有完全基于图像或动画的导航。
· 需要导航的基于脚本或基于插件的事件处理。
为用户创建一个导航页面,为搜索引擎创建一个站点地图
为用户提供整个网站的简单导航页面(如果有数百或数千,则为最重要的页面)。创建一个XML网站地图文件,以确保搜索引擎发现您网站上的新页面和更新页面,并列出所有相关URL以及其主要内容的最后修改日期。
避免:
· 让您的导航页面过时,链接断开。
· 创建一个导航页面,该页面仅列出页面而不组织页面,例如按主题。
显示有用的404页
用户有时会通过链接断开或输入错误的URL来访问您网站上不存在的页面。拥有一个自定义的404页,可以很好地引导用户返回您网站上的工作页,可以极大地改善用户的体验。您的404页面可能应该有一个返回到您的根页面的链接,并且还可能提供指向您网站上热门或相关内容的链接。您可以使用Google Search Console查找导致“未找到”错误的URL的来源。
避免:
· 允许您的404页面在搜索引擎中建立索引(请确保您的网络服务器配置为提供404 HTTP状态代码,或者在基于JavaScript的网站的情况下,当不存在的页面不存在时,请添加noindex机器人元标记要求)。
· 阻止通过robots.txt文件抓取404页面。
· 仅提供模糊的消息,例如“未找到”,“ 404”或根本没有404页面。
· 为您的404页使用的设计与网站的其余部分不一致。
简单的URL传达内容信息
为网站上的文档创建描述性类别和文件名,不仅可以帮助您更好地组织网站,还可以为想要链接到内容的用户创建更简单,更“友好”的URL。访客可能会被包含很少可识别单词的极长且隐秘的URL所吓倒。
URL显示在搜索结果中
最后,请记住,文档的URL通常显示在Google的搜索结果中文档标题下方。
Google擅长抓取所有类型的URL结构,即使它们非常复杂,但是花时间使您的URL尽可能简单也是一种好习惯。
最佳实践
在网址中使用单词
带有与您网站的内容和结构相关的单词的URL对于浏览您的网站的访问者来说更友好。
避免:
· 使用带有不必要参数和会话ID的冗长URL。
· 选择通用页面名称,例如“ page1.html”。
· 使用过多的关键字,例如“ baseball-cards-baseball-cards-baseballcards.htm”。
创建一个简单的目录结构
使用目录结构可以很好地组织您的内容,并使访问者可以轻松地知道他们在您网站上的位置。尝试使用目录结构来指示在该URL上找到的内容类型。
避免:
· 具有子目录的深层嵌套,例如“ ... / dir1 / dir2 / dir3 / dir4 / dir5 / dir6 / page.html”。
· 使用与目录内容无关的目录名称。
提供一个版本的URL来访问文档
为防止用户链接到一个版本的URL,而其他用户链接到另一个版本(这可能会在URL之间拆分该内容的信誉),请着重在页面的结构和内部链接中使用和引用一个URL。如果您确实发现人们正在通过多个URL访问相同的内容,那么将301重定向从非首选URL设置为主导URL就是一个很好的解决方案。如果您无法重定向,也可以使用规范的URL或使用rel =“ canonical” 链接元素。
避免:
· 让子域和根目录中的页面访问相同的内容,例如“ domain.com/page.html”和“ sub.domain.com/page.html”。