网站网址规范化(URL canonicalization)指的是搜索引擎挑选最合适的URL作为真正的网址过程。
下面举例来说下
- http://qcwlseo.com
- https://www.qcwlseo.com
- http:// qcwlseo.com/index.html
- https://www.qcwlseo.com/index.html
从上述列出的例子来讲,这几个URL都是不同的网站地址,而且搜索引擎的确也把他们当做不同的网址。在绝大部分情况下,这些网址所返回的内容都是相同的,也就相同的网站首页。
上面除了因为带和不带www造成的还有结尾带有index.html文件造成的不规范网址。而造成此类网站网址不规范的原因有很对。下面举例说明一下
- CMS系统原因,使一篇文章可以通过多个URL进行访问。
- URL静态化设置出错,同一个网址存在多个静态化URL。
- URL静态化后,导致静态URL和动态URL共存,有多个网址都可以访问。
- 网址目录后面带“/”和不带“/”的原因
https://www.qcwlseo.com和https://www.qcwlseo.com/是不同的网址,但其实是一个网址页面。
- 加密网址
https://www.qcwlseo.com和https://www.qcwlseo.com同时存在也都可以访问。
- URL中有端口号。
https://www.qcwlseo.com:80和https://www.qcwlseo.com。