福州大唐传易网络科技有限公司是专门从事福州网站建设,福州网络推广,福州seo的一家互联网公司
关于我们 联系我们 福州网络推广 福州seo 站点地图
MESSAGE在线留言
热线电话:
15659176979
首页
关于我们
新闻资讯
产品中心
案例展示
在线留言
联系我们
产品中心

福州seo教程

大唐传易浅谈seo之url的重要性?应该注意哪方面

发布时间:2018-01-11
    搜索引擎收录是以什么为标准?url,所以链接是非常重要的,在站点操作的时候,我们应该注意url的哪些方面?今天大唐传易带大家来分析下:
    对于url要明白动态和静态的区别,动态url指的是由数据库驱动的网站所生成的、带有问号、等号及参数的网址。一般来说动态url不利于搜索引擎蜘蛛的爬行,应该尽量避免。
    url静态化一直以来都是最基本的seo要求之一,但近一两年seo行业对是否一定要做静态化有了一些观念上的改变。
    url静态化的重要性:现在的网站绝大多数是数据库驱动,页面由程序实时生成,而不是真的在服务器上有一个静态HTML文件存在。当用户访问一个网址时,程序根据url中的参数调用数据库数据,实时生成页面内容。因此动态页面相对应的url原始状态也是动态的,包括问号、等号及参数。
    现在的网站绝大多数是数据库驱动。页面由程序实时生成,而不是真的在服务器上有一个静态HTML文件存在。当用户访问一个网址时,程序根据URL中的参数调用数据库数据,实时生成页面内容。因此动态页面相对应的URL原始状态也是动态的,包含问号、等号及参数,如下面这种典型论坛的URL:
    
搜索引擎在发展初期(其实也就是10年前到三四年前而已)一般不太愿意爬行和收录动态URL,主要原因是可能陷入无限循环或收录大量重复内容,造成资源极大浪费。最典型的无限循环就是某些网站上出现的万年历,很多博客都按时间存档,一些宾馆、航班查询网站都经常出现万年历形式。

 

    搜索引擎蜘蛛碰到万年历,如果一直跟踪上面的链接,可以不停地点击下一月、下一年,无穷无尽陷入无限循环,每一个日期对应的页面内容也没什么区别。真实用户一眼就能看出这是个日历,但搜索引擎蜘蛛面对的只是一串代码,不一定能判断出其实这是个万年历,使蜘蛛可以无限点击下去。

 

    有时就算不存在无限循环,动态URL也可能造成大量复制页面。
     更麻烦的是有时某些参数可以是任意值,服务器都能正常返回页面,虽然内容全是一样或非常相似的。例如,上面URL中的参数12345改为6789或其他什么数字,服务器很可能也返回200状态码。

 

    所以以前的搜索引攀对动态URL敬而远之,要想网站页面被充分收录,站长需要把动态URL转化为睁态URL。

怎样静态化URL

    最常见的方法是使用服务器的URL重写模块。在LAMP (Linux+Apache+MySQL+PHP)服务器上一般使用mod-rewrite模块,Windows服务器也有功能相似的ISAPI Rewrite等模块,以LAMP服务器为例,要想把URL:

 

需要启用服务器mod-rewrite模块,然后在.htacces:文件中写入如下代码:

    RewriteRule/products/([0-9]+) /products.php?id$1

    URL重写代码纂于正则表达式,每个网站的动态URL结构不同,服务器设置也可能不同,代码也就不同,正则表达式的写法比较复杂,千变万化,通常需要程序员编写。在写URL静态化代码时必须非常小心,错了一个字符,多了一个斜杠等微小的不间,都可能造成灾难性的后果。我本人就遇到过这样的案例。

 

    严格来说,这里所说的URL静态化应该称为“伪静态化”,也就是说服务器上还是不存在相应的HTML文件,用户访问时还是动态生成页面。只不过通过URL重写技术使网址看起来像是静态的。也有的CMS系统可以实现真正静态化。站长增添产品或文章后,系统会自动生成真实存在的静态的HTML文件。对搜索引擎来说,真正的静态与伪静态没有区别。

URL不需要静态化吗

    近两三年搜索引擎对动态URL的抓取有了很大进步。一般来说URL中有两三个参数,对收录不会造成多大影响。权重高的域名,再多几个问号也不是问题。不过一般来说还是建议将URL静态化。既能提高用户体验,又能降低收录难度。

 

    2008年9月份,Google站长博客发表了一篇讨论动态网址和静态网址的帖子,颠覆了这个SEO界的传统观念。在这篇帖子里,Google明确建议不要将动态URL静态化。

 

    Google的帖子有几个要点。

    (1) Google完全有能力抓取动态网址,多少个问号都不是问题。

    (2)动态网址更有助于Google蜘蛛读懂URL含义并进行鉴别,因为网址中的参数有提示性。Google举了这个例子:

    URl里的参数本身有助于Google理解URL及网页内容,比如language后面跟的参数是提示语言,answer后面跟的是文章编号,sid后面的肯定是Session ID。其他常用的参数包括:color后面跟的一般是颜色,size后面跟的参数是尺寸等,有了这些参数名称的帮助,Google更容易理解网页。

    将网址静态化后,这些参数的意义通常就变得不明显了,比如这个URL:

    就可能使Google不知道哪个是产品序列号,哪个是尺寸。

 

    (3) URl静态化很容易弄错。那就更得不偿失了。比如,通常动态网址的参数调换顺序所得到的页而是相同的,这两个网址很可能就是同一个页面:

    保留动态网址,Google比较容易明白这两个URL是一个页面,因而自动合并权重,经过静态化后。这样两个网址。Google就不容易判断是不是同一个页面,从而可能引起复制内容:

    再一个容易搞错的是Session ID,也可能被静态化进URL:

    这样网站将产生大盘URL不同、但其实内容相同的页面。

    所以,Google建议不要静态化URL.

 

    但是我日前还是建议尽量要静态化URL,原因如下:

    (1) Google给的建议是从Google自己出发,没有考虑其他搜索引擎,Google抓取任何动态网址没问题,并不意味着百度、雅虎、必应、搜狗、搜搜等都没问题。

 

    (2) Google所说的静态化的弊端,基本上是基于静态化做得不正确的假设,问题是要做静态化就得做正确,假设会做错是没有什么道理的,有几个人会在静态化网址时把Session ID也放进去呢?

 

    (3)用户体验。带有参数的URL可能有助于Google读懂内容,但是显然非常不利于用户在一瞥之下理解页面大致内容。看看这两个网址哪个更清晰,更容易读懂,更有可能被点击呢:

    显然是第二个。

 

    除了点击率,长的动态网址也不利于记忆,不利于在邮件、社会化网站等地方抄送给别人。
url设计:url在搜索结果列表中是显示内容之一。设计网站结构时需要对目录及目录及文件命名系统做事先规划。总的原则是首先从用户体验出发,url应该清新友好、方便记忆,然后才考虑url对排名的影响。
   1.URL越短越好

    这主要是为用户着想。对搜索引擎来说,只要URL不超过1000个字母,收录起来都没问题。不过真的使用几百个字母的URL,用户看起来就费事。曾经有人做过搜索结果点击实验,一个比较短的URL出现在一个比较长的URL下面时,短URL的点击率比长URL高2.5倍。

    另外,短URL也有利于传播和复制。站长在做链接时,通常会直接复制URL。短URL不会有问题,长URL复制时都会费劲,也可能复制不完整,造成404错误。

    2.避免太多参数

    在可能的情况下尽量使用静态URL。如果技术上不能实现,必须使用动态URL,也要尽量减少参数。一般建议2-3个参数之内。参数太多用户看着眼花缭乱,也可能造成收录问题。

    3.目录层次尽量少

    这里指的是物理目录结构。

    当然目录层次与网站整个分类结构相关。分类层数越多,目录层次也必然增多。在可能的情况下,尤其是静态化URL时,尽量使用比较少的目录层次。根据观察,百度尤其喜欢目录层次少的页面。

    4.文件及目录名具描述性

    尤其对英文网站来说,目录及文件名应该具备一定的描述性,使用户在一憋之下就能知道这个URL内容大致应该是什么。

    5.URL中包含关键词

    关键词出现在URL中也能提高页面相关性,在排名时贡献一点分数。关键词出现得越靠前越好,也就是说出现在域名中最好,其次是出现在目录名中,效果最小的是出现在文件名中。不过切不可为了出现关键词而堆砌。

    6.字母全部小写

    这有以下几方面原因。

   (1)全部小写容易人工输入,不会因为大小写参杂而犯错。

   (2)有服务器是区分大小写的如Linux服务器。

   (3)robots文件代码也是区分大小写的,一个字母之差可能使整个目录不能收录。

    7.连字符使用

    目录或文件名中单词一般建议使用短横线(-)分隔,不要使用下划线或其他更奇怪的字母。搜索引擎把URL中的短横线当作空格处理,下划线则被忽略。所以文件名seo-tools.html将被正确读取出的seo和tools两个单词,而文件名seotools.html就不能被分解出两个单词。

    8.目录形式还是文件形式

    大部分CMS系统都可以把页面URL设置为目录或文件形式。有人认为目录形式的权重稍微高一点,不过无法验证,就算权重高一点,也应该微乎其微。

    目录形式的一个优点是,以后如果网站跟换编程语言,URL可以不必变化,也不用经过特殊处理。文件形式的URL可能文件扩展名会变化,除非做URL重写。
网站url规范化:
网址规划化指的是搜索引擎挑选最合适的url作为真正网址的过程。
为什么出现不规范的网址?有的url虽然是相同的内容,但是url都是不一样的。如何解决网址规划化的问题?
要解决url规范化问题有很多方法,比如:

1、确保使用的CMS系统只产生规范化网址,无论是否有静态化。

    2、所有内部链接保持统一,都指向规范化网址。以不带www为列,确定一个版本为规范化网址,网站内链接统一使用这个版本。这样搜索引擎也就明白哪一个是站长希望的规范化网址。由于用户习惯,通常选择带www的版本为规范化网址。

    3、在Google管理工具中设置首选域。

    4、使用301转向,把不规范化URL全部转向规范化URL。

    5、使用canonical标签。后面将深入讨论。

    6、提交给搜索引擎的XML网站地图中全部使用规范化网址。

    但这些方法都各有局限:

    Google管理员工具不适用于其他搜索引擎。

    有的网站因为技术原因做不了301转向。

    CMS系统经常不受自己控制。

    内部链接自己可以控制,但外部链接不受控制。

    所以,虽然有解决方法备选,但到目前为止网址规范化一直是困扰站长以及搜索引擎的一个问题。据统计,网上有10%-30%的URL是内容相同但URL不一样的不规范化网址。为万无一失,经常需要综合使用多个方法。