12
2010

Permalink永久链接的搜索引擎优化

    给wordpress做seo工作的第一步,我认为就是设定好合适的permalinks(),因为其他的优化都是在wordpress内部,以后修改也可以,而永久链接以后是出现在各个网站和搜索引擎上的,更换链接会造成page 404,成本就很高,所以就先从permalinks入手。

    本篇深入讨论wordpress日志页的永久链接(permalinks)问题,permalink可在“管理后台-设置-永久链接(Customize Structure)”里设置。这里的permalink指的是你发表的日志页面的永久固定链接,wp有强大的自定义链接功能,几乎可以实现定制任何形式的文章链接。现在分析下如何选择适合自己的链接结构。

一、目录式结构还是html伪静态?

    1、目录式URL会导致存在domain.com/post-name/和domain.com/post-name的两个URL,搜索引擎对这两个URL是分开对待的,两个URL相同内容,可能导致搜索引擎误判为复制网页,并且两个URL的PR也不会一致,总之不利于SEO。而如果是html就不会有这个问题。
    2、从实际例子上看:google的博客服务blogger和百度的博客服务百度空间都是使用html静态化而不是使用目录式结构。搜索引擎本身当然可以对自己旗下的网站提高权重,而不需要通过seo来实现良好的排名,但不止他一个搜索引擎,blogger会想从yahoo搜索中拉些流量,百度知道和百度空间也需要针对google做一些优化,所以搜索引擎自身的服务seo也很重要。显然我们看到百度这这两个服务的seo做的非常好,在google中排名很高,这已很能说明问题,html静态化比目录式结构更有利于SEO。

    所以我的建议是URL采用html伪静态而非目录式结构。

二、要不要把文章分类存放(从URL上看去)?

    有的博客的永久链接为:domain.com//wordpress-seo.html,看链接就像是把每篇文章放在所属的专辑里。
    这种把文章永久链接放在各个category的子目录下的作法,在我看来是很没道理的。因为在windows下的惯性思维使我们觉得categoryname是一个个文件夹,把文章统一放在存档的文件夹里或者归类了存放似乎理所当然,但其实:

    1、在apache上的wp中categoryname/完全只是一种分类方式,与2008/1/或者tag/tagname/没有本质区别,都是一种虚拟目录形式的归类方式,并不是实际的文件夹。

    2、既然这只是一个归类方式,那就可以把它当成是一个文件(url格式的文件)清单列表。只不过这个清单的自身url看起来很友好,后面连html都没有!

    3、更形象点的比喻,这个清单就是一个简易的自己站点上的hao123,或者是供访客查看的sitemap。提供各个博文的链接。

    4、从wp自带的程序框架上看(wp的编程过程中其实已经自建了一个php框架),域名后跟的那个categoryname其实只是类似于ruby on rails中的反斜杆后的参数。有的人却把categoryname理解为文件夹。

    所以没有理由让存档的日志保存在分类的文件夹里。
    再逆向思考一下,假设这么做了:

    1、就等于认同了在分类下放文章的作法。因为前面说了,tag和category同是分类系统。
    既然跟据categoly的分类规则有:domain.com/wordpress/wordpress-seo.html
    那么跟据tag又要有:domain.com/tags/wordpress/wordpress-seo.html
    而跟据日期又要有:domain.com/2008/1/wordpress-seo.html
    显然这是不可能的。想想tag系统都没让日志保存在各个tag下,为何就要保存在自建的category中呢?(而且还不是默认的/category/categoryname/下)如果一定要保存,也应该保存在更具永久性的时间文件夹中啊。(就像wp官方博客服务那样)

    2、在用tag或者日期检索时,打开文章却跑到categoryname/里,莫名其妙,违背了分类的初衷,分类是为了找到文章,而不是让你再分类。

    3、就是用category检索,也会由category/categoryname/跑到上一级目录:categoryname/wordpress-seo.html,更容易让人混崤。

    加上一些主观的原因:

    1、你可能哪天想更改某个分类,那就得改动URL
    2、你可能喜欢把文章归为多个分类,那会造成混乱,所以我说这种分类不及时间分类永久。
    3、你可能觉得分类有助于SEO,比如分类在/wordpress下的文章就都有了天生的wordpress关键字。但想想,你写关于wordpress的文章的标题中不会含有wordpress吗?这样反而会造成重复。而且分类常常是大范围的,如technology,这样的关键字并不会被拿来搜索,对SEO无用。

    所以我不赞成使用从URL看上去分类存放的方式(暂时也没看到哪家大的博客托管商用这种方式组织URL)。

三、要不要把发表的日志归档到一个文件夹里,比如archives文件夹?

    应该说这是超级流行的做法,甚至我在搜索引擎里辨别是否blog就是看这个blog文章的地址是否有archives目录。但有必要启用吗?还是就像我这里的,直接放在根目录下?

    这里涉及到个人的建站哲学和生活方式。就我而言:
    1、既然选择了www.devebar.net.cn直接作为blog,那么就等于认同了此顶级域名(也可把域名YY成一个目录)以下的每篇文章就是博文,所以可以直接放在这个根目录下,没有必要再用一个存档文件夹。
    2、在我看来,如果建一个archives目录,就像是建了一个blog目录。这样就出了问题:一边你用了一个blog文件夹,一边却又让人访问你的域名即为访问blog首页,让人感觉思维不够清晰。
    3、如果启用archives目录,那么archives也可理解为一个分类了,而既然只有一个分类,何必还要分类?
    4、不过如果启用archives目录或者blog目录,从其他的分类进博文时,跳到archives分类下的文件,而不是根目录下的文件,就这点倒是更符合博客的分类规则。
    5、类似于我在生活中的组织文件的方式,在一个页面内,只要是站内的链接,尽量追求只进到下一级的目录,而不是N级深的目录。
    6、SEO考虑:直接把html放在根目录比放在archives目录少了一级,有人认为google是不在意目录层次的,而只在意“链接到层次”,即从首页通过几次链接然后到达此页面。但我可以证明google和其他搜索引擎是在意目录层次的,以后的SEO文章中会阐述。所以从SEO上考虑,也是不归档,直接放在根目录占优。
    7、从wordpress本身程序架构上考虑:Wordpress作为一个博客程序(如果你是把wp当成cms来用,那另当别论),其实在最终对外浏览的数据结构上只有一层树状结构,内容也只有两样,即管理页面里发表的“文章”和“页面”,所有的内容均来自这里,没有任何其他的内容了。访客看到的那么多其他的链接都是围绕着这些页面的归类连接。所以把文章放在根目录下合情合理(从数据结构层面上看,很符合wp的数据结构模式)。

    再逆向思考下,假设文章放在了domain.com/archive或者article/的目录下,则:

    1、访客会认为domain.com/archive也可以访问,但默认wp不自动构建这个存档页面的管理页面,会提示404。
    2、当然你可以新建一个名为archive的页面,页面就是显示所有存档文章的标题,这样就不会404了。但是这样这个页面与主页类似,又成了一个博客,只不过这个博客是标题输出的,而不像根目录下的那个博客是全文输出或者摘要输出的。这样又会让人感觉思维混乱。
    3、如果一定要有一个显示所有文章标题的article目录,则可以加一个参数来表达“阅读方式”:domain.com/?readingmethod=articles ,并设置为此页面不被收录,比加个/archive归类阅读的方法要清晰的多。

    所以我的建议是:除非你以后还想发布自己的摄影集之类的另外形式的博客,那时需要一个博客归类还有一个图片归类(photoarchives),否则既然顶级域名就是博客,那么直接使用http://www.xxx.com/aaaa-bbbb-cccc.html 的URL形式。

四、要不要以日期形式组织文章URL?

    类似于这样http://zfpillar.devebar.net/2010/08/961.html
    blogger.com 就是类似这样,我的blog也是如此做法。

    1、日志url的格式是按月归档,我看到很多国外的seo专家推荐这种格式,他们认为google可以跟据url中的日期参数而得知网页的更新时间,而网页地址能提供给google的信息越多,google就越喜欢。
    2、不过就我看来,google不需要日期格式的url也能得知网页的更新时间的,对wp这么流行的博客程序,google在收录时,应该可以从文章页面的代码中得知发布时间。
    3、使用包含日期的url会造成目录层次过深,在国内,对百度等其他搜索引擎就不够友好。
    4、google对url中关键字的态度类似于对文章中关键字的态度,也会考察"皮配度"。比如搜索wordpress seo时,domain.com/123/wordpressseo就不如domain.com/wordpressseo权重,因为前者url中除了wordpressseo关键字外,还有其他关键字"123"(虽然看起来123不像是关键字,但这这是一个例子),匹配度不如后者。所以url尽量短,目录层次尽量低,是有道理的。

    综上,我的建议是:
    1,写文章的url时,要注意这就像写网页的meta属性,也不能堆砌关键字。
    2,不用日期归档文章的URL形式。

    最终我选择的链接格式是在根目录下直接存放每篇文章的html格式的链接,即在永久链接里选择第四个选项(自定义),并加上这个规则:/%postname%.html,效果可见本文的地址栏。

链接地址:http://zfpillar.devebar.net/2010/08/961.html

文章标题:Permalink永久链接的搜索引擎优化

本Blog文章归追峰所有,未经许可不得转载。

作者 卍追峰Pillar卐 发表于: SEO、技术相关研究及文章 | 标签:, , , , ,

无任何评论 »

这篇文章评论的rss feed 。 引用网址


回复

  • 鲜果阅读器订阅图标
  • 推荐搜索:

  • Powered by D.V.B. Theme: 追峰. Blog由D.V.B法律频道提供法律支持

    京ICP备09022625号