正确配置WordPress的Robots.txt

使用WordPress的时候正确的配置Robots.txt是很重要的,因为一不小心不是不允许访问了,就是出现大量重复页面了,而网上很多人分享的关于WordPress的Robots.txt游魂认为都是错误的,都是想当然的以为自己的配置正确,就没有人花上10分钟去测试一下,看看是不是真的屏蔽了该屏蔽的,允许了必然需要允许的。

今天游魂在Google管理员工具中查Google抓取错误的时候发现“https://www.youhun.org/page/18”这个页面竟然出现在受Robots.txt限制这个选项里边,百思不得其解啊,游魂没有限制这个页面啊,难道是Robots.txt中的“Disallow: /page/1”这一行能匹配到“https://www.youhun.org/page/18”这个页面,于是游魂就再次去看了一下百度百科中关于Robots.txt的词条,不出所料,游魂的这个写法刚好能匹配到https://www.youhun.org/page/18”、“https://www.youhun.org/page/11”这类页面。

怎么办???继续查啊,游魂看到了$这个匹配行结束符,于是游魂就想到是不是自己的写法是错误的,正确的不让搜索引擎收录“https://www.youhun.org/page/1”页面的写法应该是:Disallow: /page/1$

于是游魂直接在google管理员工具里边测试了一下,游魂的想法完全正确,当使用“Disallow: /page/1$”的时候,https://www.youhun.org/page/18”这类页面就允许搜索引擎访问了,看来$这个匹配行结束符作用还挺大的,于是游魂就想到了网上很多人发布的WordPress的Robots.txt其实都是错误的,误人误己啊

正确的配置应该是:

User-agent: * 允许所有搜索引擎
Disallow: /wp-* 禁止访问以wp-开头的目录
Disallow: /*.php$ 禁止访问php页面
Disallow: /*.inc$ 禁止访问inc后缀文件
Disallow: /*.js$ 禁止访问脚本
Disallow: /*.css$ 禁止访问css文件
Disallow: /*?s= 禁止访问搜索结果
Disallow: /page/1$ 禁止访问第一页,因为这一页和你的首页是一样的
Disallow: /*/trackback 禁止访问trackback页
Disallow: /*/feed$ 禁止访问feed,为什么要用$,要是有个标签是以feed开头你就明白了
Disallow: /*comments 禁止访问回复,例如https://www.youhun.org/395.html#comments
Disallow: /*?replytocom=* 禁止访问带编号的回复,例如https://www.youhun.org/394.html?replytocom=3808#respond
Disallow: /search/* 禁止访问搜索,因为某些主题很奇怪,游魂遇见过
Sitemap: http://域名/sitemap.xml 让蜘蛛知道sitemap在哪

且不说您是否使用游魂的这套Robots.txt,只要你明白禁止访问第一页的写法“Disallow: /page/1”是不对的就行了,正确的写法应该是“Disallow: /page/1$

Google PR更新之游魂博客的PR又降了

  话说今天小飞龙提醒我Google更新了PR,然后游魂博客PR变成3了,杯具吧,从N年前的《PR更新了,我的竟然是6!》到《杯具之PR从6下降至5:浅析PR下降的原因》,再到今天的PR3,游魂可谓是一直在退步。

  最近一直在搞淘宝客,不过也是不死不活的,之前换了新鲜人的模板,不过没几天就视觉疲劳了,还是换回这个老主题吧,等1.9beta2更新了看看有什么好主题没有。

  今天删除了一推的链接,都是私自删除链接或是网站打不开的,出现误删的请联系我。

游魂博客终于有了Google Sitelink(全站链接)

  游魂博客从08年一月到现在已经三年半了,去年达到了PR6,后来又降成5,这个月终于得到了Google的肯定,Google给游魂博客也生成了Google Sitelink。

什么是Sitelink(全站链接)?

对一些权重比较高的网站,当用户用谷歌搜索一个关键词,认为这个网站的结果是最权威的来源,谷歌会返回正常列表外,还会多显示四行两列 共八个内链结构,称之为全站链接(sitelink)。

sitelink意义:

Sitelink是谷歌对网站主的一种肯定,也是Google排名的最高境界了。这会为你的网站多几倍的访问入口,视觉上醒目大大提高的网站访问量。出处:百度百科

为什么每年的愚人节都这么搞笑

  快一个月没有写博客了,今天是愚人节,中午休息一会,写写今天的搞笑事件。

早上一大早起来去图书馆,在门口等着无聊,于是就开始发短信骗人玩:

事件一:

我发给A:我在你们单位(博物院)门口呢,今天没事干,你带我进去溜达溜达呗。

A回复:现在不开门啊。

我:不是八点就开门么?

A回复:九点啊

我:那你去上班不?

A回复:去啊,等车呢

我:那我等你啊,那附近哪有卖早点的啊。

A回复:个小胡同,就是***,我马上就到,见面给你说啊。

发现已经上当受骗,于是我就说愚人节快乐了,不然她在那门口等我就搞笑了,我以后就吃不了兜着走了。。。。。。

事件二:

我给B发信息:火车站到你们学校坐几路车啊,找你玩吧,我刚到洛阳,上午没事,下午面试呢。

B回复:我在家呢,刚起来(杯具了,她竟然回郑州了)。面试还得跑洛阳啊,去几天?

一句话就骗住了,太无聊了,于是直接回复:某节日快乐

B回复:我记得去年就是你用这个方法骗了我一次。。。。。

我:记性这么好啊

B回复:下次你要是再说来洛阳了,我就不管你。。。

杯具啊。。。。。


我本来想给那些关系不错的女生都发个”我爱你“呢,但是想想去年我一哥们的杯具,还是算了,去年他就发了,然后某俩女生在一起呢,于是这个哥们的人品就遭受大家的怀疑了。。。

再说说今天Google的给力事件,今天竟然出了个穿越搜索,给力程度和去年的人肉搜索有一拼。

z-blog本来要在3.29发布1.9呢,谁知道前几天Washun传出消息称z-blog作者zx.asd大神被扫黄的逮起来了(杯具啊),谁知道这竟然是个骗局,今天z-blog发布了z-blog1.9 beta1,千万别去下载那个公测版,那个是愚人节的笑话,z-blog1.9 beta1这个才是最新版的。

好了,不知道我今天发出去的短信还能骗住几个,其实今天才是表白的最佳时机,对方的态度不怎么样的话,就说是愚人节的玩笑,要是对方有所表示,那就成功一半了,不过就怕对方也给你开个玩笑。。。。。

 

说说游魂博客在百度和Google上的不同待遇

  最近越来越觉得百度看我不顺眼了,而Google还是对我那么的照顾,所以今天就来说说游魂博客在百度和Google上的不同待遇。

  先说百度吧,以前百度挺照顾游魂的,每天有1500到2500的IP都是从百度来的,可是现在百度对游魂博客的态度就是爱理不理的,对于在根目录的主博客,一般情况下就是下午4点到5点发布的文章很快就被百度收录了,其他时间的话就看百度的心情了,可是对于我放在Godaddy目录下的关于Godaddy优惠码的子博客,百度个间歇性神经病确实10分钟之内就会收录,不管几点发布,一会功夫就会出现再百度的数据库里边,可见这是个神经病!再来说说Google对我博客的照顾吧,不管是主博客,还是子博客,基本上就是发布文章过后没多久,Google的蜘蛛就屁颠屁颠的跑过来,然后将文章收录进它的数据库中,并且还能给很好的排名。

  收录问题说完了,再来对比一下新站在游魂博客的链接对于百度和Google的影响,先是万恶的百度,想通过在游魂博客放链接,然后被百度收录新站,我可以很明确的告诉你,此路不通!这说明一个问题,游魂博客的导出链接在百度的权重是相当低的,这可能就是以前卖链接过度的后遗症了,可是这也说不通啊,在Google看来游魂博客的外链就是权威了,只要再游魂博客上放上一个新站的链接,最快是10分钟就能被收录,最慢也就是半天,可见Google多看得起游魂的博客了。

  问题总结完毕,下面就来分析一下产生问题的原因,仔细观察游魂的博客,你会发现更新很没有规律,虽然我一直在说想要有好排名,就要持续的、有规律的更新,但是游魂仅仅是会说,但是却做不到,而游魂用工具采集的一个新站,每天早上用工具发布几十篇伪原创文章,百度却是能天天有新的收录和最新快照,然后还能给个不错的排名。对于这个新站,Google却是不理不睬的,因为这个站的文章都是伪原创的,并且没有给这个站做过什么外链。

  由此游魂可得:百度看重的是更新,它不管你的文章是原创,还是伪原创,或是完全复制,只要你能保证持续性、规律性的更新,排名不是问题!而Google更看重文章的原创性和外链的质量、多少。这仅仅游魂通过一两个站的结论,偏颇是必然的,以后站多了就分析出更全面的给大家。

Google PR在该更新那天就更新了!

  最近大家一直在讨论Google的PR更新问题,小道消息先是说PR要在6月底更新,于是大家傻傻的等到了7月1号,咦?PR没有更新啊!于是小道消息又说了:“当时的预测应该是6月底或是7月初,现在6月底没更新,一定是7月初了。”现在是7月11号了,PR还是没有更新,于是小道消息失踪了。

  这两天关于PR的讨论声慢慢的小了,为什么?因为大家都知道PR最近应该是不更新了。关于如何提升Google PR问题,游魂总结了几条建议吧,希望对大家有帮助。

  不要把时间浪费在询问PR什么时候更新、Google的PR是怎么计算之类的问题上,或是在讨论谁谁的PR多么高,某某的PR怎么了,我自己的怎么还是0之类的话题上,有这种时间,为什么不利用起来去找找可以带签名的论坛然后注册灌水?或是看看别人的友情链接,然后试试自己是不是也能申请?总之就是不要浪费时间在那些对你增加外链无用的事情上,制造点高质量的外链才是正事。

  定期更新,但是这个更新可不是让你每天用几次Ctrl+C和Ctrl+V这样的复制加粘贴形式的更新,这样的更新只会让搜索引擎离你越来远远。博客嘛,每天写写,随意的写就行,不能保证天天更新,也要保证每周2-3篇吧。最后提醒一下喜欢复制别人东西的朋友们,喜欢转载别人的东西不是错,错的是你不该不添加出处啊,其实导出链接对你的影响大不到哪去的,不要给别人的文章伪原创一下变成自己的,想转载的话可以在开头和结尾加上自己的评论不就行了,为了一篇文章搞臭自己的名声,至于不?

  说一些在论坛发外链的小技巧吧,找一些签名可以带链接的论坛去注册,发帖的签名绝对是比回帖的签名的权重高,但是你也不可能经常发帖啊,回帖的数量才是主要的,但是回帖也要有技巧,回复超过5个都有签名的就别回了,我现在在A5论坛,看到回复超过5个的帖子我连打开都不打开了,因为在那里回复基本上都有签名。

  今天游魂就唠叨道这里了,说的也不一定好,只是游魂的一些想法和做法,最后一句结束全文:Google PR在该更新那天就更新了,只要你做好准备工作,你的PR也可以在更新的时候有所改观的。

谈谈游魂这50天来使用HTC Magic G2手机的几点感受

  掰着指头算算,到今天为止游魂的HTC Magic(G2)手机已经入手50天了,觉得该手机基本上除了很费电和无关机闹钟以外没别的缺点了,下面游魂就来说说这50天以来游魂使用G2的几点感受吧。

  1、不难上手

  很多人都认为智能机不容易上手,拿到新手机需要好久才能琢磨明白,但是游魂认为G2确实很容易上手,准确的说应该是Android系统很容易上手,所有的东西都好像是摆在你面前一样,没有像塞班的系统那样的一个目录套另一个目录的,记得有一次给我同学的N73调东西,光是找在哪里设置就找了我半天,而后仅仅用了5秒钟就设置好了。

  2、永不丢失的电话本

  当你的手机丢了的时候,其实有时候你也不是在意那几个钱而心疼,你伤心的是你丢了手机上所有的联系人!而G2所使用的Android系统能直接绑定你的Google账户,然后将你的联系人都同步在Gmail账号里边,即使你的手机失踪了,你的联系人也不会失踪!

  3、应用程序不算多

  比起来iPhone和Windows Mobile的应用程序数量来说,Android的应用程序数量确实不算多,但是也稳步上升,毕竟Android系统出道比较晚,少一点也没什么大不了的,不过游魂日常需要程序的都有。所以没必要追求数量,质量才是关键!

  4、刷机简单

  不安分的人们肯定不满意手机原版的系统,但是刷机时有一定的风险的,说不定不小心你的手机就变砖了,而大多数人不敢刷机的原因是别人写的教程太复杂了,其实复杂不怨教程,因为老一点的机器刷机就是个复杂的事情。而自从游魂看了一遍教程就成功的给我的HTC Magic刷成了1.6的系统来看,Android系统刷机其实挺简单的。

  5、HTC Magic很费电

  应该说是相当费电,比起来之前游魂使用的非智能手机来说,新入手的这台HTC Magic的费电程度简直不敢想象,基本上是一天一块电池,但是费电也有费电的原因,从开学到现在为止,只要是上课时间,游魂的手机都没有空闲过!基本上每天4大节课,每节课都有哥们要求玩我的手机,基本上只玩其中的两个游戏:Teeter和碧湖垂钓,要不然就是开Google地图玩,结果就是游魂的电池就好像是块垃圾电池,每天用完一块,而Google地图不仅要开GPS,还要开GPRS,这两个都是很费电的功能。看完这些其实也不觉得费电了,要是不开上网和卫星定位,还有不玩游戏,G2的待机时间也挺长的。

  6、无关机闹钟

  这个就没办法了,现在的刷机包也解决不了的问题,游魂现在需要按时起床有三种方法:老爸叫我起床、使用以前的那个手机当闹钟(游魂的旧手机可以关机闹钟),或是晚上睡觉不关G2!(游魂喜欢睡觉的时候关手机)

  好了,以上六条是游魂这50天来使用HTC Magic的感受,至于其他的感受,等游魂感悟出来以后会陆续分享给大家的。

谷歌将删除PageRank(貌似假新闻)

    今天在网上溜达的时候发现有人的博客上提到谷歌将删除Google工具栏中的PageRank部分,Google推出的实验室版网站管理员工具的同时,悄然撤下了爬虫统计中的PageRank部分

    今天Google的相关工作人员也证实了这一说法,一下是原文:

 We’ve been telling people for a long time that they shouldn’t focus on PageRank so much; 

many site owners seem to think it’s the most important metric for them to track, which is simply not true. 

We removed it because we felt it was silly to tell people not to think about it, but then to show them the data,

 implying that they should look at it. :-   

能看懂英语的自己看,看不懂的去translate.google.cn翻译一下就行了,不管看懂看不懂,反正你知道一件事就行了,就是PR将消失了。