正确配置WordPress的Robots.txt

使用WordPress的时候正确的配置Robots.txt是很重要的,因为一不小心不是不允许访问了,就是出现大量重复页面了,而网上很多人分享的关于WordPress的Robots.txt游魂认为都是错误的,都是想当然的以为自己的配置正确,就没有人花上10分钟去测试一下,看看是不是真的屏蔽了该屏蔽的,允许了必然需要允许的。

今天游魂在Google管理员工具中查Google抓取错误的时候发现“https://www.youhun.org/page/18”这个页面竟然出现在受Robots.txt限制这个选项里边,百思不得其解啊,游魂没有限制这个页面啊,难道是Robots.txt中的“Disallow: /page/1”这一行能匹配到“https://www.youhun.org/page/18”这个页面,于是游魂就再次去看了一下百度百科中关于Robots.txt的词条,不出所料,游魂的这个写法刚好能匹配到https://www.youhun.org/page/18”、“https://www.youhun.org/page/11”这类页面。

怎么办???继续查啊,游魂看到了$这个匹配行结束符,于是游魂就想到是不是自己的写法是错误的,正确的不让搜索引擎收录“https://www.youhun.org/page/1”页面的写法应该是:Disallow: /page/1$

于是游魂直接在google管理员工具里边测试了一下,游魂的想法完全正确,当使用“Disallow: /page/1$”的时候,https://www.youhun.org/page/18”这类页面就允许搜索引擎访问了,看来$这个匹配行结束符作用还挺大的,于是游魂就想到了网上很多人发布的WordPress的Robots.txt其实都是错误的,误人误己啊

正确的配置应该是:

User-agent: * 允许所有搜索引擎
Disallow: /wp-* 禁止访问以wp-开头的目录
Disallow: /*.php$ 禁止访问php页面
Disallow: /*.inc$ 禁止访问inc后缀文件
Disallow: /*.js$ 禁止访问脚本
Disallow: /*.css$ 禁止访问css文件
Disallow: /*?s= 禁止访问搜索结果
Disallow: /page/1$ 禁止访问第一页,因为这一页和你的首页是一样的
Disallow: /*/trackback 禁止访问trackback页
Disallow: /*/feed$ 禁止访问feed,为什么要用$,要是有个标签是以feed开头你就明白了
Disallow: /*comments 禁止访问回复,例如https://www.youhun.org/395.html#comments
Disallow: /*?replytocom=* 禁止访问带编号的回复,例如https://www.youhun.org/394.html?replytocom=3808#respond
Disallow: /search/* 禁止访问搜索,因为某些主题很奇怪,游魂遇见过
Sitemap: http://域名/sitemap.xml 让蜘蛛知道sitemap在哪

且不说您是否使用游魂的这套Robots.txt,只要你明白禁止访问第一页的写法“Disallow: /page/1”是不对的就行了,正确的写法应该是“Disallow: /page/1$

从Z-blog到WordPress的完美数据转换

纠结了很久,游魂坚守z-blog的心终于动摇了,于是投靠了WordPress,下面游魂就讲一下怎么样完美的从z-blog转换到WordPress。

一、数据导出导入

首先是把数据从z-blog中导出,游魂第一次用的是月光博客提供的那个MovableType插件,但是该插件导出的数据中Tag是连在一起的,就是如果你的文章有很多Tag的话,该插件会将这些Tag合并成一个,这就给后续带来了十分巨大的工作量,所以游魂找到了鸟儿童鞋对MovableType插件的修改版,这个修改版可以完美导出Tag(下载地址:Dbank)。导出后你就可以将数据导入到你新安装的WordPress中了,然后数据导入工作结束。

二、301转向

为什么要用301转向游魂就不再说明了,作用你懂的。

需要做转向的地址游魂分了六大类:文章,分类,标签,翻页,文章归档,其他页面。301转向数量少的可以用Redirections插件一条一条的写,但是多了就不好办了。

1.文章

游魂之前的博客删除了不少文章,于是ID不连续,并且游魂以前的日志地址是 https://www.youhun.org/分类别名/文章ID/ 的形式,基本上写通用型的301转向是不太可能了,单是400多篇文章也不能一条一条的去写规则啊,于是游魂想到了sitemap文件,这个文件记录的只有文章地址和日期等数据,并且刚好是按照时间顺排列的,将游魂博客的z-blog中的sitemap文件中的地址数据复制出来,然后用EmEditor这个文本编辑器用一些简单的正则表达式把时间等数据都去除掉,然后放进Excel表格中,然后再用同样的方法处理游魂博客的WordPress版的sitemap文件,于是一个前边是老地址,后边对应新地址的表格就做好了,然后将数据复制到文本文件中,你就会发现每一行的前边是老地址,后边是新地址,然后将数据批量替换成下边这种新式

Redirect 301 /impression/421/ https://www.youhun.org/404.html

这就是一条301转向规则了,用批量替换就能将400多篇文章都生产301规则,如下图所示

从z-blog到WordPress的完美数据转换

2.标签

当年游魂为了长尾流量,每篇文章就死命的使用大量长尾标签,于是400多篇文章,将近700的标签,于是就想给标签写一个通用的规则,可是z-blog的标签地址太诡异了,空格是” + “,地址还分大小写,而Linux主机是区分大小写的,并且WP会自动把空格转化成” – “,于是通用规则又泡汤了,但是一条一条的写也是不可能的,于是还是选择用文本编辑器批量修改。

在z-blog的tags页面把所有的Tag的地址都复制到文本中,至于怎么去掉其他的数据自己想办法,总之要保证一行一个。WP没有独立的Tag页面,所以我们用z-blog导出的数据就行了,但是需要改一下地址。z-blog中标签地址有如下三种:

1)带空格的,例如标签Adsense for Feeds的地址是 https://www.youhun.org/catalog.asp?tags=Adsense+for+Feeds

2)包含中文的,例如标签110米栏的地址是 https://www.youhun.org/catalog.asp?tags=110%e7%b1%b3%e6%a0%8f

3)纯数字或者英文的,例如标签123地址是 https://www.youhun.org/catalog.asp?tags=123

对于第一种需要先将“+”地换成“-”,然后再将 https://www.youhun.org/catalog.asp?tags= 替换成 https://www.youhun.org/tag/

对于后边两种直接将 https://www.youhun.org/catalog.asp?tags= 替换成 https://www.youhun.org/tag/

然后将z-blog所有标签和WP所有的标签用Excel表格做成前后对应的表格,然后再复制到文本中作为备用。

这时301规则就和前边文章的规则不太一样了,前边用到的是“Redirect 301”,但是这个规则对于动态页的转向似乎没用,于是游魂找到了Redirection插件,先将以上三个Tags填写到Redirection插件中,然后在Redirection插件–模块–WordPress–Apache中导出.htaccess,查看一下这个.htaccess,基本上就明白怎么做了

这时我们使用的是RewriteRule规则,于是一些符号都需要做转义处理了:

批量将 % 替换成 %25

批量将 + 替换成 %2B

批量将 ? 替换成 %3F

批量将 = 替换成 %3D

批量将 + 替换成 %2B

标签Adsense for Feeds的301规则:RewriteRule ^catalog\.asp%3Ftags%3DAdsense%2Bfor%2BFeeds$ https://www.youhun.org/tag/adsense-for-feeds [R=301,L]

标签123的301规则:RewriteRule ^catalog\.asp%3Ftags%3D123$ https://www.youhun.org/tag/123 [R=301,L]

标签ADSL快速换IP地址的301规则:RewriteRule ^catalog\.asp%3Ftags%3DADSL%25e5%25bf%25ab%25e9%2580%259f%25e6%258d%25a2ip%25e5%259c%25b0%25e5%259d%2580$ https://www.youhun.org/tag/adsl%25e5%25bf%25ab%25e9%2580%259f%25e6%258d%25a2ip%25e5%259c%25b0%25e5%259d%2580 [R=301,L]

批量写好这个之后,可以导入到Redirection插件中。

3、分类 翻页 文章归档

分类翻页文章归档都比较少,直接在Redirections插件中填上老地址和新地址,自己一条一条的写就行了

4、其他页面

游魂的z-blog除了上述页面之外,还有关于页面,留言页面,Tags页面,在WP的页面选项中新这些页面,然后在Redirection插件中填上新老地址,即可做301转向

其中关于和留言都简单,但是Tags页面需要自己添加一个模板,这样才能生成Tags页面,方法如下:

1)将所用模板目录下的page.php模板用ftp下载回来,然后改名为tags.php
2)将tags.php模板用编辑器打开,在头部添加如下代码

<?php
/*
Template Name: Tags
*/
?>

3)在tags.php模板中找到<?php the_content(); ?>,替换为下边三种形式的任意一种

<center><h2>统一字体大小</h2></center><?php wp_tag_cloud(‘smallest=1.2&largest=1.2&unit=em&number=0&orderby=count’); ?>

<center><h2>默认</h2></center><?php wp_tag_cloud(‘number=0&orderby=count’); ?>

<center><h2>随机</h2></center><?php wp_tag_cloud(‘number=0&order=rand’); ?>

4)上传tags.php模板,然后新建tags页面,内容为空,选择Tags模板即可

三、保持页面Title一致

当你改动页面标题的时候,百度会对你的网站有一定的权重降低,所以从z-blog转到WP的时候一定要保证大部分页面标题和原来一致,总的来说就是首页、分类页、文章页和Tag页。

但是如果你在使用z-blog的时候没有调用tag加入文章页的Title中,那么All in one seo之类的插件完全能满足你的需求,但是游魂在使用z-blog的时候,将tag加入了文章页的title中,于是游魂就犯难了,现有的插件都搞不定这个,当游魂准备放弃的时候,hzlzh童鞋出现了(目前使用模板的作者),于是游魂得救了,他说在页面之外调用Tag比较麻烦,但是能做,于是第二天游魂就拿到代码了,代码如下,游魂也没搞明白,只管用了

<title><?php
// Logic of printing the <title> tag
global $page, $paged;
echo trim(wp_title( ”, false, ‘right’ ));
global $post;

$post_tags = wp_get_post_tags($post->ID);
$numItems = count($post_tags);
$i = 0;
if (is_singular()){
//print_r($post_tags);
foreach ($post_tags as $post_tag) {
if($i == 0){
echo ‘-‘.$post_tag->name;
}
elseif ($i+1 == $numItems){
echo ‘,’.$post_tag->name;
}
else{
echo ‘,’.$post_tag->name;
}
$i++;
}

$post_cates = wp_get_post_categories($post->ID);
$cats = array();

foreach ($post_cates as $c) {
$cat = get_category( $c,false);
echo ‘-‘.$cat->name;
}
}
if ( !is_home() ) echo “-“;
bloginfo( ‘name’ );

// Paged format
if ( $paged >= 2 || $page >= 2 )
echo ‘ – ‘ . sprintf( __( ‘Page %s’, ‘dot-b’ ), max( $paged, $page ) );
?></title>

哪位童鞋在搜索 WordPress 文章页 title 调用Tag之类的关键词的话,应该有所帮助

总结

从z-blog转到wordpress不难,难的是不去做,遇到问题不去搜索,不要老想着自己能解决一些,是在不行就求助高手。

PS:坚守z-blog快4年了,终于没有挡住WordPress的诱惑。基本上所有从Z-blog到WordPress的数据转换的问题都解决了,以后就开始我的WordPress之旅了。

从Z-blog到WordPress,正在做最后的扫尾工作

上篇文章是在z-blog里边写的,没转移过来,不要它了,游魂正在为转换到WP做最后的一些扫尾工作,已经给域名解析过来了,在游魂的一个美国VPS上,速度不是太快,但是基本上不太抽风。

好了,先写到这里,游魂继续干活,等所有的工作都结束了,游魂会写一篇从z-blog完美转换到wordpress的心得,给那些想要投靠WP的人们作为指引

5个懒人必备的WordPress插件

写在之前的话:最近在整小故事网,所以博客就没咋更新,最近把小故事网整个删除了,以前用那个程序是PHP168,完全不给力的程序,竟然没有标签啊,所以数据转换到了dedecms,结果转换出问题了,一怒之下直接删除所有东西,换WordPress玩,于是就有了下文。

正文开动:

游魂最近开始玩WordPress,可是游魂对这个无比强大的博客程序确实是相当不了解,可以说是完全不懂,但是这又是个无限DIY的博客程序,想要各种无敌的功能,用插件吧!!!!无比强大的WP插件能够给WP武装出各种功能,并且很多插件就是专门为懒人准备的,今天游魂就分享5个懒人必备的插件。

一、All in One SEO

这个绝对是懒人和不懂WP代码之人必备的,至于WP达人,相信早就扔掉这个可有可无,并且费资源的插件了,不过对于一些像游魂这样的WP小白来说,用All in One SEO改改标题、描述、关键词,再设置一下什么noindex什么的确实很简单。

二、超级开关 (Super Switch)

这个插件更是小白们和ID控们的福音啊,不改代码,直接一键关掉保存修订版本、Browse Happy、自动保存之类的东东,以前月光博客介绍过怎么关闭自动保存的,但是只要用自动升级WP,你修改的就白费了,并且貌似月光博客的方法对最新版WP无效啊,所以说超级开关插件确实给力。

三、Easy AdSense

有流量了总想着放点Google AdSense赚点钱花花吧,可是习惯了z-blog模板之后发现WP的模板不懂的话确实不敢动啊,加个广告都难死人了,并且游魂这次直接用了最新版的WP,那个模板很诡异(其实是我很小白),搞了半天都没弄明白,最后直接插件搞定了

一般情况下文章页的内容融合的广告有比较高的点击率,Easy AdSense可以控制广告出现在文章开始、中间、末尾,中间这个位置比较给力,游魂用小故事网测试了一下,对于比较长的文章,广告会出现在中间某一段,这个确实和内容融合的比较好啊,要是文章比较长的话建议放一个文章开头的广告和一个中间的广告,这样欺骗性比较大。(游魂现在都没搞明白中间这个位置出现广告怎么在z-blog中实现)

四、Widget Logic

貌似WP最新版的那个默认主题很诡异,网上很多改代码的方法控制友情链接的对它都无效啊,不是找不到人家说的代码,就是直接出错,还是用插件吧。。。。

于是就找到了Widget Logic,开启Widget Logic后,在小工具里边就出现了一个文本框,这个文本框里边的代码就是控制该小工具出现位置的,比如游魂想要友情链接只出现在首页,只用在文本框里边输入is_home()就行了

Widget Logic常用的标记
is_home() 首页
is_single() 文章页
is_page() 页面
is_category() 文章分类页
is_tag() 文章标签页
is_archive() 归档页
is_404() 404页
is_search() 搜索结果页
is_feed() 订阅页

五、WP-PageNavi分页导航

这个就不在过多介绍了吧,WP默认的分页导航太不给力了,只有前一页和后一页,完全不给力啊,WP-PageNavi直接输出了1、2、3、4、5这样的分页(这样的叙述直接吧??颇有游魂的小白风格),如下图啊,其实这个改代码也能实现的,但是咱不是懒人嘛,能不改代码就不改代码

取消WordPress 3.2自动保存的方法

今天发现有个域名(youhun.org)一直闲置,于是就想着装个WordPress玩玩,前几天WP就更新到3.2了,没想到今天一看是3.2.1了,WP有个无敌巨烦人的功能,就是自动保存,并且该功能会将你的ID弄的非常混乱,对于某些有ID洁癖的人来说无疑是噩梦,可是升级到3.2.1后游魂发现以前月光博客介绍的关闭WordPress自动保存的方法也不管用了,不过游魂找到了别的关闭WordPress自动保存的方法,并且不怕版本升级,可谓是一劳永逸啊。

首先还是改代码的方法,直接给自动保存时间改的大一点,将以下代码加入到wp-config.php中,

define(‘AUTOSAVE_INTERVAL’, 36000);

define(‘WP_POST_REVISIONS’, false);

不过该方法不够彻底,还是用插件搞定吧,游魂推荐的就是【超级开关】,在安装新插件中搜索super switch,安装后启用,然后在【设置】里边就能找到了,该插件可以对很多选项进行控制的,如下图所示

 

英文建站之新博上线!

  半个月前就注册了www.iblog2008.com这个域名,然后就开始了游魂的英文博客之旅,为什么今天游魂才放出来给大家看呢,是因为游魂一直在寻找一款不错的主题,今天游魂终于在一个国外的站上找到一款不错的主题,并且解决掉了一点该主题的毛病,所以说今天游魂的英文博客正式上线。博客名:Ghost’s blog,地址:www.iblog2008.com。

  很早就想注册一下和我这个cn域名一样的com域名了,但是一直不知道写什么,就没有注册,后来受一哥们的启发,决定用它建造一个英文的博客,于是游魂的英文博客就诞生了!

  先说说这个博客大概会写什么吧。目前我做的关键词是:Godaddy Coupon,Make Money Online,Android Cellphone,不过主要就是前两个Godaddy Coupon和Make Money Online,后一个是写着玩呢,但是我发这俩关键词还是比较激烈的,Godaddy Coupon这个应该有信心做上去,至于Make Money Online就不太好办了,而Make Money Online同义词基本上就是Earn Money Online了,这个的竞争貌似不是太激烈,所以我觉得可以改一下,不过要等一段时间再说,毕竟先尝试一下,撞一下墙才会知道自己有几斤几两。

  关于英文站的建站我没有什么太多的经验,SEO方面我觉得和中文的差不多,主要是要搞明白外国人都用什么搜索引擎,然后有针对性的稍微优化一下就OK了,反正外国人不用百度,基本上注意一下Google就行了。

  内容方面除了高质量的原创以外,我觉得只要搞好英文俚语和习惯用法这两方面就基本OK了(从本质上说这是一方面!),比如说同样是Godaddy优惠码这个词,我可以写Godaddy Promo Code或是Godaddy Coupon,但是我在Google趋势上发现后者的搜索量明显超出前者很多,还有一个例子就是很早在网上看到的关于低价酒店(或是低价旅馆)的这个词,按照国人的理解是Cheap Hotel,但是实际上应该是Economy Hotel!因为cheap除了便宜以外还带有一点贬义,就是有廉价、不好的意思,所以外国人搜索Economy Hotel要比Cheap Hotel多。

  好了,今天的凑数的文章就结束了,关于英文建站的东西游魂会慢慢尝试,然后分享给大家的。

游魂免费给广大博主提供PHP+MYSQL空间(已结束)

    前些天游魂又给自己的Godaddy空间续费了,可是游魂也没有那么多的站,150G的空间根本用不完,所以现在就分享给大家了,共10个名额,下面说一下要求:

    首先,也是最重要的,流量太大了别来找我,Godaddy的Deluxe Hosting的负载能力有限!游魂在这里只给那些新人或是博客要出国,却还没有找到合适空间的朋友们的博客暂住,而不是长期居住!使用空间过程中不解答任何技术问题!!

    1、只能放博客,只要不是博客就免谈!

 2、必须是顶级域名,用二级域名的就算了,免费域名也别来啊,游魂觉得免费的都不靠谱!(不过游魂的空间肯定靠谱)

    3、不能有关于政治、色*情、博*彩以及任何违法性质的任何信息和链接,不能用该空间进行任何违法活动。

    4、要求原创度高的,不要是什么采集的、或是纯转载的都来凑热闹,拿博客程序做垃圾站的靠边站!

好了要求说完了,现在说说空间的配置:

用的是GodaddyDeluxe Hosting主机,Linux的系统,共享IP,PHP的版本是5.X,MYSQL为4.1或5.0(可选),zend版本是3.3,测试速度请访问:www.asd365.com

每人一个FTP账号,一个MYSQL账号个人空间理论上大小不限制(但是不要存放大量的图片和压缩包或是其他的块头大的资源,防止被迅雷等下载器搜索到,浪费自己的主机资源)

附加协议:

1、60天不更新的博客游魂将去除绑定域名,并告知博主

2、任何违反上边第二条、第三条的都将直接停止供应空间(数据你可以拿回去)

有需要的请先联系游魂,QQ:380855216(著名需要空间),邮件:youhun.org#gmail.com,对于在下边留言的游魂一概不管!

游魂将会把所有使用游魂的主机的的博客都列出来,方便大家交流

博客列表:

1、英语学习者之家:www.stuus.com

2、我的风险投资:www.myhyip.tk

3、软件分享者:www.softsharer.com

貌似WordPress和我相克!

    一直说给我哥们装个博客,昨晚帮他装了个WordPress,可是貌似WordPress和我相克,从安装开始就一直出问题,还好最后问题都解决了,下面说说我在昨晚使用WordPress时候遇到的问题

首先是安装的时候,安装页面上边显示 Warning: Cannot modify header information – headers already sent by ….问题是关于wp-config.php页面的,整个程序我只改过wp-config.php,所以我想可能是我用记事本编辑过wp-config.php造成的,我百度了好久才找到答案,解决方法如下:

  删除wp-config.php重新解压WordPress包获得wp-config-simple.php文件,将其改名为wp-config.php然后用Dreamweaver 编辑(不要用记事本)保存,然后就OK了

好了,第一个问题解决,可第二个问题接踵而至!看来WordPress还真的和我相克了,在更改固定连接的时候又出问题了,无论我怎么改,当我去访问文章页面的时候都是404错误,我记得以前在本地装WordPress的时候都是在后台一改就什么都OK了,难道是.htaccess的问题,我问SunQ用WordPress写过.htaccess没有,答案是没有,我晕,看来还是搜索一下吧,终于在一角落里边发现一问题和我的比较像,于是我就试了试,没想到我还试对了

下面是我的更改固定连接出现404解决办法

将空的.htaccess文件传到WordPress的根目录,然后用ftp将其属性改为666,然后在后台设定自己喜欢的固定连接类型,然后就OK了

要是你没有现成的.htaccess文件的话我可以提供一个,使用之前先将里边的东西清空再说上传,不然出问题可别找我

下载地址:htaccess.rar