从Z-blog到WordPress的完美数据转换

纠结了很久,游魂坚守z-blog的心终于动摇了,于是投靠了WordPress,下面游魂就讲一下怎么样完美的从z-blog转换到WordPress。

一、数据导出导入

首先是把数据从z-blog中导出,游魂第一次用的是月光博客提供的那个MovableType插件,但是该插件导出的数据中Tag是连在一起的,就是如果你的文章有很多Tag的话,该插件会将这些Tag合并成一个,这就给后续带来了十分巨大的工作量,所以游魂找到了鸟儿童鞋对MovableType插件的修改版,这个修改版可以完美导出Tag(下载地址:Dbank)。导出后你就可以将数据导入到你新安装的WordPress中了,然后数据导入工作结束。

二、301转向

为什么要用301转向游魂就不再说明了,作用你懂的。

需要做转向的地址游魂分了六大类:文章,分类,标签,翻页,文章归档,其他页面。301转向数量少的可以用Redirections插件一条一条的写,但是多了就不好办了。

1.文章

游魂之前的博客删除了不少文章,于是ID不连续,并且游魂以前的日志地址是 https://www.youhun.org/分类别名/文章ID/ 的形式,基本上写通用型的301转向是不太可能了,单是400多篇文章也不能一条一条的去写规则啊,于是游魂想到了sitemap文件,这个文件记录的只有文章地址和日期等数据,并且刚好是按照时间顺排列的,将游魂博客的z-blog中的sitemap文件中的地址数据复制出来,然后用EmEditor这个文本编辑器用一些简单的正则表达式把时间等数据都去除掉,然后放进Excel表格中,然后再用同样的方法处理游魂博客的WordPress版的sitemap文件,于是一个前边是老地址,后边对应新地址的表格就做好了,然后将数据复制到文本文件中,你就会发现每一行的前边是老地址,后边是新地址,然后将数据批量替换成下边这种新式

Redirect 301 /impression/421/ https://www.youhun.org/404.html

这就是一条301转向规则了,用批量替换就能将400多篇文章都生产301规则,如下图所示

从z-blog到WordPress的完美数据转换

2.标签

当年游魂为了长尾流量,每篇文章就死命的使用大量长尾标签,于是400多篇文章,将近700的标签,于是就想给标签写一个通用的规则,可是z-blog的标签地址太诡异了,空格是” + “,地址还分大小写,而Linux主机是区分大小写的,并且WP会自动把空格转化成” – “,于是通用规则又泡汤了,但是一条一条的写也是不可能的,于是还是选择用文本编辑器批量修改。

在z-blog的tags页面把所有的Tag的地址都复制到文本中,至于怎么去掉其他的数据自己想办法,总之要保证一行一个。WP没有独立的Tag页面,所以我们用z-blog导出的数据就行了,但是需要改一下地址。z-blog中标签地址有如下三种:

1)带空格的,例如标签Adsense for Feeds的地址是 https://www.youhun.org/catalog.asp?tags=Adsense+for+Feeds

2)包含中文的,例如标签110米栏的地址是 https://www.youhun.org/catalog.asp?tags=110%e7%b1%b3%e6%a0%8f

3)纯数字或者英文的,例如标签123地址是 https://www.youhun.org/catalog.asp?tags=123

对于第一种需要先将“+”地换成“-”,然后再将 https://www.youhun.org/catalog.asp?tags= 替换成 https://www.youhun.org/tag/

对于后边两种直接将 https://www.youhun.org/catalog.asp?tags= 替换成 https://www.youhun.org/tag/

然后将z-blog所有标签和WP所有的标签用Excel表格做成前后对应的表格,然后再复制到文本中作为备用。

这时301规则就和前边文章的规则不太一样了,前边用到的是“Redirect 301”,但是这个规则对于动态页的转向似乎没用,于是游魂找到了Redirection插件,先将以上三个Tags填写到Redirection插件中,然后在Redirection插件–模块–WordPress–Apache中导出.htaccess,查看一下这个.htaccess,基本上就明白怎么做了

这时我们使用的是RewriteRule规则,于是一些符号都需要做转义处理了:

批量将 % 替换成 %25

批量将 + 替换成 %2B

批量将 ? 替换成 %3F

批量将 = 替换成 %3D

批量将 + 替换成 %2B

标签Adsense for Feeds的301规则:RewriteRule ^catalog\.asp%3Ftags%3DAdsense%2Bfor%2BFeeds$ https://www.youhun.org/tag/adsense-for-feeds [R=301,L]

标签123的301规则:RewriteRule ^catalog\.asp%3Ftags%3D123$ https://www.youhun.org/tag/123 [R=301,L]

标签ADSL快速换IP地址的301规则:RewriteRule ^catalog\.asp%3Ftags%3DADSL%25e5%25bf%25ab%25e9%2580%259f%25e6%258d%25a2ip%25e5%259c%25b0%25e5%259d%2580$ https://www.youhun.org/tag/adsl%25e5%25bf%25ab%25e9%2580%259f%25e6%258d%25a2ip%25e5%259c%25b0%25e5%259d%2580 [R=301,L]

批量写好这个之后,可以导入到Redirection插件中。

3、分类 翻页 文章归档

分类翻页文章归档都比较少,直接在Redirections插件中填上老地址和新地址,自己一条一条的写就行了

4、其他页面

游魂的z-blog除了上述页面之外,还有关于页面,留言页面,Tags页面,在WP的页面选项中新这些页面,然后在Redirection插件中填上新老地址,即可做301转向

其中关于和留言都简单,但是Tags页面需要自己添加一个模板,这样才能生成Tags页面,方法如下:

1)将所用模板目录下的page.php模板用ftp下载回来,然后改名为tags.php
2)将tags.php模板用编辑器打开,在头部添加如下代码

<?php
/*
Template Name: Tags
*/
?>

3)在tags.php模板中找到<?php the_content(); ?>,替换为下边三种形式的任意一种

<center><h2>统一字体大小</h2></center><?php wp_tag_cloud(‘smallest=1.2&largest=1.2&unit=em&number=0&orderby=count’); ?>

<center><h2>默认</h2></center><?php wp_tag_cloud(‘number=0&orderby=count’); ?>

<center><h2>随机</h2></center><?php wp_tag_cloud(‘number=0&order=rand’); ?>

4)上传tags.php模板,然后新建tags页面,内容为空,选择Tags模板即可

三、保持页面Title一致

当你改动页面标题的时候,百度会对你的网站有一定的权重降低,所以从z-blog转到WP的时候一定要保证大部分页面标题和原来一致,总的来说就是首页、分类页、文章页和Tag页。

但是如果你在使用z-blog的时候没有调用tag加入文章页的Title中,那么All in one seo之类的插件完全能满足你的需求,但是游魂在使用z-blog的时候,将tag加入了文章页的title中,于是游魂就犯难了,现有的插件都搞不定这个,当游魂准备放弃的时候,hzlzh童鞋出现了(目前使用模板的作者),于是游魂得救了,他说在页面之外调用Tag比较麻烦,但是能做,于是第二天游魂就拿到代码了,代码如下,游魂也没搞明白,只管用了

<title><?php
// Logic of printing the <title> tag
global $page, $paged;
echo trim(wp_title( ”, false, ‘right’ ));
global $post;

$post_tags = wp_get_post_tags($post->ID);
$numItems = count($post_tags);
$i = 0;
if (is_singular()){
//print_r($post_tags);
foreach ($post_tags as $post_tag) {
if($i == 0){
echo ‘-‘.$post_tag->name;
}
elseif ($i+1 == $numItems){
echo ‘,’.$post_tag->name;
}
else{
echo ‘,’.$post_tag->name;
}
$i++;
}

$post_cates = wp_get_post_categories($post->ID);
$cats = array();

foreach ($post_cates as $c) {
$cat = get_category( $c,false);
echo ‘-‘.$cat->name;
}
}
if ( !is_home() ) echo “-“;
bloginfo( ‘name’ );

// Paged format
if ( $paged >= 2 || $page >= 2 )
echo ‘ – ‘ . sprintf( __( ‘Page %s’, ‘dot-b’ ), max( $paged, $page ) );
?></title>

哪位童鞋在搜索 WordPress 文章页 title 调用Tag之类的关键词的话,应该有所帮助

总结

从z-blog转到wordpress不难,难的是不去做,遇到问题不去搜索,不要老想着自己能解决一些,是在不行就求助高手。

PS:坚守z-blog快4年了,终于没有挡住WordPress的诱惑。基本上所有从Z-blog到WordPress的数据转换的问题都解决了,以后就开始我的WordPress之旅了。

对左旋肉碱站群和近期百度的一点看法

  近期SEOer们讨论最多的应该就是那个神团制造的关于左旋肉碱的站群了,该神团在之前曾经用.com后缀的域名制作了一个左旋肉碱的站群,抢占了百度前边好几页的大多数位置,结果遭人妒忌,被人投诉给了百度,然后百度运用了他们惯用的杀手锏——人工干预,然而一周之后百度再次遭到该神团的蹂躏,在百度搜索“左旋肉碱”,百度前四页中有34个位置都是同一个产品的站,该站群还是出自上次虐待百度的那伙人,可见该团队威力确实不一般。然后昨天百度又使用了人工干预K掉了这个站群,并使用了百度的另一强大武器——百度推广!

  新闻播报完毕,下面来分析一下这个团队的站群是如何大批量的排在百度前边的,游魂认为只要保证两点:持续性原创更新和链轮。

  首先是持续性原创更新:游魂认为对于百度来说那些不太热门的关键词只需要持续的原创更新,就能做到很好的排名,而该站群就是利用了百度看重更新的原因,使用了一些站群软件(如芭奇站群)对这些网站进行批量的持续性原创更新。解释一下站群软件是如何运作的,不然大家也搞不明白为什么使用这些软件更新的文章百度会认为是原创的,至于如何采集游魂就不说了,只说说此类站群是如何更新的:将采集回来的文章进行同义词、反义词替换,然后在标题中插入一些关键词或者其他文字,调整一下文章顺序,基本上做完这些步骤,生成的文章连自然人都看不懂,何况百度这么白痴的搜索引擎呢?所以说百度认为这些文章是原创也情有可原。

  然后就要说说链轮了,仔细观察这次出现的站群中的友情链接会发现:他们使用的都不是互相链接,而是全部的单向链接,而这些单向链接构成了一个轮状结构,如下图

左旋肉碱的链轮模式

  单向链接在搜索引擎优化中能够较好的传递网站权重,而像上图这样的单向链接结构既传递给他站权重,又保证自身的权重得到提高,并且不是互相链接,这样既保证了权重的传递,又保证不被搜索引擎发现是站群,可见操作该站群的团队seo的功底。

  说完站群了,再来说说百度吧,这次的站群事件可谓令百度颜面再次扫地:首先可以看出百度的算法就是谁都能蹂躏的,可见其算法是垃圾,可谓是垃圾中的战斗机;其次我们可以看出百度人工干预的强大!要是第一次该神团站群出现后几天后被K,并且没有第二次出现的话,我们可以说百度修正了他的算法,而事实恰恰不是这样!第一次该团队站群被K之后一周,该神团使用.info后缀域名又蹂躏了百度一次,然后一周之后又被封杀,由此可以看出百度不是调整了算法,而是手工调整了排名,可见百度人工干预之强大!最后还可以看出来百度想钱想疯了:当他们第二次干掉左旋肉碱的站群之后,百度搜索“左旋肉碱”竟然出现了竞价排名,这么热门的关键词,百度一天又能赚到好多钱啊。

PS:百度的颜面貌似已经在地上好久了,今天又说百度坏话了,欢迎大家举报,欢迎百度拔毛,欢迎百度人工干预。

游魂分享第二季:41个百度外链有效的网址导航

  接着游魂分享第一季的步伐,今天分享的是41个百度外链有效的网址导航,为什么这么说呢,因为你如果登录这些网址导航,用“domain:www.youhun.org”在百度查外链的时候会显示出来,不知道这能不能给你的网站权重加分,但是既然百度有这个命令,那么就肯定有他的意义所在。

  这些导航都是游魂精心搜集的,百度收录最少的也有400多,而多的就有68800,可见这些网站的质量还算可以,游魂现在在搞一个医药招商的网站,这些导航都是从同关键词的竞争对手那里查到的,花了游魂大概一天的时间,虽说可能你认为没什么用,虽说很多都不知名,但是好歹也是个网址导航哎。

  这次的文件游魂懒得放在115了,直接上传了,表格里边有PR、Alexa排名,搜狗rank,百度、Google和Yahoo的收录和反向链接等数据,不过没有联系方式,游魂没空去验证那么多的联系方式到底正确不正确,所以就一个也没发。

  下载地址:42个外链有效的导航.rar  求分享。。。。。求传播啊,这是我在腾讯微博上发表的地址http://t.qq.com/p/t/13015033312628

  预告:这一季可能不能令大家都很满意,游魂分享第三季将分享女性、健康、养生类搞质量的网站,会注明帖子能否带链接、是否能发日志、论坛签名是锚文本还是文字等信息,让你能明确的知道所到网站你可以干什么

游魂分享第一季:43个高质量gov.cn论坛

  前文已经说到游魂最近找了个关于seo的工作,一直没空好好写点文章,今天工作完全没有思路了,所以就写写文章调整一下。游魂前期的工作就是收集外链资源,下面就把游魂收集到的43个高权重的gov.cn的论坛分享给大家。

  有些人觉得只要和gov.cn沾上边的东西都是高权重的,其实这是个很搞笑的想法,即使是gov.cn,它也仅仅是一个域名而已,域名权重再高、但是网站质量不行,这个网站的权重也不行。至于收集这类论坛的方法就很简单了,使用一下搜索引擎的高级搜索语法就行了,例如“inurl:gov.cn *论坛”。我用百度Google翻了前30页的论坛,然后一个一个的检查收录、快照、是否能注册等信息,然后删减出来了43个自己认为权重不错的论坛留了下来。

  下面说说我是怎么检查一个论坛的,首先看论坛昨天和今天有人发帖没有(有的话就继续查看,没有的话就扔掉),然后在站长帮手网里边查一下收录情况,顺带着看一下百度日收录、周收录、月收录,然后再去对比一下昨日发帖量和日收录量,再根据日收录量和周收录量的多少判断出是否有删除收录的,不行就对比日收录和月收录,基本上看完这些就去查看论坛是否能注册,能否发链接、能否带签名了,所以说使用我分享出来的东西可以为你省去很多时间的,你只需要注册发帖就行了。

  好了,废话结束,正题开始:文件在115网盘,地址是http://u.115.com/file/f1263a1573

PS1:游魂收集到的都是有人管理的,不是广告满天飞的那种,基本上都是高权重的我才留下来,所以说发广告需要很小心,不然你就会被删帖禁号的

PS2:哪位好心人若是觉得游魂的分享对你很有用,可否给游魂博客www.youhun.org)加个链接呢,这样游魂分享的动力就更充足了

在别人博客上评论的六大理由(转)

中国人好像不太习惯在别人博客上发表留言或评论,中国人更喜欢在论坛里灌 水,这个习惯也不能说是不好,只是~~小一觉得博客也是一个和别人交流的平台,没有留言评论,没有互动~~就失去了开博客的意义。友情链接不是摆设,这是 博客互动的接口,友情链接的重点在友情而不是链接。下面说一下在别人博客评论的六大理由:
 

1、增加流量
多一个链接多一个来路,也许你的评论很新奇、很有见解、很深刻,总之就是很吸引人,自然会有人回访你的博客,也许你就此多了个朋友也说不定!这点对新开的博客很重要,新开的博客没收录、没链接,流量基本来自评论的回访。

2、交朋友
如 果你想做个孤独的博客,可以略过这点,甚至可以略过这篇文章了,呵呵。博客是个交流的平台,我们做的是独立博客而不是孤独博客。留多在别人博客上留言评 论,但不要留一些如“哈哈”“你好”“来看看”“回踩”“沙发”之类毫无意义的话。小一看到这样的话真的不知道怎么回复(虽然大多数人留完言后就不再回来 看了,但小一还是坚持尽量回复每个人的留言)。

3、让你的博客火起来
怎样才算火呢?按照中国人的习惯,人多、热闹就是火,人多就是流量大,热闹就是留言评论多,你给别人留言评论的同时,别人也会给你留言评论,当然~~前提是你的留言评论要有价值,垃圾留言评论不会给人带来好印象哦!

4、评论=知识+思考+创作灵感
小一在这里一再强调,不要发垃圾留言,要仔细的看完博主的文章再留言,小一在别人的文章中学到了很多东西,小一在看别人文章的同时还会认真的思考,有时候就成了小一第二天文章的素材。

5、增加博客在搜索引擎中的权重
不少人为了SEO大量在比较火的博客上留言、抢沙发,最可恶的是广告留言,其实~~这种想法是错误的,因为现在的博客系统都在留言板上加了nofollow标签,你的Spam跟本不起作用。小一非常不理解那些制造Spam的人,特别是机器人Spam。

6、获得推荐
当你通过留言和博主熟了,博主在写文章时可能会提到你哦,也许还会加上你的链接呢,文章中出现的链接的SEO效果要远远大于友情链接。这才是SEO的正道,不要再发Spam了~~就算博主没装反Spam插件,不删你的Spam,也是没用的。

 

转载自小一博客 [ http://www.xiao321.com ]

原文链接地址: http://www.xiao321.com/post/78.html

PS:虽然小一说不希望看到“沙发”,等字样,不过小一的一楼从来都不缺“沙发”二字。最近抢到沙发最多的是锐风同学(http://iruif.cn/Blog/