本网站http://jijian91.com是7月2日正式架起来的。一周以来,陆续有各搜索引擎的蜘蛛到访。下面对目前为止的情况作一总结:
最早到达的是Technorati,7月2日当天就来了。访问的频度很高,一天要来数次。每次都是先访问/、/feed、/feed/rss、/feed/atom。一旦发现更新,立即抓走。
几乎同时来的是Google。也是每天来数次,但每次只抓走很少的几页,没看出抓取的标准是什么。Google还经常性地来取/sitemap.xml和/feed,但似乎很健忘,并不按最新的sitemap抓取。我在最初的几天曾经几次调整过永久链接的格式,最后一次是在7月6日左右。但Google至今(7月10日)仍大量访问那些已失效的链接。而且新旧链接间隔着抓取。在Google网站上site:jijian91看到的也大多是过时链接。今天,首次出现了抓取图片的Mediapartners-Google蜘蛛。
最奇怪的是Yahoo. Yahoo蜘蛛在2-3天后就来了,但只是访问/一下就走。以后,每天来几次,或访问/,或访问某一页。但至今,在Yahoo网站上仍然查不到。
baidu的蜘蛛是大约一周后来的。之后,每天来访问一下/,并不抓取内容。 直到今天,突然开始抓取,一次就抓了300页。从抓取的顺序来看,似乎和以前的访问没有关系,是顺着百度空间的一个链接过来的。现在在百度网站,用site:jijian91.com已经查到抓取的网页。
继续…
原文永久链接:https://jijian91.com/blog20070710/search-spider.html
今天发现,使用wordpress自带控件从blogger导入的若干篇文章不完整。都是发生在表格部分,只留下了表头,表格的其余部分全部丢失。
手工copy文章源代码,修正完成。
原文永久链接:https://jijian91.com/blog20070710/wordpress-blogger-import-error.html
comscore刚刚公布的亚太互联网用户报告称:
中国用户访问最多3个网站是微软、百度和腾迅QQ。
这个结果确实与我们的感觉有很大差异。我就不记得上一次访问微软网站是什么时候。中国用户到微软网站上去干什么呢?
- 微软官方网站的流量不会太大。
- live搜索引擎虽然被微软想尽一切办法推销,但由于其本身质量的低劣,在中国市场的占有率非常可怜。流量几乎都是来自IE的默认搜索引擎。
- MSN算是个重要的流量来源。但其中的水分也不小。比如登录MSN时,强制弹出的2页内容和msn邮箱。
- live space曾经是个很有前途的blog。但在微软的大力发展下,已经成为缓慢和混乱的代名词,逐渐式微。前不久有传说myspace将与msn在7月26日合并。live space就这样退出江湖也算不失面子。
这样算来,微软的流量应该主要来自msn系列产品和默认搜索引擎。其中,大多数是被流氓手段带来的。微软真是深谙中国互联网的精髓。
另外,此次报告的调查对象是对15岁以上用户。众所周知,百度和QQ的用户群更年轻。所以,这对它们是不公平的 🙂
原文永久链接:https://jijian91.com/blog20070709/china-internet-user-microsoft.html
看了一些wordpress SEO的资料,最后把文章永久链接的格式改成了/blog%year%%monthnum%%day%/%postname%.html。
这是个折衷方案,兼顾几方面:
- postname做文章题目,体现文章内容,有利于搜索引擎识别
- 包含年月日段,避免url重复。如果直接用/%postname%.html,随着积累题目重复的可能性就越来越大。
- 包括url中分类段,对SEO有帮助,但wordpress是将文章的全部分类都列出来,可能会使url很长。所以放弃了。
还有一点,我曾经把永久链接格式写成 /blog/%year%%monthnum%%day%/%postname%.html。没有报任何错误,但所有的文章页都是404错误。去掉blog一段就正常了。似乎是wordpress不支持在永久链接格式中写单纯的常量。没有多试,存疑。
因为永久链接是SEO的基础,一旦确定就不要改变了。所以,还是想清楚了再动手,改后多试试链接是否有效。
原文永久链接:https://jijian91.com/blog20070707/wordpress-permalink.html
经过几天的奋战,本网站http://jijian91.com终于搭起来了:
在http://lunarpages.com买了最便宜的basic plan空间,送1个域名
用lunarpages的fantastico安装wordpress 2.2,过程完全自动化。但遇到汉字显示问题,加了set name也不行。最后在mysql中,把所有表的字符集都改成utf8,才ok.
用wordpress内置的import功能导入以前的2个blog(http://jijian91-tec.blogspot.com和http://jijian91.blogspot.com)的文章,效果很好。
下载、安装 wordpress汉化包。
寻找模板,最后选择了keso风格模板。
整理文章的标题、分类。分类相当于blogger.com的tag,基本直接可用,只需整理一下。标题则要一个个重新设置,近200篇文章,累死了。
修改模板,增加google analytics跟踪代码。
到现在,http://jijian91.com已经可以出来见人了。未来要做的事情还很多。
原文永久链接:https://jijian91.com/blog20070705/jijian91-com.html