今天,网易有道推出了有道手机购物助手。据有道博客宣称,功能实现:

通过手机摄像头扫描商品条码,从而识别商品进行比价。

这与jijian91在2006年11月《输入技术决定手机的未来》一文中的想法完全相同:

要解决输入问题,手机应该发挥在声音和图像输入方面的优势。特别是手机摄像头的潜力巨大。二维条码只是最初的试水,而且在推广上人为提高了门槛,其实不利于教育用户。还不如从一维条码做起。比如,扫描图书和商品上的条码,提供比价服务。扫描快递单据的条码,提供邮件跟踪服务。

非常兴奋!虽然,2年半的时间对于互联网这个行业太长了,但毕竟从一个设想变成了现实了。更高兴的是,在中国,还有有道这样专心为用户做事而不是沉溺于炒作的互联网公司 。有道的低调和实用,恰恰说明其正走在正确的道路上。

原文http://jijian91.com/blog20090611/youdao-zhushou.html

汉字与字母的数量

2009-02-16 18:28 +0800

很多人学中文时都在抱怨汉字太多,比英语的26个字母多了数百倍。曾经有一段时间,人们都在说拼音文字必将替代汉字。

其实,仔细想想,用汉字与字母比数量是不对的。

语言的最小意义单位是语素。汉语中,绝大多数语素是单个汉字。而英语的语素包括词根(自由语素)和词缀(粘着语速)。所以,应该是汉字与英语词根、词缀比较数量。常用汉字和次常用汉字的总量大约是六千。常见的英语词根数量上没有汉字多,大约是数百,但构词时的变形比较复杂,所以会滋生出词干。总体算来,常见英语词素接近千计。中英文常见词素对比在6-7左右。

由此推断,中英文对应关系是:
汉语 vs 英语
笔划 vs 字母
汉字 vs  词根、词缀
复合词 vs 单词

汉语的常用复合词大约有数万(《汉语大词典》收词6.5万),英语的
美国人平均掌握的词汇量是14,000个。权威的词典Oxford English Dictionary收词41万。估计总词汇量接近100万。

但在由词素派生词的能力上,英语明显较差:

  1. 新词与词素的关系不明显,很难从单词中辩认词素,更难记忆和推导含义。汉字独立成字,优势明显。事实上,英语词素、单词的关系与汉语的部首、汉字的关系相近。
  2. 英语派生词较长,读写不便,从而大量了出现简写。无意义的字母组合简写易混、易重,而且与原单词联系微弱,变成了新的单词。这种词生词的怪圈导致英语单词量暴增

注:这是很早写的半篇blog,一直没时间写完。看来也没续写的机会了。先放出来。

原文http://jijian91.com/blog20090216/hanzi-zimu.html

百度永远是不可信任的

2008-09-13 17:29 +0800

说2个亲身体会:

这个blog已经建起来1年多了。开始的时候,虽然没做什么SEO,但百度收录得很快,而且引来了不少流量,一度占到总访问量的80%。今年4月的一天,来自百度的流量突然变成0了。查了一下,百度的收录量没有大的变化,只是排名顺序变了。不知道什么原因,也无从询问。

而Google则相反。虽然开始来自Google的流量很少,但一直缓慢上升。现在已经占到总流量的一半。

我在百度有个帐号,最初是为了陪文文玩,在百度空间注册的。后来在百度知道回答过一些问题。三天打鱼两天晒网,一年多来也积累了不少。昨天,又是突然被封禁了,大部分被采纳的回答变成了”失效或不存在”。没有任何通知,没有任何说明。本打算去百度知道投诉吧问一下。随便翻了几篇投诉,admin的回答是”我们没有解禁的功能,只有封禁的功能”,然后就是copy一段牛头不对马嘴的规章。那还有什么可说的。

如果是一个以来百度流量的商业网站,遇到这种情况就只有花钱消灾了。挟流量以令网站,就是百度主要的收入来源。

这就是百度。永远是非规则化,永远不会告诉你为什么,永远不可信任。

原文http://jijian91.com/blog20080913/bad-baidu.html

百度收录日期4月25日,距百度蜘蛛来访4天。

雅虎中国收录日期4月28日,距搜索蜘蛛来访4天。

有道收录日期4月22日,与有道蜘蛛来访时间不符。

原文http://jijian91.com/blog20080509/baidu-yahoo-yodao-xizanginfo.html

首先,西藏信息网Yahoo收录了。是yahoo.com,而不是马云的yahoo.cn。yahoo虽然今不如昔,落到被微软压价并购的地步,但仍然是世界三大搜索引擎之一。所以,这是继被Google收录之后,又一个小小胜利。

说到世界三大搜索引擎,就不能不提到百度。百度搜索蜘蛛很早就来了,除了每天十数次疯狂访问首页,也访问了其他网页。但至今,仍然没有收录。很是奇怪。

五一期间还有一个小收获。在访问日志中,见到了有道搜狗搜索蜘蛛。下面详细说说搜索蜘蛛的不同访问特点。

继续…

原文http://jijian91.com/blog20080503/yahoo-include-xizanginfo.html