第1次搜索引擎评测前,我设了一个粗略的关键词选取原则。现在加以完善和细化:

搜索关键词选择原则

  • 关键词易分辨:关键词必须是易分辨的、公认的词或词组,避免选择特殊缩写、过于个性化的用法、新词、专业术语。
  • 关键词含义单一:避免选取含义单一的关键词,便于比较结果质量
  • 关键词易导致错误:对关键词的分词错误能导致明显和一定数量的错误结果,便于评测分词能力。
  • 搜索结果数量较少:不重复的正确结果最好在15-20个,不能超过30个。因为评测只取前30个结果,正确结果过多可能导致错误结果被略过。
  • 搜索结果分布广泛:结果要存在于多个网站,以便考验搜索引擎对重复内容的分辨能力。同时,避免搜索引擎屏蔽个别网站导致搜索结果的重大不同。
  • 搜索结果易体现时间因素:例如,近期有重大相关事件,但避免用新词
  • 搜索结果时间跨度较长:搜索结果时间跨度越长越好

做这些设定是为了充分考验搜索引擎的分词、重复内容和时间因素分辨的能力。同时减少因各搜索引擎收录网站不同对得分的过度影响,创造一个公正的评测环境。

先想到这些,以后慢慢补充。

本文来自http://jijian91.com  原文http://jijian91.com/blog20070208/search-keyword-choice.html

Google

评论

Good.Be the first to comment on this entry.

Post comment

comment has COPYRIGHT too!

Fields in bold are required. Email addresses are never published or distributed.

Some HTML code is allowed:
<a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <code> <em> <i> <strike> <strong>
URIs must be fully qualified (eg: http://www.domainname.com) and all tags must be properly closed.

Line breaks and paragraphs are automatically converted.

Please keep comments relevant. Off-topic, offensive or inappropriate comments may be edited or removed.