中文搜索引擎评测——关键词选取原则修订
2007/2/8 08:48第1次搜索引擎评测前,我设了一个粗略的关键词选取原则。现在加以完善和细化:
搜索关键词选择原则
- 关键词易分辨:关键词必须是易分辨的、公认的词或词组,避免选择特殊缩写、过于个性化的用法、新词、专业术语。
- 关键词含义单一:避免选取含义单一的关键词,便于比较结果质量
- 关键词易导致错误:对关键词的分词错误能导致明显和一定数量的错误结果,便于评测分词能力。
- 搜索结果数量较少:不重复的正确结果最好在15-20个,不能超过30个。因为评测只取前30个结果,正确结果过多可能导致错误结果被略过。
- 搜索结果分布广泛:结果要存在于多个网站,以便考验搜索引擎对重复内容的分辨能力。同时,避免搜索引擎屏蔽个别网站导致搜索结果的重大不同。
- 搜索结果易体现时间因素:例如,近期有重大相关事件,但避免用新词
- 搜索结果时间跨度较长:搜索结果时间跨度越长越好
做这些设定是为了充分考验搜索引擎的分词、重复内容和时间因素分辨的能力。同时减少因各搜索引擎收录网站不同对得分的过度影响,创造一个公正的评测环境。
先想到这些,以后慢慢补充。
转载请注明来自:jijian91与小z - 互联网
永久链接:https://jijian91.com/blog20070208/search-keyword-choice.html