一、 数据挖掘
湖州网站开发完成后,常常会对网站进行搜索引擎统计并分析用户搜索行为,从而做些有效的数据调整来保障网站排名的有效提升:
1. 首点击排位:
对于任意关键词,统计用户首点击排位,得到结果为平均值或概率分布。若不考虑UI设置带来的视觉体验,能否在 时间搜索到目标对用户体验的影响是较大的,用户首点击的搜索结果代表了两种可能:一是结果相关性和二是习惯。毫无疑问,用户会在搜索结果中优先选择与自己希望得到的信息相关性较高的,统计其首点击排位,反应了用户在搜索此关键词时较可能感兴趣的信息,进而改进搜索结果排位;对于某些关键词,搜索结果所给出的简介可能无法令用户判断出相关性,在这种情况下,并非所有用户都会在搜索结果中优先选择 个,此时统计首点击的排位也有意义,它反应了用户的习惯,对于类似的关键词,可以合理的安排排位缩短用户搜索成功的时间。
2. 尝试次数:
用户在修改关键词前尝试不同搜索结果的次数。一般来讲,用户在 页无法得到满意结果便会开始完善自己的关键词或选择相关搜索,三页之后的搜索结果极少被点击到。统计用户的尝试次数,可以更为合理的安排每页显示的所搜结果个数,缩短用户搜索成功的时间。
3. 错写纠正:
搜索引擎对于未切换输入法、错别字等错写已经有了比较完善的纠正能力,但对于一些生僻词汇,错写纠正的结果是否符合用户的需求仍有待验证。
4. 相关搜索:
通过统计用户搜索行为,对比用户连续两次搜索关键词的关系,通过一定的算法给出相关搜索。相关搜索相当给用户提供了完善搜索关键词的选项,其要点应是尽量做到完备。
5. 垂直引入:
以搜索引擎为例,在网页中搜索“谢霆锋”,搜索结果前三位分别为百科、视频、贴吧搜索结果的垂直引入。同样可以通过分析用户连续两次搜索关键词的关系、用户对于某些特定关键词选择的功能搜索,使用聚类、二叉树等方法得到合理的搜索功能引入方案。
6. 广告相关性:通过用户对广告的点击量分析搜索关键词与广告相关性,用户对推广链接的点击量可以较好的反应关键词与广告的相关性,相关性越高,用户对于广告的兴趣的点击可能性越高。
二、 横向对比
每种搜索引擎均有其优缺点,举简单的例子:一些人在搜索中文关键词时选择,搜索英文关键词时选择谷歌;搜索湖州生活相关的东西使用,搜索专业文献选择谷歌。类似的选择反应了用户对于搜索引擎部分功能的评价。
由此可以提出这样的想法可以:在搜索某类关键词时,对比竞争对手给出的结果,通过合理的引入,提高搜索引擎的搜索效果。
三、 用户建模
此方面实际是用户需求细分的过程。可以设置用户登录系统,对用户信息和搜索行为进行聚类分析,理解不同类型的用户的兴趣点和搜索行为特点,在此系统中, 方面的所有方法均适用且可以得到更好的结果。
潜在风险:
1. 恶意刷流量软件:此类软件会造成某些搜索结果排位靠前,却并非用户所需,造成用户体验的降低。
2. 非正常的用户行为:如某些内容不健康的网站的首点击率非常高,很可能出现在用户搜索结果的 页中,但其信息却与关键词毫无关系。
3. 时新性:由于通过用户搜索行为改进的搜索引擎给出的搜索结果都是从已有信息中得出的。这样会造成搜索结果的时新性很差:一个新生事物,无论它具有多么大的吸引力或轰动性,均不可能出现在搜索结果的 页中。