为什么常识

垂直搜索引擎的 suggest 设计,最重要的是什么呢?

生活词典 changshi.cidiancn.com

阅读: 130

垂直搜索引擎的 suggest 设计,最重要的是什么呢?6 个答案

答案 1:

1. suggest的定位:在用户输入关键词的时候,起到提示作用,减小用户输入量,提高用户输入准确度。能够智能的预测用户心中的期望;2. 备挖掘基础数据对于suggest是很重要的,一般要来源于用户实际的输入,让程序能够借助历史数据预测用户意图;3. 要关注被挖掘数据的来源、数据量、多样性、更新频率等4. suggest是交互性很强的产品。随着用户的输入,呈现不同的内容。而不同用户输入的行为是不一样的。一般而言,中文用户输入的时候,由于输入法的特点,用户输入是以“概念”为单位的,而一次性输入概念的长短取决于用户输入技巧。的比如输入“-市朝阳区”,技巧差的人可能先输入-市,然后再输入朝阳区,这时suggest有机会在-市这个层级就作出推荐。技巧更差的,可能一个字一个字的输入,这时候suggest介入的机会就更多了。但是显然,输入内容越多,用户表达的需求就越明确,推荐出来的内容越可能符合用户需求,但是意义也就越小,因为没有起到节省用户时间的目的。因此在输入的前几个字,就应该尽可能的贴近用户需求,一种方式是覆盖热点,打概率,覆盖大多数用户,更讨巧的方式是所谓个性化推荐。这些思考适用于任何用户输入,机器推荐的场景,比如搜索框,比如浏览器地址栏等等。这点google c-rome做的极好,-浏览器也做了一些很好的尝试5. suggest的质量评测重点在于数据量、数据质量和查询逻辑,此外,以吞吐量为代表的性能指标也很重要。6. 需要注意的是,对于新闻、网页、-这类全文检索类型的查询,suggest尽量采用用户输入的query记录,因为基于历史的推荐是最靠谱的。但是对于数据库查询,也即有最佳查询方式的产品(比如地图查询、词典查询等),要具体分析,不能完全依赖于用户的历史查询。应该根据用户输入,进行意图判断,给用户提示更接近用户意图的查询推荐,这个推荐不一定只来自历史query记录,比如可以像地图搜索那样,向用户推荐POI数据点。库结构的数据另一个特点是有层级,比如分类树,比如地图数据的省市区等,这些特点在suggest设计的时候要予以考虑7. “冷启动”是个问题,也即最初可能没有任何用户行为数据。这时候需要结合热点挖掘的方式给用户一个最初的感受,不过需要很好的把控质量,并进行灰度放量,AB test8. 当无法得到初始query的时候,需要想办法。比如地图使用POI数据,还因为用户查询poi数据的比例很高,且有这方面的数据可供挖掘suggest的一些质量评测点1. 垃圾词过滤。比如带无意义符号的查询串要进行处理2. 意义重复的query,比如“天上人间照片”和“天上人间的照片”属于同意3. 在去重复基础上考虑多样性4. 匹配模式,前缀匹配、后缀匹配5. 中英文(拼音)混合串的质量6. -智能纠错7. -、黄词、零结果等的过滤8. 新闻类检索需要引入时新性9. 如果有类似阿拉丁的直达区,考虑直达区策略以及展示样式10. 数据方面主要看CTR。但是要注意,用户只要输入query,就会调用suggestion,多一个查询词,suggest就又检索一次,如果以单纯的检索量做分母是不合适的。应该以一次完整的检索行为作为分母,以点击提示词的次数为分子。

答案 2:

重要的是你做的是垂直搜索的suggestion, 用户输入的关键词会相对集中,你又有很多这个领域内的知识积累,如何利用这些提高用户寻找的效率?suggestion 出现在互联网上已经有超过10年了,像z-i-u顶部的搜索是否也可以认为是一种suggestion的创新?总之,suggestion的目的是为了让用户更少的输入,让用户搜索和寻找更便捷。想想看。

答案 3:

最重要的是CTR阿

答案 4:

看来LZ或许是-的Map经理,关于地图搜索的suggestion减少查询次数的一个方法是不是可以通过判断输入是否是地名词来做,当然这需要后台地名词库,这样检索明显能降低次数。

答案 5:

行业专业词库,这个需要大量的行业积累,有可能需要人工编辑。

答案 6:

无论做什么,第一个要回答的问题是,你满足了哪些用户的哪些需求。

分享常识给亲友.

下一篇:如何防止博客被别人抄袭和拷贝? 下一篇 【方向键 ( → )下一篇】

上一篇:现在买理光 R10 合适吗?这款在1-1.5k的价位上表现如何? 上一篇 【方向键 ( ← )上一篇】