改造-用AI大模型-QQ浏览器搜索-腾讯独家揭秘 (改造ing)
引言
自搜索引擎问世以来,信息检索算法历经多次技术更迭,其演进的历程可大致归纳为四个技术代际:
- 1.0 文本索引
- 2.0 超链分析
- 3.0 机器学习
- 4.0 深度学习
QQ 浏览器搜索在深度学习时代(4.0)的实践
QQ 浏览器作为一款国民级智能工具,用户通过搜索进行信息查询是其中一个重要的使用场景。本文主要探讨 QQ 浏览器・搜索在深度学习模型方面的各种实践。
搜索匹配四大难题
搜索引擎是一种智能化的信息检索工具,能够从互联网上的海量信息中为用户提供精准的搜索结果。在实际应用中,搜索引擎需要解决的关键问题是如何让用户快速、准确地找到所需内容。虽然通过字面匹配可以获得最相关的文档,但在大多数情况下,这种匹配方式会面临多种挑战,例如:
- Query和Doc非直接命中,而是语义满足的,需要通过语义建模才能挖掘出最匹配的Doc
- Query和Doc的标题命中不好,但是和Doc的内容文本命中较好,需要对Doc的内容域进行建模
- 对于相同的搜索请求,用户会随着时间的变化产生不同的结果页需求,需要对需求切换进行建模
- 同一个搜索Query下,相同匹配的结果在满足用户需求上存在差异,需要对多需求PK进行建模
技术框架
如图6所示,QQ浏览器整个搜索系统采用分层治理,返回结果条数呈现金字塔型,自下而上分别是:
- 数据层:主要是抓取存储解析各种数据内容。
- 召回层:从千亿级Doc中召回和Query相关的百万级目标,然后通过粗排模型进行进一步筛选获取十万级。
- 精排层:在粗排召回的基础上引入更多的精细特征,引入更复杂的模型计算获得和Query最相关的百级Doc,大量的深度语义模型都分布在这一层。
- 混排层:主要是用于普通结果和卡片类结果进行插入混排。
为了解决搜索引擎面临的诸多挑战,在整个系统的多个模块中引入了深度语义匹配模型,典型的有:
- 精排层相关性模型,除去传统的字面匹配特征之外,重要特征是深度语义匹配。
- 精排层时效性模型,除去时间因子,爆发系数特征之外,重要的特征是深度语义。
- 深度点击模型,除了有点率,点击率,跳过率,时长之外,重要的特征也是深度语义。
- TOPK模型,除相关性,时效性,质量,热度特征之外,也有内容深度语义匹配特征。
训练pipeline
如图7所示,QQ浏览器・搜索构建了从预训练->post预训练->第一轮fune->第二轮finetune的pipeline。
如何调整QQ浏览器所使用的搜索引擎。
当我们在使用QQ浏览器浏览网页的时候,如果想要修改浏览器所使用的引擎的话,应如何操作呢?接下来就由小编来告诉大家。 具体如下:1. 第一步,打开手机并在桌面找到QQ浏览器图标,点击进入。 2. 第二步,进入浏览器主页后,点击下方的我的选项。 3. 第三步,切换至浏览器的个人中心页面后,点击右上角的齿轮形设置图标。 4. 第四步,在设置页面下,点击搜索引擎选项。 5. 第五步,进入搜索引擎选择界面后,选择合适的引擎即可。
手机QQ浏览器"语音搜索"功能如何使用?
目前,手机QQ浏览器用户通过起始页搜索框进入搜索界面,点击“话筒”即可调用语音搜索功能。 初次使用,手机QQ浏览器会提醒用户先下载安装“语音搜索”插件,安装完成后即可使用语音搜索功能。 对于插件模式,很多网友肯定不陌生,因为在PC浏览器中很多功能的实现都是依靠插件完成的,比如,Flash、音乐播放等一些功能扩展。 手机QQ浏览器的插件功能不仅包括语音搜索,还有QQ爱拍,通过安装爱拍插件,可以一键拍照上传至腾讯微博和QQ空间。 同时,“语音搜索”功能不只是搜搜可以使用,手机QQ浏览器内置的几大搜索引擎都可以使用,包括网络、宜搜、google。 测试中发现,语音搜索的识别能力很不错,基本的普通话和简单的英文单词都可以正确识别,这无疑大大提升了搜索的效率。 另据了解,未来手机QQ浏览器各大平台可能都会加入“语音搜索”功能,而且会变得越来越智能化。 在手机QQ浏览器的带领下,这个功能或成为移动浏览器类应用必备的功能之一,是大的趋势也可能会称为近期的热点。 手机浏览器企业蜂拥做语音功能,无疑将带动手机浏览器行业创新。 有业内人士分析认为,虽然目前手机浏览器的语音功能只是一种单向的语音输入和操控,并无法向苹果Siri那样可以双向智能互动,但是这种创新的交互方式仍然让用户感觉新鲜,也期待手机浏览器拥有更强大、更智能化的语音功能。
免责声明:本文转载或采集自网络,版权归原作者所有。本网站刊发此文旨在传递更多信息,并不代表本网赞同其观点和对其真实性负责。如涉及版权、内容等问题,请联系本网,我们将在第一时间删除。同时,本网站不对所刊发内容的准确性、真实性、完整性、及时性、原创性等进行保证,请读者仅作参考,并请自行核实相关内容。对于因使用或依赖本文内容所产生的任何直接或间接损失,本网站不承担任何责任。