在AI和信息交互之间:QQ 信息交互的实例
互联网2.0时代,互联网开始成为人们获取价值信息和社交不可或缺的重要工具,人与信息的关系开始有了双向的交互,信息与人共同编织、丰富着这张时代大网。,在AI和信息交互之间:QQ 信息交互的实例
互联网1.0时代,网络是大众查阅资料、了解全球的重要窗口,这个时期人和信息的关系是单给的,信息如一本本静态的电子化书本需要用户触及后再阅览获取;
互联网2.0时代,互联网开始成为大众获取价格信息和社交不可或缺的重要工具,人和信息的关系开始有了双给的交互,信息和人共同编织、丰盛着这张时代大网。
随着主推技术成熟以及信息流业务急速扩张,用户和内容的交互玩法逐渐从“人找内容-搜索”给“内容找人-主推”迁移,而且这种动向仍在扩大它的外延。搜索作为人和内容信息交互的一种重要方法,它的影响并没有削弱,用户在主推场景的沉浸消费反而会激发出新的搜索需求。
从本质上看,搜索和主推关注的交汇点都是交互的核心——用户兴趣,因此怎样在当前信息分发场景中更好满足用户兴趣一个重要命题。而浏览器是用户在互联网2.0时代和全球交互信息的重要入口,也是展示搜索和主推技术精进的绝佳观察点。
500)this.width=500">
浏览器一直以来综合性APP,承载了搜索、信息流主推、小说等多种用户消费信息的场景。这些场景都有大量的内容领会、内容生成方面的AI需求。不同的场景都有各自的特征,比如搜索的Query意图分类、信息流的内容主推、小说的内容分类等。
这些特征也让浏览器成为综合观察AI技术在天然语言语义领会路线进步很好的窗口,跟随主推技术的进步脉络,大家发现企鹅旗下的QQ浏览器应用月活用户已经超过4亿,俨然成长为浏览器中的超级APP。
在国内,企鹅是较早大规模操作AI主推技术的厂商其中一个,旗下的QQ浏览器过去几年来在AI和主推技术方面故事了几次大规模重构和迭代,现在已经蔚然成森。这几年QQ 浏览器在技术层故事了如何的厚积?在信息茧房和视频化难题的泥沼中,QQ 浏览器做出了哪些选择?其实战故事对于浏览器行业来说,还是具有一定的进修和参考价格的,值得大家探讨一下。
信息流“沼泽”中
QQ浏览器面对的选择
在浏览器中,信息流主feed是图片文字、短视频、小视频混合形态,这也是主推算法应用的主场景。在这些场景中,浏览器在不断进步的进阶经过中容易遇到这些痛点难题:
1.信息茧房现象。内容和资讯类平台不光要主推热门的信息内容,也面临化解一些初始信息的冷启动难题,主推体系怎样公正有效的主推优质内容,使得好内容获取更多的爆料机会,触达更多的人群。
2.面对具有丰盛场景的浏览器,其背后的AI研发需求多样复杂,传统的研发玩法研发周期长,效率低。比如内容视频化路线,如何打更好的标签以及做更好的多模态,对视频的领会和多模态的领会怎样做到准确把控等。
3.细分场景的多样化和精细化运营的需求,信息流目前进步到了精细化运营的阶段,需要针对多种多样的细分场景进行敏捷优化。
500)this.width=500">
无论是对于用户来说,信息内容的茧房现象带来的一亩三分地的局限“视野”,还是企业面临的形态复杂、内容多样化进阶的AI技术需求等,这些对信息流内容产生影响的挑战都亟需化解,为内容信息的获取和交互还一片轻快的价格尝试。
QQ浏览器在面对上述挑战中,选择运用预训练+finetune+AutoML的新范式和多目标多场景联合优化的新深度模型等创造来应对信息流这方面的技术挑战。在企鹅QQ 浏览器举办的AI算法大赛中也可以窥视到多模态技术和超参数对这些浏览器难题的优化,这两个技术也是此次比赛的两条赛道。
比如在视频流的场景中,多模态的技术可以根据视频观看的时刻及关注的兴趣及行为让下壹个视频更符合、相似目前观看的视频,在语义上的相似可以让用户的尝试更好。QQ 浏览器在多模态技术中也做了评价视频语义相似度的难题,可以更精确地评价两个视频的文本不同差异,为用户不再主推重复的内容,增强在主推方面的泛化和兴趣寻觅的能力,很好地缓解信息茧房的难题。
而超参数技术可以实现多目标融合,也就是在主推体系中,从刷视频的点击率演进到点击、关注、点赞等同时完成,超参数搜索把以前人工寻参的方法通过网格搜索、非特点化寻参到特点化寻参的方法提高效率。在企鹅QQ浏览器操作经过中可以减少 80% 以上的寻参时刻,大大提高了主推体系的研发效率。
大家了解浏览器在实际的主推和搜索业务场景中,有异常丰盛且持续演化的内容需求,这些庞大的内容数据并没有客观清晰的定义,数据标注也就成为内容算法研发的核心瓶颈,而预训练大模型是化解这一难题的“良药”。
聚焦主推和搜索:
当浏览器拥抱大模型
预训练大模型也是近两年AI产业中最火的决定因素词其中一个。目前相对有名的模型参数量都已经达到万亿级别了,应用场景差异也相对明显。以 OpenAI斥巨资打造的GPT-3为例,它依然是偏 NLP 的模型。在AI大模型的寻觅上,无论是着眼于提高超大规模AI算力,还是突破学术前沿的角度,本质上都是通过将海量的数据进行预训练、预集成,形成高鲁棒性、低样本量需求的大模型。企业可以根据自身的应用场景,在大模型的基础上进行少量的调参即可完成落地。
而浏览器和大模型的结合,可以将浏览器背后场景的大量内容领会、内容生成中的AI研发所需样本量大大降低,化解标注量和成本这个在浏览器整体业务场景中的核心瓶颈。
QQ浏览器实验室自研了预训练模型“神舟”,这个模型具有百亿参数的训练能力,可以为搜索、主推、内容领会等多种业务场景起到直接帮助,提高各种天然语言领会算法效果。神舟预训练大模型专注中文天然语言领会,基于预训练的研发玩法,可以提前把语言语义中通用的姿势进修到预训练模型中,针对下游具体的任务只需要进修任务相关的姿势。
500)this.width=500">
通过该模型QQ 浏览器可以微调和满足业务中出现的如点评领会、搜索 Query 主推等NLP 需求,可以减少 40% 以上所需的标注数据量和相应的研发时刻,节省了标注的成本,大大提高了研发的效率。在学术上,也刷新了业界纪录,登顶了中文语言领会测评基准 CLUE 榜单上,成为首个在中文天然语言领会综合评价数据上超过人类水平的预训练模型。
当前神舟大模型已经逐步应用于 QQ 浏览器的搜索、看点资讯、小说等多个场景。随着大模型进一步的迭代和操作,也会深度改造 QQ 浏览器的搜索主推能力,更好地领会并满足用户表达背后的意图和需求。
大算力时代,机器变得更加领会信息和人,比如在医疗领域的问诊问答、交互对话等实际场景中,大模型可以为语义的领会带来更强的综合效果,而浏览器拥抱大模型,可以更好地沉淀大量的姿势,帮助大家更准确地寻觅AI和机器进修的边界。
在综合数字化迁徙之旅中,大家获取信息的渠道和服务方法也变得越来越便捷智能,对于浏览器行业来说,让大众以优质的尝试零门槛获取价格信息是核心诉求,基于这个变化和诉求,QQ 浏览器也将自己的技术品牌更新为QQ 浏览器实验室以更好地聚焦服务用户。
QQ 浏览器实验室:
走给下一代信息交互
对于下一代信息的交互平台,每个人心目中的浏览器都不一样,大家也许会借助元宇宙的技术,通过手势、眼神甚至是觉悟来操控搜索和主推,当大家进入沉浸式的新搜索界面时,也许很多的边界都会模糊甚至消失,比如消费和应用的边界,尝试和内容的边界,尝试和创作的边界等,也许搜索就一个创作的引子,发现就是寻觅开始的价格,用户和内容和应用开始层层递进深入,尝试和交互的方法综合融合。
无论是哪种未来浏览器,本质上都是搜索网罗信息,精准主推价格内容,这也是信息技术进步经过中的不变内核。无论未来信息交互的前景如何变化,前提是技术的不断更迭、突破才能带来尝试的重构。
500)this.width=500">
(左起:企鹅副总裁郄小虎、信息平台和服务线CTO徐羽、企鹅副总裁殷宇)
QQ浏览器瞄准长线的数字化动向价格,成立“QQ浏览器实验室”技术品牌,依靠AI、搜索、大数据、主推算法的技术研究,提高信息和服务的获取效率,帮助用户零门槛地获取价格信息和服务,革新用户和全球的交互方法。
近些年来,大家发现企鹅越来越重视AI技术能力的构建,也成立了一些技术品牌,比如TEG(技术工程事业群)和反恐精英IG(云和聪明产业事业群),这也是大家心目中离技术最近的品牌。以内容为主的PCG并没有得到足够的关注。随着PCG技术中台的成立,主推AI中台也成为企鹅技术平台中的核心中台,而QQ浏览器实验室是PCG技术中台的核心支撑中台模块其中一个,不断为企鹅的主推业务赋能。
实验室是创造不断诞生并生根发芽的地方,搜狗搜索团队并入后,全网搜索的技术能力和企鹅垂直搜索的能力形成互补,强强联手,这个实验室就聚合了信息交互中最核心的两个技术,也许是大家迈入未来沉浸式搜索交互的第一步。
500)this.width=500">
大家了解,信息技术交互平台的进步不断进阶的目标就是消除鸿沟和隔阂,缩短人和人、人和信息的距离。企鹅信息平台和服务线CTO徐羽也公开表示QQ 浏览器的进阶目标,和之相似都是紧密连接信息和价格,拓宽用户了解全球的眼界。打造互联网未来30年的信息服务工具,做技术的摆渡人,让价格信息更好地网罗服务生活,成为寻觅未知的下一代超级窗口。
人类历史的长河中,随着信息技术的不断更迭,会越来越注重信息和价格的准确和高效,这也就意味着主推体系是个无限增长且没有最优解的技术体系,不断进化是它的特征,因此领会用户的能力也会不断地深入,这样持续洞察寻觅主推的新动向和路线,会为用户带来新一代的交互尝试和价格赋能。
文章来源:燕良 脑极体
(转载)