文小言品牌焕新功能升级,多模型融合调度是核心亮点
温小扬更像人类。
在31日的百度AI日,Wen 宣布该品牌已完成品牌续订和功能升级:该品牌在视觉上改变了其“皮肤”,使其看起来更年轻,更新鲜;功能性升级侧重于模型开发和功能创新,支持多模型融合和调度,并升级了各种功能,例如新的语音模型,图片问答,AI传记视频等。
当百度向外界介绍新文章时,它生动地描述了:“如果他很聪明,有很强的了解,善于寻找话题,并且很年轻,您想认识他吗?”
Wen 再次升级
Wen 这次升级的核心亮点是“多模型融合计划”。通过整合Baidu的自发模型,例如 X1和 4.5,并连接到第三方高质量的模型,例如-R1和,Wen 在多个模型之间实现了智能合作。
应该补充的是, X1仅在发布后半个月后,Baidu称其为“独立使用工具的第一个深思熟虑模型”; Big Model 4.5是Baidu独立开发的新一代本机多模式基本大型模型。它在多模式的互动和理解中更强。天然模型的联合预训练可以实现更深的模态融合。
由于“自我开发 +开源模型”的组合,用户有权选择和切换到“自动模式”,并且可以一键调用最佳模型组合,或者灵活地根据需要选择单个模型来完成特定的任务,从而大大提高响应速度和任务处理功能。
这也使温小扬(Wen )更加强大。以装饰计划为例,输出:我的客厅在南部为35平方米,并有一个全落地窗户。请根据我的要求绘制三种不同的装饰效果图:浅奶油风格,深浅的豪华风格和类似儿童的风格。三种类型的房屋必须保持一致。
如果我选择 X1模式,Wen 可以根据要求生成各种装饰样式解决方案,并提供设计原理和效果图。在推理的过程中,它可以自由地使用图片和文本来调用工具的能力使许多人发光。
根据Baidu的先前介绍, X1使用进行性强化学习训练方法,基于思维链和动作链的端到端培训以及多样化和统一的奖励系统。也可以理解,这是百度自我开发的大型模型的独特技巧。 X1的推理输出可以与图片和文本直接混合,以连续完成任务。
在多模式的理解能力方面,温小扬再次增强了他的图片理解能力。例如,在简短的视频平台上存在一个流行的挑战:根据图片猜测街道场景或位置。发起者上传的图像不是很标志性,可识别和信息丰富。 Wen 可以快速,准确地分析答案。
世界上还有“午餐吃什么”的问题。只要您拍摄菜单的照片并告诉它类似的需求:两个人的预算为200元。如果您想吃更多,应该如何订购食物? Wen 可以在很短的时间内提供令人满意的解决方案。
Wen 进一步提高了新的语音模型,图片问答,AI图片和视频的功能。例如,新的语音模型随时支持方言对话,复杂的知识问答和中断,用户可以执行语音知识问答或有趣的角色扮演。
以孩子和小扬之间的对话为例,联系是丝般的,无需担心AI在中断后将无法回答对话。您也可以切换到各种音色,例如蜡笔Shin-Chi,Sun 和Xiong 。不仅如此,他还学会了各种方言。您可以与重庆方言,河南方言,广西方言等聊天。
图片和答案功能允许用户使用文本或语音问题直接通过拍摄图片或上传图片来直接获得深入的分析。例如,拍摄数学问题可以实时产生解决问题的想法和视频分析。上传多个产品图片可以比较参数和价格以帮助购物决策;拍摄杯子设计图片后,AI可以自动分析样式并生成外围产品,例如同一手机盒,支架等。
值得一提的是,新添加的“图片冷知识”功能更有趣,用户可以预设人类设计的观点,例如“历史学家”和“技术专家”,以对同一图片进行多维解释。例如,当用户问“猫为什么在探索猫的窗户时窗户上的科学真理?”时,温小扬可以从狩猎本能,能量获取和领土意识的角度做出独特的解释。
百度发现AI到C节奏
回顾过去,这应该是Wen 两年内的第二次大规模升级。
不到四个月,百度于2023年3月16日,百度推出了生成的AI产品“ Yiyan”,从而缩小了海外AI大型模型公司的差距。
2024年9月4日,百杜(Baidu)升级了已经筹集了一年半的 Yiyan应用程序,将其定义为“ Wen ”,其定位也明确定义为“ Baidu的新搜索智能助手”。当时,Wen 推出了“新搜索”功能,例如丰富的媒体搜索,多模式输入,文本和图像创建以及高现实的数字人物;同时,它还发布了新功能,例如独家首次内存和免费订阅。
该产品升级和定位反映了百度的野心:在传统搜索中继续其优势,并再次定义新的搜索。官员们认为,与其他搜索产品不同,AI时代的新搜索需要AI功能,包括生成AI,多轮互动,个性化互动以及其他不同的功能。
换句话说,合格的“新搜索智能助手”不仅具有传统的信息检索功能,而且还满足用户的多层次需求,例如搜索,创建和聊天,并且具有更像和了解人的特征。
Wen 是Baidu在AI到C的关键步骤。它在搜索,创建和聊天等多个方面实现了搜索行业的变化。此外,从单独的名称来看,其拟人化属性被放置在一个突出的位置,大大削弱了Baidu产品的强大“工具属性”,并与普通用户具有更多的“普及”。
我还注意到了一个业务趋势。 Wen 完成升级后不久,百度举行了2024年第三季度局长大会。第三季度通常是百度的战略赛季,罗宾·李(Robin Li)和百度(Baidu)的董事级别及以上将参加,这表明其重要性。
罗宾·李(Robin Li)在会议上发表了近10,000个单词的讲话,在未来时期为百度商业策略定下了基调,并在思想上动员了。在其中,他提到,“温小扬”不需要像和kimi一样从根本上推广它。在接下来的六个月中,Wen 一直是“低调的发展”,直到这段时间她进行了翻新。但是,它的用户规模和产品体验友好一直是类似产品列表中的首位。
另一个重要的一点是,基于对搜索的新理解,李·扬洪认为,搜索的重建和重建应分为两个步骤:
首先是搜索和推动融合。他强调,搜索的任何变化不仅应取决于搜索方案中对核心业务指标的影响,还应取决于提要的核心业务指标。空箱建议的本质(例如,在百度搜索框中预设了某些单词和句子)是一种建议,因为用户不是输入此词,只有使用建议概念才是正确的解决方案。
其次,AI应与移动生态系统结合使用。 AI需要与移动生态系统进行进一步集成,例如如何组合图像用户界面和自然语言界面,它将更自然,这将是未来搜索开发的范式。
我一直认为AI到C需要解决两个关键问题:用户体验和业务模型。因为只有在这两个方面取得突破,基于不断优化用户体验并允许AI解决真实方案的用户需求的前提,可以通过用户接受AI并忠实地保留AI,从而产生商业价值。
Wen 的两个升级并没有偏离Robin Li设定的两步策略,这也符合这种逻辑。它不断整合百度的移动生态系统,例如整合许多代理商以向用户提供服务。同时,百度还鼓励用户创建自己的代理商并分享它们。为此,百度还建立了一个社区模块来创建通信平台并交换创意体验。
不仅如此,Wen 还在BAIDU系统内外整合技术能力。在此基础上,Wen 满足Baidu对新搜索的定义。在此过程中,百度还发现了将AI与C产品制作的节奏:生态层是开放的,场景层是深层培养的,并且重建了价值层。
一位相关的百度官员在活动中告诉唐·陈(Tang Chen),过去,AI应用程序是模型的展示网站,但这对普通人来说还不够。该模型就像引擎一样,但是普通用户想要的是汽车,因此他们必须添加框架和座椅才能满足舒适的驾驶体验。
在经验和沟通过程中,我清楚地认为,在百度想“打开”之后,其AI到C的产品气质和节奏正在对肉眼进行明显的变化,并且可以轻松摆脱负担。就像罗宾·李(Robin Li)在Baidu产品访问之后说的那样,“百度希望与所有人合作,以促进人工智能技术的发展,以便每个人都可以使用最先进的生产力工具并从中受益。”
这也可能是百度对Wen 的持续升级的重要性。
但是不可避免的是,Baidu AI到C产品仍然存在一些惯性问题。例如,在功能设计方面,百度非常慷慨,希望向用户展示其所有良好的技术成就。但是,覆盖所有内容并不是一件好事,这无形地提高了用户的门槛。我使用了问题搜索功能,然后遵循提示来找到入口以上传问题,这花了很长时间。结果,在对话框上方,“解决问题老师”的快捷方式被单独列出。
对于百度来说,步伐是正确的,其余的调试是与时间和友好的公司比赛。
参考:
量子碎片,“怀过的小小的思考之后,它是如此的香”
Baidu,“ Wen 升级:多模型调度,图片问题和答案”
智力出现了,“李·扬港的内部讲话:“温肖”不需要像 and kimi那样从根本上提升。
我是唐·陈(Tang Chen),我要注意互联网技术和商业故事。未经许可,禁止生殖。
“唐陈”
钛媒体,36kr,老虎金融热门清单
2024年最令人惊讶的创建者
Tiger 2024优质专栏
Henan Daily·顶级新闻2024有影响力的作家
接口新闻高质量清单
Tiger 2024优质专栏
腾讯新闻的年度高质量热门问答所有者
2023年SOHU新闻的年度最佳创作者
每个人都是产品经理2023杰出作者
2023 新闻年度内容合作伙伴
界面,36KR,钛媒体,彭帕,蓝鲸,老虎金融和其他平台认证作者