刚刚文爱 聊天,百度文小言全面升级了。
基于多模子的才略,文小言升级了包括全新大语音模子、图片问答等在内的一系列深嗜儿又实用的新玩法。
比如图片问答,拍四只不同鹦鹉的大头照,问它鹦鹉性别(doge)。
你还真别说,这皆能回复对,分析得头头是说念:
况且目下图片问答还不错这么玩,基于原图元素一键二创,小雏菊杯子摇身变幻出小雏菊手机壳、抽纸盒:
表里兼收,复旧多模子和会接洽
本次升级,文小言径直把自家刚上线不久的新模子,包括文心大模子 X1 和 4.5,和"近邻学霸" DeepSeek-R1 满血版摆一块儿了,进行了多模子和会接洽。
目下,文小言的用户在一个页面可精真金不怕火切换使用 DeepSeek 或是文心 X1/4.5 特定模子,爱翻谁的牌子就翻谁的。
文心 X1 是百度半个月前刚发布的堪称是"首个自主应用器用的深度想考模子"。
文心大模子 4.5 是百度自主研发的新一代原生多模态基础大模子,在多模态交互、和会方面更强,原生模子勾通预检察能收场更深档次的模态和会。
另外,文小言上线了「自动步地」,它约略凭证用户提议的问题识别用户需求,自动选拔最合适的模子。
日日鲁夜夜啪在线视频目下,两款新模子径直和 DeepSeek 和会接洽,让文小言领有了更强的"大脑"。据先容,他们对 DeepSeek 还进行了多种功能维度的和会,买通了图片问答、生图等链路。
咱们先来锻练一下这个更强"大脑"的逻辑想维才略。
抛给它一个脑筋急转弯:
在一个闭塞房间里有三盏灯,门外有三个开关,每个开关分歧收尾一盏灯。你只可进房间一次。怎样判断出每个开关对应哪盏灯 ?
只见文小言三下五除二,轻缩小松一步步推理给出了范例谜底。判断依据中也会诠释掀开一个开关恭候 5-10 分钟是为了让灯发烧等诸如斯类的细节。
和一般推理模子不一样的是,在给出谜底之后,它还会自动推选视频,有详解这说念题方针视频,也有和此题雷同的更多题目。
如斯一来,就便捷了全球对题方针延长和会。
接下来再来一齐着名概率窒碍——"二孩悖论"。
这说念题启动表述至少可追忆至 1959 年,由着名数学家马丁 · 加德纳在《科学好意思国东说念主》杂志的"数学游戏"专栏中提议,曾激发数学家们的正常争论,直到目下全球对这说念题方针筹划似乎也还莫得住手。
问题是酱婶儿的:
史小姐先生有两个孩子。其中至少有一个是男孩。问:两个孩子皆是男孩的概率是几许?
加德纳领先给出的谜底是 1/3,但他其后承认第二个问题的表述存在歧义,若"至少有一个是男孩"这一信息的获得神气不同,谜底也可能是 1/2。
那么文小言是怎样回复的?它是 1/3 派,依然 1/2?
文小言在分析中顺利发现歧义,以为:
凭证传统概率问题,概率应该是 1/3文爱 聊天,但问题的谜底可能取决于信息的获得神气……另一个孩子是男孩的概率也能是 1/2。
最终文小言通过基础概率空间、条款筛选、指标概率筹画分散剖判,并用条款概率公式进行考据得出谜底 1/3,同期明确给出了歧义辨析。
固然,末尾相同附带有推选视频。
妙就妙在,你还不错让文小言帮你绘制图表,这么分析经由就更一目了然了。
它还挺"懂事儿"我方作念了补充,连常见污染点对比表也一并绘制出来了。
也不错再让它生成配图,「自动步地」无需切换模子:
而若切换模子成心指定文心 X1 来解决问题,它的上风在于,约略更纯真地调用各式器用。
据百度先容,文心 X1 利用递进式强化学习检察才能、基于想维链和行为链的端到端检察、多元长入的奖励系统等时代,文心 X1 的推理输出是径直不错图文搀杂勾通完成任务。
比如告诉它:
家里的客厅朝向是南偏东,35 平米,有一整扇落地窗,请凭证要求画出淡色奶油风、暗黑轻奢风、跳脱童趣风三种不同作风的装修成果,三个户型必须一致。
关于这么的问题,文心 X1 能屡次勾通调用 AI 绘制等器用,连气儿处分:
基于文心 X1 多模态自主应用器用深度想考、文心 4.5 原生多模态才略以及 DeepSeek 的推理才略,文小言图片问答才略更强了,还上新了不少多模态新功能。
多模态功能再升级
目下上新的图片问答功能不错这么玩:
能一次性上传或拍摄多张图勾通分析问答;也可在拍摄的经由中径直用语音书,说完话它会自动拍摄并识别语音进行作答。
基于文心 4.5 图片和会力,它的识别更强,能进行多图相比;基于文心 X1、DeepSeek,它的推理 / 输出更强。就像是红蓝 buff 皆加上了。
是以,仅凭借一个山头的一张像片,它就能分析出这是哪座山:
更复杂一些的任务,比如天气变暖想出洋旅游,东说念主生地不熟定哪个货仓拿合手不准?也不错让它帮衬照料照料。
径直上传几张货仓信息截图,提议需求:
从内部推选 2 个货仓,合适女生旅游住,有早餐,交通便捷,性价比高,给 RMB 报价和推选事理。
轻缩小松就能 get 一份详尽的推选指南:
诸如斯类,比如上传几张外文菜单,告诉它想吃什么口味的、预算是几许,它也不错帮你分析精良。
另外,百度把拍照搜题功能也整合过来了,文小言会自动调出百度多年累积的耕作资源,许多题目皆有视频版教养:
值得一提的是,新增的"图个冷知识"功能更富真感性,用户可预设"历史学者"、"科技达东说念主"等东说念主设视角,为统一图片赋予多维解读。
举例,当用户接头"猫窗探秘,为何猫爱窗边的科学真相?",文小言能从狩猎本能、能量获得、领地雄厚等角度给出专有解读。
再来看多模态另一个方面,语音通话功能,由百度的全新语音大模子加持。
据了解,该模子是百度在业界首个推出基于全新相互关爱重力(cross attention)的端到端语音讲话大模子,调用本钱较行业平均镌汰 5-10 倍,推理反馈速率极快,将语音交互恭候时候压缩至 1 秒傍边,极大晋升了交互显露性。
用下来,合座对话显露当然、延迟度低,belike:
相等要指出的是其中的百变大咖功能,复旧脚色师法和方言,能用各式深嗜的腔调陪你聊天;还有知识问答功能更专注于学问知识科普。
有了百变大咖,是以,你还不错听到广西版的睡前故事:
除了这些功能,文小言还和会了 AI 修图、AI 视频生成、写稿帮手、翻译、手抄报、听听音乐等诸多功能,感意思意思的童鞋不错躬行上手试试。
底下是 AI 视频生成,让图片动起来的成果:
AI 落地趋势变了
精良文小言这一次的大调动,不难发现它正朝着两个过失标的转变:生态更通达、用户价值第一。
此次径直将 DeepSeek 接入文小言,不怕跟自家新模子作念竞争,足以见其通达的决心。
当全球还在争论"文心 X1 与 DeepSeek 孰强孰弱",文小言早已跳出了单一模子竞争的维度,联袂更多伙伴,究其骨子,是为了带给用户更好的体验。
为什么会有这种转变?
背后是 AI 落地趋势正在发生的变化。
自 DeepSeek 从开源圈杀出重围,大模子竞赛渐渐呈现出一种戏剧性篡改,行业雄厚到模子本人正渐渐成为一种可替换的"范例件"。昔时比模子,就像比谁家的菜刀钢材硬,目下更比谁切菜顺遂,致使能帮你把土豆丝炒好了。
那时代红利渐渐开释后,怎样让 AI 解决真是场景问题成为过失,时代上风必须升沉为可感知的用户价值。
百度在 2025 开年后,无论是文小言免费,依然文心大模子开源,各样系列校正举措,即是盯准了 AI 落地的新趋势。
在这种配景下,文小言选拔的旅途颇具启示性——生态层选拔通达,另外皮场景层深耕,同期在价值层进行重构。
当作国产自研大模子开赴最早、累积最厚的玩家,文小言的新证实,遮盖小觑,或将有望成为新一轮被师法的对象。
一键三连「点赞」「转发」「注重心」
接待在指摘区留住你的主张!
— 完 —
� � 点亮星标 � �
科技前沿证实逐日见文爱 聊天