肛交哭一手实测！文心X1/4.5 Turbo推理和多模态双双变强，还把模子资本降了6成？！

热点资讯

肛交哭一手实测！文心X1/4.5 Turbo推理和多模态双双变强，还把模子资本降了6成？！

发布日期：2025-04-27 09:58 点击次数：60

"周周有发布肛交哭，天天有更新。"

这是百度独创东谈主李彦宏最新对大模子竞速的欷歔，但……卷王内容即是百度我方，因为就这一个多月以来，百度仍是连发 4 款模子了。

就在刚刚，在 Create 2025 百度 AI 设备者大会上，李彦宏又连气儿官宣了两款新模子：差别是主打深度想考和多模态的 X1 Turbo/4.5 Turbo。

况兼发布即上线，正常用户咫尺都能免费体验。

据先容，它们是百度在 3 月发布的旗舰模子 X1、4.5 的升级版，推理和多模态身手双双更跃 Level。

比如在挑战"史上最难高考数学题之一"时，新模子是为数未几能给出正确谜底的选手（正确谜底为 145）：

一个冷学问，2003 年数学寰球卷被誉为"史上最难高考卷"，而这谈题如故内部的压轴大题，难度无庸赘述。

以至，于今还能看到一众自称 03 级的网友集体"诉苦"：

再比如濒临一段让东谈主头晕眼花的视频，新模子竟得胜猜对了小球的位置（原视频如下）：

正确谜底是3 号杯子，话说公共最终猜出来了吗？ ( doge）

凭据官方测评限制，深度想考模子文心 X1 Turbo（深蓝），举座恶果最初 DeepSeek R1、V3 最新版。

文心 4.5 Turbo（红色），多模态身手优于 GPT 4o，文自身手与 DeepSeek V3 最新版握平，优于 GPT 4.5。

咫尺，两款新模子均在文心一言官网盛开，设备者在百度智能云千帆大模子平台，也可成功调用 API。

另外，最要道的如故资本的下落！

文心 4.5 Turbo 输入 0.8 元 / 百万 tokens，输出 3.2 元 / 百万 tokens；文心 X1 Turbo 输入 1 元 / 百万 tokens，输出 4 元 / 百万 tokens。

以上价钱，前者仅为 DeepSeek V3 的 40%，后者仅为 DeepSeek R1 的 1/4；同期比较一个月前的 X1/4.5，价钱均下落一半及以上。

大模子身手在进化，资本不才降，应用立异的大爆发将势不可挡。

只不外，咱如故先从一些具体身手上，望望百度最新最弘远模子文心 X1 Turbo/4.5 Turbo，究竟是不是像跑分展现的那么强？

老法例，上一手实测～～

实测之后，如故太全面了！

开始来看主打深度想考的文心 X1 Turbo 模子。

据先容，它基于文心 4.5 Turbo，在性能擢升的同期，具备更先进的想维链，尤其擅长推理和用具调用。

文心大模子 X1 Turbo

一上来，咱们先拿一齐经典逻辑罗网题热热身：

一根 5.5 米的竹竿不错通过高 4 米宽 3 米的门吗？

关于这么一个看似浅易的问题，咫尺市面上绝大精深的模子响应 be like：

而文心 X1 Turbo 经过一番严谨论证，第一次就得出了正确谜底（通过诊治竹竿的歪斜角度，不错通过）：

看来这种问题仍是难不倒它了，接下来难度升级。

成功一步到位，扔给它一齐某地高中物理模考卷压轴题，如故只上传图片的那种：

不错看到，关于这种波及专科鸿沟的高难度推理题，X1 Turbo 依旧想路明晰。

先是自主调用"图片意见"用具识别出题目与火箭辐射干系，然后上手一步步解题，最终给出了正确谜底。

值得提神的是，尽管查考的是 X1 Turbo 的逻辑推理身手，但咱们仍是提前发现它的一大特点——

与其他推理模子比较，文心 X1 Turbo能够纯真调用各样用具。

官网线路，文心 X1 Turbo 默许开启代码讲授器、文档阅读、图片意见、图片生成等诸多用具，一朝清晰到谜底波及代码、表格、图片等多模态内容，就会自动调用这些用具。

比如在日常生计中，咱们唾手将一张好意思食照共享给文心 X1 Turbo，让它帮衬反向领会详备制作过程。

况兼为了便于保藏肛交哭，咱们还条件它最终成功生成一份PDF 文献：

看来挑战如故太浅易了，好好好，接下来咱们干脆玩把大的。

让文心 X1 Turbo 帮咱们筹算一个五一去北京游玩的行程，况兼提了一大堆条件，不成太"特种兵"，住宿、交通、门票等等都要谈判到，限制用表格呈现……主打一个全面检修用具调用。

话未几说，来感受一下最终恶果：

不仅贴心标注了"五一滑程—— 8 点当然醒版"（doge），况兼表格中每一天的安排都额外明晰，以至非常标出了需要提前预约的景点和预约渠谈。

再仔细一看，归并天安排的景点的位置都比较连合，属于合理鸿沟。

此外，咱们还发现文心 X1 Turbo 复旧持续对话生成，能在前边的行程筹算上，接着为每个景点生成配图。

终末趁机一提，咱们在测试文心 X1 Turbo 的推理和用具调用身手的过程中，还发现它在创意写稿方面有点意象。

恰逢五一假期邻近，咱们让它凭据一张"西湖东谈主山东谈主海图"，仿照《岳阳楼记》的文风写一篇纪行。

对比一下《岳阳楼记》原文，是不是有内味儿了 ~

庆历四年春，滕子京谪守巴陵郡。越来岁，政通东谈主和，汹涌澎拜，乃重修岳阳楼，增其旧制，刻唐贤今东谈主诗赋于其上，属予作文以记之……

性生活

其次来看主打多模态的文心 4.5 Turbo 模子。

据先容，它源自文心 4.5，是恶果更好、资本更低的多模态大模子。

文心大模子 4.5 Turbo

实测下来发现，比较单项推理身手隆起的文心 X1 Turbo，它更像是一个主打抽象实力的"六边形战士"。

切换模子后，底部输入框的文档、图片、视频、音频等多模态功能全部"点亮"：

文自身手就无谓多说了，咱们成功上传一张经典梗图，查考其视觉意见身手，限制亦然秒秒钟 get~

再来个实用的，让 4.5 Turbo 想象一些包含故宫博物院元素的雪柜贴文创。

疏通教导词下，通过对比文心 4.5 和 4.5 Turbo，不错看到后者的生成恶果照实更好、更缜密了。

终末，文心 4.5 Turbo 也能意见音视频素材。

一方面不错成功和它语音对话，亲测用四川方言也能结束无拦阻交流：

另一方面还能抽象分析视频中的场景、声息、东谈主物等等，咫尺单个视频最大复旧 20MB。

小结一下，百度这次推出的文心大模子 X1/4.5 Turbo，实测下来在推理身手和多模态身手上照实有一定进度升级。

那么接下来的问题是：背后依靠了哪些中枢期间？

挖一挖背后的期间在想考旅途中和会用具调用

开始，行动能够自主利用用具的深度想考模子，文心 X1 Turbo 背后的要道期间包括：

其一，冲破了仅基于想维链优化的范式，在想考旅途中讨好用具调用，构建了和会想考和活动的复合想维链，模子搞定问题的身手得回显贵擢升。

其二，讨好多元长入的奖励机制，结束了长距离想维和活动链的端到端优化，显贵擢升了跨鸿沟搞定问题的身手。

一般而言，传统的单一奖励机制通常只可从一个角度评估模子的性能，这可能导致模子"纳履踵决"，比如过于珍视语法，可能就会忽略语义的连贯性。

而多元长入奖励机制是从多个维度全面评估模子的性能，这种抽象性的反馈机制能够匡助模子在多个方面同期优化，从而擢升举座实力。

禁受不同模态羼杂考验

其次，为了擢升文心 4.5 和 4.5 Turbo 的多模态身手，一大约道即是禁受了不同模态（文本、图像和视频）的羼杂考验。

针对不同模态数据在结构、规模、学问密度上的互异，主要应用了如下期间：

多模态异构群众建模

自稳当分辨率视觉编码

时空重摆设的三维旋转位置编码

自稳当模态感知失掉狡计

最终，模子的学习效力提高近 2 倍，多模态意见恶果擢升向上 30%。

况兼为了进一步擢升模子的抽象实力，他们在后考验阶段也进行了优化。

研制了自反馈增强的期间框架，基于大模子自身的生成和评估反馈身手，结束了"考验 - 生成 - 反馈 - 增强"的模子迭代闭环。

这不仅搞定了大模子对皆过程中数据分娩难度大、资本高、速率慢等问题，况兼显贵裁减了模子幻觉，擢升了模子意见和处理复杂任务的恶果。

此外皮考验阶段，他们还研制了和会偏勤学习的强化学习期间，通过多元长入奖励机制，擢升了对限制质地判别的准确率，通过离线偏勤学习和在线强化学习长入优化，进一步擢升了数据利用效力和考验巩固性，并增强了模子对高质地限制的感知。

恰是因为受益于偏好信号与奖励信号的和会利用，模子的意见、生成、逻辑推理和追思等身手才得以全面擢升。

数据的合理挖掘及利用

固然，能够考验出高质地模子，还离不开对数据的合理挖掘及利用。

在这方面，他们打造了"数据挖掘与合成 - 数据分析与评估 - 模子身手反馈"的数据设备闭环。

主要体咫尺两点：

一是针对专科深度学问及鸿沟过程学问的数据稀缺问题，研制了旨趣启动、过程评估与限制校验的数据合成期间、学问点启动的大规模稀缺数据挖掘期间，擢升数据的学问密度和障翳面。

二是针对不同模态数据割裂、跨模态语义干系难度大等问题，建议了和会语义对皆的多模态平行数据构建、和会视觉学问的描述生成等期间，大幅擢升不同模态数据的对皆精度和深度语义干系，增强多模态意见身手。

最终结束了——既能滚滚束缚地分娩学问密度高、数据各样、鸿沟障翳广的大规模数据，还能将数据设备经由庸俗迁徙到全新的数据类型。

考验推理中禁受合资优化

除了上头这些，期间团队还进行了模子的算力优化。

考验方面，多模态长入的掩码提神力加快，利用飞桨已有的块状掩码提神力加快期间，显贵裁减不同模态混总狡计提神力时的掩码构建和狡计支出，大幅擢升考验性能。

推理方面，多模态流式分块预填充机制，减少首 token 耗时，同期减少推理狡计的显存峰值，擢升推理批次大小，擢升朦拢性能。

况兼值得一提的是，设备者还能利用百度飞桨框架 3.0，"像写单机代码相通写散播式代码"，借助其动静长入自动并行期间，设备者无需感知复杂的通讯和篡改逻辑，即可结束大模子的设备。

咫尺，文心飞桨的设备者数目仍是向上了 2185 万，做事向上 67 万家企业，创建的模子达到 110 万。

改日，跟着百度进一步走向开源，设备者也能通过该框架结束更多开源模子的高性能推理了。

把分娩力资本打下来了

期间上所具备的中枢上风，最终也让百度把模子价钱狠狠打下来了。

还在一个月前，百度发布的文心大模子 X1 和 4.5，就因为低于 ChatGPT 和 DeepSeek 的价钱出圈。

而咫尺发布的文心 X1 Turbo/4.5 Turbo，模子性能升级的同期，价钱却进一步裁减了。

文心大模子 X1 Turbo API，输入价钱 1 元 / 百万 tokens，输出价钱 4 元 / 百万 tokens，仅为 DeepSeek R1 调用价钱的 1/4，况兼比较文心大模子 X1，价钱成功腰斩。

文心大模子 4.5 Turbo API，输入价钱 0.8 元 / 百万 tokens，输出价钱 3.2 元 / 百万 tokens，仅为 DeepSeek V3 调用价钱的 40%，况兼比较文心大模子 4.5，价钱更是下落了 80%。

况兼不啻卷价钱，一朝梳理百度咫尺取舍的一系列动作，咱们就能看到一个中枢要道词——分娩力。

一方面，百度行动国内最早入局大模子的头部玩家之一，恒久矍铄插驾驭一代基础模子。

模子升级的主张，咫尺主要包括推理、多模态、用具调用等等，这些功能均围绕"分娩力"伸开，主若是为了得意正常东谈主的日常责任生计需要。

带来的限制是，越升级基础模子，咱们正常用户越能免费薅到更弘远的分娩力用具。

另一方面，他们还为设备者提供了全场所复旧。以文心大模子为例，咫尺仍是酿成了从模子到用具平台的齐备体系，包括文心 4.5、X1 等旗舰模子过甚 Turbo 升级版、文图生成模子、场景模子和轻量模子、文心一言和智能体，以及赋能设备者的数据分娩、后考验、推理部署和场景化用具等。

再加上模子价钱一降再降，设备者搞应用的门槛也更低了，这将鼓动 AI 应用进一步爆发，进而有望擢升通盘社会的分娩力。

这省略亦然百度这届 AI 设备者大会，主题"模子的世界，应用的天地"的要道原因，模子仍是随处都是、垂手而得，那么应用的爆发也就成为了势必趋势。百度独创东谈主李彦宏还预判："模子会有许多，但改日确凿宗治这个世界的是应用，应用才是王者。"

在发布终末，李彦宏的发言也激发了现场设备者的激烈掌声反馈，他说——

统共这些发布，都是为了让路发者们不错无谓牵挂模子身手、无谓牵挂模子资本、更无谓牵挂设备用具和平台，不错绳趋尺时局作念应用，作念出最佳的应用！

文心一言地址：

https://yiyan.baidu.com/

一键三连「点赞」「转发」「堤防心」

迎接在批驳区留住你的想法！

— 完 —

� � 点亮星标 � �

科技前沿阐扬逐日见肛交哭

肛交 哭 一手实测！文心X1/4.5 Turbo推理和多模态双双变强，还把模子资本降了6成？！

肛交哭一手实测！文心X1/4.5 Turbo推理和多模态双双变强，还把模子资本降了6成？！