2025-08-01 07:12 点击次数:156
DeepSeek如同梁文峰参加到AI圈的一颗深水炸弹,它掀翻的巨浪依然在滂湃之中。受DeepSeek挑战,2月13日秘书,将于4月1日零时起,全面免费,通盘PC端和App端用户均可体验文心系列最新模子。同期,即日起,文心一言上线深度搜索功能,该功能也将于4月1日起免费通达使用。现时,用户可在文心一言官网上体验深度搜索功能,APP端也行将同步上线。
(图源:百度公众号)
此前,当作国内最早布局AI大模子的企业,百度旗下的文小言(即原文心一言App)还接入了DeepSeek-R1大模子。
在iOS平台,文小言App已更新至4.9.0版块,更新日记显现,该版块上线伴学模式、手抄报和作文等学习类功能,且接入DeepSeek-R1模子,优化拍照解题功能。
(图源:App Store截图)
文心一言免费、接入DeepSeek……百度的举措让不少网友吐槽,其AI手艺“如故掉队了,尽然要为我方的AI器用接入其他企业的大模子。”
在AI边界,百度的地位号称黄埔军校,培养了多数手艺东说念主才。文心一言曾经是国内AI大模子边界的领头羊,文心3.5便对标GPT-3.5,如今文心4.0、文心4.0器用版、文心4.0 Turbo三款大模子更是在豆包、Kimi、通义千问等宽广AI大模子免费提供就业的大环境下,执意罗致收费就业模式,优惠时间流畅包月用度高达43.9元/月(原价59.9元/月),可见百度的自信。
若计议百度在AI边界是否真是掉队,最粗拙顺利的活动即是将文心一言与其他AI大模子进行对比。因此,小雷决定将文心一言最强的文心4.0 Turbo和最近大火的DeepSeek-R1进行对比,不雅察文心4.0 Turbo的实力,部分问题还会用其他AI大模子进行测试,并在文中当作参考。
文心一言、DeepSeek大决战:不分仲伯
本次对比测试,小雷不再用AI大模子生成笔墨或转头内容,而是以测试推理才调为起点,口头共分为误导题、逻辑推理题、数学推理题三个部分。
1、误导题:DeepSeek-R1后起之秀。
AI大模子爆火之后,用户们就发现其遍及存在一个问题,即莫得谜底的问题AI也会凭空一个谜底。AI大模子已屡次迭代的今天,小雷十分介意,AI还会凭空谜底吗?
第一题,小雷向AI大模子发问“心肌干细胞有什么作用”。心肌干细胞(cKit+心肌成体干细胞)作秀是学术圈有史以来最大的丑闻,以好意思国为主的大宽广个筹商机构、大学、病院深陷其中,多数论文被动下架。面前科学界已基本已矣共鸣,心肌干细胞并不存在。
关连词AI似乎并不这样合计,文心4.0 Turbo给出的恢复是,心肌干细胞领有建造与再生心肌细胞、促进血管更生、抗炎和免疫迂曲、防护腹黑短少等作用。不仅仅文心一言,豆包、Kimi、ChatGPT等国表里AI大模子,全部齐给出了心肌干细胞的作用。小雷还有利稽察了文心4.0 Turbo提供了9条参考信息,发现齐是半年内AI生成的信息。
(图源:文心4.0 Turbo截图)
基于夙昔造作的论文,在东说念主为干扰的情况下,AI输出了造作的信息。此后其他AI大模子又把柄造作的信息,不断凭空造作的信息,这种情况或将成为改日终止AI手艺发展的关节因素。
不外在该项测试中,DeepSeek-R1却给出了卓尔不群的谜底,该大模子生成的内容显现,心肌干细胞表面上领有潜在作用,但筹商存在争议。尽管DeepSeek-R1的恢复仍有为心肌干细胞辩驳的因素,但至少如故跳出了问题自己,能够去分析心肌干细胞是否存在。
(图源:DeepSeek-R1截图)
其实顺利发问“心肌干细胞是否存在”,大多数AI大模子会给出存在和不存在两边的不雅点和例证,并加以分析。而向AI商讨心肌干细胞的作用时,AI则遍及依然会出现凭空谜底的情况。在第一轮测试中,能够率先跳出问题自己,去隆重了解心肌干细胞的DeepSeek-R1获得了奏凯。
2、逻辑推理:文心一言DeepSeek瓜分秋色。
能否运用题目中的信息,去推导出正确谜底,相同是困扰AI大模子的难点。本轮测试中,小雷选拔了一齐悬疑逻辑推理问题:
一位画家被发现死在一间老旧的画室中,应付来往木质料板齐发出吱吱声。画家死在画板前,正画着自画像,是被东说念主从背后用匕首刺杀。手上仍持着画笔,警方锁定了2名嫌疑东说念主。一位是画家的一又友,但欠下画家巨款。一位是曾屡次出当今隔邻的流氓,有入室掠夺的前科。是谁刺杀了画家?(正确谜底:画家的一又友)
本轮测试文心4.0 Turbo和DeepSeek-R1打成平手,两边把柄题目说起的印迹,平分析出了画家的一又友才是杀害画家的真凶。
这说念题并不难,联接以上印迹,东说念主类其实很容易分析出画家的一又友才是真凶的谜底。关连词当小雷用其他豆包、Kimi、文心3.5、通义千问、7B参数的DeepSeek-R1等大模子推理该题时却发现,只好豆包给出了正确谜底,其他几款大模子全部给出了造作谜底。最离谱的是Kimi,推理历程中一直在强调画家的一又友嫌疑更大,但最终谜底却是隔邻的流氓。
(图源:Kimi截图)
本轮测试中,文心4.0 Turbo和DeepSeek-R1打成平手,齐奏凯推理出了正确谜底,况且相较其他AI大模子,发达也愈加出色。
3、数学推理:DeepSeek败下阵来。
能否快速、正确解答出数学题,一直是考证AI大模子是否领有确凿推理才调的紧迫测试口头。该法子小雷选拔了一齐概率关连的数学题:
一架飞机上有一百个座位,编号是从1到100。当今编号为1到100的乘客顺序坐上飞机。编号为1的乘客上了飞机之后,立地(等概率地)坐座位。编号为2的乘客上了飞机之后,他先看有莫得东说念主坐在2号位上,如果有,那他就在剩下的位子里立地(等概率地)挑选一个,如果莫得东说念主坐,他就坐在2号位上。3号亦然一样,如果前边有东说念主如故坐了3号位了,他就在剩下的位子上应付挑一个坐,反之则坐我方的位子。依此类推,临了问题是,第100个东说念主坐在第100号位子上的概率应该是若干。(正确谜底:1/2)
这说念题相同存在多数误导信息,若能正确意会题目,其实终点粗拙。在本轮测试中,文心4.0 Turbo、DeepSeek-R1、通义千问、豆包、Kimi等大模子,全部恢复出了正确谜底。
真谛的是,即便濒临如斯粗拙的问题,依然有一个大模子恢复造作,那即是文心3.5。在一番运筹帷幄之后,文心3.5尽然给出了概率为99/100的离谱谜底。
(图源:文心3.5)
磋议到上一齐题目难度不高,小雷决定再加入一齐附加题:
甲、乙两东说念主各有四张卡片,每张卡片上标有一个数字,甲的卡片上永诀标罕有字1,3,5,7,乙的卡片上永诀标罕有字2,4,6,8,两东说念主进行四轮比赛,在每轮比赛中,两东说念主各自从我方持有的卡片中立地选一张,并相比所选卡片上数字的大小,数字大的东说念主得1分,数字小的东说念主得0分,然后各自弃置此轮所选的卡片弃置的卡片在此后轮次中弗成使用则四轮比赛后,甲的总得分不小于2的概率为?(正确谜底:1/2)
这说念题小雷此前曾测试过,豆包、通义千问、Kimi、文心3.5等大模子全部未能解出正确谜底。本轮测试中,豆包、通义千问、Kimi、文心3.5再次恢复造作,但独一恢复正确的大模子并不是DeepSeek-R1。
DeepSeek-R1推理这说念题耗时足足728秒,最终给出的谜底却是13/24,跨越12分钟的推理时期齐没能给出正确谜底,令小雷有些失望。
(图源:DeepSeek-R1截图)
不被小雷看好的文心4.0 Turbo,竟然用时不到两分钟,就运筹帷幄出了正确谜底。确信不啻小雷,绝大多数网友齐莫得预奏效用会是这样。
(图源:文心4.0 Turbo截图)
近期知乎常常给小雷推送问题“DeepSeek对文心一言有什么影响”,评述区险些清一色斥责文心一言。关连词本次评测却证明,文心一言在推理方面并不落伍DeepSeek-R1,依然稳居AI大模子第一梯队。
在才调不输DeepSeek-R1,部分测试发达当先豆包、Kimi、通义千问等AI大模子的情况下,文心一言的口碑却并不睬想。奈何蜕变这一场所,值得百度深念念。
百度“掀桌子”,文心一言能否逆天改命?
在与DeepSeek-R1对比测试之前,小雷本以为文心4.0 Turbo会输,骨子效用却打了小雷的脸,这两款大模子在不同边界互有上风,但才调差距不大。文心一言之是以给小雷留住了发达不行的印象,是因为小雷平时使用文心一言时,总会选拔免费的文心3.5大模子。
通过以上实测不难发现,文心4.0 Turbo与文心3.5的才调号称云泥之别,三说念推理题文心4.0 Turbo全部恢复正确,而且推理任务所需时期极短,文心3.5却全部恢复造作。
不是用户不肯意用更高大的文心4.0 Turbo,而是不菲的用度为文心4.0、文心4.0器用版、文心4.0 Turbo筑起了高高的门槛,拦阻用户体验它。如若在国外市集,43.9元/月的用度对比20好意思元/月起步的ChatGPT-GPT并不算贵,但在国内市集,豆包、Kimi、DeepSeek、通义千问等AI大模子均免费提供就业,用户不免更倾向使用它们。
(图源:雷科技摄制)
百度急于收获的心态小雷不错意会,毕竟设备AI大模子的老成老本和提供就业的推理老本齐不低,现阶段通盘企业的AI大模子业务齐在亏欠。可AI行业仍处于市集开拓阶段,其他企业齐在通过免费提供就业争夺用户,百度却先一步开启收费模式,将多数潜在用户拒之门外。
酒香也怕胡同深。2月13日,百度秘书文心一言将在4月1日绝对免费,这是镌汰AI门槛、劝诱多数用户的最好决策。百度这一举措跟比亚迪将高阶智驾标配到全系车型可同日而说念,齐是推进AI普惠的举措。
短期的亏欠难以幸免,奈何让用户变成对文心一言的依赖,才是百度需要磋议的要害问题。承受一段时期的亏欠,换来的可能是改日成为AI行业的训导者,并赚更多钱的契机。就跟比亚迪用“掀桌子”的技巧,力图不才半场成为智驾训导者一样。
当作一个国民级AI器用,免费并阻碍易,文心一言莫得在2月13日顺利免费,而是将时期推迟到4月1日,约略百度还有多数的责任要作念。
险些是清除时期,OpenAI也秘书免费版ChatGPT在范例智能成立下将不错泛泛止使用GPT-5,尽管未能如百度一般十足免费,但也能看到OpenAI的腐败。跟着文心一言和GPT-5范例智能模式免费通达,通盘AI大模子边界的竞争也将迈入新阶段,DeepSeek的性价比上风也将很难接续。当今,压力似乎正在升沉到DeepSeek这一边。
Powered by 九游(jiuyou)体育 官方网站-登录入口 @2013-2022 RSS地图 HTML地图
Copyright Powered by站群系统 © 2013-2024