您的位置:首页 >资讯 > 热点 >

大模型扎堆「赶考」,语文还是国产AI行,文言文能力超过95%考生 当前快报

2023-06-08 17:02:12    来源:量子位公众号

ChatGPT诞生后的第一场全国高考,考生忙,大模型们也很忙。

这不,高考还没结束,AI挑战高考题就成了刷屏热搜话题,各家大模型都被拉出来写起了高考作文,甚至是参与整场考试。


(资料图片)

(不知是不是巧合,Bard还在下午数学高考后,紧急升级了一波数学推理能力……)

结果,竟然有大模型写的作文,把资深高中老师都骗过了!

就在考试当天,百度搜索正在内测的“AI伙伴”,现场直播挑战了一套语文试题。

从“基础题”文言文翻译编程客栈、阅读填空、古诗词赏析,到“拉分题”微写作和作文,AI伙伴全部上手做了一遍。

结果,当9份“混进”了AI伙伴作品的高考作文送到语文老师庄临旭手上时,他完全没发现有篇是AI写的:

紧接着,AI伙伴展现的文言文理解能力,更是把资深老师吓了一跳:

一整场直播下来,就连围观了AI伙伴考试全程的毕导都感慨:

所以,集成了百度语义检索技术+大模型能力于一身的AI伙伴,整场考试表现具体如何?

咱们一项一项展开来看。

“AI考生”现场挑战语文高考

先来看看大模型的“基础题”——古诗词赏析。

面对情感和写法的“找不同”问题,百度搜索AI伙伴胸有成竹,不仅给出了明确的修辞手法,还进一步分析了古诗的来历和情感,属实是阅读理解十分到位了:

再到阅读填空。面对文章解读和“续写句子”能力,AI伙伴同样毫不逊色:

那么,来看看大模型的“拉分题”写微作文,依旧没什么问题!

要是小作文体现不出来,再来看看AI伙伴作诗的能力。不仅现代诗手到擒来,甚至连藏头诗都能搞定:

不过,要是再仔细一点搞搞提示词工程,AI伙伴似乎就答得更好了。

以高考语文题目中的古诗词理解为例,这里我们先在不给提示词的情况下,把题目原样“喂”给AI伙伴:

AI伙伴给出来的答案虽然也不错,但对于高考题目来说,这答案着实有亿点长,也有点太仔细了:

接下来,给AI伙伴换上强调“最重要的三个意象”的提示词。

果然,AI给出了更精准的回答,指出包括病柏、丹凤和鸱鸮在内的三个意象,是最关键的:

但是,上述都还只是直播中展现出来的效果。像AI伙伴这类有大模型加持的功能,其使用效果是否真的和提示词工程强相关?

为了测测AI伙伴的“真正实力”,我们亲自上手测了测它做高考题的效果。

直播中已经做过了全国甲卷的作文题目,那么我们再来试试今年上海卷的作文。

第一轮,我们直接把题目甩过去:

看起来,AI伙伴虽然理解了文章“主旨”,但写出来还差点意思:论点不够明确,作文的结构也不太清晰。

第二轮,我们试着换了一下提示词,给AI伙伴设置一个“角色扮演”效果。

首先,强调它是一名高考考生,然后给它“灌输”一些高考作文的写作技巧:

这一轮,AI伙伴写得就有高考作文内味了。

不仅给出了10字以内的标题,还按照总分总、夹叙夹议的方式,很好地写出了一篇议论文:

看起来,挖掘大模型的潜力,很大程度上确实要依靠提示词工程。

在直播中,百度集团副总裁、搜索平台负责人肖阳还给我们列举了一个非常简洁的提示词公式:

提示词 = 任务 + 角色 + 上下文背景 + 细节补充。

有了它,不用再担心大模型输出和设想无关的答案了。

当然,作为百度“用大模型重塑搜索能力”的终极杀器,AI伙伴能实现的功能,也远不止是做做高考题而已。

最早在2023万象百度移动生态大会上官宣发布的AI伙伴,目前已经开启内测,获得试用资格后,可以直接从百度搜索界面进入:

它的本职工作,更像是一个搜索引擎端的全能AI助理,不仅具有智能搜索能力,还兼具创作生成技艺:

一方面,AI伙伴相当于一个对话版智能搜索工具。用它查资料,不需要再按关键词搜索,直接“用人话”提问就行:

不仅如此,每一句回答都有理有据,如果想要“追根溯源”,直接点链接就能跳转到对应的网站:

这样一来,就不用担心它会出现像ChatGPT整理文件那样,出现“无中生有”一些案件的操作了。

另一方面,它又相当于一个多模态大模型创作助手。

不仅可以帮助查资料、写周报、画头像,还能陪你模拟面试、甚至替你约会(?)。

这里我们借助AI伙伴的“程序猿小助手”,来试试生成一段代码的能力。

以面试可能会考到的冒泡排序算法为例。

很快啊,几乎没有怎么思考,AI伙伴就给出了一段带注释的冒泡排序算法,最关键的是,它自己已经运行过,并成功输出了一段结果!

这意味着我们不需要再自己去跑一遍这段代码,而是能直接将它交给面试官了(doge)

从上面这些展现的能力来看,AI伙伴所能做到的,远非仅仅提供高考试题“参考答案”而已。

这次选择用它挑战高考题,大家伙可能看的是个新鲜php劲儿,但“术”的表象之外,更值得关注的是“道”的变化:

使得AI伙伴能在高考题面前依旧“神采飞扬”的大模型技术,正在以搜索引擎的代际变革为基点,席卷各行各业,甚至改变每个人的工作方式。

正如ChatGPT搅动风云之初,微软CEO纳德拉预测的那般:搜索正面临巨变。

并且变化的不仅仅是搜索的技术、产品本身,这一次,更与每一个个体有了更紧密的关联。

搜索三变

百度CEO李彦宏同编程客栈样认为,“大模型即将改变世界”。基于这样的判断,李彦宏2023年一季度OKR,便指向了“引领搜索体验的代际变革”。

现在,三个月过去,大模型究竟如何变革搜索,现在答案已经越来越清晰。

从技术的角度出发,大语言模型的爆发,正在重新定义人机交互。

对于人类而言,最自然的交流方式就是语言沟通。而大模型的代际突破,最直观的一点体现,就是机器自然语言聆听和表达能力的飞速提升。

搜索本身,就是一种人机交互的核心方式。其本质的技术追求,就是要让机器更高效地理解、推理、表达,化复杂问题为直观的第一条搜索结果。

因此可以说,大语言模型的突破,正在全面激发搜索全新的潜能。

值得关注的一点是,伴随着AI的发展,搜索始终都是最前沿AI技术最先落地的场景。

以百度搜索为例,围绕“降低用户表达需求门槛”、“降低用户获取内容和服务的门槛”、“丰富搜索引擎的内容供给”这三个目标,百度搜索一直在AI技术上大量投入。

引入大模型之前,百度搜索已经实现:

千亿级全网索引;

全球领先的深度语义理解技术,相关成果曾获2020年国家技术发明奖二等奖;

最大中文知识图谱,覆盖50亿实体。

从产品的角度看,过去三个月,数据已经证明,对话式搜索正在成为搜索引擎市场的一个新变量。

百度集团副总裁、搜索平台负责人肖阳就透露,大模型加持下的AI伙伴,在内测阶段就已爆火,相关搜索问答量激增。

这进一步佐证大模型带来的新人机交互方式,更能满足人们对搜索“快速”、“有效”的诉求。

牵一发而动全身,在现在这个时间节点,围绕搜索的内容生产和创作领域,创新模式也开始逐渐显现,并被积极地探索实践。

同样是在万象大会上,百度搜索还配合AI伙伴,推出了AI BOT解决方案。目的就是向内容、服务生产者释放大语言模型和AI技术能力,降低其与新搜索模式融合的门槛。

具体来说,百度搜索提供了创作者、商家、机构、服务和品牌等各类型的AI BOT,让他们能够利用自身优势和独特的内容、知识、服务,创造虚拟分身,直接回答用户的问题。

在技术和产品之外,更与每个人息息相关的,是用户搜索方式的改变。

正如前文所展示的,大模型时代,“提问编程题”的能力正在变得越来越关键。

体现在现阶段,就是提示词写得好不好,会直接影响搜索生成结果的质量。是否掌握提示词工程能力,就像互联网时代开启时,是否掌握搜索能力一样关键。

对此,肖阳提到了“搜商”的概念:

也就是说,找到合适提示词的能力越强,越能在大模型落地应用的时代里,充分利用大模型的强大生产力。

可以说,大模型刮起的时代风暴之下,搜索三变,既是内在技术瓶颈的代际突破,亦是外在人类接触信息方式的彻底变革。

无怪乎肖阳作为技术变革的一线亲历者,会有这样的判断:

并且这一次,或许每一个人都会真真切切感受到这种代际变革带来的影响。

One More Thing

说起来,就在高考这两天,AI加持下的百度搜索,忙的还不止有刷题这件事儿。

每年此时,百度都会启动专门的高考服务,通过搜索和AI核心技术,为考生和家长提供便利。

今年,百度还基于AI技术,首次推出了高考搜索指数,涵盖专业搜索热度及变化趋势、“院校PK”等信息。考生家长在择校选专业的时候,可以更方面地参考对比。

AI志愿助手也进行了重大升级,能更直观地展示志愿预测结果,提供相关数据来辅助考生家长做决策。

对了,利用高考搜索指数和其他高考相关搜索数据,百度还联合中国教育在线掌上高考发布了不少有意思的数据:

高校方面,搜索热度最高的本科院校里,南方高校霸榜双一流和非双一流大学前十。

专科院校中,山东是搜索职业教育最多的省份。

专业方面,医学搜索热度断层第一,航空航天热度攀升最快。

而最有“钱”景的,是船舶电子电气工程……

—完—

相关阅读

精彩放送

热点聚焦:皓晨韩羽斩杀黑风蛇王,侠隐回归夜探魔族大营,青妖魔神霸气登场

苹果发布工具包:在MacOS流畅游玩2077等游戏 焦点热议

环球看热讯:品牌史上最小SUV 沃尔沃EX30全球首发亮相

阿莱德董秘回复:公司产品可应用于上述领域,公司在深耕通讯领域的同时,积极布局并开发...

每日热门:2023年三星手机还会爆炸吗?

光遇橙色光芒在哪_光遇橙色光芒是在那里呢_焦点快报

天天讯息:代工是什么意思啊(代工是什么意思)

中级经济师《经济基础》每日一练(2023.06.08)_当前短讯

突发,闪崩跌停|环球快消息

海联金汇:公司智能制造板块将乘新能源快速发展的大势继续聚焦汽车零部件业务,金融科技...

中集来福士获世界级“滚装船技术与环境奖”

环球今头条!小米平板2充电接口

赵丽颖谢娜,黄景瑜,热巴,华晨宇,范丞丞-快报

@ 全国游客,贵州国有A级景区门票五折优惠_世界短讯

注意!时代万恒将于6月28日召开股东大会 今日热搜

淄博在全省首推“无还本续贷”创业担保贷款,企业无需还本也可续贷

广东省发文进一步完善和落实积极生育支持措施_即时看

【全球新视野】北京居住区新能源车充电试点!服务费将不高于0.5元

世界热点评!手机显示屏坏了还能修吗

即时焦点:深交所向联络互动发出问询函

《海南往事》第十八期:这栋带有金色字匾的骑楼,你知道它的故事吗?

每日热议!华为vr眼镜官网_华为vr怎么用 怎么玩 华为VR眼镜怎么使用教程

菏泽:是时候给你点颜色看看~-焦点观察

大米的营养成分_视点

天天时讯:办公用品发票明细清单_办公用品大全

焦点观察:快手拿什么拯救持续下滑的广告业务?

【天天新视野】到“十四五”末,山东全省将培育建设工匠不少于1万名

通讯!国内商品期货收盘 甲醇跌超3%

焦点速递!五款大模型谁最强?ChatGPT实测高考作文全国卷:《时间的主人与奴隶》

环球即时:受贿1992615.31元!陈克祥一审获刑三年半!

马鞍山市市场监管局发布端午粽子消费提醒

全球快消息!意法半导体携手三安光电,推进中国碳化硅生态系统发展

信息:南疆阿克苏的“流量密码”

环球热讯:放弃造车,苹果把虚拟现实放入“快车道”

热头条丨卡霍夫卡水电站大坝遭袭 芝加哥期货交易所主要农产品期价上涨

翻译英文翻译中文_昔有二翁同邑而居翻译和注释

华安证券:苹果开拓性MR新品发布 持续催化传媒行业内容生态型企业向好

寡助之至的下一句_寡助之至的之翻译

全球热文:泰国恐怖片校园怪谈在线观看_泰国恐怖片

前海深港风投创投“十八条”措施发布 助力深港科技创新合作迈向新台阶

中小商家迎来红利,淘宝发布中小商家造星计划 世界报道

每日速读!基金调研丨长安基金调研亿嘉和

6月7日国内钴市行情汇总-天天快资讯

天天视点!白蚁防治方法_白蚁如何防治

【全球独家】中炬高新两副总经理辞职,因涉嫌违法犯罪已被移送检察机关

“身兼多职”,社区达人用业余时间为社区居民点亮乐趣

潮汕美食大全_潮汕美食小吃介绍

淳于髡怎么读音是什么意思_淳于髡怎么读 今日报

中油工程:积极布局“双碳三新”新赛道-环球最资讯

康乐县这个搬迁安置项目正在加速建设

兴业科技:宏兴汽车皮革已是如理想、蔚来、问界等的内饰皮革供应商 焦点播报

甘肃榆中乡村农耕博物馆:馆里留“乡愁”

今日观点!液压行业市场深度调研 2023液压行业发展前景投资分析

天天热文:23安徽债61今日发布发行公告

庄浪县气象台发布雷电黄色预警信号【2023-06-07】

SK-II、OLAY计划在王府井集团旗下门店卖出2.5亿元 热闻

23安徽债60今日发布发行公告-每日热闻

省委老干部局主题教育调研组来金塔县调研

大盘震荡分化,多只恒指科技ETF涨近3%,锂电池相关ETF跌幅居前

饭圈什么意思_关于饭圈什么意思的介绍

环球最新:名师点评海南高考作文:降低审题难度 让考生有话说

每日关注!江西临川:“维权娘家”情系农民工

当前快讯:组图|2023年海南陵水黎安国际教育创新试验区知识产权沙龙活动举行

世界快看:百洋医药:公司是专业的健康品牌商业化平台,目前并未合资建厂

国恩股份:子公司益青生物“新型空心胶囊智能产业化项目”目前正在按计划进度进行建设,...

鲁平_关于鲁平简述 焦点讯息

鲁平德·帕尔·辛格_关于鲁平德·帕尔·辛格简述

环球快消息!浦东金桥:本次担保金额合计人民币 5.0334 亿元

期市收评 | 商品市场多数收跌 甲醇跌超3%_当前速讯

南疆阿克苏的“流量密码”-环球速讯

全球快看:《山河令》制片人马韬去世 多位工作人员发文悼念

焦点热门:沙特政治学者:沙伊复交有助于中东地区稳定与发展

长春高新回应股价跌停:公司经营一切正常 集采对业绩影响“中性偏好”|世界今日报

速递!博敏电子:截至本公告披露日 公司及其控股子公司对外担保总额为约26.88亿元

注意!森特股份将于6月28日召开股东大会 热资讯

天津普林拟关联收购 被问高溢价是否损害上市公司利益

世界视点!孟广禄为她打call,北京京剧院老旦王中女来杭开专场

拥抱新能源布局稀有金属 工银瑞信稀有金属ETF基金重磅发行

世界动态:爱康医疗尾盘涨近4% 招银国际给予买入评级

关注2023高考|渝北警方开出首张高考场外鸣笛罚单-天天速看料

新消息丨商务预报:5月29日-6月4日国内重要生产资料价格情况

美议员借军舰事件称要“坚决反对中国的欺凌”,外交部驳斥!-每日热门

南向资金今日净买入2.41亿港元

【世界时快讯】*ST越博与财务总监徐方伟收警示函 业绩预告两度不准

环球视点!长春高新跌逾9%,董办工作人员回应公司一切正常

聚焦:商务预报:5月29日至6月4日食用农产品价格总体平稳 生产资料价格略有下降

发现两例!北京疾控提示

618特惠!美的【礼盒套装】挂烫机家用手持蒸汽熨烫机减20元啦

长春高新跌逾9%,董办工作人员回应公司一切正常

优博讯:公司目前生物识别技术主要为人脸识别

上海钢联、新通联共设数据科技新公司

全球今日讯!欧洲开盘涨跌不一 德国DAX30指数涨0.06%

焦点资讯:涨停雷达:零售个股异动 国光连锁触及涨停

东田微涨20.00%_播资讯

长安汽车回应“克扣供应商10%货款”:内容不实

健之佳:王雁萍女士累计质押的公司股份数为129万股 环球新消息

快报:杰创智能:与南方电网等有业务合作并承接部分智能化业务

华为100%自研数据库发布:国产替代重大进步,中国第一金融云!_全球今热点

【活跃度】6月7日商品期货活跃度排行榜:原油、菜油、橡胶位列前三

杨紫高考前采访视频曝光,学业为主规划好未来,众星为考生打call

初中女厕精品视频网站(0女厕大小便)_世界热点

全球快看点丨景德镇一餐饮店发生爆炸,官方回应:事故正在处理中

龙舟赛期间南昌免费发放1万张景区门票_世界即时看

中国东航:8月旅客周转量同比上升62.14%

大郑爽老公_大郑爽 环球快讯

今日关注:长期失眠多梦怎么回事_经常失眠多梦是怎么回事 经常失眠多梦的原因是什么

表演系艺考考什么学校_表演系艺考考什么_天天热议

大理市2863个国资收费车位,高考期间送考车辆可免费停!-当前讯息