您的位置:首页 >资讯 > 国内 >

大模型扎堆「赶考」,语文还是国产AI行,文言文能力超过95%考生

2023-06-09 06:02:03    来源:量子位

鱼羊 萧箫 发自 凹非寺

量子位 | 公众号 QbitAI


(资料图片仅供参考)

ChatGPT诞生后的第一场全国高考,考生忙,大模型们也很忙。

这不,高考还没结束,AI挑战高考题就成了刷屏热搜话题,各家大模型都被拉出来写起了高考作文,甚至是参与整场考试。

(不知是不是巧合,Bard还在下午数学高考后,紧急升级了一波数学推理能力……)

结果,竟然有大模型写的作文,把资深高中老师都骗过了!

就在考试当天,百度搜索正在内测的“AI伙伴”,现场直播挑战了一套语文试题。

从“基础题”文言文翻译、阅读填空、古诗词赏析,到“拉分题”微写作和作文,AI伙伴全部上手做了一遍。

结果,当9份“混进”了AI伙伴作品的高考作文送到语文老师庄临旭手上时,他完全没发现有篇是AI写的:

我是真没想到,AI还能写文言文作文

紧接着,AI伙伴展现的文言文理解能力,更是把资深老师吓了一跳:

凭借我的教学经验来看,超过95%的同学没问题。

一整场直播下来,就连围观了AI伙伴考试全程的毕导都感慨:

再来一次高考语文,我可能考不过它……

所以,集成了百度语义检索技术+大模型能力于一身的AI伙伴,整场考试表现具体如何?

咱们一项一项展开来看。

“AI考生”现场挑战语文高考

先来看看大模型的“基础题”——古诗词赏析

面对情感和写法的“找不同”问题,百度搜索AI伙伴胸有成竹,不仅给出了明确的修辞手法,还进一步分析了古诗的来历和情感,属实是阅读理解十分到位了:

再到阅读填空。面对文章解读和“续写句子”能力,AI伙伴同样毫不逊色:

那么,来看看大模型的“拉分题”写微作文,依旧没什么问题!

要是小作文体现不出来,再来看看AI伙伴作诗的能力。不仅现代诗手到擒来,甚至连藏头诗都能搞定:

不过,要是再仔细一点搞搞提示词工程,AI伙伴似乎就答得更好了。

以高考语文题目中的古诗词理解为例,这里我们先在不给提示词的情况下,把题目原样“喂”给AI伙伴:

AI伙伴给出来的答案虽然也不错,但对于高考题目来说,这答案着实有亿点长,也有点太仔细了:

接下来,给AI伙伴换上强调“最重要的三个意象”的提示词。

果然,AI给出了更精准的回答,指出包括病柏、丹凤和鸱鸮在内的三个意象,是最关键的:

但是,上述都还只是直播中展现出来的效果。像AI伙伴这类有大模型加持的功能,其使用效果是否真的和提示词工程强相关?

为了测测AI伙伴的“真正实力”,我们亲自上手测了测它做高考题的效果。

直播中已经做过了全国甲卷的作文题目,那么我们再来试试今年上海卷的作文。

第一轮,我们直接把题目甩过去:

看起来,AI伙伴虽然理解了文章“主旨”,但写出来还差点意思:论点不够明确,作文的结构也不太清晰。

第二轮,我们试着换了一下提示词,给AI伙伴设置一个“角色扮演”效果。

首先,强调它是一名高考考生,然后给它“灌输”一些高考作文的写作技巧:

这一轮,AI伙伴写得就有高考作文内味了。

不仅给出了10字以内的标题,还按照总分总、夹叙夹议的方式,很好地写出了一篇议论文:

看起来,挖掘大模型的潜力,很大程度上确实要依靠提示词工程。

在直播中,百度集团副总裁、搜索平台负责人肖阳还给我们列举了一个非常简洁的提示词公式:

提示词 = 任务 + 角色 + 上下文背景 + 细节补充。

有了它,不用再担心大模型输出和设想无关的答案了。

当然,作为百度“用大模型重塑搜索能力”的终极杀器,AI伙伴能实现的功能,也远不止是做做高考题而已。

最早在2023万象·百度移动生态大会上官宣发布的AI伙伴,目前已经开启内测,获得试用资格后,可以直接从百度搜索界面进入:

它的本职工作,更像是一个搜索引擎端的全能AI助理,不仅具有智能搜索能力,还兼具创作生成技艺:

一方面,AI伙伴相当于一个对话版智能搜索工具。用它查资料,不需要再按关键词搜索,直接“用人话”提问就行:

不仅如此,每一句回答都有理有据,如果想要“追根溯源”,直接点链接就能跳转到对应的网站:

这样一来,就不用担心它会出现像ChatGPT整理文件那样,出现“无中生有”一些案件的操作了。

另一方面,它又相当于一个多模态大模型创作助手

不仅可以帮助查资料、写周报、画头像,还能陪你模拟面试、甚至替你约会(?)。

这里我们借助AI伙伴的“程序猿小助手”,来试试生成一段代码的能力。

以面试可能会考到的冒泡排序算法为例。

很快啊,几乎没有怎么思考,AI伙伴就给出了一段带注释的冒泡排序算法,最关键的是,它自己已经运行过,并成功输出了一段结果

这意味着我们不需要再自己去跑一遍这段代码,而是能直接将它交给面试官了(doge)

从上面这些展现的能力来看,AI伙伴所能做到的,远非仅仅提供高考试题“参考答案”而已。

这次选择用它挑战高考题,大家伙可能看的是个新鲜劲儿,但“术”的表象之外,更值得关注的是“道”的变化:

使得AI伙伴能在高考题面前依旧“神采飞扬”的大模型技术,正在以搜索引擎的代际变革为基点,席卷各行各业,甚至改变每个人的工作方式。

正如ChatGPT搅动风云之初,微软CEO纳德拉预测的那般:搜索正面临巨变。

并且变化的不仅仅是搜索的技术、产品本身,这一次,更与每一个个体有了更紧密的关联。

搜索三变

百度CEO李彦宏同样认为,“大模型即将改变世界”。基于这样的判断,李彦宏2023年一季度OKR,便指向了“引领搜索体验的代际变革”。

现在,三个月过去,大模型究竟如何变革搜索,现在答案已经越来越清晰。

从技术的角度出发,大语言模型的爆发,正在重新定义人机交互

对于人类而言,最自然的交流方式就是语言沟通。而大模型的代际突破,最直观的一点体现,就是机器自然语言聆听表达能力的飞速提升。

回答来自百度搜索AI伙伴

搜索本身,就是一种人机交互的核心方式。其本质的技术追求,就是要让机器更高效地理解、推理、表达,化复杂问题为直观的第一条搜索结果。

因此可以说,大语言模型的突破,正在全面激发搜索全新的潜能。

值得关注的一点是,伴随着AI的发展,搜索始终都是最前沿AI技术最先落地的场景。

以百度搜索为例,围绕“降低用户表达需求门槛”、“降低用户获取内容和服务的门槛”、“丰富搜索引擎的内容供给”这三个目标,百度搜索一直在AI技术上大量投入。

引入大模型之前,百度搜索已经实现:

千亿级全网索引;

全球领先的深度语义理解技术,相关成果曾获2020年国家技术发明奖二等奖;

最大中文知识图谱,覆盖50亿实体。

从产品的角度看,过去三个月,数据已经证明,对话式搜索正在成为搜索引擎市场的一个新变量。

百度集团副总裁、搜索平台负责人肖阳就透露,大模型加持下的AI伙伴,在内测阶段就已爆火,相关搜索问答量激增。

这进一步佐证大模型带来的新人机交互方式,更能满足人们对搜索“快速”、“有效”的诉求。

牵一发而动全身,在现在这个时间节点,围绕搜索的内容生产和创作领域,创新模式也开始逐渐显现,并被积极地探索实践。

同样是在万象大会上,百度搜索还配合AI伙伴,推出了AI BOT解决方案。目的就是向内容、服务生产者释放大语言模型和AI技术能力,降低其与新搜索模式融合的门槛。

具体来说,百度搜索提供了创作者、商家、机构、服务和品牌等各类型的AI BOT,让他们能够利用自身优势和独特的内容、知识、服务,创造虚拟分身,直接回答用户的问题。

在技术和产品之外,更与每个人息息相关的,是用户搜索方式的改变

正如前文所展示的,大模型时代,“提问题”的能力正在变得越来越关键。

体现在现阶段,就是提示词写得好不好,会直接影响搜索生成结果的质量。是否掌握提示词工程能力,就像互联网时代开启时,是否掌握搜索能力一样关键。

对此,肖阳提到了“搜商”的概念:

未来不仅要卷智商、情商,还要卷“搜商”。

更好地使用提示词,更好地使用AI伙伴,获得的优势会越来越大。

也就是说,找到合适提示词的能力越强,越能在大模型落地应用的时代里,充分利用大模型的强大生产力。

可以说,大模型刮起的时代风暴之下,搜索三变,既是内在技术瓶颈的代际突破,亦是外在人类接触信息方式的彻底变革。

无怪乎肖阳作为技术变革的一线亲历者,会有这样的判断:

语义检索技术与大语言模型结合,促进搜索的理解、推理、组织和创作潜能进一步释放,有望在多方面催生颠覆式创新,促成搜索奇点降临

并且这一次,或许每一个人都会真真切切感受到这种代际变革带来的影响。

One More Thing

说起来,就在高考这两天,AI加持下的百度搜索,忙的还不止有刷题这件事儿。

每年此时,百度都会启动专门的高考服务,通过搜索和AI核心技术,为考生和家长提供便利。

今年,百度还基于AI技术,首次推出了高考搜索指数,涵盖专业搜索热度及变化趋势、“院校PK”等信息。考生家长在择校选专业的时候,可以更方面地参考对比。

AI志愿助手也进行了重大升级,能更直观地展示志愿预测结果,提供相关数据来辅助考生家长做决策。

对了,利用高考搜索指数和其他高考相关搜索数据,百度还联合中国教育在线掌上高考发布了不少有意思的数据:

高校方面,搜索热度最高的本科院校里,南方高校霸榜双一流和非双一流大学前十。

专科院校中,山东是搜索职业教育最多的省份。

专业方面,医学搜索热度断层第一,航空航天热度攀升最快。

而最有“钱”景的,是船舶电子电气工程……

相关阅读

精彩放送

固态电池大战在即,谁能突破技术瓶颈成为王者?

汇通达网络(09878.HK):6月8日南向资金增持2.68万股-每日快报

创维集团(00751.HK):6月8日南向资金增持18万股

寻文化根脉叙一家亲情 两岸少数民族文化交流活动落幕

焦点关注:曲芷含微博超华 曲芷含微博

每日快讯!特朗普又要被起诉?特朗普被检方明确通知是调查目标

陕京天然气管道系统单日输气量1.6亿立方米 创同期新高-全球观焦点

多位大咖分享工业设计“干货”-热点评

科伦博泰港股IPO:估值百亿尚无药品上市,默沙东为第二大股东 天天观热点

越跌越买!315亿大举抄底!

全球动态:财务核算等三方面违规 圆通速递被大连证监局责令改正

广汽集团曾庆洪:中国汽车市场将保持微增长 想“找死”的企业就早点降价 全球热点

天天新消息丨钾矿储量超白亿吨 老挝官员称还有投资机会

越跌越买!315亿大举抄底!

吉镜头丨鲜花、微笑、合影……2023高考落幕_环球动态

武汉首例框架协议采购项目跨市远程异地评标顺利完成 世界速看

上交所理事长邱勇重磅发声!

全球今日报丨中国电信广东客服最新回应:受影响用户正逐步恢复

热门看点:小程序未来现状预测分析 2023小程序市场前景前瞻

热资讯!广州楼市没有“红五月”:市场需求略显透支,热点区域二手成交量追平历年新低

这种食品“盲盒”卖爆了!年轻人的“新宠”!你买了吗?

武汉邓南振兴街社区开展安全生产月宣传活动

环球微速讯:uc qq uc qq

全球快报:邮储银行:副行长牛新庄任职资格获批

问道果果打什么天书好 问道果果成长

杭州中考总分2023 各科分数是多少

天天新消息丨“结怨”4年,李冰冰逐渐过气,彭于晏却要翻身了!

延吉市多部门协同合作为考生保驾护航-天天热消息

股价仅剩0.43元!龙头房企退市!曾打造北京、上海豪宅标杆

【环球聚看点】马大哈考生忘带身份证 民警开辟绿色通道

【全球速看料】报告称谷歌成日本安卓手机市场占有率最高的品牌,索尼退居第五

董明珠再回应“手机核心团队解散”:我现在用的就是格力手机 消费者用了都说好 每日资讯

世界关注:杞县:“六到位” 确保夏粮颗粒归仓

天天看点:小伢儿画亚残 ▏浙江省杭州湖畔学校范欣妍:《LOVE》

邮储银行: 中国邮政储蓄银行股份有限公司关于副行长任职的公告|天天报道

广州楼市没有“红五月”:市场需求略显透支 热点区域二手成交量追平历年新低

世界热门:聚焦氢燃料电池零部件产业发展方向 中原内配构建五大氢能产业格局

完全成本加成定价法(关于完全成本加成定价法介绍)

广汽集团曾庆洪:中国汽车市场将保持微增长 想“找死”的企业就早点降价-天天速看料

上海电力大学财务处岗位招聘公告

头条:完全掌握Eclipse项目开发实战(关于完全掌握Eclipse项目开发实战介绍)

每日速读!总台记者专访丨俄外交官:日本应与国际社会协商核污染水排海计划

当前观点:陶大宇谭耀文电视剧_谭耀文电视剧

哈尔滨2023民办小学招生计划

世界视讯!开源证券发布家家悦研报 公布股票期权激励计划 激发内部成长动能

全球滚动:金铃子又叫什么名_金铃子又叫什么

长三角贸易调整援助行业服务联盟成立,18家行业协会发倡议

短讯!叶绿素含量高的蔬菜_叶绿素含量

中金料中国今年全年经济增长接近6%-天天热消息

重大网络故障!广东电信崩了,官方最新回应 微速讯

广安爱众: 四川广安爱众股份有限公司第七届董事会第六次会议决议公告 每日关注

全球通讯!特斯拉做到了!减少55吨二氧化碳当量不在话下

湖南开展世界海洋日暨全国海洋宣传日活动

天天观察:小鹏汽车宣布与林志颖达成合作,引发网友热议

冀光恒出任平安银行党委书记、行长

重点聚焦!中国银联开展“绿色环保月”主题活动 云闪付APP上线“低碳计划”小程序

空调一小时耗几度电_空调介绍

世界速读:建行副行长纪志宏:着力推动科技产业和金融的良性循环

当前焦点!信质集团: 031 关于第一大股东拟通过公开征集转让方式协议转让公司股份的提示性公告

思维导图 | 什么样的人,会越来越优秀?|今日要闻

【报资讯】新劲刚: 关于公司特定股东彭波女士减持计划的预披露公告

保利发展首5月签约额涨23.5%至1966.6亿 近期新增5地产项目_今日热议

上交所邱勇:将健全制度体系,构建科技创新良好生态 全球要闻

跨界融合戏剧艺术《柒》7月上演,多种艺术相融表达民族精神|环球快资讯

李生论金:疯了吗?美联储加息声高涨!|焦点热讯

重返未来1999兔毛手袋怎么样-兔毛手袋强度一览_全球信息

经营未取得医疗器械注册证的第二类医疗器械 深圳承宝医疗器械有限公司被罚款50000元

广东再发促进生育重磅文件 这一相关技术供不应求 托育产业将会继续扩大-看热讯

深圳市云海物业管理有限公司价格违法案

立讯精密(002475.SZ):2022年度权益分派10派1.29966元 股权登记日6月14日

安徽信敏惠新材料科技有限公司

天天短讯!天生智商奇高,但很懂得隐藏的三个星座!

热头条丨安徽信诺家具有限公司

茵曼/inman是哪个国家的品牌_什么档次怎么样|焦点

世界快资讯丨6月08日擒牛姐复盘

技术服务费属于成本还是费用_技术服务费计入什么科目

文旅产业“加速跑” “烟火气”袅袅升腾 观速讯

黑客远程控制别人手机可以做什么_怎样利用黑客远程控制别人电脑

南凌科技:公司未来在边缘计算服务领域最终能取得的订单金额存在较大不确定性

华夏银行:去年绿色贷款余额2470.35亿元 占比持续提升-环球热资讯

浙江力诺:实控人、一致行动人等拟减持不超3.49%股份

易天股份:公司主营业务尚未涉及房地产业务 环球快看

世界通讯!交易赢家的21周操盘手记,记录30年老期货的操作心得

菠萝长在地上还是长在树上_世界速看

交易赢家的21周操盘手记,记录30年老期货的操作心得_今日快讯

天天热消息:神经通路的发现可能会导致精神障碍的新疗法

大模型扎堆「赶考」,语文还是国产AI行,文言文能力超过95%考生 当前快报

天天快资讯:广东省深圳市2023-06-06 12:57发布雷雨大风黄色预警

全球热文:先享价10万元起 一汽奔腾T90将于6月18日上市

市区不是油老虎了!坦克300 PHEV现身:电池超大

【速看料】qq怎么查空间访客记录(qq查看空间访客记录方法)

广东高考成绩2023公布时间 环球播资讯

品鉴向往已久的智电出行,传祺智电新能源E9带你玩转杭城-环球快播

吉利的手机号后四位 六六大顺的手机号码-每日速递

11位手机号码分别代表能量 带财有富贵命的手机号_世界新资讯

焦点!360电池医生ios_360电池医生

全球焦点!2023年自学考试《马原》章节考点(34)

热资讯!今天,我们来聊聊生态补水

热点聚焦:皓晨韩羽斩杀黑风蛇王,侠隐回归夜探魔族大营,青妖魔神霸气登场

中华癌症网 中国癌症杂志社 全球实时

世界观点:婴儿服装裁剪图案_婴儿服装裁剪图

北京居住区新能源车充电试点 服务费将不高于0.5元

焦点速递!建筑电气专业技术资料精选 第二版

【20230608收评】内生动力不足,围绕年线反复

韩媒:时隔5年,韩国修改国安战略文件,“写明朝核威胁”|每日精选

TCL实业收购新能源公司 天天热闻

彻底决裂,彭斯称“特朗普不应该成为美国总统”

苹果发布工具包:在MacOS流畅游玩2077等游戏 焦点热议