《连线》杂志创始人Louis Rossetto曾这样说过:“只有少部分玩家才能穿越时间,绝大部分公司只能抓住一次浪潮,并日夜祈祷产品的生命周期足够长”。
而如今随着大模型的出现,一种新的生产力正在诞生。在6月9日,2023 NAVIGATE领航者峰会上,百度集团执行副总裁、百度智能云事业群总裁沈抖说道:世界人均GDP就是在工业革命开始以后,才出现了指数级的增长,而这种GDP的增长和技术之间的强相关性,正好验证了我们熟悉的一段话,那就是“科技是第一生产力”。
从技术来看,伴随着算力、尤其是专用算力的指数级发展,随着模型参数的不断扩大,人工智能的能力出现“指数跃升”:建模、多任务理解、关联学习等能力都不再是线性增加,而是具备了小模型上观测不到的涌现能力。大模型的问世,让人工智能焕然一新,将为生产经营效率与用户体验效果带来“双效”的提升,加速实现社会“智能化跃迁”, 同时催生更多新业态、改变世界。
科技浪潮从不等人,就像哥伦布当年探险新大陆一样,大模型就是一艘行向远方的巨船,万千应用的开发就是新大陆的建设。不论是红杉资本还是黄仁勋,都喜欢将当下称为“AI的iPhone时刻”。
亦如乔布斯讲出那句“今天,苹果将重新发明手机”,而将手机划分为了智能手机和非智能手机时,变革的伏笔已经埋下,如今大模型的出现同样会将企业分为两类:智能企业和非智能企业。
在这股浪潮之中,百度智能云亦交出了一份时代的答卷。
01、大厂大模型,久违的一把手工程
在AI发展历史上,曾有过三座里程碑:第一次是1997年,蓝色巨人IBM旗下的AI“深蓝”击败国际象棋大师卡斯帕罗夫;另一次则要回溯到2016年——谷歌旗下的AI机器人AlphaGo在“人机大战”中,第一次击败人类职业围棋冠军李世石。
这之后,AI行业经历了从极速繁荣到资本退潮,行业随之步入数年的低谷期,一直到去年ChatGPT的横空出世。作为后疫情时代的一个绝佳故事脚本,尤其在其三个月达到过亿用户爆火之后,ChatGPT这类大语言模型就像一颗燎原的星星火种,在科技公司间急速蔓延,引得大洋两岸那些曾经高昂头颅的互联网巨头们纷纷趋之若鹜,躬身入局。
尤其最近3个月,整个世界因ChatGPT进入快进状态。几乎每隔几周,甚至是每隔几天,就有人工智能新进展刷新新闻版面,也同时在刷新人们的认知。
在百度开始文心一言内测前,百度 CEO 李彦宏每晚和项目团队开会,甚至为筹备产品一度睡在公司;阿里巴巴 CEO 张勇,亲自盯人工智能新项目,并在 4 月 11 日举行的云峰会上发布“通义千问”大模型;张一鸣时常会和一些字节人士分享论文学习心得和对 ChatGPT 的思考;任正非参加座谈会时称,华为会做底层算力平台;腾讯正在加速推进大模型 “混元”;还有360“红孩儿”、商汤“日日新”、网易“玉言”、科大讯飞“星火”、昆仑万维“天工”,甚至OPPO、vivo 等消费电子厂商也都接连发布了自己的大模型。
面对 ChatGPT 和背后的机会,大模型已然成为中国众多互联网科技大公司的一把手工程。上一次中国互联网和科技行业,像这样如此大规模同时瞄准一个目标,还是疫情前各公司密集进入,押注重金的社区团购买菜业务。
然而在这场狂奔中,仅短短两个月,分化就已然显现。
不同于其余企业都在卖算力,百度则更多的聚焦于服务。因为在其看来,算力并不是评判大模型优劣的唯一标准。一个好的大模型需要由算力、框架、模型、应用等四层架构相互配合提供支持,为客户提供低门槛、高效率的企业服务。
正在内测的文心千帆大模型平台,是百度提供给客户的一站式企业级大模型生产平台,不但提供包括文心一言在内的大模型服务及第三方大模型服务,还提供大模型开发和应用的整套工具链。
也就是说,文心千帆大模型平台是以文心一言为核心,提供大模型服务,帮助客户改造产品和生产流程;同时企业也可以在文心千帆平台上基于任何开源或闭源的大模型,开发自己的专属大模型。
这是由于单独的通用大模型面临算力需求大、训练和推理成本高、数据质量不佳等挑战。一个成功且可对外输出的成功商业化通用大模型,不仅要求厂商拥有全栈的大模型训练和研发能力,还需要丰富的业务场景落地经验、丰富的开放生态以及可靠的安全治理措施等一系列核心优势。
从这一角度来看,大部分公司并不具备做通用大模型的能力,相反这些拥有丰富数据积累的企业更适合做垂域的大模型,而只有像百度这类拥有丰富AI技术底蕴的巨头才有希望成为“大模型的底座”,去进一步赋能千行百业。
对此,百度集团副总裁侯震宇在文心大模型技术交流会上表示:“最终能够让大模型服务推广开的只有两个原因:第一个是模型效果,第二个是成本”。
而如今随着“文心千帆”大模型平台的推出,当初掣肘的两座冰山似乎已然开始悄然溶解。
02、文心千帆成为“超级应用”孵化器
趁着ChatGPT这股东风,英伟达的股价呈现出迅猛增长的态势,市值更是在近期一度突破万亿美元。在消费级市场,英伟达的显卡产品相较于AMD这样的竞争对手虽有明显领先,但仍然是游戏玩家装机时的重要参考对象,AMD系列显卡的定价策略也对N卡定价产生影响。
但在AI领域,作为最关键的算力基础设施,除了像Google等玩家有自己开发的TPU之类的专业设备,其他企业并不会在N卡和A卡之间存在任何纠结,AMD甚至连做对手的资格都没有。这种现象出现的原因,并非单纯的硬件领先,而在于英伟达围绕自身的显卡构建了一个健壮丰富的生态。举个例子,CUDA架构就是支撑这个生态的关键一环。
李彦宏曾表示,对于大部分创业者和企业来说,真正的机会并不是从头开始做ChatGPT和文心一言这样的基础大模型,这很不现实,也不经济。对于大部分创业者和企业来说,真正的机会是,基于通用大语言模型,抢先开发重要的应用服务。就像移动互联网时代,最成功的商业产品不见得是安卓和IOS,而是基于安卓和IOS开发的微信、淘宝、抖音等各种超级应用。
如果说英伟达要做AI的孵化器,百度智能云文心千帆大模型平台则希望把目标聚焦一些,要做基于大模型的“超级应用”的孵化器。
例如:石墨文档基于此大模型能力,研发出了AI助手石小墨,具有快速创作功能,辅助高效办公,不仅可以写招标建筑合同,新品沟通会邀请函,还可以写简历、需求文档。
而在电商直播行业,电商助手可以自动生成多种风格的商品带货脚本,再配合数字人主播,帮助每个品牌实现7*24小时直播,大大提升电商销售效果,降低企业的直播成本。
这是因为作为全球首个一站式企业级大模型平台,文心千帆将能够覆盖人工智能研发的全生命周期,包括:数据管理、模型训练、模型评估、预测部署和插件服务,端到端地帮助用户高效地开发和部署大模型应用,不断降低大模型技术门槛,让更多人和组织受益于人工智能。此外,大模型平台还提供内容安全的机制,使大模型问答内容可控。
概括而言,文心千帆具有以下六大特点:
易用:提供开箱即用的解决方案、可视化界面及更多自动化的功能,用户无需进行繁琐的环境配置工作,大幅降低企业使用门槛。
全面:提供覆盖全生命周期的工具链,从数据处理、模型训练,到部署服务、应用集成,每个环节都可以通过简单的界面操作来实施。
安全:平台不但通过自带的安全策略,建立起过滤异常输入的第一道屏障,还向客户提供自定义的干预接口,客户可以上传关键词列表,也能配置模型的回复模板和匹配规则等。
高效:指性能优化和效果优化,通过AI大底座端到端的全流程优化可实现AI开发的极致效能提升。
开放:兼收并蓄,不单单是支持文心一言核心大模型,还支持更多的第三方大模型,满足不同客户的需要。
集成:平台提供应用编排和插件机制,可以使大模型的服务可以更好地和其他模型或服务进行集成。
在大模型浪潮方兴未艾的当下,“文心千帆”这类大模型服务平台的推出可谓正逢其时,因为它解决了众多企业参与这个浪潮而不得窥门而入的痛点。而另一方面,“文心千帆”及早即时地推出,也将帮助百度智能云和百度本身建立起AI大模型时代的独特竞争优势。
由于“文心千帆”具备平台和生态属性,在网络效应的催化下,它将变得越来越好用,越来越快地取得效果和成本的改善。而效果和成本这两个要素,如百度集团副总裁侯震宇提及的那样,将成为决定大模型推广的关键。
6月6日,在成都举行的文心大模型技术交流会上,百度进一步推出了文心一言高性能模式(文心一言-Turbo/ErnieBot- Turbo)。通过文心千帆大模型的技术优化和迭代,文心一言-Turbo在一些高频、核心场景中实现了端到端的效能提升:在满足同样客户需求的情况下,推理服务的整体性能总共提升了50倍,这极大提升了客户的模型使用效果和效率。
同时在这次大会上,百度还开发了开放代码助手“Comate”的内测邀请。作为一款利用大模型实现的编码辅助工具,Comate具有代码自动生成、代码自动补全、查找错误、高质量代码推荐、测试代码自动生成等多种智能功能。而支撑Comate这些功能的,是文心大模型的语言理解能力和推理能力。
相较于其他编码辅助工具,“Comate”代码助手在需求理解上表现更优,使代码生成更精准;在推理速度上,完全匹配编码速度,单请求可实现300ms左右,并基于多行代码推荐能力,可确保推荐代码内容逻辑完整,保障流畅的使用体验。
当前“Comate”代码助手支持主流开发语言/框架30余种,尤其在 C/C++、Python、Java、Go、PHP、JavaScript 等多个主流语言表现出色。此外,Comate还支持前后端、软硬件不同场景、以及程序员最喜爱的IDE。某种程度上说,由于大模型本身是通过计算机编程实现的,当大模型又具备编码能力时,其实意味着其打开了自我学习和优化的另一层次。
而无论是文心一言高性能模式,还是“Comate”之类的代码助手的推出,都说明了大模型重塑现实业务的能力在不断飞跃。毫无疑问,当越来越多客户基于大模型重塑业务后,大模型已逐渐成为新应用生态,甚至是云服务行业的Game Changer,彻底改变云计算的游戏规则。
一个鲜明的例子是,汉得信息就基于文心千帆大模型平台打造了四大智能助手:
智慧导购:可与消费者进行多轮次对话,基于聊天内容精准理解需求,为消费者的购物决策提供即时帮助,改善消费者购物体验;
智慧物流助手:可以为企业提供合适的物流方案,在减少延误风险,还能降低费用成本的同时,还可以 物流管理中间的繁琐流程,减轻物流管理的负担;
资产设备管理助手:可以把成熟管理员的经验沉淀下来,给出设备维修和保养的合理建议,让没有经验的管理员也可以轻松管理企业设备资产;
营销创意助手:可以自动生成不同风格的多种文案,高效地满足企业营销需求。
截至目前,已经有15万企业申请加入文心一言内测,覆盖政务、金融、媒体、电商零售等行业。其中,内容创作、智能客服、办公提效为各行业通用的高频需求场景。其中已有超过300家生态伙伴在400多个企业内部场景取得测试成效。
随着时间推移,原有的云产业江湖格局也会被AI打破重组,毫无疑问一场产业升级的风暴即将来临,但百度已经为此做好了充足准备。
03、“云智一体”落地,百度智能云行稳致远
每每谈及科技演替的故事,人们总是惜字如金,习惯性地用一两行文字铺叙跨越数十年、数百年的历史。在此叙事逻辑下,蒸汽机、电灯、计算机等发明、技术就像是一个个分水岭,分割出一轮又一轮的科技革命。
殊不知,点燃每轮科技革命的“星火”,都经历了漫长而乏味的“钻木”过程。尽管当下人们普遍认为一切均是历史的必然,但在当时来看,点燃星火的过程,其实充斥着偶然因素。
不积跬步,无以至千里;不积小流,无以成江海。这世上哪有那么多的一蹴而就,所有命运馈赠的礼物都早已在暗中标好了价格。
正是此前的不断沉淀积累,使得百度成为全球唯一在芯片、框架、模型和应用这四层进行全栈布局的人工智能公司,而百度智能云也成为国内第一个训练出大模型的云。
而这四层布局则对应 AI 的三驾马车,数据、算力和算法。数据是 “燃料”,算力是 “发动机”,它们共同训练出算法,基于算法训练的模型则像一套机械传动装置,能最终完成具体动作。算力由 AI 芯片提供,深度学习框架则是训练、优化模型的工具。
纵观人类历史上的几次科技革命带来的爆发式增长,都是由科技创新所驱动。但创新不是闭门造车。创新,是你有机会进入市场,不断获得用户和客户的反馈,摸着“反馈”过河才能实现的。
自推出以来,“文心一言”的能力在持续迭代中快速拔高。一个多月内文心一言推理服务已完成4次迭代,在业内首创支持动态插入的分布式推理引擎,使得单机QPS(每秒查询率)相对线上版本提升123%,模型推理效率提升10倍,模型推理性能提升50%,模型算力利用率提升1倍。
诚然大模型与产业相结合,所迸发的想象力远不止于此。在李彦宏看来,过去,云计算主要卖算力,看速度、看存储。今天,客户购买云服务,则要看框架好不好、模型好不好。MaaS(模型即服务),将成为评判云服务的行业新标准。
按照历史经验, AI也只有与业务落地结合,为其提供支撑才能走得更远。
从2023年百度最新的Q1财报来看,经过近几年的奋起直追,百度智能云已凭借AI成功翻身。据财报显示,2023年Q1,百度智能云营收42亿元,同比增长8%,在这条动辄盈利周期十年起,夹缝中求生存的云产业之路上,百度智能云只用了8年便实现了盈利(non-GAAP)。
不仅如此,随着使用者的反馈,大模型平台性能的迭代升级,日后大模型的其它使用成本也将大幅度降低。未来几个月,模型使用、模型微调甚至在模型再训练方面,相关成本都将大幅拉下来。这意味着,价格不会成为企业以及个人使用或拥抱大模型的瓶颈,而这也符合百度智能云AI普惠的理念。
除此之外,针对不同客户需求,文心千帆也将会针对性提供多样性的服务模式:公有云层面,文心千帆提供推理、微调、托管等服务;私有化部署方面,文心千帆则通过软件授权、软硬一体、租赁服务的方式交付给客户。
毫无疑问,随着时间进一步推移,现有的云产业江湖格局将会因为大模型打破重组,一场产业升级的风暴即将来临,但百度智能云已经为此做好了充足准备。
04、写在最后
计算机科学家吴恩达曾在《为什么AI是新电能》中如是写道:如今我绞尽脑汁,也想不出几年后还有什么行业是AI改变不了的。
如果从更早的2013年建立美国研究院算起,百度投身AI则有十年了。前沿技术经过长年累月地研发“消化”,最终也能得以开花结果。比如百度,早已推出的深度学习框架平台飞桨,后者在填补国内空白的同时,也实现了对Google、Meta旗下深度学习平台的赶超。
只不过,对背负着“第四次工业革命”的前沿科技而言,阻碍仍将长期存在,路程亦会更加漫长。现阶段,一众科技巨头相继放缓了增长脚步,逐渐走出了自己的舒适圈,而投融资氛围也在逐渐冷却,四处似乎均充斥着“寒气”。
但这,正是“第四次工业革命”必须跨越的裂谷:面对旧秩序的寒冬与焦虑,以及技术商业化落地的此起彼伏,唯有延续科技创新路径,才能找到解药。
而就表现来看,如今的百度已然背好行囊,先行一步。
*题图及文中配图来源于网络。