分享到:

婷婷五月综合网李开复解读大语言模型:两年内LLM至少还有两波迭代

婷婷五月综合网李开复解读大语言模型:两年内LLM至少还有两波迭代

2024-08-08 14:09:44 来源:婷婷五月综合网参与互动参与互动

  《第22届华人领袖远见高峰会人物专访》

  来源:《远见》

  文/曾子轩

  “我这个年纪创业(能招募人才),肯定不只是因零一万物的AI演算法做得比别人好。”说出这句话的,是年过花甲的李开复。当人工智能掀起巨潮,他却重回海景第一排逐浪,他究竟看见什麽?

  李开复创办的“零一万物”,主攻瞩目程度最高、竞争也最激烈的大语言模 型(Large Language Model, LLM)。既要对标美国世界级的玩家,也得和中文世界的大厂和新创业者抗衡,不只比拼模型性能,还要在价格上维持竞争力。

  从硬件、基础建设、开发者工具、应用到模型,生成式AI的每个领域都已烽火连天。李开复如何深度解读这场大型语言模型之战?

  注入智慧,AI赋能一切应用

  自2009年创办并操盘“创新工场”,李开复在科技创投领域耕耘超过十年。去年3月隐士出山,亲自下场筹划,以基础模型为题创业,只因他已看见全新机会。

  去年接受《远见》专访,李开复表示,在生成式AI的带动之下,软件应用将能重生、使用者界面出现改变、商业模式更会进化。一年过去,预言逐步成真。

  ChatGPT全面进化,已能读懂图片和声音,微软让笔电搭载Copilot,苹果更宣言,将在手机中注入AI,从装置到应用,让时隔一年再度接受《远见》专访的李开复乐观表示,“Super Intelligence”时代已然来临。

  他分析,电脑时代能用“Computer on every desktop”总结,当人们的办公桌放上电脑,提升生产力的Office便成为杀手级应用。“Anywhere Anytime Computing”则是移动网路时代的标记,四处迁徙的消费者时刻连网,应用程式能获取位置资讯,Uber、美团因此带来价值。

  将时间快转至今,得到AI赋能的应用,不再只是解决疑难杂症,甚至代理人类完成工作。生成式AI与大语言模型之所以标志AI 2.0的开展,正是因为AI做为生产要素的成本下降,从专用走向通用,运算不再昂贵,应用就此得到智慧,“你要善用这些应用程式的聪明才智,做过去不方便或不可能做的任务。”

  推论成本将是关键

  不过,虽然生成式AI颳起的旋风未停,但目前获益最多的,仍是卖铲子的人。云端服务商对AI伺服器的需求激增,催动辉达等晶片生产商接满订单,效应也外溢到台厂协力厂商,但真正让消费者有感的应用还在半途,软件厂商也在寻觅应用场景。

  李开复解读,无论是对企业或者消费者,生成式AI都有市场。前者在企业后勤单位如财务、人资领域中,增加员工效率的效益已浮现,帮助消费者完成任务的用法,也在陆续发生。

  然而,AI时代和移动时代的巨大差异之一,在于每次大语言模型运作服务时,皆会产生推论成本。“在移动互联网时期,都是先获取大量用户,不收任何费用,待用得开心后,再从他们身上收费。”搜寻引擎、社群网络和短影音应用,皆遵循此法则。

  但AI时代很难靠著补贴式战法打下江山,因为用户变多,不会带来规模经济成本降低的益处。“以前你去烧用户(成本补贴),烧不掉太多什麽,⋯⋯现在每次回答问题,我们都在烧GPU,最后用户不付费就破产。”无论是和ChatGPT对答,还是以Bing生成图像,OpenAI与微软都得在云端上消耗算力,这也是后者力推AI PC的原因之一。

  即便向消费者收费,若费用无法超过获客成本和推论成本的总和,服务仍无法延续。李开复以近期他提倡的的概念“TC-PMF”(Technology Cost- Product Market Fit)提醒生成式AI创业者,在寻找产品与市场契合程度时,需关照技术成本的变动。

  静态来说,要在模型价格和生成内容品质之间取捨,例如,GPT-4表现优异但所费不赀,GPT-3.5同等模型效果差却便宜。动态来看,每过9到12个月,基础模型能力便会显著升级,例如GPT-3.5至GPT-4的换骨夺胎,以及GPT-4到GPT-4o的化蛹为蝶。

  当新模型面世,调用旧等级的模型费用,将下降到原先的十分之一,因此创业者不能只看PMF,而要考虑变动的TC,惟有掌握动态变化,才能生存。

  李开复认为,自研基础模型、搭建AI基础设施、推出AI优先应用的“三位一体”战略,是大模型创业者第一时间捕捉到TC-PMF的关键,零一万物目前正在实践当中。

  中美AI竞争各有优势

  有许多人关注科技战,对中国发展AI带来负面影响。李开复表示,添购显卡的问题没有想像中严重,关键差异在融资。“美国的创业公司,比中国公司更愿意花钱买GPU,理由就是美国市场给这些有能力做大模型的公司,更高的估值。”

  这既影响企业发展走向,也影响商业模式。李开复解释,虽然中国大语言模型企业算力较少,但人们愿意花心思、下苦功,“刻苦耐劳做一些不那麽光鲜耀眼的事情。”例如,调校GPU、修改架构和配合软体,挤出每张显卡的最大价值。

  李开复分析,美国企业人才顶尖,能开拓出科技最尖端的创新,中国则擅长改善产品、在成本效益间找到甜蜜点。“美国公司做不出拼多多,但是中国公司也做不出Google。”即便大语言模型领域中国落后半年,但很难说后发一定无法先至。

  以大型语言模型企业来看,对比中、美环境,李开复分析,后者消费者付费意愿和客单都高于前者,这让中国创业者需要在商业模式上下功夫。“因为用户付费习惯不够多,反而要逼自己找新的商业模式。”例如,当年主打免费的淘宝,便是靠著收取广告费的另闢蹊径击败eBay。

  观察零一万物发展,既有面向消费者的应用“万知”,同时也在中国海外推行企业用服务。万知背后旗舰模式YI-Large,中文能力足以和GTP-4o相提并论,因此消费者愿意埋单,这正是由技术实力撑起;在海外市场拓展也颇有成绩,无论是付费意愿或者平均客单价都高过中国竞业,稳定的SAAS服务,让零一万物不用在客制化AI、无法规模化的红海中,与他人争抢微薄利润。

  他坚定表示,大语言模型至少还有两代巨大的模型提升,不只带动应用发展,同时降低推论成本的定价,未来两年生成式AI应用将会看到剧烈竞争。

  在李开复眼裡,想在大型语言模型竞赛做出成绩,是最短的时间窗口之内,最有挑战性的难题。

  正如《离骚》中所言,“路漫漫其修远兮,吾将上下而求索。”一辈子在人工智慧领域打滚,如今重返前线迎难而上,这是李开复的“吾虽艰险,心中乐之”。

  李开复

  出生:1961年

  经历:曾任苹果、SGI和微软等企业高阶主管,于微软工作任内创立微软中国研究院(微软亚洲研究院),后至Google担任全球副总裁与大中华区总裁。2009年创立创投机构创新工场,2023年创办零一万物

  荣誉:《时代杂志》百大全球最具影响力人物、《时代杂志》全球25大AI领袖

  新浪声明:所有会议实录均为现场速记整理,未经演讲者审阅,新浪网登载此文出于传递更多信息之目的,并不意味着赞同其观点或证实其描述。

责任编辑:梁斌 SF055

【编辑:杜秀娟 】
关于我们 | About us | 联系我们 | 广告服务 | 供稿服务 | 法律声明 | 招聘信息 | 网站地图
 | 留言反馈
本网站所刊载信息,不代表本站观点。 内容全网聚合禁止采集。
未经授权禁止转载、摘编、复制及建立镜像,违者将依法追究法律责任。
[网上传播视听节目许可证(0106168)] [京ICP备05004440号-1] [京公网安备:110102003000-1] [京ICP备05004440号-1] 总机:86-10-87828888

Copyright ©1999-2023 cmmrmedia.com. All Rights Reserved

app安卓v1.4.1 下载