李彦宏:没有应用,基础模型将一文不值

2024-09-11 21:39:14 财经资讯 毓果

7月4日,百度创始人李彦宏再度回应大模型开源闭源之争。他在2024世界人工智能大会上表示,激烈竞争环境中,商业化闭源模型最能打。但比开源闭源之争更重要的是,“卷”应用才是当前更具价值的话题,“没有应用,基础模型将一文不值”。

百度创始人李彦宏在2024世界人工智能大会演讲。

今年3月以来的开源闭源争议中,李彦宏称“有些外行甚至混淆了模型开源和代码开源这两个概念”。模型开源的情况下,使用者得到的是基础参数,还需进一步做监督微调(SFT)、安全对齐。但由于不清楚参数来源,就无法做到“众人拾柴火焰高”。即使拿到对应的源代码,也无法获知大模型开发者使用了哪些数据去训练模型。所以,使用开源模型并不意味着可以站在巨人的肩膀上去开发迭代。

李彦宏认为,同样参数规模之下,闭源模型的能力优于开源模型。如果开源模型想要追平闭源模型的能力,需要有更大的参数,那么推理成本会更高,反应速度会更慢。一个激烈竞争的市场环境中,比拼的是业务效率和更低的成本,对此,“商业化的闭源模型是最能打的”。

此前4月中旬,李彦宏的一份内部讲话内容流出,给开源路线泼冷水。他说,模型开源的意义不大,闭源才有真正的商业模式,能够赚到钱并聚集算力和人才。李彦宏随后在4月18日的百度AI开发者大会进一步断言:“开源模型会越来越落后。”其理由在于,通过文心4.0降维裁剪出来的更小尺寸模型,比直接拿开源模型调出来的模型,在同等尺寸下效果明显更好;同等效果下,成本明显更低。

但李彦宏也承认开源模型在某些场景下存在价值,比如学术研究、教学领域,可以借助开源模型研究大模型的运作机制。

与开源闭源之争相比,李彦宏认为关注大模型的应用层更为重要,“没有应用,光有一个基础模型,不管是开源还是闭源,一文不值。”他呼吁业界不要继续“卷”底层模型——此前的“百模大战”造成了巨大的算力资源浪费,而应当去“卷”应用。

李彦宏说,随着基础模型的日益强大,开发应用变得越来越简单,他最看好AIAgent(智能体)的应用方向。制作一个有价值的智能体,通常并不需要代码,只需用自然语言把智能体的工作流程表述清楚,再配上专有的知识库,比互联网时代制作一个网页还要简单。

他预测,未来在医疗、金融、教育、制造、交通、农业等等各个领域,李彦宏:没有应用,基础模型将一文不值都会依据特定场景下的经验、规则、数据等,打造出各种各样的智能体,“将来会有数以百亿的智能体出现,形成庞大的智能体生态”。搜索则是智能体分发最大的入口。

李彦宏还回应了AI对就业市场影响的外界担忧。他说,AI大模型更多扮演Copilot(副驾驶)的角色,只是辅助人,让人的工作效率更高、质量更好,而不是替代人。另一方面,大模型也催生了一些全新的工作机会。比如,过去几年,百度在全国二十多个城市落地了数据标注中心,提供了大量的数据标注师就业岗位。此外,随着智能体的大量涌现,提示词工程师的工作需求也会飙升——无需编程能力,但要有很强的逻辑性,用提示词对模型进行调教。

“从石器时代的石斧,到移动时代的手机,再到AI时代的大模型,人类不断创造各种工具来改善生活,来提高生产力。但是它们永远只是工具,只有在被人类所使用的时候才有价值。”李彦宏说,AI不是人类的竞争对手,构建和应用AI技术是为了满足人的需求,增强人的能力。

采写:南都见习记者杨柳记者王子黎发自上海

搜索
最近发表
标签列表