在大模型引领的AI新时代,开源与否,依然是众多科技厂商需要做的一个关键决策。
一方是考虑产品利润的闭源派,在巨大的成本面前,希望能通过闭源的方式,兜售知识产权,快速获取利润。从GPT-3开始,OpenAI不再将GPT模型的源代码完全开放给公众,许多OpenAI的跟随者也做了同样的选择。另一方则是考虑产品生命力的开源派,希望能用共享源代码的方式,激发全世界开发者的力量,共同构建一个更大、更长久的技术精品。
在这个问题上,我们不禁要思考:什么样的技术更适合开源?
答案是,越是根技术,越是应该开源。正如我国古代哲学家老子所言:“天下难事,必作于易;天下大事,必作于细。”根技术是整个技术体系的基石,只有打好基础,才能支撑起上层建筑的繁荣。最近,华为昇思MindSpore最新的“成绩单”,恰恰也印证了这一点。
据中国科学院科技战略咨询研究院预测,中国AI框架2024年新增市场昇思份额将达30%。目前,昇思已经使能超50主流大模型,成为AI创新源动力。
为什么大模型时代开源依旧能带给软件产品强大的生命力,或许我们也能从昇思MindSpore的发展脉络中窥得一二。
技术创新与开源社区互为支撑
“开源精神”最初出现在IT世界,便是因为黑客们想通过开源的模式,汇聚全球开发者的智慧,共同推动技术进步。正如《大教堂与集市》一书中所描述的,开源项目像集市一样,生机勃勃,不断迭代升级。
毫无疑问,开源能够加速技术的成熟和普及。当源代码开放给公众,成千上万的开发者可以参与到项目的完善和优化中,这样不仅能够迅速发现并修复漏洞,还能激发更多的创新思路,使得技术快速迭代。
当然前提是,这个软件足够能吸引开发者来做贡献。
“在AI技术体系中,AI框架处于‘承上启下’的位置,南向使能多样化算力,北向孵化各类算法模型,是人工智能应用创新的土壤和源泉。”在12月14日的昇思人工智能框架峰会上,中国人工智能学会副理事长、中国工程院何友院士指出了AI框架在AI技术体系中的重要性。
由此可见,AI框架是许多企业、开发者想要落地AI技术必不可少的一环。更重要的是,AI框架的技术发展路线也紧贴时代趋势,给了更多开发者参与的机会。
“AI发展瞬息万变,但昇思一直在紧贴时代变化。正是因为紧跟技术发展的趋势,所以大量开发者一直活跃参与整个项目开发”,开源中国CTO红薯介绍,目前昇思项目已有超过10万次的代码合入请求,这是昇思在Gitee上取得的好成绩,“Gitee指数2.0排名中,昇思在AI全领域取得最好的成绩,稳居该领域第一。”
比如,2021年AlphaFold破解了蛋白质结构预测的难题,AI在生物、材料、化学和量子计算前沿领域取得了非常好的成绩。2021年3月到9月,昇思MindSpore同时推出了量子使能计算套件和科学使能计算套件,“这两个套件在一年后,相继成为Gitee上面最具价值的开源项目。”红薯介绍。
到了2023年百模大战阶段,彼时Transformer成为技术热点,而早在2022年,MindSpore就已经推出了Transformer开发套件,走在行业的前沿。
当下,提升大模型训训练效率,同时提升模型与应用的敏捷度是业界所追求的目标。
昇思MindSpore面向多模态、长序列、MoE等主流场景,联合产业界、学术界积极探索,打造业界最全的多维混合分布式并行算法,并提供业界首创的并行策略自动配置能力,将万亿MoE训练效率提升50%以上。
不仅如此,昇思MindSpore还持续强化全流程开发部署能力,以更敏捷的AI框架加速应用落地。昇思聚焦生成式AI的快速开发和端侧部署,不断推进套件化的开发与部署技术。在短短6小时内,昇思即可复现LLaMA3.1-7B模型,天级即可完成典型大语言模型部署。随着LLM结合强化学习技术的演进,昇思推出了创新的训推同构架构,加强了大型模型在训练与推理阶段的快速交互能力,并开发了相应的开发套件,以加速强化学习类大型模型的推理速度和应用部署。
技术实力与性能永远是软件产品征服市场的第一利器。基于昇思MindSpore快速的技术迭代与强大性能,4年时间,昇思在社区活跃方面整体取得了指数级的增长。社区贡献者从200增长到了3.7万,累积代码提交突破10万,下载量从10万增长到1100万。昇思的用户来自于全球130多个国家与地区,2400多座城市。学术方面,已经有1700多篇学术论文基于昇思原创发表。昇思社区的发展,是全球数万名开发者共建的成果。
用行业生态造就长久生命力
事实上,开源社区可以赋予开源项目更持久的生命力,其本身也需要不断成长,这个过程中,除了技术立足点,还需要有更多动力。其中,生态便是一个重要的飞轮。
强大的生态系统可以维持开源社区的长期活跃,为技术产品提供支持和服务,用户和开发者之间的互动也能促进知识的传播和共享,这对于技术产品的长期发展至关重要。
生态建设可以让企业从单打独斗到协同创新。随着AI技术的深入发展,单一企业或研究机构已经难以承担起整个行业的技术创新任务。此时,开源模式的优势愈发凸显在未来的AI战场上,企业之间的竞争将不再是简单的技术比拼,而是在开放生态中的合作与共赢。
据了解,昇思MindSpore已经联合各界,原生适配了50+大模型,并且通过套件的能力封装,可以实现开发、训练、微调、部署的全流程开箱即用。
昇思MindSpore开源社区理事长丁诚介绍,目前已有1700多名社区伙伴采用昇思框架,累积孵化了超过2000个解决方案,在互联网、金融、能源、交通等15个行业获得了广泛应用。
在日前的昇思人工智能框架峰会上,昇思携手18家生态伙伴重磅发布基于昇思AI框架的大模型原生开发成果,面向金融、工业、互联网、电信、能源、交通等重点行业推出丰富的AI应用,加速千行万业数智化升级。
在与南方电网的合作中,昇思助力其打造了全球首款以AI科学计算的电力系统智能仿真器——驭电。南方电网公司战略总监、规划部总经理、科研院董事长郑外生介绍,驭电是南方电网联合华为等单位,基于昇思自主开发的,主要应用场景是大规模新能源电网,它能够在确保电网安全的前提下,最大限度利用新能源,解决当前新兴电力系统建设最大的痛点问题。
在与中国移动的合作中,昇思助力中国移动建设高效计算集群。中国移动研究院AI中心的技术负责人王斌介绍,中国移动在哈尔滨建成了全球运营商最大的单体计算机群,为了充分发挥其性能,他们在框架选择上非常谨慎。经过对比不同模型、参数规模和超常配置,并进行了充分验证,最终选择了昇思框架。在使用昇思框架近一年的时间里,有三点超出预期的感受:
一是昇思框架与NPU的软硬件协同表现优异;
二是预训练稳定性方面,基于昇思框架的千亿参数模型训练,实现了长达22天的稳态训练,期间无需人工干预;
三是集群性能方面,采用昇思加NPU和多维并行策略,集群线性度达到了98%,在业界处于领先水平。
可见,在大模型时代的浪潮中,开源不仅能够出奇制胜,而且在某种意义上已经成为推动AI技术发展的关键力量。
昇思MindSpore的开源战略,不仅证明了开源路径的可行性和强大生命力,更是展现了开源社区集体的智慧和创造力。在未来的AI征程中,开源将继续扮演着不可或缺的角色,它不仅能够促进技术的快速进步和普及,还能够凝聚全球开发者的力量,共同推动智能世界的到来。