代码将由大模型生成 解密中国电信“星辰大模型·软件工厂”
未来,也许只需要一句话、一个文档,就能拥有属于自己的网站、App、小程序了。
2024年7月5日,由中电信人工智能科技有限公司和中国电信人工智能研究院(TeleAI)联合发布的星辰大模型·软件工厂,或许能够完成这一愿景。它首创了面向文档开发的软件开发新范式,并结合自研多模态大模型技术,能够重塑当前的软件开发流程。
星辰大模型·软件工厂发布现场
众所周知,目前的软件开发离不开需求分析与功能实现。需求分析常用产品文档来描述产品,它贴近于日常语言,却不能直接用于开发功能。功能实现需要靠写代码,代码可以说是一种高度抽象逻辑的非自然语言,它适合于功能实现,却不适合于描述项目需求。
面向文档开发意味着只需要撰写简明易懂的产品文档,然后大模型就可以生成相应的代码,结合自动化的测试与部署,即可快速完成应用的开发与上线。
星辰大模型·软件工厂面世后,开发人员或许可以从需求解析、代码撰写和调试测试之间的循环往复中跳出,将精力更多的放在专心处理软件需求分析,维护产品描述文档上面。
中国电信研究人员提出了一种多模态大模型驱动的自动化软件开发框架。通过该框架,可将软件开发流程中的前后端需求、UI设计统一为需求文档进行拆分与描述,然后通过大模型来逐步理解产品需求并生成相应的代码,在自动化测试后,即可完成项目的一键部署上线。
星辰大模型·软件工厂从开发流程革新、代码可控生成、交互模式升级构建了三大核心能力:
面向文档开发的协同新流程,非软件开发人员也能参与
软件开发流程涉及到不同岗位的人员,如何实现产品研发需求的无损传递,保证参与者对项目需求理解的一致性,是实现优秀应用开发的前提条件。
针对该问题,星辰大模型·软件工厂提出文档即工程的软件开发新范式。使用更接近日常语言的项目文档来作为软件开发的核心,通过撰写文档来实现开发,隐去代码编写过程,简化软件开发流程;同时使非软件开发人员也可以直接参与到项目开发进程中,加速需求传递与协同开发。
面向文档的开发范式使得用户能够专注于核心业务逻辑的实现,而不是繁琐的编码和调试。
自研多模态代码生成大模型,实现从项目文档到项目代码的稳定生成
生成式人工智能具有一定的随机性,如何保证大语言模型生成代码的健壮性、可控性与可维护性,是实现生成项目稳定运行的基础。
为实现上述目标,星辰大模型·软件工厂提出代码基元的概念,从海量代码抽取最小方法单元,实现代码模块间的关系解耦,有效改善大模型生成代码的可维护性;同时面向标准库构建调用规范知识,实现了代码的可控生成,提高了开发效率。
代码基元概念的引入,为大模型生成规范代码建立了约束,实现了从项目文档到项目代码的快速、稳定生成。
大模型编程交互新模式,真正做到所写即所得
当前大多数代码生成产品,依旧是以对话模式为主,仅仅在开发流程中扮演辅助角色,同时受限于对话Token上限,无法支撑项目级别的代码生成、部署与维护迭代。
星辰大模型·软件工厂结合软开流程特点,设计了大模型编程交互新模式,用户无需直接与大模型沟通,只需要关心产品需求与描述文档撰写,跟随软件工厂的步骤指引即可完成软件开发、测试与部署,真正做到所写即所得。
星辰大模型·软件工厂提供了项目级别的协作与管理能力,为软件开发提供一站式全流程服务,协助推动项目快速开发迭代。
大模型浪潮下,中国电信快速推进大模型在软件开发领域落地应用
在大模型和AI技术领域,中国电信有长期积累与多方面布局。目前,中国电信已经组建了一支近800人的研发团队,由AI领域科学家李学龙牵头,不断开展基础、前沿研究。
中国电信人工智能研究院(TeleAI)揭牌仪式
目前,中国电信已打造出基础模型+行业模型+应用模型的布局,除了自研本身,还采取生态合作的方式,联合头部生态构建了涵盖教育、政务、应急等20多个行业大模型,覆盖全行业500多个应用场景。
在数据方面,已经完成了超500TB文本数据、12亿张图文数据、PB级视频数据的积累。
而且,中国电信拥有丰富的产线业务与庞大的客户基础作为落地基底,以及丰富的2C、2H、2B的信息服务经验,能够更快地推动大模型在各个领域的落地,形成新的经济增长点。
除了星辰大模型·软件工厂,中国电信还先后发布了星辰AI大模型、行业大模型、星辰语音大模型、大模型生产应用流水线“慧聚”等多个基础大模型和落地应用产品。
中国电信的AI之路,是让技术更加扎实,应用茁壮发芽,生态向上开花。以此为基础,AI才能生长为参天大树,变为栋梁之材。也只有如此,时代对智能的呼唤才能变为现实,人工智能技术才能够成为新质生产力的源泉,助力我国在新一轮国际科技竞争中掌握主导权,为推进中国式现代化提供更加有力的支撑。