图说:阿里云CTO周靖人在2023世界人工智能大会演讲 采访对象提供(下同)
【资料图】
7月7日上海世界人工智能大会,阿里云CTO周靖人在演讲中表示:“阿里云将把促进中国大模型生态的繁荣作为首要目标,向大模型创业公司提供全方位的服务,包括最强大的智能算力和开发工具,并在资金和商业化探索方面提供充分支持。阿里云魔搭社区现已聚集180万AI开发者和由20多家顶尖人工智能机构贡献的900多个优质AI模型,找大模型上魔搭,我们将努力把魔搭社区培育成中国最大的‘大模型自由市场"。”
阿里云是业内最早布局大模型的科技公司之一,也是全球为数不多拥有超万亿参数大模型研发经验的机构,其自研的通义系列大模型已发展成涵盖多个模型和产品的家族。2022年,阿里云在国内首倡MaaS(ModelasaService,模型即服务)理念,提出以AI模型为核心的开发范式,并搭建了一套以AI模型为核心的云计算技术和服务架构,积累了丰富的大模型研发经验、工具和平台,这套能力将全部向大模型初创企业和开发者开放,提供包括模型训练、推理、部署、精调、测评、产品化落地等在内的全方位服务。
在基础设施层,阿里云拥有国内最强的智能算力储备,阿里云的智算集群可支持最大十万卡GPU规模,承载多个万亿参数大模型同时在线训练,为大规模AI集群提供无拥塞通讯的自研RDMA网络架构和低成本高可靠的高性能存储CPFS。
在AI平台层,以机器学习平台PAI为核心的PaaS服务可支持万卡的单任务分布式训练规模,覆盖全链路AI开发工具与大数据服务,AI训练效率提升可达10倍,推理效率提升可达6倍。
阿里云的灵积模型服务平台,将面向所有业界模型开放。平台建设了一系列自动化的模型上云统一工具链路,支持模型的自主接入,所有接入灵积平台的模型都能自动获取平台的强大服务能力,包括基于阿里云强大算力的跨区域自适应弹性能力,并提供基于云原生的公共部署以及用户自定义独占部署等多种形式,来满足不同模型的需求。灵积平台还积累了模型自适应推理优化和高效微调训练的能力,并提供了基于插件进行模型能力拓展的系统框架。通过灵积,丰富多样化的模型不仅能通过推理API被集成,也能通过训练微调API实现模型定制化。对于AI开发者而言,这些不同模型的能力都能通过统一的SDK方便地获取并集成到自己的AI应用中去。当前灵积平台上托管了包括通义千问、ChatGLM-v2、百川、姜子牙、Dolly等在内的业界领先大语言模型。
在开发者生态层,阿里发起的AI模型社区魔搭集聚了180多万AI开发者和900多个优质AI模型。模型贡献者基本覆盖国内大模型赛道核心玩家,如百川智能、哔哩哔哩、IDEA研究院、兰丁股份、澜舟科技、openBMB社区、启智社区、清华TSAIL、RWKV、深势科技、WeNet社区、元语智能、浙江大学、智谱AI等(排名不分先后),他们贡献了30多个10亿以上参数规模大模型。
在魔搭这个自由市场,所有模型生产者都可上传模型,验证模型的技术能力,探索模型的应用场景和商业化模式。魔搭社区打通了与灵积平台的部署链路,支持社区的模型通过灵积来实现服务化。为进一步降低大模型使用门槛,阿里云在大会现场推出了一款智能工具魔搭GPT(ModelScopeGPT),它能接收用户指令,通过“中枢模型”一键调用魔搭社区其他的AI模型,大小模型协同完成复杂任务。这是国内首款大模型调用工具。
魔搭GPT现已能够调用魔搭社区十多个核心AI模型的API,未来随着更多模型API的加入,魔搭GPT的能力也将不断增强。构建这一模型调用工具的数据集和训练方案将会对外开放,供开发者自行使用,开发者可以根据需要对不同的大模型和小模型进行组合。
阿里云能够满足大模型企业在不同场景的数据安全要求。阿里云是亚太区最早布局可信计算和机密计算的云服务厂商,在业内首个推出基于SGX2.0和TPM的虚拟化实例。基于TPM、VTPM、虚拟化Enclave等技术,阿里云构建了基于神龙安全芯片的全隔离、高可信的计算环境,并通过硬件层、虚拟化层、应用层三种形态的机密计算能力,确保用户数据的机密性、可用性、完整性。
作为全球第三、亚太第一的云服务厂商,阿里云服务了全球超过400万客户,多年深耕产业智能,深悉工业、农业、医疗、办公、能源、零售、金融风控、传媒娱乐等行业的需求与痛点。周靖人表示:“阿里云愿与合作伙伴共享大模型的市场机遇,与大模型企业和开发者共同探索可持续的商业化路径。”
新民晚报记者 金志刚