华为发布盘古大模型3.0:“不写诗,只做事”

日期:2023-07-08 16:02:19 / 人气:130

编辑|佘陈晓7月7日,华为开发者大会(云)期间,华为正式发布盘古大模型3.0。华为云CEO张平安表示,与现在流行的ChatGPT不同,盘古大模型3.0是一系列完全面向行业的大模型,包括“5+N+X”三层架构:L0层包括自然语言、视觉、多模态、预测、科学计算五大基础大模型,提供行业场景下的多种技能需求;L1层是n个行业大模型,华为云可以提供利用行业开放数据训练的通用行业大模型,包括政务、金融、制造、矿业、气象等大模型。也可以根据自己的行业客户数据,在盘古大模型的L0层和L1层上,为客户训练自己专有的大模型。L2层提供更详细的场景模型,专注于政府热线、网络助手、试点药物筛选、传送带异物检测、台风路径预测等特定行业应用或特定业务场景,提供“开箱即用”的模型服务。张平安介绍,盘古3.0为客户提供了100亿参数、380亿参数、710参数、1000亿参数的一系列基础大模型,同时提供了一套全新的能力,包括NLP大模型的知识问答、副本生成和代码生成,以及多模态大模型的图像生成和图像理解,客户和合作伙伴可以直接调用。根据华为现场展示的气象行业案例,在3000台服务器的高性能计算机集群中,模拟台风未来10天的路径用了5个小时。在预先训练好的盘古气象模型的支持下,只需要在单台服务器上配置一张卡,就可以在10秒内得到更准确的预测结果。张平安在接受媒体采访时表示,他不想将盘古模式与ChatGPT相提并论。“聊天就是聊天,但是我们没有时间聊天。参数再多,对话能力再好,如果不能解决实际问题也没什么用。AI最不应该取代的就是画画和画画。这才是人类应该呈现的。为什么要给机器?”华为之所以切入行业模式,一方面是基于其过去在To B领域的经验,另一方面也将得益于华为在计算基础设施方面的布局。计算力是大模型不可或缺的“引擎”,盘古大模型的计算力来自于华为上升的AI集群。根据华为公布的数据,目前基于Ascension AI汹涌澎湃的计算能力,研发和适配的原创大机型已经超过30款,占国内大机型的近一半。受制裁影响,华为无法使用业界主流的GPU架构,而是推出了基于其自研达芬奇架构的AI训练芯片Ascension系列。2019年,华为宣布Ascent 910芯片正式商用。华为当时将其描述为业界“最强大”的AI处理器。在日前举行的世界人工智能大会上,华为宣布全面升级盛腾AI集群。集群规模从最初的4000卡集群扩大到16000卡。据华为介绍,这是业内首个Wanka AI集群,训练速度更快,训练周期稳定在30天以上。发布会上,华为盛腾AI云服务正式上线。据介绍,盛腾AI云服务提供2000P FLOPS的计算能力,支持主流AI框架和90%以上的算子,训练效率比业界主流GPU高1.1倍。华为提升计算业务总裁张在接受其他媒体采访时表示,中国对计算能力的需求非常强烈,很多大厂商都能获得计算能力,很多小企业却做不到。张平安还提到,目前英伟达芯片交付周期长,价格高,华为希望为业界提供另一种选择。华为在计算基础设施上投入了大量资金。目前,华为基于盛腾ai在上海、武汉、Xi安等25个城市建设了人工智能计算中心,提供计算基础设施服务。张平安表示,华为在计算能力方面投入了大量资金。“如果使用(计算能力)的人少了,我们就会亏损。但不能因为现在亏损,就不投资了。我相信在我们把AI算力生成做好之后,国内很多AI算力都会用我们。现在谈论好处还为时过早。”

作者:杏耀注册登录测速平台




现在致电 8888910 OR 查看更多联系方式 →

COPYRIGHT © 杏耀注册登录测速平台 版权所有