华为发布盘古大模型3.0:“不写诗，只做事”

日期：2023-07-08 16:02:19 / 人气：483

编辑|佘陈晓7月7日，华为开发者大会(云)期间，华为正式发布盘古大模型3.0。华为云CEO张平安表示，与现在流行的ChatGPT不同，盘古大模型3.0是一系列完全面向行业的大模型，包括“5+N+X”三层架构:L0层包括自然语言、视觉、多模态、预测、科学计算五大基础大模型，提供行业场景下的多种技能需求；L1层是n个行业大模型，华为云可以提供利用行业开放数据训练的通用行业大模型，包括政务、金融、制造、矿业、气象等大模型。也可以根据自己的行业客户数据，在盘古大模型的L0层和L1层上，为客户训练自己专有的大模型。L2层提供更详细的场景模型，专注于政府热线、网络助手、试点药物筛选、传送带异物检测、台风路径预测等特定行业应用或特定业务场景，提供“开箱即用”的模型服务。张平安介绍，盘古3.0为客户提供了100亿参数、380亿参数、710参数、1000亿参数的一系列基础大模型，同时提供了一套全新的能力，包括NLP大模型的知识问答、副本生成和代码生成，以及多模态大模型的图像生成和图像理解，客户和合作伙伴可以直接调用。根据华为现场展示的气象行业案例，在3000台服务器的高性能计算机集群中，模拟台风未来10天的路径用了5个小时。在预先训练好的盘古气象模型的支持下，只需要在单台服务器上配置一张卡，就可以在10秒内得到更准确的预测结果。张平安在接受媒体采访时表示，他不想将盘古模式与ChatGPT相提并论。“聊天就是聊天，但是我们没有时间聊天。参数再多，对话能力再好，如果不能解决实际问题也没什么用。AI最不应该取代的就是画画和画画。这才是人类应该呈现的。为什么要给机器？”华为之所以切入行业模式，一方面是基于其过去在To B领域的经验，另一方面也将得益于华为在计算基础设施方面的布局。计算力是大模型不可或缺的“引擎”，盘古大模型的计算力来自于华为上升的AI集群。根据华为公布的数据，目前基于Ascension AI汹涌澎湃的计算能力，研发和适配的原创大机型已经超过30款，占国内大机型的近一半。受制裁影响，华为无法使用业界主流的GPU架构，而是推出了基于其自研达芬奇架构的AI训练芯片Ascension系列。2019年，华为宣布Ascent 910芯片正式商用。华为当时将其描述为业界“最强大”的AI处理器。在日前举行的世界人工智能大会上，华为宣布全面升级盛腾AI集群。集群规模从最初的4000卡集群扩大到16000卡。据华为介绍，这是业内首个Wanka AI集群，训练速度更快，训练周期稳定在30天以上。发布会上，华为盛腾AI云服务正式上线。据介绍，盛腾AI云服务提供2000P FLOPS的计算能力，支持主流AI框架和90%以上的算子，训练效率比业界主流GPU高1.1倍。华为提升计算业务总裁张在接受其他媒体采访时表示，中国对计算能力的需求非常强烈，很多大厂商都能获得计算能力，很多小企业却做不到。张平安还提到，目前英伟达芯片交付周期长，价格高，华为希望为业界提供另一种选择。华为在计算基础设施上投入了大量资金。目前，华为基于盛腾ai在上海、武汉、Xi安等25个城市建设了人工智能计算中心，提供计算基础设施服务。张平安表示，华为在计算能力方面投入了大量资金。“如果使用(计算能力)的人少了，我们就会亏损。但不能因为现在亏损，就不投资了。我相信在我们把AI算力生成做好之后，国内很多AI算力都会用我们。现在谈论好处还为时过早。”

作者：杏耀注册登录测速平台

华为发布盘古大模型3.0:“不写诗，只做事”

新闻资讯 News

案例展示 Case

现在致电 8888910 OR 查看更多联系方式 →

现在致电 8888910 OR 查看更多联系方式 →