每日看点!华为推AI大模型 拟下月公布详情

2023-06-05 10:22:15     来源 : 大公报


(资料图片)

人工智能(AI)聊天机器人程式ChatGPT的出现,令各科网企业加快拓展AI应用,继百度(09888)的“文心一言”、商汤(00020)的“日日新SenseNova”大模型体系,以及阿里巴巴(09988)的“通义千问”等之后,华为亦加入AI大模型的行列,据报将于下月公布详情。

内地媒体消息指出,华为AI大模型命名为“盘古CHAT”,早于2020年11月通过华为云内部立项。据报,趁7月7日举行的华为云开发者大会(HDC. Cloud),华为将对外正式发布详情及内测,产品主要面对商业(To B)及政企(To G)客户。

命名为“盘古CHAT”

根据华为公布的一份论文数据显示,华为盘古PanGu-Σ大模型参数最多为1.085万亿,基于华为自研AI计算框架MindSpore开发。消息指出,整体而言,PanGu-Σ大模型在对话方面可能已接近GPT-3.5的水平。

华为云官网显示,盘古大模型由自然语言处理(NLP)大模型、计算机视觉(CV)大模型、多模态大模型、科学计算大模型等多项构成,通过模型泛化,解决传统AI作坊式开发模式下不能解决的AI规模化、产业化难题,可以支持多种自然语言处理任务,包括文本生成、文本分类、问答系统等。

另外,根据浙商证券的信息显示,华为在训练千亿参数的盘古大模型时,调用超过2000片昇腾910芯片,进行超过两个月的数据训练能力。

华为内部人士透露,集团每年在大模型训练调用处理器超过4000片,3年间的大模型算力成本达9.6亿元人民币。

标签:

推荐文章

X 关闭

最新资讯

X 关闭