鈦媒體從華為內(nèi)部獨(dú)家獲悉,華為公司將發(fā)布一款直接對標(biāo) ChatGPT 的多模態(tài)千億級(jí)大模型產(chǎn)品, 名為“盤古 Chat”。
(資料圖)
據(jù)介紹,盤古大模型于 2020 年 11 月在華為云內(nèi)部立項(xiàng)成功。這款“盤古 Chat ”預(yù)計(jì)將于今年 7 月 7 日舉行的華為云開發(fā)者大會(huì) (HDC.Cloud 2023) 上對外發(fā)布以及內(nèi)測, 產(chǎn)品主要面向 To B / G 政企端客戶。
根據(jù)華為公布的一份論文數(shù)據(jù)顯示,華為盤古 PanGu-Σ 大模型參數(shù)最多為 1.085 萬億,基于華為自研的 MindSpore 框架開發(fā)。整體來看,PanGu-Σ 大模型在對話方面 可能已接近 GPT-3.5 的水平。
IT之家查詢公開資料獲悉,華為盤古大模型于 2021 年 4 月正式對外發(fā)布,后來又在 2022 年 4 月升級(jí)到 2.0 版本。目前,AI 大模型中的 NLP 大模型、CV 大模型以及科學(xué)計(jì)算大模型(氣象大模型)均已被標(biāo)記為即將上線狀態(tài)。
據(jù)介紹,這是首個(gè)干億參數(shù)中文預(yù)訓(xùn)練大模型,CV 大模型則首次達(dá)到 30 億參數(shù)。盤古 CV 大模型業(yè)界最大 CV 大模型、首次實(shí)現(xiàn)兼顧判別與生成能力、在 ImageNet 上小樣本學(xué)習(xí)能力上的業(yè)界第一;盤古氣象大模型提供秒級(jí)天氣預(yù)報(bào);紫東。太初是全球首個(gè)圖、文、音三模態(tài)大模型。
對于盤古大模型定位,華為內(nèi)部團(tuán)隊(duì)確立了三項(xiàng)最關(guān)鍵的核心設(shè)計(jì)原則:一是模型要大,可以吸收海量數(shù)據(jù);二是網(wǎng)絡(luò)結(jié)構(gòu)要強(qiáng),能夠真正發(fā)揮出模型的性能;三是要具有優(yōu)秀的泛化能力,可以真正落地到各行各業(yè)的工作場景。
根據(jù)華為云高管的演講 PPT 信息,目前華為“盤古系列 AI 大模型”基礎(chǔ)層主要包括 NLP 大模型、CV 大模型、以及科學(xué)計(jì)算大模型等,上層則是與合作伙伴開發(fā)的華為行業(yè)大模型。
華為云官網(wǎng)顯示,盤古大模型由 NLP 大模型、CV 大模型、多模態(tài)大模型、科學(xué)計(jì)算大模型等多個(gè)大模型構(gòu)成,通過模型泛化,解決傳統(tǒng) AI 作坊式開發(fā)模式下不能解決的 AI 規(guī)模化、產(chǎn)業(yè)化難題,可以支持多種自然語言處理任務(wù),包括文本生成、文本分類、問答系統(tǒng)等等。
具體來看,盤古 NLP 大模型 首次使用 Encoder-Decoder 架構(gòu),兼顧 NLP 大模型的理解能力和生成能力,保證了模型在不同系統(tǒng)中的嵌入靈活性。
下游應(yīng)用中,僅需少量樣本和可學(xué)習(xí)參數(shù)即可完成千億規(guī)模大模型的快速微調(diào)和下游適配,這一模型在智能輿論以及智能營銷方面都有不錯(cuò)的表現(xiàn)。
盤古 NLP 大模型
盤古 CV 大模型是 首次實(shí)現(xiàn)模型按需抽取的業(yè)界最大 CV 大模型,首次實(shí)現(xiàn)兼顧判別與生成能力,基于模型大小和運(yùn)行速度需求,自適應(yīng)抽取不同規(guī)模模型,AI 應(yīng)用開發(fā)快速落地。
使用層次化語義對齊和語義調(diào)整算法,在淺層特征上獲得了更好的可分離性,使小樣本學(xué)習(xí)的能力獲得了顯著提升,達(dá)到業(yè)界第一,這一模型在智能巡檢以及智慧物流方面有不錯(cuò)的表現(xiàn)。
盤古 CV 大模型
盤古氣象大模型提供秒級(jí)天氣預(yù)報(bào),借助創(chuàng)新的 3DEST 網(wǎng)絡(luò)結(jié)構(gòu)以及分層時(shí)間聚合算法,在氣象預(yù)報(bào)的關(guān)鍵要素和常用時(shí)間范圍上精度均超過當(dāng)前最先進(jìn)的預(yù)報(bào)方法, 速度相比傳統(tǒng)方法提升 1000 倍以上。
同時(shí),盤古氣象大模型支持廣泛的下游預(yù)報(bào)方案,如在臺(tái)風(fēng)路徑預(yù)測任務(wù)上,相比傳統(tǒng)數(shù)值氣象預(yù)報(bào)方法,盤古氣象大模型可以降低 20% 以上的位置誤差。
盤古氣象大模型
浙商證券此前披露的信息顯示,華為在訓(xùn)練千億參數(shù)的盤古大模型時(shí)調(diào)用了超過 2000 塊的昇騰 910 芯片,進(jìn)行了超 2 個(gè)月的數(shù)據(jù)訓(xùn)練能力。華為內(nèi)部稱,每年大模型訓(xùn)練調(diào)用 GPU / TPU 卡超過 4000 片,3 年的大模型算力成本高達(dá) 9.6 億元人民幣。
東吳證券梳理的華為盤古大模型產(chǎn)業(yè)鏈研報(bào)中指出,華為盤古大模型的優(yōu)勢在于人才儲(chǔ)備和算力自主可控,有望成為國內(nèi)領(lǐng)先的大模型,其生態(tài)產(chǎn)業(yè)鏈標(biāo)的有望迎來加速發(fā)展,包括拓維信息、四川長虹、麒麟軟件(中國軟件)、統(tǒng)信軟件(誠邁科技)、麒麟信安等華為生態(tài)公司。國盛證券則認(rèn)為,華為盤古為首個(gè)多模態(tài)千億級(jí)大模型,有望賦能百業(yè)。
2023 聯(lián)想商用產(chǎn)品發(fā)布會(huì)將于6 月 6 日下午 14:30 召開, IT之家網(wǎng)站 & App 將會(huì)同步直播,歡迎觀看!
另外,近期還有不少熱門內(nèi)容, 點(diǎn)擊下方藍(lán)字即可查看:
【好物】魅族18s Pro手機(jī)2459元腰斬清倉,京東PLUS+愛奇藝年卡128元限時(shí)購 馬斯克,腦機(jī)接口,第一刀 支付寶變“黑”了,又沒完全黑 Wi-Fi 7將至,實(shí)測小米13 Pro速率“碾壓”iPhone拭目以待 ↓↓↓
責(zé)任編輯:

- 六五環(huán)境日!業(yè)之峰打造“更環(huán)保的高端裝飾”1972年6月5日,聯(lián)合國在瑞典首都斯德哥爾摩舉行第一次人類環(huán)...
- 嘭彈水潤少女感:BENEV貝妮芙小金瓶讓肌膚元?dú)鉂M滿無論在什么年紀(jì),愛美人士對于年齡和美麗都會(huì)有一種焦慮感,...
- 熱心青少年公益!業(yè)之峰祝孩子們六一節(jié)快樂又逢兒童節(jié),業(yè)之峰裝飾集團(tuán)祝孩子們六一節(jié)快樂!在青少年公...
- 川渝地區(qū)優(yōu)質(zhì)房地產(chǎn)開發(fā)項(xiàng)目對外招商四川盛豪房地產(chǎn)開發(fā)投資有限公司成立于2006年08月03日,注冊...
- 平安私人銀行高質(zhì)量發(fā)展之路:踐行One Ping An,以專業(yè)創(chuàng)造價(jià)值中國平安近日迎來35周年司慶日,35年來平安始終堅(jiān)持以滿足人...
- 什么是除權(quán)價(jià)?股票前復(fù)權(quán)和不復(fù)權(quán)哪個(gè)準(zhǔn)確?
2023-06-02 16:50:36
- 股票XD會(huì)持續(xù)幾天?xd股票分紅到股票賬戶嗎?
2023-06-01 16:50:07
- xd股票是好是壞?股票xd當(dāng)天買入的好處?
2023-05-29 16:51:29
- 股票上的增發(fā)價(jià)是什么意思?增發(fā)價(jià)低于現(xiàn)價(jià)是利空還是利好?
2023-05-24 15:22:16
- 什么是套期保值?套期保值有哪三種類型?
2023-05-19 16:40:43