出品 | 搜狐科技
作者 | 潘琭玙
【資料圖】
6月28日,在火山引擎“V-Tech體驗創新科技峰會”上,火山引擎發布大模型服務平臺“火山方舟”,面向企業提供模型精調、評測、推理等全方位的平臺服務(MaaS,即Model-as-a-Service)。
目前,“火山方舟”集成了百川智能、出門問問、復旦大學MOSS、IDEA研究院、瀾舟科技、MiniMax、智譜AI(以拼音首字母排序)等多家AI科技公司及科研院所的大模型,并已啟動邀測,首批邀測企業包括金融、汽車、消費等眾多行業的客戶。
在會后的媒體對話中,火山引擎總裁譚待向搜狐科技在內的媒體指出,目前已有7家大模型提供方加入平臺,火山會對進入平臺的大模型進行精選,“我們希望是已訓練好的模型,在合規等方面做得比較好,基本達到可用的形態。”
另外,譚待闡釋了火山方舟的設計與推出,是基于火山認為未來企業應用大模型將會是多模型并用的模式,所以火山方舟會支持多個模型上云的提供服務。
他判斷,企業使用大模型,未來可能會呈現“1+N”的模式,“1”是通過自研或深度合作,形成1個主力模型。另外,由于成本和場景復雜多元等原因,在這個主力模型之外,還會有N個模型同時應用。
火山引擎智能算法負責人吳迪也補充道,訓練大模型很昂貴,但長期來看,模型的推理開銷會超過訓練開銷。效果和成本的矛盾永遠存在,吳迪認為,降低推理成本會是大模型應用落地的重要因素。
“一個經過良好精調的中小規格模型,在特定工作上的表現不亞于通用的、巨大的基座模型,而推理成本可以降低到原來的十分之一。”他表示。
談及大模型的隱私安全問題,譚待認為,如果將大模型私有化部署,企業將承擔更高的成本,模型生產方也會擔心知識資產安全。
吳迪介紹,“火山方舟”已上線了基于安全沙箱的大模型安全互信計算方案,利用計算隔離、存儲隔離、網絡隔離、流量審計等方式,實現了模型的機密性、完整性和可用性保證,適用于對訓練和推理延時要求較低的客戶。
提及平臺如何平衡公司自研大模型與其他大模型的關系,譚待也明確表示火山不做大模型。但他也提到,若字節內部其他團隊有成熟的大模型也將會放在“火山方舟”平臺上,“每個模型在不同場景性價比有所差異,客戶會自行進行選擇。”
針對近期各大云廠商紛紛降價的消息,譚待也在對話中回應,“首先我們的價格已經比較便宜了,所以沒有必要。”他也指出針對刊例價的降價與大客戶上云所簽的折扣價沒有關系,“省不僅是采購價格上,也是在采購產品之后能不能跑得比其他的競品更快。”
以下為對話實錄,經編輯:
媒體:我們應該如何看待火山方舟這個平臺,是否類似于MaaS平臺?
譚待:方舟本身從層次上是屬于MaaS這一層,但是它和以前端到端閉環的MaaS不同的是,它是一個開放的MaaS,行業這些模型都可以放上去,應用者和開發者在里面找到多個行業的模型。
媒體:目前火山方舟平臺內的模型提供商有沒有一個具體的數字?現在可能國內已有70多家做大模型的公司,具體在方舟上正在洽談合作大概是什么數字?
譚待:火山方舟最終服務的是模型應用方,也就是廣大的企業客戶,我們和大模型的生產方合作,他們在我們的平臺上部署,然后對外進行提供服務。
我們對進入方舟平臺內的大模型提供商還是需要進行精選,希望是模型已訓練好,在合規等方面做得比較好,基本達到可用的形態,再放到方舟平臺上來。后續也會有更多廠商加入,和模型生產速度是有關系的,大家未來可以看到陸續的披露。
媒體:字節內部也在開發字節的大模型,今天我們看到火山方舟推出的平臺。我想了解一下我們字節研發的模型會不會放在火山方舟里面一塊提供服務?以及它們兩者之間的關系怎么平衡?
譚待:火山方舟是個開放的平臺。字節內部其他團隊如果做好了模型,大概也會上到方舟平臺上對外提供,它在方舟上就是眾多模型的一個。至于如何平衡自己的大模型和其他合作方的大模型,我覺得這是客戶自己的選擇,不需要火山來平衡。我認為一個企業未來一定會在多個場景應用多個模型,因為每個模型在不同場景性價比是不一樣的,這是一個開放的市場,自然而然取得平衡。
媒體:這幾個月我們也看到阿里云騰訊云說開始要降價了,火山引擎有相關的動作嗎?因為我們GPU很多,GPU有沒有一些相應的措施?
譚待:首先我們的價格已經比較便宜了,所以沒有必要。而且大的客戶上云,簽的都是折扣價,折扣價和刊例價的降價是沒有關系的。最重要還是看是不是真的讓客戶更省錢,能否提升效率,而不是一個刊例價的波動。
為客戶省錢是火山引擎很重要的事情,省不僅是采購價格上,也是在采購產品之后能不能跑得比其他的競品更快,這也是客戶考慮的省的要素。
相當于你通過你的工程平臺,火山平臺能夠讓它把GPU的物理極限用到最滿,用這個平臺再加上底層的服務器,性價比是最高的。
媒體:我們經歷了早期的ChatGPT火熱之后,現在有幾家已經開始布局所謂的平臺。請問怎么看待這樣一個趨勢?大家覺得還是通用型的大模型的機會太少了嗎?火山未來是不是也會更側重在產業大模型?
譚待:我自己預判未來可能頭部會有幾個超級大的(模型),非常大所以成本也非常高,中部的可能相對沒有那么貴。各個行業里面會有進一步縮減之后的模型,所以未來是每一層都有機會。
我們認為,在每一個場景里應該選擇最合適的模型。就像招聘員工,你不可能每個員工都要博士學位,會根據工作的難度,衡量不同學歷的人。
另外,在具體行業里,行業上的數據是有壁壘的。現在大家用公開數據來做通用模型是沒有問題,但是未來進入到某一個行業的時候,你有沒有這個數據是很大的差別。
還有安全性的問題,有的客戶需要私有化,有的客戶需要專有云,有的可以公開來使用。不同的模型對他自己的知識產業的保護也是不一樣的。
我自己覺得很難有一個模型能解決所有的問題,因為我們認為未來會是多模型,所以需要平臺把多模型服務好,讓企業可以更方便使用對應的模型。所以火山側重提供平臺,提供安全、低成本的應用服務,我們自己是不做模型的。
媒體:未來這個大模型MaaS平臺上會如何定價?會不會延續云產品的低價策略?
譚待:價格低不是一個商務手段,價格低是要通過技術,持續把成本做低。短期降價最后用規模換收入不可行。我們說性價比是強調通過技術來實現性價比。
吳迪:價格體系上,我們會把資源供應給大模型提供方,在這個供應里面就有一定的IaaS層面的利潤。然后大模型供應方會在上面刨除基本成本。他們的基本成本上再疊加一個他們認為的合理利潤,成為他們大模型在火山方舟的定價。
下游客戶的支付是兩部分,第一個是模型服務費。第二個是平臺服務費,平臺服務費在相當長的時間我們都會設置成零。
在客戶使用過程中,模型調用的錢,肯定給到對應的模型方,也可以認為這是一種分成。另外,客戶肯定也會使用到其他的云服務,比如說存儲,火山引擎會正常收費。
至于把成本做低的技術手段,我們花了很多年的時間深耕技術內功。第一個在基礎模型優化,包括算子優化等等。第二點,我們要基于云的規模化效應,利用錯峰、利用訓推一體把整體的利用率打上去,就能把單位價格打下去。
這也是為什么在大模型時代,大家的應用需要更多用于上云,因為能夠天然通過云的規模化來獲得更低的單位成本。
媒體:最近很多廠商都在發布相關的模型服務平臺,在兩位看來火山引擎平臺最大的優勢在哪里?
譚待:跟其他很多云廠商單純提供一些算力,提供一些基礎底座不一樣。我們火山方舟平臺一方面會在資源和優化方面跟模型提供商進行深度合作,把推理成本往下打。火山算法團隊也會和客戶做重點的應用共建和應用落地,我們想催化大模型、大算力在千行百業的落地速度。
還有一個很重要的是大家首先理念就不一致。很多友商推出模型平臺,但是其實模型也是自己做的,模型平臺也是自己做的,是很封閉的端到端。他們可能認為未來一個模型就夠了,我們理念認為未來肯定是多個模型,所以我的平臺一定要支持多個模型上云的提供服務。所以這個理念代表平臺能力是完全不一樣的。
還有一個是,這些本身業界做的比較好的獨立模型,大部分的訓練都在火山引擎上,所以我們已經跟他建立了很強的合作關系和信任感,把推理放到火山上就順理成章。我們在訓練端就跟這些企業有很好的基礎,而且這件事做好之后對他們也有很大價值。訓練和推理放在一起對他的成本也有很大的節省。
另外還有安全的能力,如果是一個端到端的閉環,很難用第三方安全方案證明安全,只有第三方的平臺才能具有三方安全的數據托管。
責任編輯:

- 聯邦高登×謝英凱聯名款衣帽間發布,以“未至之境”打開家居邊界落日晚霞相伴,音樂美酒為媒 關于設計與家居的聯...
- 誰能帶領交大昂立更好發展?復盤新舊實控方5次關鍵“交鋒”文|和訊財經 張星鈺本周五,由交大昂立(600530)二股東、原...
- 科順股份與豐澤股份參加2023世界交通運輸大會,智能化減隔震產品助力交通強國!6月14日-17日,WTC2023世界交通運輸大會(World Transport ...
- 20歲的民生保險 一個向光而行的追夢者2023年6月18日,是民生保險開業20周年的生日。民生保險從源起...
- 業之峰橋牌隊又雙叒叕拿冠軍了!6月16-18日,浙江省第十七屆南潯杯橋牌公開賽暨第二屆水晶晶...
- 股市什么時候休市?股票的漲跌是根據什么來決定的?
2023-06-27 23:22:36
- ipo上市是什么意思?ipo和直接上市有什么區別?
2023-06-21 11:47:33
- 出水芙蓉最佳買入形態?出水芙蓉上漲概率大嗎?
2023-06-20 16:14:53
- visa信用卡是什么?不出國visa信用卡有什么用?
2023-06-16 16:10:22
- 跌停能賣出嗎?漲停跌停還能交易嗎?
2023-06-14 15:46:11