8 月 7 日,元象 XVERSE 公司宣布開源其百億參數(shù)的高性能通用大模型 XVERSE-13B,可免費(fèi)商用。
開源信息:
Hugging Face:https://huggingface.co/xverse/XVERSE-13B
Github:https://github.com/xverse-ai/XVERSE-13B
據(jù)稱,XVERSE-13B 大模型基于標(biāo)準(zhǔn) Transformer 結(jié)構(gòu),在 1.4 萬(wàn)億高質(zhì)量、多樣化 tokens 的訓(xùn)練數(shù)據(jù)上,從零訓(xùn)練(train from scatch)了 130 億參數(shù)大模型,支持 40 多種語(yǔ)言,上下文窗口大小為 8192 。元象近期還將發(fā)布大模型 Chat 版,開箱即用,持續(xù)優(yōu)化開發(fā)者體驗(yàn)。
在多項(xiàng)權(quán)威的標(biāo)準(zhǔn)中文和英文測(cè)評(píng)中,XVERSE-13B 性能超越了 Llama-2-13B、Baichuan-13B 等國(guó)內(nèi)外開源大模型代表。它具備了高性能、全開源、可商用等諸多優(yōu)勢(shì),能大大降低高校和企業(yè)部署使用大模型的成本,不僅實(shí)現(xiàn)了國(guó)產(chǎn)可替代,也是中文應(yīng)用更好的選擇。
秉持開源精神,XVERSE-13B 代碼采用 Apache-2.0 協(xié)議,向?qū)W術(shù)研究完全開源,企業(yè)只需簡(jiǎn)單登記,即可免費(fèi)商用。
哈爾濱工業(yè)大學(xué)(下稱“哈工大”)作為我國(guó)最早從事自然語(yǔ)言處理研究的頂級(jí)科研團(tuán)隊(duì),已經(jīng)率先使用 XVERSE-13B 大模型推進(jìn)相關(guān)研究工作。哈工大計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院張偉男教授表示,“開源是互聯(lián)網(wǎng)時(shí)代主流模式,不僅能貢獻(xiàn)社區(qū),推動(dòng)技術(shù)持續(xù)創(chuàng)新,還能利用協(xié)同解決算法透明性、穩(wěn)定性、公眾信任度等共性問題。”
元象 XVERSE 創(chuàng)始人姚星表示:“真實(shí)世界的感知智能(3D),與真實(shí)世界的認(rèn)知智能(AI),是探索通用人工智能(AGI)的必由之路,也是元象持續(xù)探索 3D 與 AI 前沿技術(shù)的動(dòng)力。XVERSE-13B 是我們?cè)趪?guó)產(chǎn)技術(shù)自立自強(qiáng)上邁出的一小步,而開源開放將激發(fā)大模型生態(tài)活力,讓 AI 的未來(lái)發(fā)展邁出一大步,為實(shí)體經(jīng)濟(jì)、數(shù)字經(jīng)濟(jì)的發(fā)展注入強(qiáng)勁動(dòng)力。我們期待與眾多企業(yè)與開發(fā)者攜手,開創(chuàng)大模型商用新紀(jì)元!”
投稿/爆料:tougao@youxituoluo.com
稿件/商務(wù)合作: 六六(微信 13138755620)
加入行業(yè)交流群:六六(微信 13138755620)
版權(quán)申明:本文經(jīng)原作者授權(quán)發(fā)布,不代表VR陀螺立場(chǎng),如需轉(zhuǎn)載請(qǐng)直接聯(lián)系原作者
元宇宙數(shù)字產(chǎn)業(yè)服務(wù)平臺(tái)
下載「陀螺科技」APP,獲取前沿深度元宇宙訊息