當(dāng)前位置：聯(lián)訊汽車網(wǎng) > > 動態(tài) > >

百川智能發(fā)布Baichuan2開源大模型

時間：2023年09月07日 09:24 來源：中國網(wǎng) 閱讀量：13367

9月6日，百川智能召開主題為“百川匯海，開源共贏”的大模型發(fā)布會，正式開源微調(diào)后的Baichuan2-7B、Baichuan2-13B、Baichuan2-13B-Chat與其4bit量化版本，并且均為免費可商用。

據(jù)介紹，Baichuan2-7B-Base和Baichuan2-13B-Base均基于2.6萬億高質(zhì)量多語言數(shù)據(jù)進(jìn)行訓(xùn)練，在保留了上一代開源模型良好的生成與創(chuàng)作能力，流暢的多輪對話能力以及部署門檻較低等眾多特性的基礎(chǔ)上，兩個模型在數(shù)學(xué)、代碼、安全、邏輯推理、語義理解等能力有顯著提升。

其中Baichuan2-13B-Base相比上一代13B模型，數(shù)學(xué)能力提升49%，代碼能力提升46%，安全能力提升37%，邏輯推理能力提升25%，語義理解能力提升15%。

Baichuan2-7B和Baichuan2-13B不僅對學(xué)術(shù)研究完全開放，開發(fā)者通過郵件申請獲得官方商用許可后，即可以免費商用。

大模型訓(xùn)練包含海量高質(zhì)量數(shù)據(jù)獲取、大規(guī)模訓(xùn)練集群穩(wěn)定訓(xùn)練、模型算法調(diào)優(yōu)等多個環(huán)節(jié)。每個環(huán)節(jié)都需要大量人才、算力等資源的投入，從零到一完整訓(xùn)練一個模型的高昂成本，阻礙了學(xué)術(shù)界對大模型訓(xùn)練的深入研究。

百川智能本次開源了模型訓(xùn)練從220B到2640B全過程的Check Ponit，并宣布將發(fā)布 Baichuan 2技術(shù)報告，詳細(xì)介紹Baichuan 2的訓(xùn)練細(xì)節(jié)，幫助大模型學(xué)術(shù)機(jī)構(gòu)、開發(fā)者和企業(yè)用戶更深入的了解其訓(xùn)練過程，更好地推動大模型學(xué)術(shù)研究和社區(qū)的技術(shù)發(fā)展。

百川智能由前搜狗CEO王小川創(chuàng)辦于今年4月，已相繼發(fā)布Baichuan-7B、Baichuan-13B兩款開源免費可商用的中文大模型，以及一款搜索增強(qiáng)大模型Baichuan-53B。8月31日，百川智能宣布百川大模型通過《生成式人工智能服務(wù)管理暫行辦法》備案，面向公眾開放。

聲明：以上內(nèi)容為本網(wǎng)站轉(zhuǎn)自其它媒體，相關(guān)信息僅為傳遞更多企業(yè)信息之目的，不代表本網(wǎng)觀點，亦不代表本網(wǎng)站贊同其觀點或證實其內(nèi)容的真實性。投資有風(fēng)險，需謹(jǐn)慎。

分享到微信