DoNews11月21日消息,11月21日,「筑基賦能 智向未來」九章云極DataCanvas大模型系列成果發(fā)布會(以下簡稱“發(fā)布會”)在北京召開,發(fā)布會上重磅發(fā)布圍繞DataCanvas Alaya九章元識大模型的開源底層LLMOps大模型工具鏈,開源Alaya-7B大模型系列,以及TableAgent數(shù)據(jù)分析智能體等一系列直擊應用的大模型創(chuàng)新成果。
Alaya-7B通識&對話大模型 + LLMOps工具鏈,大模型「全家桶」重磅開源
九章云極DataCanvas Alaya-7B系列大模型正式開源
發(fā)布會上,九章云極DataCanvas公司自主研發(fā)的DataCanvas Alaya 九章元識大模型矩陣正式開源一系列新成果,其中包括「Alaya-7B大模型系列」中的Alaya-7B Foundation Model通識大模型和Alaya-7B Chat Model對話大模型兩大模型,以及「LLMOps大模型工具鏈」中的LMS模型運行工具和LMPM?提示詞管理器兩大工具。
【技術門檻更低,算力消耗更少的Alaya-7B】
九章云極DataCanvas 公司副總裁于建崗介紹,Alaya-7B大模型系列是DataCanvas Alaya九章元識大模型矩陣的成員之一,基于Alaya通識大模型,由自我采集、精心篩選處理的萬億token數(shù)據(jù)集(包含網(wǎng)絡上的中英文文章、新聞、百科等數(shù)據(jù)源)上從0開始預訓練而成。在此前參與的C-Eval、CMMLU、AGIEval、?MMLU、BBH等權威大模型評測榜單中,Alaya-7B均表現(xiàn)出業(yè)內(nèi)領先水準。
Alaya-7B Chat Model 是Alaya-7B Foundation Model的對話版本,通過在精心選擇的微調數(shù)據(jù)集上進行微調,并對基于涉毒、涉黃以及不良偏見數(shù)據(jù)進行去毒,從而生成和人類價值觀對齊的對話式大模型。Alaya-7B Chat Model具備多輪對話、自我認知和偏見拒答的能力,能夠完成知識問答、代碼編寫、信息提取、閱讀理解、創(chuàng)意寫作等多項語言任務。
于建崗稱,Alaya-7B大模型系列在保證模型表現(xiàn)的同時,對使用者的安裝使用硬件要求更低、應用技術難度更低、訓練所需的算力資源消耗更小,有助于加速大模型在各類行業(yè)場景的實際應用。
九章云極DataCanvas LLMOps大模型工具鏈正式開源
【全生命周期的大模型工具鏈】
LLMOps大模型工具鏈則覆蓋了大模型從訓練、精調、壓縮、部署、推理到監(jiān)控的全生命周期過程。本次開源兩大工具——LMS(Large?Model?Serving)模型運行工具和LMPM (Large Model Prompt Manager) 提示詞管理器——在大模型業(yè)務賦能過程中均起著關鍵作用。
九章云極DataCanvas正在不斷嘗試工具鏈、大模型和行業(yè)應用的融合創(chuàng)新。此前,工具鏈之一DingoDB多模向量數(shù)據(jù)庫,與DataCanvas Alaya九章元識大模型聯(lián)合打造了企業(yè)知識管家解決方案,賦能企業(yè)構建高度自動化與智能化的企業(yè)知識庫,加速多模態(tài)大模型落地應用。
從DingoDB多模向量數(shù)據(jù)庫、LMS模型運行工具、LMPM提示詞管理器,到Alaya-7B通識+對話大模型系列,九章云極DataCanvas已經(jīng)為用戶提供了從數(shù)據(jù)管理到大模型應用的一站式、0門檻、全鏈條開源工具組合。
直擊最具商業(yè)價值應用場景!TableAgent實現(xiàn)人人都是數(shù)據(jù)分析師
TableAgent數(shù)據(jù)分析智能體正式發(fā)布
本次發(fā)布會正式發(fā)布公測的TableAgent數(shù)據(jù)分析智能體,同樣是以DataCanvas Alaya九章元識大模型和LLMOps大模型工具鏈為基礎實現(xiàn)的智能體創(chuàng)新。
九章云極DataCanvas公司主任架構師楊健介紹稱,TableAgent在Alaya元識基礎上進化而來,是從0到1的交互式結構化數(shù)據(jù)分析的突破,是企業(yè)數(shù)據(jù)分析的全新方式,讓“人人都是數(shù)據(jù)分析師”得以從夢想照進現(xiàn)實。
TableAgent是能夠實現(xiàn)私有化部署的企業(yè)級數(shù)據(jù)分析智能體,有非常強大的意圖理解能力、分析建模能力和洞察力。在充分的理解用戶意圖后,TableAgent能夠自主地利用統(tǒng)計科學、機器學習、因果推斷等高級建模技術從數(shù)據(jù)中挖掘價值,進而提供分析觀點和指導行動的深刻見解。這種啟發(fā)式和引導式分析能力,能夠從深度和廣度上不斷挖掘數(shù)據(jù)中的信息和價值,幫助用戶完成高質量的分析工作。
TableAgent數(shù)據(jù)分析智能體特性優(yōu)勢
同時,得益于自有大模型和自研T+底層體系,TableAgent能夠適用于各類行業(yè)和專業(yè),實現(xiàn)對任何特定領域內(nèi)個性化數(shù)據(jù)分析情景下的專業(yè)化微調。
楊健指出,當前市場呈現(xiàn)出豐富多樣的生成式AI形態(tài),撥開一眾表面浮夸的形態(tài)和場景,TableAgent團隊發(fā)現(xiàn),“數(shù)據(jù)分析”是大模型和具體業(yè)務融合的更深一步,是最能為用戶產(chǎn)生直接商業(yè)價值的核心領域,也將是企業(yè)真正需要沉淀的、最有業(yè)務價值的領域。