螞蟻集團(tuán)CTO:堅(jiān)決投入大模型底層基礎(chǔ)設(shè)施,已建成萬(wàn)卡AI集群

2023-09-09 15:21:50   來(lái)源:新浪科技   評(píng)論:0   [收藏]   [評(píng)論]
導(dǎo)讀:  在2023外灘大會(huì)上,螞蟻集團(tuán)宣布發(fā)布金融大模型,并開(kāi)源生成式AI編程平臺(tái)CodeFuse。螞蟻集團(tuán)首席技術(shù)官、平臺(tái)技術(shù)事業(yè)群總裁何征宇在接受采訪時(shí)介紹,螞蟻大模型走純自研的技術(shù)路線,以全棧布局、長(zhǎng)線發(fā)展為
  在2023外灘大會(huì)上,螞蟻集團(tuán)宣布發(fā)布金融大模型,并開(kāi)源生成式AI編程平臺(tái)CodeFuse。螞蟻集團(tuán)首席技術(shù)官、平臺(tái)技術(shù)事業(yè)群總裁何征宇在接受采訪時(shí)介紹,螞蟻大模型走純自研的技術(shù)路線,以全棧布局、長(zhǎng)線發(fā)展為原則,以創(chuàng)造產(chǎn)業(yè)價(jià)值為目標(biāo)。為此,螞蟻堅(jiān)決投入大模型底層基礎(chǔ)設(shè)施,目前已建成萬(wàn)卡AI集群,訓(xùn)練效率領(lǐng)先行業(yè),為大模型產(chǎn)業(yè)化應(yīng)用提供有力支撐。

  何征宇介紹,螞蟻一直以來(lái)堅(jiān)持核心技術(shù)自主創(chuàng)新,2022年底正式立項(xiàng)大模型研發(fā),目前已形成從基礎(chǔ)大模型到行業(yè)大模型以及產(chǎn)業(yè)應(yīng)用的全棧布局。

  今天發(fā)布的螞蟻金融大模型基于螞蟻基礎(chǔ)大模型,針對(duì)金融產(chǎn)業(yè)深度定制。何征宇介紹,螞蟻基礎(chǔ)大模型平臺(tái)具備萬(wàn)卡異構(gòu)集群,其中千卡規(guī)模訓(xùn)練MFU可達(dá)到40%,集群有效訓(xùn)練時(shí)長(zhǎng)占比90%以上,RLHF訓(xùn)練在同等模型效果下訓(xùn)練吞吐性能相較于業(yè)界方案提升3.59倍,推理性能相較于業(yè)界方案提升約2倍,處于業(yè)界先進(jìn)水平。

  何征宇表示,未來(lái)螞蟻將持續(xù)探索和精進(jìn)大模型的五大能力方向。一是,建設(shè)高質(zhì)量的數(shù)據(jù)標(biāo)注團(tuán)隊(duì),沉淀高質(zhì)量數(shù)據(jù)體系;二是,攻堅(jiān)基礎(chǔ)大模型算法,以及高效綠色工程能力,提升模型邏輯推理等能力;三是,從通用語(yǔ)言大模型到通用多模態(tài)大模型,從一般通識(shí)走向全面專業(yè);四是,建設(shè)高效的大模型評(píng)測(cè)標(biāo)準(zhǔn)和評(píng)測(cè)體系,加快大模型迭代速度;五是,建設(shè)大模型安全能力,保障大模型健康可持續(xù)發(fā)展。

分享到:
責(zé)任編輯:zsz

網(wǎng)友評(píng)論