打破語(yǔ)音邊界,大模型泛化語(yǔ)音語(yǔ)料資源平臺(tái)的創(chuàng)新之路

2024-03-21 15:04:45   來(lái)源:搜狐   評(píng)論:0   [收藏]   [評(píng)論]
導(dǎo)讀:  萬(wàn)物互聯(lián)的時(shí)代浪潮下,智能語(yǔ)音以其直觀、高效、自然的交互優(yōu)勢(shì),已成為人機(jī)交互的關(guān)鍵入口和影響用戶交互體驗(yàn)最直接的因素。然而,如何優(yōu)化產(chǎn)品語(yǔ)音交互性能,減少喚不醒、誤喚醒、聽不懂等問題的發(fā)生率,
  萬(wàn)物互聯(lián)的時(shí)代浪潮下,智能語(yǔ)音以其直觀、高效、自然的交互優(yōu)勢(shì),已成為人機(jī)交互的關(guān)鍵入口和影響用戶交互體驗(yàn)最直接的因素。然而,如何優(yōu)化產(chǎn)品語(yǔ)音交互性能,減少“喚不醒、誤喚醒、聽不懂”等問題的發(fā)生率,持續(xù)提升用戶交互體驗(yàn),成為當(dāng)前智能產(chǎn)品創(chuàng)新的重點(diǎn)之一。

  為了持續(xù)優(yōu)化產(chǎn)品的交互效果,企業(yè)通常會(huì)開展大量的測(cè)試工作。在此過(guò)程中,語(yǔ)音語(yǔ)料資源扮演著至關(guān)重要的角色。然而,現(xiàn)階段對(duì)于大部分企業(yè)來(lái)說(shuō),獲取高質(zhì)量、高覆蓋度的語(yǔ)音語(yǔ)料資源仍面臨著成本高、質(zhì)量參差不齊、場(chǎng)景語(yǔ)料泛化能力弱以及資源調(diào)用復(fù)雜等挑戰(zhàn)。因此,行業(yè)亟需一個(gè)高效、靈活且可拓展的語(yǔ)音語(yǔ)料資源管理平臺(tái),以支撐智能語(yǔ)音技術(shù)發(fā)展,甚至推動(dòng)行業(yè)整體技術(shù)創(chuàng)新。

  面向行業(yè)發(fā)展迫切需求,國(guó)家智能語(yǔ)音創(chuàng)新中心針對(duì)性開展了語(yǔ)音語(yǔ)料資源技術(shù)攻關(guān)。從數(shù)據(jù)生成、存儲(chǔ)到管理,平臺(tái)整合了人工智能通用大模型的多種能力,通過(guò)聲音復(fù)刻、文本生成泛化、語(yǔ)音合成、語(yǔ)料資源管理等核心技術(shù)加持,創(chuàng)新性地構(gòu)建了一站式、全流程的大模型泛化語(yǔ)音語(yǔ)料資源平臺(tái),實(shí)現(xiàn)了高質(zhì)量、高適應(yīng)性場(chǎng)景語(yǔ)料資源批量生成,功能強(qiáng)大。

  聲音復(fù)刻:平臺(tái)可以根據(jù)上傳的音頻或?qū)崟r(shí)錄制音頻進(jìn)行聲音復(fù)刻,通過(guò)少量的音頻文件,即可訓(xùn)練出個(gè)性化發(fā)音人,形成個(gè)性化發(fā)音人模板庫(kù)

  文本泛化:平臺(tái)接入通用大模型,在語(yǔ)料泛化技術(shù)與大模型生成技術(shù)的雙重加持下,高效實(shí)現(xiàn)所需場(chǎng)景的文本語(yǔ)料的生成與泛化。根據(jù)語(yǔ)料邏輯、對(duì)話邏輯、使用場(chǎng)景等相關(guān)需求,平臺(tái)可一次性輸出至少25條聯(lián)想泛化結(jié)果。

  語(yǔ)音合成:平臺(tái)支持文本語(yǔ)料與發(fā)音個(gè)性化組合,可以批量合成語(yǔ)音語(yǔ)料資源,還可以對(duì)合成后的音頻文件進(jìn)行音量、音調(diào)、語(yǔ)速等方面進(jìn)行調(diào)節(jié)。

  語(yǔ)音及語(yǔ)料資源管理:對(duì)于用戶生成或上傳的語(yǔ)音語(yǔ)料資源,平臺(tái)可進(jìn)行統(tǒng)一化、標(biāo)簽化管理,利用集成工具即可實(shí)現(xiàn)語(yǔ)料獲取與分配,大幅節(jié)省語(yǔ)料獲取時(shí)間。

  同時(shí),平臺(tái)還可以進(jìn)行用戶管理、數(shù)據(jù)統(tǒng)計(jì)及分析,在幫助企業(yè)管理資源、優(yōu)化業(yè)務(wù)流程以及提升測(cè)試效率等方面具有諸多優(yōu)勢(shì)。

  更靈活:實(shí)時(shí)語(yǔ)料定制,可快速定制生成測(cè)試用數(shù)據(jù),提升開發(fā)速度與靈活性。

  更高效:集成化資源管理,簡(jiǎn)化資源獲取與分配工作,大幅度節(jié)省時(shí)間成本。

  更準(zhǔn)確:通過(guò)先進(jìn)的算法,豐富語(yǔ)料多樣性,提升語(yǔ)料質(zhì)量,進(jìn)一步保障測(cè)試全面性與準(zhǔn)確性。

  更便捷:平臺(tái)配置API接口,可支持跨系統(tǒng)功能集成,程序間資源調(diào)用更簡(jiǎn)單。

  更兼容:支持跨行業(yè)應(yīng)用,可覆蓋家電、汽車、金融等多行業(yè)特定測(cè)試需求,覆蓋率更廣,延伸度更高,兼容性更強(qiáng)。

  大模型泛化語(yǔ)音語(yǔ)料平臺(tái)以其高效生成高質(zhì)量、高覆蓋度場(chǎng)景語(yǔ)音語(yǔ)料,以及其他綜合功能優(yōu)勢(shì),將進(jìn)一步助力提升人工智能產(chǎn)品的語(yǔ)音識(shí)別準(zhǔn)確度和交互效率,從而幫助企業(yè)提升核心競(jìng)爭(zhēng)力。

  當(dāng)前,大模型泛化語(yǔ)料平臺(tái)已在智能家電領(lǐng)域?qū)崿F(xiàn)落地驗(yàn)證,為智能家電產(chǎn)品測(cè)試與調(diào)優(yōu)提供定制化語(yǔ)音語(yǔ)料解決方案。未來(lái),中心將持續(xù)優(yōu)化平臺(tái)性能,接入更多模型與能力,為更多領(lǐng)域、更多產(chǎn)品提供更優(yōu)質(zhì)、更全面的語(yǔ)料資源服務(wù),為行業(yè)整體技術(shù)創(chuàng)新發(fā)展增添助益。

分享到:
責(zé)任編輯:zsz

網(wǎng)友評(píng)論