進(jìn)軍智能語音賽道 漢王科技發(fā)布首款智能語音應(yīng)用“漢王語音王”
8月8日,漢王科技2024新品發(fā)布會圓滿舉行,首款智能語音應(yīng)用——漢王語音王App正式發(fā)布,致力于讓所有人都可以無障礙地進(jìn)行語言記錄、交流溝通,構(gòu)建智能時代“通天塔”,讓世界文明共享、共謀新發(fā)展。
漢王科技在人工智能技術(shù)上堅持原始創(chuàng)新三十余載,在感知智能、認(rèn)知智能以及具身智能領(lǐng)域持續(xù)深耕和廣域布局,進(jìn)一步完善從“看懂”、“聽懂”、到“讀懂”,再到“表達(dá)”的人工智能和機(jī)器人核心技術(shù)體系。漢王語音王正是在此技術(shù)體系下孕育而生,依托多模態(tài)天地大模型、OCR等全棧AI技術(shù)賦能,將在蓬勃發(fā)展的智能語音賽道上開辟出屬于自己的天地。
漢王語音王是基于漢王自研多模態(tài)天地大模型,自主研發(fā)的一款集AI語音記錄、智能翻譯與同聲傳譯于一體的智能語音旗艦應(yīng)用,支持AI精準(zhǔn)轉(zhuǎn)寫、拍錄同步(自動裁邊)、話稿整理、智能總結(jié)及不間斷實時翻譯等功能,用戶可以即聽即用,幫助跨越語言障礙,提高日常辦公、學(xué)習(xí)、會議、旅游等場景應(yīng)用效率和便捷性。
AI語音記錄:精準(zhǔn)識別拍錄同步
AI語音記錄支持實時語音轉(zhuǎn)錄和語音文件轉(zhuǎn)錄兩種方式,具備錄音速記、拍錄同步(自動裁邊) 、語音轉(zhuǎn)文字、說話人精準(zhǔn)識別、智能總結(jié)、AI話稿整理等多種智能功能,滿足用戶不同場景的語音記錄應(yīng)用需求。
漢王科技自研高精度語音識別模型,基于多元化數(shù)據(jù)訓(xùn)練、多任務(wù)聯(lián)合學(xué)習(xí)等方式提升語音準(zhǔn)確識別的性能,并通過多項模型優(yōu)化技術(shù)對性能進(jìn)一步完善和提升,確保在多種復(fù)雜的聲學(xué)場景下都能得到語音識別的高準(zhǔn)確性,隨時隨地滿足用戶對語音記錄準(zhǔn)確性的要求。
實際測試時,漢王科技語音識別具備高準(zhǔn)確率、多語言支持、動態(tài)修正和自然交流等特點。在行業(yè)廣泛使用的開源中文語音識別數(shù)據(jù)集上測試,錯誤率低至1.94%,處于行業(yè)領(lǐng)先水平。
漢王語音王可以自動修正錯誤文本,內(nèi)容規(guī)整后無須二次編輯,也支持自動生成標(biāo)題、總結(jié)記錄要點等,省心省力,同時更提升工作效率和學(xué)習(xí)效果。
值得一提的是拍錄同步功能,在錄音轉(zhuǎn)寫的同時拍照,通過強(qiáng)大的原研OCR技術(shù),在錄音類產(chǎn)品中首創(chuàng)照片自動裁邊和內(nèi)容智能排版功能,為用戶直接提供一份聲、圖、文并茂的多媒體記錄文檔,重要信息一點不落。
在會議、頭腦風(fēng)暴等多人對話場景中,準(zhǔn)確分離出每個人的身份以及內(nèi)容具有非常大的挑戰(zhàn),聲紋識別成為關(guān)鍵。聲紋和掌紋等類似都是人類生物特征,漢王科技聲紋識別技術(shù)具備在不限定用戶說話內(nèi)容的情況下,最短2秒準(zhǔn)確識別說話人的能力。
為解決場景中的各種環(huán)境噪聲和回響,以及說話人語速和情感變化等復(fù)雜情況下的識別準(zhǔn)確性問題,漢王科技隨機(jī)對語音數(shù)據(jù)進(jìn)行了速度變化,添加環(huán)境噪聲、回響等模擬復(fù)雜場景,通過持續(xù)訓(xùn)練迭代,最終在復(fù)雜場景下得到穩(wěn)定的準(zhǔn)確識別率。同時,漢王科技也引入聚類算法等實現(xiàn)了結(jié)合聲紋和語義特征,進(jìn)一步提高識別的準(zhǔn)確性,杜絕“張冠李戴”的情況出現(xiàn)。
當(dāng)整理好會議紀(jì)要、演講內(nèi)容等后,漢王語音王能與電紙本一鍵分享,將語音文本一體化傳輸?shù)诫娂埍旧线M(jìn)行高效閱讀辦公操作,構(gòu)建成一個多端互聯(lián)、共享的應(yīng)用生態(tài)。
對話翻譯:自然準(zhǔn)確林籟泉韻
對話翻譯具備實時翻譯和語音合成兩大能力,可以精準(zhǔn)捕捉每一句對話,即時翻譯,讓大家可以跨越語言界限,適合辦公、教育和旅游等場景下無障礙交流溝通。
基于漢王自研天地大模型的對話翻譯,具備更好的語義理解和上下文聯(lián)系能力,以及自適應(yīng)語言風(fēng)格和行業(yè)領(lǐng)域,提供更準(zhǔn)確和自然的翻譯內(nèi)容,表達(dá)更清楚、交流更順暢。
漢王科技自研的語音合成系統(tǒng)不僅具有卓越的多音字準(zhǔn)確識別能力,還能處理各種復(fù)雜多變的語音現(xiàn)象,能輕松應(yīng)對日常溝通交流、教育輔助朗讀和客戶服務(wù)等應(yīng)用場景。
為了進(jìn)一步提升語音自然度、準(zhǔn)確性和合成效率,漢王科技自研高自然度聲學(xué)模型,并引入了恒Q變換等多項先進(jìn)技術(shù),讓合成語音能更加高效和精準(zhǔn)地還原人類語音特性,帶來林籟泉韻的聽覺體驗。
同聲傳譯:長時間不間斷實時同傳
在AI語音記錄和對話翻譯的能力基礎(chǔ)上,漢王語音王又更進(jìn)一步拓展,推出了同聲傳譯功能。這對語音識別的實時準(zhǔn)確度、轉(zhuǎn)寫、糾正和翻譯能力都提出了更高的要求。
漢王語音王具備長時段不間斷即時翻譯能力,實時雙語對照文字記錄更能準(zhǔn)確表達(dá)專業(yè)術(shù)語和詞句表達(dá),加上領(lǐng)先的配錄同步功能,跨越語言的障礙,讓聲音也能看得見,幫助用戶輕松解決超長時間國際會議、學(xué)術(shù)研討的內(nèi)容記錄難題,為辦公、學(xué)習(xí)等全面提質(zhì)增效。
通用人工智能浪潮興起,對人工智能技術(shù)和產(chǎn)品產(chǎn)生了巨大推動,更是成為行業(yè)智能應(yīng)用的革命性工具,為各行各業(yè)開啟“人工智能+”變革之門。
漢王科技此刻恰逢其會,發(fā)布智能語音應(yīng)用——漢王語音王,一方面源于自研天地大模型的多模態(tài)智能涌現(xiàn),另一方面智能語音市場將進(jìn)入一個新的爆發(fā)增長期。在技術(shù)和商業(yè)雙輪驅(qū)動下,漢王語音王必將在智能語音市場上頂天立地,開辟出一片屬于自己的嶄新未來。
網(wǎng)友評論
專題排行
- 探秘2024電博會機(jī)器人展示區(qū),見證人工智能科技生活奇跡!
- “卷”出高增速,掃地機(jī)器人將在AWE2025上持續(xù)多樣創(chuàng)新
- 北京首家Max店落地!蘇寧大店助燃以舊換新
- 國家以舊換新補(bǔ)貼火熱進(jìn)行 北京蘇寧銷售增長超150%
- 回歸用戶價值本質(zhì),AIRMX秒新能否引領(lǐng)新風(fēng)行業(yè)一飛沖天?
- 格力超3000家門店接入京東家電秒送服務(wù),空調(diào)最快當(dāng)日即送即
- 科沃斯入選中國制造業(yè)民營企業(yè)500強(qiáng)!持續(xù)引領(lǐng)服務(wù)機(jī)器人行
- 馬清運:建筑是感性生活的理性投射
- 給消費者實惠、助商家拓銷路 京東11.11發(fā)布“以舊換新”等
- 央視點贊蘇寧家電3C以舊換新服務(wù):有效推動綠色循環(huán)經(jīng)濟(jì)
延伸閱讀
最新專題
- 探秘2024電博會機(jī)器人展示區(qū),見證人工智能科技生
- 科沃斯入選中國制造業(yè)民營企業(yè)500強(qiáng)!持續(xù)引領(lǐng)服
- 給消費者實惠、助商家拓銷路 京東11.11發(fā)布“以
- “卷”出高增速,掃地機(jī)器人將在AWE2025上持續(xù)多
- 格力超3000家門店接入京東家電秒送服務(wù),空調(diào)最快
- 大金鏈子配AR眼鏡,扎克伯格搶光了蘋果的風(fēng)頭
- 淘寶官宣:今年雙11期間,“先用后付”服務(wù)費全部
- 華為申請“鴻蒙甄選”商標(biāo) 商標(biāo)狀態(tài)為等待實質(zhì)審
- 李佳琦公司啟動出海:成立國際發(fā)展部,招聘英語印
- 50萬以上“車王”問界M9大定已超14萬輛,投影巨幕