反向工程助力AI語音技術(shù)發(fā)展迅猛
來源:龍人計算機研究所 作者:站長 時間:2019-08-26 16:48:21
人工智能被認為是引領(lǐng)新一代科技革命和產(chǎn)業(yè)變革的戰(zhàn)略性技術(shù)。近年來,隨著各國對人工智能技術(shù)研發(fā)的強調(diào)及產(chǎn)業(yè)未來的關(guān)注,人工智能迎來了飛躍式的發(fā)展。
日前,我國連續(xù)第三次將人工智能寫入政府工作報告之中,且提出“智能+”新概念;國內(nèi)35所高校成功建設(shè)人工智能相關(guān)專業(yè)和學院;以及人社部等三部門發(fā)布人工智能有關(guān)新職業(yè),共同推動了我國人工智能建設(shè)的進一步提速。
而作為人工智能重要分支之一的AI語音技術(shù),當前在積極向上的大環(huán)境下也正迎來迅猛發(fā)展。在科大訊飛、阿里、百度、搜狗等越來越多科技公司的助力之下,AI語音技術(shù)正不斷突飛猛進、更新?lián)Q代,給人們的生產(chǎn)和生活帶來更加顛覆性的影響。
目前,AI語音技術(shù)除了傳統(tǒng)意義上的AI語音識別、AI語音服務(wù)之外,又誕生出了AI語音合成和AI語音識人等新突破與新應用。其中,AI語音識別是AI與語音最早的一種組合,將AI加持到語音識別技術(shù)之上,能賦予產(chǎn)品更智能、更準確的識別效果,眼下市場上科大訊飛研發(fā)的各種翻譯機器、不少手機采用的語音解鎖,以及智能門鎖等安防產(chǎn)品,都普遍采用了該技術(shù)。
而AI語音服務(wù)是繼AI語音識別之后的又一創(chuàng)新嘗試。機器人企業(yè)通過該技術(shù)賦予了機器人說話、溝通的能力,讓人機互動更加順暢、自然和智能;而電銷企業(yè)則運用該技術(shù)替換人工電銷員,帶動了電銷行業(yè)的整體提效增速升級;此外,由該技術(shù)打造的AI合成主播也成為電視熒幕上的全新吸睛點,推動了新聞傳媒的與時俱進。
再往下,AI語音技術(shù)的又一突破是AI合成技術(shù),利用該技術(shù)人們可以輕松生成各種AI定制語音,實現(xiàn)創(chuàng)造聲音和變換人類聲音的神奇功效。日前,阿里巴巴便發(fā)布了新一代語音合成技術(shù)KAN-TTS,據(jù)悉該技術(shù)可大幅提高合成語音與真人發(fā)聲的相似度,并將語音合成定制成本降低10倍以上。普通用戶只需手機錄音十分鐘,就能獲得與錄制聲音高度相似的合成語音,這大大降低了人們定制“AI聲音”的門檻。
最后,AI語音技術(shù)最前沿的創(chuàng)新便是AI語音識人技術(shù),換句話說就是“聞聲識人”。在國外,有研究人員設(shè)計了一種智能軟件,通過深度學習網(wǎng)上搜集到的百萬段教學和音像視頻中的人聲和面部特征,習得了單聽聲音便能畫出人物相貌的功能,雖然該軟件尚不成熟,但準確性也八九不離十。未來該技術(shù)有望運營到刑事鑒識等場景之中。
日前,我國連續(xù)第三次將人工智能寫入政府工作報告之中,且提出“智能+”新概念;國內(nèi)35所高校成功建設(shè)人工智能相關(guān)專業(yè)和學院;以及人社部等三部門發(fā)布人工智能有關(guān)新職業(yè),共同推動了我國人工智能建設(shè)的進一步提速。
而作為人工智能重要分支之一的AI語音技術(shù),當前在積極向上的大環(huán)境下也正迎來迅猛發(fā)展。在科大訊飛、阿里、百度、搜狗等越來越多科技公司的助力之下,AI語音技術(shù)正不斷突飛猛進、更新?lián)Q代,給人們的生產(chǎn)和生活帶來更加顛覆性的影響。
目前,AI語音技術(shù)除了傳統(tǒng)意義上的AI語音識別、AI語音服務(wù)之外,又誕生出了AI語音合成和AI語音識人等新突破與新應用。其中,AI語音識別是AI與語音最早的一種組合,將AI加持到語音識別技術(shù)之上,能賦予產(chǎn)品更智能、更準確的識別效果,眼下市場上科大訊飛研發(fā)的各種翻譯機器、不少手機采用的語音解鎖,以及智能門鎖等安防產(chǎn)品,都普遍采用了該技術(shù)。
而AI語音服務(wù)是繼AI語音識別之后的又一創(chuàng)新嘗試。機器人企業(yè)通過該技術(shù)賦予了機器人說話、溝通的能力,讓人機互動更加順暢、自然和智能;而電銷企業(yè)則運用該技術(shù)替換人工電銷員,帶動了電銷行業(yè)的整體提效增速升級;此外,由該技術(shù)打造的AI合成主播也成為電視熒幕上的全新吸睛點,推動了新聞傳媒的與時俱進。
再往下,AI語音技術(shù)的又一突破是AI合成技術(shù),利用該技術(shù)人們可以輕松生成各種AI定制語音,實現(xiàn)創(chuàng)造聲音和變換人類聲音的神奇功效。日前,阿里巴巴便發(fā)布了新一代語音合成技術(shù)KAN-TTS,據(jù)悉該技術(shù)可大幅提高合成語音與真人發(fā)聲的相似度,并將語音合成定制成本降低10倍以上。普通用戶只需手機錄音十分鐘,就能獲得與錄制聲音高度相似的合成語音,這大大降低了人們定制“AI聲音”的門檻。
最后,AI語音技術(shù)最前沿的創(chuàng)新便是AI語音識人技術(shù),換句話說就是“聞聲識人”。在國外,有研究人員設(shè)計了一種智能軟件,通過深度學習網(wǎng)上搜集到的百萬段教學和音像視頻中的人聲和面部特征,習得了單聽聲音便能畫出人物相貌的功能,雖然該軟件尚不成熟,但準確性也八九不離十。未來該技術(shù)有望運營到刑事鑒識等場景之中。
面對國內(nèi)產(chǎn)業(yè)現(xiàn)狀,龍人反向研究義無反顧,肩負起國產(chǎn)企業(yè)的責任,持續(xù)為我國AI語音技術(shù)的發(fā)展、核心技術(shù)的跟進以及國外壁壘的突破提供系統(tǒng)級解決方案與全方位技術(shù)支持。