百度智能云曦靈-AI手語平臺發(fā)布
百度智能云曦靈正式發(fā)布“AI手語平臺”,可實現(xiàn)分鐘級生成手語合成視頻、手語主播實時直播等能力,為手語服務(wù)普及的難題提出了科技新解法。同時百度智能云曦靈還發(fā)布了“AI手語平臺一體機”,可以通過規(guī);渴鹂焖俳o障礙窗口,插電即用、操作簡單,適用于醫(yī)院、銀行、車站等多種公共場合,緩解無障礙窗口短缺困境。
百度智能云曦靈此次發(fā)布的“AI手語平臺”及“AI手語平臺一體機”,可以輕松在線上線下不同場景中快速實現(xiàn)手語翻譯服務(wù),助力無障礙環(huán)境的建設(shè)。
針對線上場景,“AI手語平臺”具備“視頻手語合成”、“直播手語合成”、“文本轉(zhuǎn)手語”、“語音轉(zhuǎn)手語”四大功能,可實現(xiàn)普通視頻合成為手語視頻、實時直播中增加手語畫面、文字翻譯為手語、語音實時翻譯為手語等多種效果。AI手語平臺可搭載在各類APP、網(wǎng)站、小程序中,讓聽障人士也能輕松實現(xiàn)線上社交、娛樂休閑、課程學(xué)習(xí)等各類需求。
對于諸如醫(yī)院、銀行、機場等線下場景,一體化產(chǎn)品的優(yōu)勢正在逐漸放大。百度智能云曦靈此次發(fā)布的全離線一體機V3以及端云結(jié)合一體機P3,搭載了“AI手語平臺”的核心功能,具備聯(lián)網(wǎng)即用、開機即用的特性,可實現(xiàn)AI手語翻譯對線下場景的快速支持,讓“AI手語平臺一體機”像手機、電腦一樣可快速、批量的生產(chǎn),并滲透到生活的各個角落。
未來通過“AI手語平臺一體機”即可將普通服務(wù)窗口直接轉(zhuǎn)換為“無障礙窗口”,聽障人士在醫(yī)院可輕松實現(xiàn)掛號、看診、繳費、取藥等全系列流程,在車站、機場可獨立完成值機、托運、改簽、中轉(zhuǎn),在法院、警局等特殊場景中也可對各類緊急情況進行實時平等的溝通。
和傳統(tǒng)翻譯相比,手語翻譯過程更為復(fù)雜,主要在于手語翻譯并非按照日常說話的順序逐字翻譯,而要根據(jù)語句意思進行語言精煉和語序調(diào)整。手語是真正的小語種,數(shù)據(jù)量難以支撐訓(xùn)練,各類場景聲學(xué)環(huán)境復(fù)雜難部署,還需要唇語及表情的配合輔助理解,對 AI 手語平臺的構(gòu)建提出層層挑戰(zhàn)。
想實現(xiàn)高可懂度的AI手語能力要解決三大技術(shù)點:語音識別的清晰度、手語翻譯的準(zhǔn)確度、手語動作的流暢度。
首先,在語音識別清晰度上,百度智能云曦靈-AI手語平臺通過SMLTA語音識別算法模型,實現(xiàn)聲學(xué)、語言一體化端到端建模語音識別,在手機端近場語音識別率可達98%以上。百度語音技術(shù)部總監(jiān)高亮表示,基于百度自研的深度學(xué)習(xí)算法,還可針對諸如旅游、醫(yī)院、司法等不同領(lǐng)域的詞準(zhǔn)率進行針對性訓(xùn)練,詞準(zhǔn)率可達96%,使得AI手語平臺一體機更好地應(yīng)用于不同場景中。
其次,在手語翻譯的準(zhǔn)確度及精煉度上,百度人工智能技術(shù)委員會主席何中軍表示,百度研發(fā)了首個基于神經(jīng)網(wǎng)絡(luò)的精煉度可控手語翻譯模型,并聯(lián)合手語語言學(xué)專家、特殊教育專家以及天津理工大學(xué)聾人工學(xué)院等制定了自然手語標(biāo)注規(guī)范,建設(shè)了大規(guī)模自然手語翻譯語料庫,使得模型可以從真實數(shù)據(jù)中學(xué)習(xí)手語翻譯知識,比如語序的調(diào)整、詞語的映射以及長度控制等,從而生成符合聽障人群習(xí)慣的自然手語。
最后,在手語動作的流暢度上, AI手語平臺通過“動作融合算法”,基于《國家通用手語詞典》規(guī)范精修近11000多個手語動作,讓每一個動作的起落之間自然銜接,帶來真人手語般地連貫性表達。再配合4D掃描技術(shù)訓(xùn)練,使得AI手語數(shù)字人表情自然生動,口型生成準(zhǔn)確度高達98.5%。

大家都在看
