搜狗語音:科技向善的願景與落地

搜狗語音:科技向善的願景與落地

文 | 闌夕

在人類歷史的車輪中,「科技」始終都是最為舉足輕重的碾壓與推動力,其對於社會底層民眾及弱勢群體也有著雙刃劍般的意義。

宏觀科技發展推動下的生產力進步自然會為整個社會帶來下限整體提高的福祉,這一點早已從過往數次工業革命的顛覆性影響中得到了印證。

但另一方面,生產力越發達,那些更難適應生產力變化的弱勢群體所面臨的問題就更多,這不僅僅體現在生產效率的提升會讓底層勞動者面臨被淘汰的厄運,對於老年人、殘障人士等弱勢群體而言,他們想要跟上時代的步伐就要付出更多努力。

僅以最近一次科技革命為例,網際網路技術的普及應用呈現出了顛覆知識分配體系以及資訊溝通渠道為核心的特色,前者將資訊變成了最重要的生產資料之一,並且將它的分配形式進行了重塑,也正是這一威力巨大的特徵讓學者們詬病,認為科技正在製造社會中的斷層——弱勢群體正面對比以往更可怕的機會差異。

在這樣的背景下,那些掌握著先進技術與社會話語權的科技企業們,其自身形象就對映著社會走向——能否讓包括但不限於弱勢群體在內的任何人都有權力、平等、方便地享受到科技進步的普惠成果,將決定文明社會的最終高度。

10月17日重陽節當天——也是中國傳統意義上的敬老節——搜狗圍繞「阿茲海默」主題釋出了《以聲相伴,讓愛常在》的公益短片,透過搜狗語音合成技術實現家人聲音的復刻與重現,倡導國人關愛和陪伴罹患阿茲海默症的老年人。

據瞭解,俗稱老年痴呆的阿茲海默症至今病因不明,亦無能夠有效逆轉病情進展的藥物,患病者的記憶會逐步衰退,繼而行動遲緩、情緒淡漠乃至生活不能自理。因此其堪稱是對老年人群體危害最大的疾病之一,而我國阿茲海默症患者人數超千萬,位居全球首位。

基於此,家人對於阿茲海默群體的重視與關愛顯得尤為必要——老年人群體本身就多渴望子女的陪伴和照顧,家人可以與罹患阿茲海默症的老年人一起回顧以前那些美好的事,撫慰老人的心理情緒,培養積極樂觀的健康心理,共同守護記憶。

而搜狗本次所展現的語音合成技術同時也可以幫助那些日常工作繁忙的上班族們,以聲音的陪伴緩解不能留在父母身旁所帶來的愧疚和無奈。即使自己不能時刻陪在父母左右,能讓他們時常聽聽自己的聲音也是一種慰藉。

這樣提升幸福感的技術,是搜狗基於國際領先的 WaveNet / WaveRNN 的語音合成技術,不僅可以將文字轉化為清晰自然、富有表現力的語音朗讀出來,而且只需要10MIN以內的少量資料即可生成使用者的說話音色,可支援離/線上、男/女、中/英等多達23種不同的音色。

彼時,機器還只能冷冰冰地發出毫無波瀾的聲音;此時,AI已經可以用你的聲音,說出你的特色。

值得一提的是,搜狗還在業內獨創了語音合成情感遷移技術,可實現說話人風格遷移,讓將機器對人類聲音的模仿更加惟妙惟肖,簡單地說,這意味著使用者不再需要預先錄製語音片段,只需留下足夠的語音訓練資料,即可結合使用場景需求由機器播放對應語音,這無疑是激發了資料的活性應用,也能夠滿足更多陪伴老年人的語音需求。

正如克萊頓·克里斯坦森在其著作《創新者的窘境》中所指出的,「很多時候技術發展與使用者需求的關係並非必要條件,而是充分條件——技術發展往往並非由使用者需求驅動的,反而是由於新技術的產生和應用,刺激和帶來了新需求的增長。」

事實上,搜狗多年來始終堅持對AI技術的研發推進和落地應用,僅在本次所展現的語音合成技術方面,搜狗就斬獲了Blizzard Challenge 2018 語音合成大賽中可懂度和語音停頓這兩項任務的冠軍,更重要的是,我們也能從搜狗呼籲倡導全社會關愛阿茲海默群體中看到其踐行先進科技公益向善的願景落地。

值得一提的是,搜狗語音合成技術不僅可應用於公益事業,助力企業更好的擔負起社會責任,另一方面也可以滿足相當程度的特殊人群使用者市場需求,達成公益與商業的雙贏。

這一點早已在其他國家得到過印證,以美國為例,根據美國人口普查資料顯示,全美接近20%的人患有不同程度的殘疾,其中一半以上是重度殘疾。

在今年5月舉辦的微軟Build 2018開發者大會上,微軟宣佈斥資2500萬美元推出為期五年的AI for Accessibility專案,鼓勵那些致力於改善殘疾人群生活的AI功能開發設計。Airbnb則在今年年初,推出了一項包括21種無障礙設施篩選器在內的更新,來幫助殘障使用者更好的找到適合自己的房子,包括無障礙淋浴間、輪椅通道、殘疾人車位等。

而根據世界銀行的資料顯示,全球範圍內約有15%的人是殘障人士,我國殘障人群數量則多達8500萬人。此外,人口老齡化大勢所趨的今天,我國65歲以上老年人群已經突破1。36億人,提升科技產品對於這些弱勢群體的實用性,無疑具備著相當廣闊的市場前景。

與之相對應的,是搜狗已經上線的個性化語音合成小程式「搜狗制音坊」,可在獲取一定時長人的聲音之後,快速合成用該音色進行新聞播報、閱讀兒童讀物、閱讀私人書單等語音播報。

搜狗語音:科技向善的願景與落地

這無疑將在諸如語音早教、虛擬助手等更多領域為包括但不限於上述弱勢群體在內的大眾使用者服務,藉由先進技術拉近人與人之間的距離,讓家人的陪伴與關愛能夠真正做到無視時間與空間的限制。

美國政治哲學家約翰·羅爾斯在其所提出的著名理論「無知之幕」中指出,「當每一個人都不知道自己在這個社會組織中處於什麼樣的角色之時,所制定的政策才能夠保證強者不會得到過度的利益,弱者能夠受到最大程度的保護。」

換言之,強調對於弱勢群體的照拂才是真正意義上的社會公平,而在數字資訊時代,諸如搜狗這樣的科技企業能夠讓新興技術真正惠及少數派群體,這展現的不僅是企業在盈利能力之外所具備的善良屬性,更是科技發展普惠民眾的終極目標。