藏在互動直播、線上課堂、IoT背後的技術之源

藏在互動直播、線上課堂、IoT背後的技術之源

作者| Cici

編輯| 吳懟懟

01

「只聞其聲,不見其人」

最近熱門話題不少,但雙十一可能會是持續時間最久的一個。

工作三年,自認為大件小件已經買的差不多,這次交了定金的4件東西總價沒到500。上一個購入的千元級物件,還要追溯到半年前的一臺破壁料理機。

除了讓我每天都能喝到一杯暖暖的豆漿之外,這臺料理機引起的對話其實更讓我無法忘懷。

收到貨的當天,我的室友——一位汽車發動機方向的工程師,興致勃勃地要來圍觀它的運作。觀察它轟隆隆工作1分鐘後,他興奮地下了結論:

這本質上是一臺高速運轉的電機。

這句話讓我感到震驚,因為它完全顛覆了我的思維方式。當我瞭解「聲網」後,立刻就聯想到這件事,當然它不是一臺電機這麼簡單。

長久以來,我們習慣享受一件成品帶來的服務,卻沒有想過背後如何運轉。

無論套上怎樣的外殼,擁有如何華麗的外觀,但其工作原理或是一個重要功能,可能就是簡單的一句話甚至一個詞。

而聲網,如果要用一個詞概括,那就是「實時通訊」。簡簡單單四個字,但卻蘊含著複雜的技術與服務。

藏在互動直播、線上課堂、IoT背後的技術之源

聲網是誰?我們日常運用的軟體中內嵌實時通訊技術(Real-time communication,簡稱RTC)的提供者,它藏在背後、深層,不會被直接看到,卻又無處不在。

聲網是第一個把RTC技術作為服務提供給開發者和創業者的公司,而且在很長一段時間內是唯一一家。在這段時間裡,聲網舉辦的每年一屆的RTC大會,是該領域國內外開發者交流相關技術、行業想法的最大平臺。

創立於2014年的聲網,目前為社交泛娛樂、教育、醫療、金融等各行業提供場景化解決方案。聯想到它的核心理念與服務範圍,用「只聞其聲,不見其人」概括再合適不過。

透過呼叫聲網的API,開發者可以快速建立聊天、語音、影片等功能,比起考核送達率的即時通訊(IM),RTC主要要求低延時和接通率,影片社交、互動直播、遊戲開黑、AR遠端協作等場景都在應用RTC。

這些熟悉的場景每個人都在接觸,教育和社交就是兩個非常依賴RTC的領域,也是聲網長久以來深耕的兩個重要領域。

2018年年初,受困於使用者規模增速減緩的陌陌,開始主打場景化社交。除了直播,還提供一起KTV、狼人圈、派對等一系列功能,讓使用者有更多可選擇的娛樂方式。

為其提供多樣場景解決方案的,正是聲網。

以一起KTV為例,它依託於語音聊天室,主播使用播放器播放MV,MV切換到伴奏時,房間觀眾聽主播K歌,同時可以上麥和主播交流。

播放過程中,主播可以控制歌曲的切換和暫停。

聲網的SDK解決了主播和觀眾的MV播放需要同步,同時對音質要求較高的難點,為其延續了社交直播平臺中實時場景的熱度,又完善了實時體驗。

在教育領域,聲網服務於VIPkid、好未來、滬江等多位賽道領跑者。

聲網曾和滬江合作,將實時互動的教育大課搬上實時網際網路,讓中國5W偏遠地區的小學生同時「坐」在一個虛擬大教室,跟英美外教學英語、跟一線名師做物理實驗,將實時互動大頻道的技術邊界繼續推到了100W。

本質上都是解決需求,外表看起來這些似乎更傾向於「提供服務」,那麼聲網還有更直接利落的「解決問題」。

隨著海量UGC內容的產生,音影片平臺的稽核壓力不斷加大,聲網的一站式服務不僅可以讓平臺擁有實時音影片的功能,還擁有實時智慧語音識別功能。對於試圖利用背景音矇混過關的,聲網獨特的AI降噪技術也能夠提升不良資訊識別率。

02

提供技術,構建場景

資料統計門戶Statista報告顯示,2015年-2019年,CPaaS(Communication Platform as A Service)市場從4億美元增長到81億美元。

幾年間,聲網與全球CPaaS市場共同發展,也經歷了從SDK到場景服務,再到生態共創的發展階段。

在場景服務的階段,聲網為各種規模的公司提供輕鬆開發和嵌入實時通訊的方法,為開發團隊節省人力資源和時間成本,使開發者專注於構建應用程式而非基礎架構,併為泛娛樂社交提供變現解決方案,為線上教育提升感受體驗等。

藏在互動直播、線上課堂、IoT背後的技術之源

到最新階段,聲網進一步升級成生態共創。在聲網Agora 2019品牌釋出會上,聲網公佈「Agora雲市場 」全球合作伙伴計劃,這也是聲網第一次品牌釋出會。

生態共創意味著,聲網的使用者成為合作伙伴,雙方一起構建基於實時互動場景的技術市場平臺,為開發者提供技術平臺、產品功能、開發整合、渠道銷售等解決方案,探索RTC在更多領域的用法。

除了社交和教育是重中之重,聲網也持續不斷地在IoT、金融、醫療等行業發力探索。

醫療急救一直讓我有個困惑——在醫生到來之前,作為患者家屬甚至是路人除了等待能夠做什麼?畢竟不是人人都會CPR,也並非所有急救措施都要用到CPR,普通人也難擁有足夠的醫學知識判斷患者的突發疾病。

聲網其實解決了我這個困惑。

2018年下半年,重慶率先上線了視覺化120自救互救系統。在撥打120後,點開由平臺傳送的簡訊連結,醫生就可以透過影片對話,指導現場人員進行自救或互救。

這背後的技術就由聲網合作提供。

儘管現在我們幾乎用微信代替了一切通訊(非簡單社交),但它還是建立在熟人基礎上。不得不承認的是,很多狀況與場景容不得讓我們「先加個微信」。

2018年統計結果顯示,我國每年有54 萬人發生猝死,超過 80%猝死在醫院門外,搶救成功率不到 1%。

如果聲網RTC能夠在醫療急救領域大規模運用,相信未來會對這個數字有所改變——在急救車到來之前,RTC提供幫助的可能性,可能遠大於恰巧身邊有一位醫生的機率。

03

聲網開放,CPaaS迎接未來

除了「Agora雲市場 」全球合作伙伴計劃之外,聲網還在釋出會上提到三個重要舉措。

第一件事是,Q4上線Agora Analytics水晶球2.0。聽起來名字很夢幻,其實很直接,就是服務透明化。

如果說聲網的實時音影片服務是為開發者提供了一輛車,那麼水晶球就是告知開發者車況如何,以及如果發生故障,那麼問題出在哪。量身打造的使用場景+售後自助服務,由此全都具備。

藏在互動直播、線上課堂、IoT背後的技術之源

一個常見的場景是,一位學生在觀看付費線上課程中進行投訴,原因是畫面卡頓體驗差。

由於這個平臺使用的是聲網的服務,於是請求聲網查詢問題,最終結論是學生使用的裝置版本過低,不支援老師的高解析度畫面。

問題最終被解決,但在一來一去三方溝通之間,幾個小時可能就這樣過去。平臺客服可能有著必須在規定時間內解決投訴的kpi壓力,學生可能當天不止觀看這一堂課,但由於問題一直在,所以始終體驗不好。

那麼,對水晶球2。0的需求就會非常迫切。聲網以此提供RTC服務全面的質量監控和分析資料產品套件,在實時問題調查的基礎上,可以進行整體服務質量和分析,實時質量監控。

藏在互動直播、線上課堂、IoT背後的技術之源

另兩件事是,聲網開源自研的抗丟包音訊編解碼器Agora Solo。Solo是聲網專為不穩定網路設計的語音編解碼器,能夠在弱網條件下保證流暢的高質量通話;Agora RTC SDK3。0也將於11月上線,實現直播和通訊大融合,並全面提升弱網環境下的音影片體驗。

聲網不僅為平臺使用者賦能,授之以漁,還為開發者提供福利,實現技術共享與進步。

之前提到未來,其實任何技術與服務的發展都應該具備前瞻性。

Low-code(構建自定義程式碼開發)甚至No-code(零程式碼-拖放式編輯)快速開發應用,正在成為新的趨勢。Agora雲市場的一站式解決方案,就是以Low-code的形式,把聲網的實時音影片技術和合作夥伴的業務能力結合,無論單一介面的功能還是場景解決方案,都可以根據實際需求,透過低程式碼模組組建的方式自由組合,靈活開發。

在未來,RTC服務的界限會變得越來越模糊,多種技術的結合也會變得越來越普遍。

在4G時代,解決丟包問題是聲網在RTC領域擁有卓越表現的關鍵。5G時代儘管也將要到來,但頻寬只是其中一個環節,並不一定能夠避免丟包,高峰期、不同運營商之間的資料傳輸依舊面臨與4G時代同樣的問題。

不過,聲網考慮的問題顯然不只是不丟包而已。5G時代與VR、AR、AI的結合將會大大拓寬使用場景,AI教育、工業領域智慧製造,聲網始終在路上前行。