快手於冰:跟最優秀的人一起追求極致

晚上八點多,採訪結束。和於老師寒暄了幾句,他說下週要去WWDC,還要去訪問聖地亞哥實驗室。我們相互道別後,他轉身回去工作了。我大快朵頤著快手的免費晚餐——壽司和賽百味麵包。來到樓下,看到幾幢四面透明的玻璃大樓,燈火通明,負責公共關係的員工告訴我,這裡有食堂、星巴克、超市、健身房、理髮室、郵局……都是快手自有的,像是一個獨立的小鎮。過去的一個多小時,與於老師交流了他個人的成長與理想,一起探討了他是如何堅持初心,並一步步實現理想的。

文 / 於冰(快手音影片技術負責人)

策劃 / LiveVideoStack

LiveVideoStack:今天我們是在快手北京的總部,邀請到快手音影片技術負責人於冰,於老師同時還是8月份LiveVideoStackCon2019北京的聯席主席。我一般在採訪前先研究一個人的背景,所以我花了大概一個多小時研究您在Linkedin的資料。我很好奇,您曾經有兩段創業經歷,能聊聊這兩段創業的故事嗎?

於冰:

創業有快樂也有痛苦。首先分享快樂的事情吧,最快樂的事當然是把自己的創新技術應用到產品裡面去,為使用者創造價值。我參與創辦過兩家To B的創業公司,都是為電視臺提供網際網路影片解決方案的。在這個過程中,我瞭解了專業媒體機構是如何使用影片技術的,利用我們所掌握的全新技術,幫助傳統電視臺將媒體平臺拓展到網際網路上,是一段很跨界的經歷。

端到端的影片技術突破是產品的核心競爭力,從影片採集編解碼、傳輸分發,再到播放都是自主研發的。我們在2008年首創了H264+HTTPFLV技術,在瀏覽器內實現了實時+7天內任意時移回看,從清晰度流暢度,互動體驗創新上,在當時在行業內是最領先的。

創業公司人手不夠,我幾乎什麼都自己動手做過,從前端到後端,從編解碼裝置,流媒體伺服器到播放器,從運維到售前到產品經理。一開始我們給不同客戶做定製化開發,後來逐步把解決方案產品化。很多一線電視臺、網際網路公司都採用過我們的產品,也承接過超大規模的直播活動如優酷Nokia演唱會、2008年奧運直播等。透過技術改變世界,還是很有成就感的。

創業最大的痛苦在於,To B市場做起來比較辛苦。因為客戶的需求都是個性化的,定製化的東西非常多,每個專案做下來都投入非常大,但可複製性不高,每個客戶都要撥出人力去做支援,公司很難實現規模盈利,團隊也就很難成長得快。我中間在外企FreeWheel修煉了幾年,優秀的老闆和同事們帶我在技術上和管理上更進了一步,後來看到新的技術機遇,還是沒忍住又出來創業。第二次創業和第一次面向的市場客戶還是類似的,區別在於技術上更成熟了,而且會使用一些更新的技術,比如用Flash P2P來解決規模和成本問題,用硬體編碼器來提升編碼叢集密度等。

LiveVideoStack:我相信這兩段經歷你讓收穫了很多經驗,有了對市場認知。最大收穫是什麼?

於冰:

我覺得最大的收穫是轉變技術主導的思維,多思考技術以外的東西。首先,作為技術合夥人,在公司內外,還需要跟非技術人員做大量溝通,過程中也認識了很多朋友,得到了很多有益的幫助。公司內的產品、設計、銷售、售前售後支援,合夥人、投資人,公司外的各種客戶,電視臺的領導、技術人員、編導等,合作伙伴如整合商、友商、CDN廠商等,各行各業各種型別的人都接觸過。三人行,必有我師,這個經歷,沒創業是很難獲得的。另外,在公司內,我在研發團隊內的管理方面也得到了比較多的鍛鍊。比如在資源受限條件下,如何招聘到比較好的工程師?如何跟產品業務部門PK溝通需求,排定路線圖?應該如何處理突發事故?怎樣去激勵團隊,怎樣苦中作樂?在創業過程中必然會歷經很多磨難,但吃一塹長一智,都是個人成長的源泉。

LiveVideoStack:當初決定去創業時候,相信會有自己的目標或夢想,目標和夢想是什麼?

於冰:

團隊的初心很明確,就是希望能夠自己從頭到尾構建一個最強大的影片系統,解決一些別人解決不了的問題——那個時候Google對技術人員的影響是比較大的,大家都希望能夠透過技術來改變世界。

我們最開始是在清華的教師宿舍裡創業,團隊都是清北的背景,應該是在當時做To B影片技術公司中比較出眾的。我們希望用技術來改變影片分發和傳輸架構,在影片編碼密度、質量、系統吞吐率和終端使用者體驗上都要做到極致。能夠跟優秀的演算法專家、工程師一起合作,一起解決難題,這個過程非常爽。

LiveVideoStack:跟這樣一幫人在一起就是讓你覺得技術可以真正的改變世界了。

於冰:

是的,在產品體驗獲得客戶認可的時候,是很有改變世界的成就感的。只是當時底層技術雖然做的還行,但產品化做的不夠好,複製成本高。受限於行業規模,公司成長空間也受限,還是希望能夠做影響力更大的事情。當時做的很多直播相關的技術,現在整個行業也還在應用,說明大方向是對的,只是時機未到,平臺也不夠大。

LiveVideoStack:但是夢想和目標始終都沒有變?

於冰:

沒有變。我個人是一個技術控、產品控,同時愛才如命。一方面要在技術指標上追求極致,一方面要把使用者體驗做到最優,因此必須跟最好的人來合作,達成這個目標。

LiveVideoStack:回到今天,回到您加入快手,跟當初創業有非常緊密的關係?

於冰:

現在的想法和當初創業時是一樣的,做技術的人都希望跟強者一起合作,這樣會效率更高。我一直在找能夠打造一流團隊的平臺,希望有更大的成長空間,更好的品牌來吸引優秀的人。這樣的話,團隊和平臺雙贏,創造更大的價值。

其實在快手的幾年,更像是和公司一起創業,快手的音影片團隊從初期六個成員成長到如今一百餘人的規模,這個成長速度是創業團隊才有的,大家的狀態也一直都是創業團隊的狀態。

快手的使命是“用科技提升每一個人獨特的幸福感”。在快手,每個人都能夠看到更廣闊的世界,也能夠被更廣闊的世界看到,這就要求平臺堅持普惠、去頭部化,不然普通使用者是永遠沒機會被看到的。平等普惠,真實向善的價值觀,使用者導向,技術驅動的方法論,吸引了一批最優秀的人才一起去努力,一起追求極致,將使用者體驗打磨的更好。

LiveVideoStack:所以,Google只招全世界最聰明的人,至於這個人做什麼不重要。

於冰:

人很重要,做什麼也是很重要的。因為做事情需要專注,需要你對這件事熱愛,兩者是相輔相成的。

LiveVideoStack:你一直在尋找吸引行業中最頂尖人才,等待機會一起來做足夠大的事情。

於冰:

做一件大家都熱愛的事情,這個想法一直沒有變。

在快手,兩年的時間,我們已經逐步構建了端到端的音影片技術體系,打通了整個短影片+直播的技術棧,建立了完善的資料驅動的音影片體驗最佳化體系。

快手於冰:跟最優秀的人一起追求極致

圖:快手的音影片技術體系(摘自於冰在LiveVideoStackCon2018北京的主題演講PPT)

LiveVideoStack:您有些事業上的追求,尋找最優秀的人在一起,接下來就是兩個選項,一是大公司,二是創業。如果都能滿足要求,你會選什麼?

於冰:

對於影片行業來說,創業比較難。因為大平臺擁有流量的優勢、資本的優勢,在創業公司則很難擁有這樣的資源去發揮你的價值。

現在快手平臺日活已超過2億,原創影片總量超過100億條,每日影片播放量超過150億次,每天上傳影片超過1500萬,這個平臺規模是創業公司所不能比擬的。我們團隊每天並行的AB實驗就有幾十個,規模小的系統可能資料置信度都保證不了。在快手平臺,每做一個音影片相關的最佳化,可能會影響上億人的使用體驗,如果產生的收益,也會是一個天文數字。我們透過大量線上實驗證明了,技術最佳化對於核心使用者體驗(QoE)影響十分顯著,對業務指標有直接的貢獻,也直接對應巨大的使用者價值。在創業公司很難產生這麼大的價值,因此投入規模也會比較受限。

LiveVideoStack:這個行業裡技術創業,難度非常大?

於冰:

我並不是持一個完全消極態度,只是覺得只靠技術來創業很難,除非是特別強的人,才能做起來。一方面技術上需要有別人真的做不出來的東西,或者至少是短期內做不出來的東西,要有足夠前瞻性的技術佈局和儲備;另一方面還要有剛需的使用者場景,解決的是真需求而不是偽需求;最後一個建議是,不妨結合一些非技術的要素,比如資源、資料、版權等,建立自己的核心價值和壁壘。

LiveVideoStack:對於那些還是想去試一把的技術人,有什麼建議?

於冰:

影響創業成功的因素很多,再說一下人的因素吧,公司肯定不止要做技術,早晚需要做業務來讓公司持續賺到錢,走向正向迴圈。技術人要麼自己放棄技術,快速進化成為合格的業務負責人,同時找到合格的技術合夥人來幫你搞定技術問題;如果自己不放棄技術,就需要找到能力強,可依賴的業務合夥人,否則創業很難成功。好的技術人,做業務的潛力也是很大的,因為你有更加結構化、系統性、客觀的思維方式;但在感性思維和溝通方面,需要多鍛鍊加強。

LiveVideoStack:您一直在從事這個行業,但是我們回顧網際網路發展有機會,有社交、遊戲、區塊鏈還有AI,對技術人來講,機會很多,那我的問題是,為什麼還會一直專注在影片這個領域?

於冰:

影片是一個比較垂直的大行業,以影片作為牽引,可以整合很多技術,未來是有很大的空間和機會的。但我覺得AI、區塊鏈都是解決問題的手段,不是問題本身。影片行業問題本身是影片體驗——怎樣更清晰更流暢,這麼多年這個行業一直在解決這個問題,我們現在在用AI來解決傳輸、影象處理、影片壓縮、音訊處理的問題,問題還是不變的,只是手段變多變高階了。

LiveVideoStack:問題的本質是?

於冰:

提供更好的使用者體驗。

LiveVideoStack:只要能夠更好的解決問題,就有足夠的價值?

於冰:

是的,如果能夠把使用者的影片體驗做到最好就有足夠的價值。在快手,我們比較崇尚使用者導向、技術驅動的做事方式,首先理解使用者場景,之後根據使用者痛點設計最佳化方案,設定優先順序,最終用資料來驗證最佳化的QoE收益。

當然使用者導向也會給技術同學帶來很大挑戰。大家通常喜歡從技術角度出發想問題,但是現在要換位思考,從使用者角度、使用者需求去考慮,要有反向思維的能力,要培養同理心,這是非常難的事,很多工程師需要經歷一段時間的思路轉變才能做到。

要說改變起來其實也簡單,就是研發人員要成為產品的深度使用者,自己從使用者角度來推敲和最佳化,跟產品經理一起深入探討如何改進得更好。同時要做很多的技術儲備,這樣當用戶需求來了,隨時可以拿出來用。如果自己的技術儲備不夠,又十分著急的話,要考慮採用成熟的第三方技術,而不是從頭開始造輪子,讓業務方乾等著。最終技術好不好要用實際資料來說話,看使用者是否接受它,而不是盲目上線技術上看起來很厲害卻曲高和寡的東西。

LiveVideoStack:這個事情值得你去用十幾年二十年去投入?

於冰:

值得,會一直關注,一直做下去。720P做完了做1080P,1080P做完了做4K,4K做完了還有8K,還有HDR、高幀率、全景聲、VR等更好的體驗等著我們,挑戰也越來越大:舉個例子,8K@120fps HDR的影片如何做實時壓縮,想一想就覺得很興奮,非常有挑戰。

LiveVideoStack:從這個角度來看,多媒體技術人職業的發展應該是非常寬闊的,應該是充滿了機會。

於冰:

是的,解決核心問題有各種各樣層出不窮的手段,這個領域有很多細分方向,只要沿著主航道去深入發展就充滿了機會。

LiveVideoStack:這又引出另外的問題來,許多專家吐槽,這個行業裡的人才太少了,供給出現了問題。從學校這個最大的人才的輸出機構來看,選擇多媒體、編解碼、網路這些底層的技術的學生越來越少。想招一個合適的學生非常難,學生更願意去搞AI或者金融。

於冰:

首先,在我的觀察看來,現在有很多學生研究AI、做深度學習,實際上很多人都是拿現成的框架去解決一些自己拍腦袋想出來的問題,而且大多把時間花在了標註資料和調參上。我建議同學們多思考一下哪些問題是真實場景中的真問題,避免解決偽問題。在找到真問題之後,不妨嘗試用傳統方法搭建框架解一遍,把問題白盒化,有深入理解之後,再嘗試用深度學習去解決其中的難點。否則一開始就嘗試用深度學習去解端到端的問題,對於領域知識問題本質都缺乏瞭解,對於深度學習這個黑盒有沒有足夠的能力掌控,必然會碰壁。

說回行業的問題,其實建議在學校的同學可以放開視野。多媒體領域有很多問題待解決,例如一些老問題可以解的更好:比如如何透過演算法做主觀質量評價,如何更精確地預測頻寬變化,如何進一步對影片圖片進行壓縮,如何透過演算法最佳化影象質量等等。而且總是有新的問題、亦或新的方法湧現出來,尤其是在即將到來的5G+AI時代,問題和對應的方法會越來越多。想搞AI的同學不妨來影片行業看一下,這裡有很多實實在在、時時刻刻都在發生的問題,我們有大量的資料集,包括使用者行為日誌資料、內容樣本、傳輸日誌等等,還可以在大規模真實使用者中做實驗,這些條件在實驗室是完全接觸不到的。 在學校關起門做科研的問題在於,學生直接發paper,卻不瞭解問題本質,不瞭解真實的使用者需求,有可能paper涉及的問題是一個根本不存在的問題,或者是個偽問題。而在工業界每天遇到的問題都是實實在在存在的,你用什麼方法去解都可以,也可以用非常高深的演算法去解決。只是如果用非常複雜方法解,最終很可能是上不了線的,原因可能是演算法複雜度太高,或者有一些bad case特別難fix,但發paper大機率是可以的。

要解決高校多媒體專業的人才供給問題,一個思路就是希望高校能夠以開放思路來建設實驗室,多跟工業界的大平臺合作,這樣可以為學生提供真實的問題、真實的資料,透過實戰的專案,能夠進一步開闊眼界,鍛鍊動手能力。與真實場景問題結合,發paper也更容易中。有了產學研結合雙贏的機制,相信會有很多優秀的學生選擇多媒體相關的專業。快手去年就跟清華大學聯合成立了“清華大學-快手未來媒體資料聯合研究院”,一起去培養學生,鼓勵大家多用AI嘗試解決產品上的問題,有了不少喜人的落地成果。

最後說到行業人才問題,其實國內外多媒體人才並不少,尤其是國內每年優秀的畢業生很多。但與其他行業一樣,最好的人才都是比較搶手的。快手在音影片工程演算法方向的收益明確,投入堅決。我們在演算法方向招聘要求是出了名的高的,主要面向海內外高校TOP實驗室招聘最優秀的研究型人才;工程方面覆蓋面很廣,移動端雙端開發和SDK、服務端C++/Java、大資料系統和分析、音影片質量實驗室都有開放職位,目前在北京、杭州、深圳、矽谷、西雅圖、聖地亞哥都建立了研發中心和演算法實驗室,也在考慮開設更多的辦公地點,吸引一流人才入駐。

LiveVideoStack:剛剛提到了大平臺的流量和資源的優勢,可以滿足你達成技術人夢想。如果讓你用幾個關鍵字來形容一下快手這家公司會用哪些詞?

於冰:

去年我在LiveVideoStackCon2018大會上講過,前邊也提到了:“使用者導向,技術驅動”,這是我非常認同的方法論。快手是一家特別重視使用者體驗的公司,可以說整個公司的人都在最佳化體驗,投入巨大,今年公司對大家的要求也是 “追求極致”,這已經成為了公司的基因不會改變:“追求極致”就需要在關鍵領域上有足夠大的壓強,這樣才能夠突破。我們給了最優秀的技術人員一個很好的機會——把特別細的細節做好,不像有的產品只做到80分就夠了。這就可能要求在一些別人看起來非常小的領域中投入非常大,當然我們做得還不夠,積累的時間還不夠長,某些技術也正在逐步趕上。另外,前邊還提到過,公司的價值觀也是吸引眾多優秀技術人才的因素:平等普惠,真實向善,是貫穿在公司內外的行為準則。

LiveVideoStack:畢竟人力是有限的,當你在做一個決策的時候,到底是自己來做,還是先用供應商的產品。你也說到,業界有團隊會做得非常出色。

於冰:

我們一直都抱有開放的心態,積極調研外界的新產品新技術,跟自研系統來PK,很多友商的產品做得相當不錯,不過很多公司並不對外提供技術,有的則價格很貴,而且要採用第三方的產品上線還必須考慮各種各樣的非技術因素。當然在這個行業裡面,評測下來我們自己做的還可以。

我們很歡迎大家多利用LiveVideoStackCon大會這個平臺來探討,怎樣把技術做得更好。希望大家能夠保持長期的合作,一起做對比測試,我們有非常專業的質量測試實驗室,會幫忙建議哪裡需要加強,我們也可以知道自己哪裡做的不好:三人行,必有我師。這樣的話,技術才能不斷改進,而不是盲目驕傲自滿。

LiveVideoStack:快手和外界的供應商與技術團隊是一個比較良好的互動切磋?

於冰:

我希望建立一個開放的系統,而不是封閉的閉門造車,我自己創過業,相信創業團隊在某些點上很可能會做的比我們深入。只是團隊有時候比較忙(沒有時間一一反饋),也有些時候是因為提測的技術沒成熟到一定程度,評估需要花比較多人力去測試,因此我們會盡可能多做評測,同時也會謹慎選擇。

LiveVideoStack:很多公司有一套自己的資料集和系統來評估Codec,快手是否有這樣的系統?

於冰:

我們有一套比較完善的codec評估體系,主客觀都會做評估。我們的移動端短影片和直播的通用測試集,可以提供給相關合作夥伴採用自己的演算法做壓縮,結果出來後,我們會對比質量是否達標,客觀指標主要看PSNR和SSIM BDRate,主觀指標有專業的評估團隊來看。十分期待LiveVideoStack組織一箇中立的比賽,讓大家用同樣的測試集PK,用標準的評估手段去考驗大家對Codec實現和調優的能力,提升整個行業的水平。

LiveVideoStack:快手、大疆,包括華為、阿里、騰訊等越來越多的國內企業在標準組織貢獻專利,參與標準的制定。怎麼來解讀這個現象?我們能看到一個原因是規避一些專利風險。

於冰:

我認為多數公司是從專利這個角度出發來思考的。除此之外,我們有更深入的考量。首先,面向廣播電影電視內容制訂的壓縮標準,實際上對移動端影片並不是特別的適合,所以我們會針對移動端做許多創新的演算法研究。第二,在研究演算法的同時,我們也希望把演算法實現到產品裡去,看如何做的更有效率,這方面標準演算法研究團隊的專家們可以很大的忙。

LiveVideoStack:倒數第二個問題。5G帶來產品機會,哪些技術會因此會受益,快速普及或難點突破?

於冰:

目前暫時還不明朗。3G到4G經歷了網際網路移動化大潮,這個過程中有新的終端產生:智慧手機,它的使用者體驗遠遠超越了傳統的終端,但是在5G時代還沒有出現這樣的終端。實際上如果沒有智慧手機的普及,4G是沒有應用場景的。 2007年初喬布斯開iPhone釋出會之前,所有的運營商、電信裝置商都很焦慮,他們看不出4G做出來有什麼用?發圖片、發簡訊3G就夠了。但在5G時代,這幾年內如果沒有一個能創造類似量級的體驗革命的終端出來,很可能會遭遇4G發展初期類似的困境。

LiveVideoStack:哪些技術會有機會?

於冰:

革命性的終端出現前,技術都是漸進式的變化,不會特別明朗。

LiveVideoStack:最後一個問題,今年有什麼計劃?2019年馬上過去五個月了。

於冰:

今年要做的事挺多的,跟公司大方向一致,那就是“追求極致”。我們在移動端影片拍攝編輯、傳輸演算法、壓縮演算法等方向都在進一步突破。

另外,今年我們會將音影片中臺的建設作為重點工作,音影片中臺是快手技術中臺的核心支柱之一,我們希望利用領先的音影片工程演算法能力來支援快手APP以外的其他業務,如AcFun、快手海外版Kwai和影片編輯工具快影等。透過中臺的建設,我們的技術落地場景將會更多,包括短影片、直播、長影片等,將覆蓋更大範圍的使用者,也將會迎來更大的技術挑戰。

這裡也預告下,快手的短影片架構負責人陳彬、直播架構負責人郭亮在LiveVideoStackCon 2019北京站大會上,會分別分享“快手高效能移動端多媒體引擎架構”以及“快手直播的升級之路”,歡迎大家來聽聽我們在做的事情。