更準 更透明!DXOMARK史上最大規模更新揭秘:特定"最佳化"不管用了

說到顯示卡跑分,都會想到3DMark;說到電腦跑分,都會想到PCMark;說到手機跑分,自然都會想到DXOMARK。

各種各樣的Mark軟體,為我們認識、衡量產品的效能提供了非常直觀的參考,但因為種種原因,也經常引發各種爭議,尤其是中立性、客觀性。

這其實也是不可避免的。

在測試段,使用的裝置、方法都是人來定義的;在產品端,體驗如何也都是人來感知的。

畢竟,人,必然有著主觀性。一千個觀眾,就有一千個哈姆雷特。

DXOMARK是評測相機起步的,之後逐漸成為手機評測的代名詞,又陸續拓展到了音訊、螢幕、電池以及其他消費電子領域,而在不斷髮展的同時,DXOMARK也在思考,如何為大家帶來更精準、更客觀、更結合新技術、更符合實際體驗的測試。

近日,DXOMARK就對智慧手機測試基準、評分系統進行了史上最大規模的更新,工程師團隊歷時一年多,使得手機影像、自拍、螢幕、音訊、電池等評測專案都煥然一新。

同時,DXOMARK還首次公開了評分標準。

更準 更透明!DXOMARK史上最大規模更新揭秘:特定"最佳化"不管用了

DXOMARK指出,全新的測試基準,致力於距離使用者更近一步,基於真實用例進行測試,囊括評測裝置在不同場景、不同環境的日常使用情況,同時堅持緊緊跟隨技術發展,考察裝置的最新科技。

除了更新基準測試,DXOMARK本次還做了以下三個方面的工作:

一是更透明。

所有評分公式和分數結構,都可以在DXOMARK官方網站“如何測試”的相應部分中查閱。

二是提高分數的可讀。

本次重新格式化了分數尺度,數值在所有測試基準中都代表相似的表現,更容易進行比較。

比如同樣是80分,以往在攝像頭測試中是個很普通的成績,但在音訊、螢幕測試中相對較高,而以後都會反應同樣的高低水平。

三是在所有基準中使用幾何平均分規則。

對於在一個測試中表現出色、另一個測試中表現糟糕導致不均衡的裝置,這可以大大提高評分的一致性。

更準 更透明!DXOMARK史上最大規模更新揭秘:特定"最佳化"不管用了

一、影像基準測試

DXOMARK影像基準測試經過更新後,已經來到了第五版,主要變化有以下幾個方面:

一是

增加與使用者需求密切相關場景的測試

,包括人像、低光拍攝、室內、戶外等;

二是

進一步改進測試方法

,包括擴充套件變焦評分、增加照片和影片變焦測試的焦距範圍、豐富變焦測試場景等,比如5勒克斯極低光下變焦、微距功能加分(不支援不扣分)、檔案掃描場景、

三是

新增實驗室設定

,能在實驗室中重現真實生活場景,並測試人像、運動物體的HDR模式;

四是

新增AI驅動指標

,能在真實場景、物體上執行照片和影片的噪點和紋理AI指標,比如對人臉細節增加新的AI測量。

五是使用國際焦點小組(focus group),以更好地反應使用者偏好,並評估攝像頭的暗光效能。

更準 更透明!DXOMARK史上最大規模更新揭秘:特定"最佳化"不管用了

總的來說,DXOMARK第五版基準標準不會讓已有的排行榜完全重新洗牌,原來靠前的仍然會有好成績,但會出現一些區域性變化。

如上新的TOP10機型,

榮耀Magic4至臻版、華為P50 Pro仍然位居前兩名。

蘋果iPhone 13 Pro Max、iPhone 13 Pro升到第三和第四,原本在此的華為Mate 40 Pro+、小米12S Ultra分別滑落到第六和第七,後者甚至比小米11 Ultra還要低(有點小尷尬)。

另外,第九和第十的Google Pixel 6 Pro、三星Galaxy S22 Ultra驍龍版互換了一下位置。

對於iPhone 13 Pro Max為何排名大漲,DXOMARK也做了詳細解釋,主要一是微距細節相當豐富,偽像很少,人像拍照可以很好地捕捉運動場景、控制低對比度,而且在所有光照條件下都能呈現良好的膚色,只是暗光表現略差一些。

DXOMARK透露,

已經對資料中的近80款手機進行了重新測試,目標是重測超過100臺,爭取所有機型都再來一遍。

更準 更透明!DXOMARK史上最大規模更新揭秘:特定"最佳化"不管用了

更準 更透明!DXOMARK史上最大規模更新揭秘:特定"最佳化"不管用了

↑↑↑DXOMARK影像測試第四版、第五版裝置排名變化

DXOMARK還指出,

在新版測試基準下,影象質量對評分的影響更大。

比如對比度

,尤其在人像和逆光場景中,小米11 Ultra、小米12S Ultra、華為P50 Pro在這方面表現不是太好,所以丟失了一些分數。。

比如運動

,榮耀Magic4至臻版在室內照明下表現非常出色,華為P50 Pro、蘋果iPhone 13 Pro Max等則在移動物體的細節呈現上有些處理。

比如低光和夜間“氛圍”

,DXOMARK直言在測試中,

一些手機在低光和極低光下拍出了明亮的測標曝光,背離了使用者的偏好

,包括華為P50 Pro、小米12S Ultra、蘋果iPhone 13 Pro Max,所以更新後會丟失一些分數。

這意味著,那些宣傳自己是“夜視儀”的手機,今後要在DXOMARK測試中吃虧了。

更準 更透明!DXOMARK史上最大規模更新揭秘:特定"最佳化"不管用了

↑↑↑不自然的拍照效果,DXOMARK新版測試中會丟分

二、音訊基準測試

相比於影像拍照測試基準的大幅度調整,第二版DXOMARK音訊測試的整體結構保持不變,

只是調整了播放、錄製的細項分數,同時面向高階手機增加了風噪聲、音訊變焦兩項新的測試屬性。

風噪聲會破壞錄音效果,也是手機錄音中最令人頭疼的問題。

DXOMARK音訊實驗室引入了全新設定,可測量風噪聲對在各種角度上、不同風速範圍內的影響。

音訊變焦可以錄製來自特定方向的聲音,並削弱其他方向的聲音,通常與變焦拍照結合使用。

新的音訊變焦測試包括客觀測量和感知測量,可以在廣角、遠攝、超遠攝變焦的全新設定上進行,結果納入方向性測量中。

2020年,DXOMARK音訊團隊委託多位音樂家,量身定製了自定義曲目,包含基準測試所需的全部聲音屬性。

第二版中又增加了2首新的曲目,可以進行更精確、更全面的測試,曲目總數也達到10首。

更準 更透明!DXOMARK史上最大規模更新揭秘:特定"最佳化"不管用了

第二版DXOMARK音訊測試規則中,表現四平八穩的手機會得分更更高,尤其是音訊變焦和風噪聲效能更加的手機,會獲得加分。

榜單順序變化幅度不是很大,但不少裝置的名次都變了。黑鯊5 Pro仍是第一,在各個方面都穩坐王者寶座,在新的風噪聲評分中表現尤為出色。

華碩手機整體排名上升,要歸功於其整體良好的效能

,比如ROG遊戲手機5取代黑鯊4/4S Pro升至第二,華碩驍龍Insider取代榮耀Magic 3 Pro+拿到第四。

iPhone 13 Pro Max憑藉出色的音訊變焦功能,三星Galaxy S22 Ultra憑藉出色的風噪降噪能力,都在排名中攀升了幾個位置。

更準 更透明!DXOMARK史上最大規模更新揭秘:特定"最佳化"不管用了

更準 更透明!DXOMARK史上最大規模更新揭秘:特定"最佳化"不管用了

↑↑↑DXOMARK音訊測試第一版、第二版裝置排名變化

三、首次公開評分標準、專訪

現在,

DXOMARK第一次對外公開了其評分演算法結構,包括有測試基準的子專案得分、評分佔比。

DXOMARK強調,所有測試基準都是基於消費者使用場景制定的,子專案的分數權重也完全由消費者手機使用行為的科學調研資料所決定。

對於不同測試場景、不同子專案所佔的比重如何決定,DXOMARK表示有三個方面。

一是在測試基準中有統一的標準,百分比代表的是各個使用場景在我們日常生活中的使用頻率,同時也代表了這些使用場景的重要性。

二是會把消費者的痛點考慮進去。如果手機在某一方面的表現能更好地響應或者解決消費者的痛點,這一部分也會佔據更高的百分比。

三是與攝影師、技術專家等大量行業專業人士交流和溝通,瞭解他們對行業未來發展趨勢的觀點和看法,並納入評分考量。

最後要說的是,除了測試基準更新,

DXOMARK所有分數的演算法,都會由算數平均數轉變為幾何平均數,以強調裝置的均衡表現。

這樣一來,

針對特定技術、場景專門最佳化的機型,將很難獲得高分

,而在單獨某個方面表現稍差的機型,也不會被大幅拉低分數。

更準 更透明!DXOMARK史上最大規模更新揭秘:特定"最佳化"不管用了

對於大家非常關注的測試手機來源問題,DXOMARK高管在接受快科技採訪時表示,

他們的測試大部分手機都來自商業渠道,也就是大眾銷售渠道購買的,主要是法國市場、中國市場,並且與法國最大的電信公司Orange建立了合作,會測試其所售手機。

當然,

還有一部分機型是廠商送測的原型機,但在測試完成之後,DXOMARK還會再自行購買一臺上市的商用機型,進行復測,以避免刻意“最佳化”造成的影響。

PS:iPhone 14系列已經在測試中了……

最近,有些廠商公開宣佈不會再像DXOMARK送測手機,這引發了不小的爭議。

對此,DXOMARK解釋說

,廠商是否送測,其實都是基於他們自己的選擇。

無論如何,DXOMARK仍然會繼續測試市面上的手機,尤其是所有的旗艦機型都會測試。

DXOMARK強調,

不管廠商是否送測,都不會影響其使命:為消費者提供全方位的技術指南。

有著20年影像評測歷史的DXOMARK,一直都在不斷延伸觸角,影片會議、智慧家居、無人機都測過,

目前正在與法國P2020汽車成像標準委員會進行交流溝通

,其負責制定智慧裝置尤其是自動駕駛電動汽車、智慧感測器的相關規範,未來有望推出車載娛樂裝置、電動汽車智慧感測器的測試基準。

關於螢幕測試,流程包括兩個部分,首先是在實驗室中對每一個使用者

使用情境

進行測試,成績佔比為1/3,然後是再用

感官測試

進行驗證,從而讓測試結果更貼合消費者的實際體驗,因此佔比更大,達到了2/3。

關於電池測試,

續航部分佔比50%是因為消費者目前最在意續航

,手機沒電、耗電快是比較大的痛點,而充電30多分鐘對於消費者而言並沒有那麼大的影響。當然,快充技術發展非常快,未來可能也會佔據更重要的位置。

更準 更透明!DXOMARK史上最大規模更新揭秘:特定"最佳化"不管用了

↑↑↑DXOMARK CEO 弗雷德裡克·吉夏爾(Frédéric Guichard)