論文圖片作假:僥倖機會小,撤稿代價大

論文圖片作假:僥倖機會小,撤稿代價大

pexels。com

查處學術不端的成本有多高?

張月紅 (浙大學報前總編輯)

2010年9月,我在《自然》發文指出,經文字查重工具 CrossCheck 稽核,投到《浙江大學學報》(英文版)31% 的論文投稿可能存在抄襲現象。10年過去了,文字重複出版問題確有了改善。孰不知影象不端的風波正在一浪高似一浪。

7月21日,《自然》發文大談AI技術能助 “專打影象之假的鬥士” Bik博士對論文影象查重。Bik博士這兩年全靠肉眼打假,發現論文中的影象不端問題而聞名,讓一批 “研究論文中發現重複的影象” 的學術造假者瑟瑟發抖。

看到如今為查處科研不端如此研發工具,竟然用到人工智慧,不由得想問有誰計算過查處科研誠信的成本有多高?科研不端的的後果會如何?記得美國10年前為學術不端的調查/研究投入經費達1億1千萬美元;那時也有人計算過查處學術不端行為的成本和未得到充分認識的後果,分析後得出四點結論:

(https://journals。plos。org/plosmedicine/article?id=10。1371/journal。pmed。1000318)

1.

科學不端行為造成的不良後果是廣泛的,與調查相關的費用是巨大的;

2.

調查科學不當行為的單個案件的直接和間接成本是可以估算的;

3.

對一項特定的調查,其在評審過程中所有階段均有成本估算,直接成本估算525,000美元;

4.

對國家而言向科研誠信辦公室報告和未報告的所有科學不當行為案件的稽核,相關總費用可能成倍增加;

我們可曾計算過5年前韓春雨事件,有多少專業人士為了證明其結果的可重複性做了多少實驗?國家與學校為他 “假陽性” 的行為付出了多少經費?這些成本難道不需要計算嗎?

坦率地說,全世界都是一樣,視科學與科學期刊為真理的殿堂,而誠信是前提。學術期刊對所有作者的投稿發表,不妨借用一個法律概念“無罪定論”,絕對不會懷疑作者有假而來,持包容信任的態度,尤其是未經證實和判決有學術造假之前。但是今天的精英層,尤其是一直被國際同業認為勤奮的頂尖中國科研人員,接連被查出發表的論文圖片有假,無論你無意重複用圖,有意編造做假,已經深深地傷害了中國科研人員的聲譽,玷汙了科學的可靠性和完整性。若國際期刊對中國作者的來稿首先放棄了 “無罪定論” 的慨念,統統來查是否有不端現象,這不僅增加了中國科技文章發表的難度,也會因疑有假而不引用中國研究論文的成果,無形中等於關閉了中國科技與外界的交流平臺,試問:其後果與代價誰去研究計算過?

面對接連不斷的中國作者涉嫌圖片重複或造假的地震波,特邀請生物醫學領域期刊的主編夏華向教授的團隊對圖片學術不端的幾種型別,與圖片學術不端可能產生的原因與後果做一些專業分析,並將國際學術出版對圖片發表的規則與標準做一些解讀。

撰文 | 廖慶姣(美捷登生物科技有限公司學術部主任)

夏華向(

Journal of Clinical and Translational Hepatology

主編)

● ● ●

2020年7月5日,微生物學家、影像分析專家,被譽為 “造假偵探” 的比克(Elisabeth Bik)博士在自己的部落格《科學誠信文摘》(

Science Integrity Digest

)上發文,揭示在英文期刊發表的121篇來自中國作者的科研論文似乎存在不當圖片重複使用。同時公佈了這121篇論文的作者名單及其單位。

一石激起千層浪,這篇博文引起了國內外媒體的高度關注。2020年7月5日,《華爾街日報》發表了題為“Red Flags Raised Over Chinese Research Published in Global Journals”的英文評論文章,在7月7號還刊發了對應的中文版,報道了對刊發文章的雜誌社和作者進一步跟蹤追蹤情況,同時分析了背後可能的原因並強調說明中國政府已經注意到這一問題並開始採取了一些措施。7月11日《搜狐》刊登了題為 “再曝121篇論文造假,這本3分SCI期刊怕是要涼涼!華爾街日報質疑中國學術誠信” 報道評論文章,很多知名微信公眾號也刊登了類似報道評論。

實際上,論文圖片問題已經成為學術造假的重災區。2018年10月,比克和同事在《分子和細胞生物學》(

Molecular and Cellular Biology

)發表的一項研究發現,2009-2016年間發表在該期刊的960篇論文中,有59篇(6。1%)存在不當圖片重複使用(Inappropriate image duplication),其中,41篇更正,5篇撤稿,13篇沒有采取行動。他們推測,同期在 PubMed 資料庫發表的論文大約有3。5萬篇論文存在嚴重的不當圖片重複使用而需要撤稿。

論文圖片作假(包括不當圖片重複使用)一旦被揭發,很可能斷送當事人的科研、學術生涯。而隨著科技高速發展,各種 “查重”、“打假” 軟體的產生,各種學術不端行為必將被檢查出來。科研人員一定要遵守科研倫理和學術誠信,不要在科研論文中弄虛作假,尤其不要心存僥倖在論文圖片上作假。

下面,我們將從專業視角透過案例分析圖片作假包括不當圖片重複使用的形式及可能的後果,並簡要介紹科研圖片處理應該遵循的原則。

01

圖片作假的兩種主要表現形式

1)

一圖一文重複使用:即在同一篇文章中有完全相同的圖片

(例如免疫印跡條帶或細胞免疫熒光照片)

,但表示不同的處理結果;或同一文章中將一張圖片經過不同剪下拼接後,表示不同的處理結果。

對於完全相同的圖片這種情況,雜誌社一般比較寬容,發現後一般是要作者解釋並提供原片以及正確的圖片,畢竟有時候圖片太多了拼圖時也可能發生錯誤,只要能提供正確的圖片並且提供所有的原片,雜誌社一般不會深究。

對於圖片經過一定剪下拼接這種情況,因為是 “有意” 所為,會被認為存在圖片作假行為,因此存在被撤稿的風險。

圖1展示了一種比較典型的這種情況,上圖中Distal組+/+(紅色框)和下圖中Proximal組-/-(紅色框)完全相同,兩張圖片應該都是同一張圖片的一部分;黃色線框示意的是完全相同的圖片表示不同的處理結果。

論文圖片作假:僥倖機會小,撤稿代價大

圖1。 一圖一文重複使用示例。相關文章已被撤稿。圖片根據Retraction Watch網站上的撤稿說明(http://retractionwatch。com/2017/11/07/researchers-ask-retract-cancer-paper-five-days-flagged-journal)製作,原圖來自已撤稿文章https://jcs。biologists。org/content/130/4/805。long

2) 一圖多文重複使用:相同的圖片在不同的文章中重複使用。

這種是目前發現比較多的一種不當圖片重複形式,是比較公認的一種學術不端行為。因此,這種情況一旦被雜誌社發現,都將被撤稿。

Journal of General Virology

雜誌發表關注宣告的Gulam Waris博士圖片作假主要是這種情況。目前已經被撤稿的9篇全部是因為一圖多文重複使用(圖2)。

論文圖片作假:僥倖機會小,撤稿代價大

圖2。 以“Gulam Waris”為關鍵詞在Retraction Watch (撤稿觀察)資料庫(http://retractiondatabase。org)的檢索結果(http://retractiondatabase。org/RetractionSearch。aspx#?auth%3dGulam%2bWaris)

圖3展示的是 Gulam Waris 博士於2012年發表在

Journal of General Virology

雜誌的一篇文章中圖3c中 Actin 條帶是其2003年發表在

Journal of Biology Chemistry

雜誌的一篇文章中圖2A中Actin的一部分。

論文圖片作假:僥倖機會小,撤稿代價大

圖3。 一圖多文重複使用示例一。相關文章已被撤稿。引自PubPeer網站:https://pubpeer。com/publications/74D279D33833580DCF3FA1FC9CF893

同樣,Gulam Waris博士2010年發表在

Journal of General Virology

雜誌上的一篇文章也與其2003年發表在

Journal of Biology Chemistry

雜誌上的這篇文章有多個條帶重複(圖3),相同顏色的框示意條帶相同。

論文圖片作假:僥倖機會小,撤稿代價大

圖4。 一圖多文重複使用示例二,相關文章已被撤稿。引自PubPeer網站:https://pubpeer。com/publications/6602D5F5A612F1B5BEE632996A2A66

02

圖片作假常用軟體

圖片作假過程中常用的軟體是 Photoshop(PS)。前面舉例算是比較簡單的一些PS操作,只是裁剪。實際上很多作者為了達到 “預期結果” 會用PS對圖片做更多處理,或移位或旋轉,展示為不同的結果;或拼接不同的圖片,或清除背景,展示對結果有利的圖片;有少數作者為追求 “結果完美” 也會 “無意” 做一些PS修改。根據比克博士的調查,已存在一家或數家 “論文工廠” 用PS進行批次作假。

Journal of Biological Chemistry

上2002年發表的一篇文章,後來被揭發存在圖片作假,這篇文章涵蓋了圖片作假中免疫印跡常用的各種PS技術,在2018年已經被撤稿(圖5)。

論文圖片作假:僥倖機會小,撤稿代價大

圖5。 被撤文章及撤稿宣告。圖片來自https://pubmed。ncbi。nlm。nih。gov/30030385/

這篇文章的 Figure 2A 和 Figure 3A 存在大量條帶被重複使用情況。如圖6所示,Figure 2A 中的p-ERK條帶完全是兩個條帶複製而來,而 Figure 3A 中的 GST-RBD 條帶也完全是一個條帶的重複;其他相同顏色的框示意相同的條帶。

論文圖片作假:僥倖機會小,撤稿代價大

論文圖片作假:僥倖機會小,撤稿代價大

圖6。 圖片PS示例一。相關文章已被撤稿。引自PubPeer網站:https://pubpeer。com/publications/89582C2164A1D9F4764540B7A83E2B

甚至透過PS技術,作者還能根據一點 “素材” 完全 “創造” 出一個完整的實驗結果。圖7就是這樣被“創造”出來的。咋一看,感覺只有右下角的兩個條帶和上面有點一樣的感覺,但實際上,整個結果是作者透過對同一段條帶的不同部分進行不同的亮度調整,以及各種剪下拼接,最後拼合出三個條帶。

論文圖片作假:僥倖機會小,撤稿代價大

圖7。 圖片PS示例二。相關文章已被撤稿。引自PubPeer網站:https://pubpeer。com/publications/89582C2164A1D9F4764540B7A83E2B

圖8展示了這一PS操作拼接過程,同一段條帶經過5次不同亮度的調整,然後裁剪不同的條帶進行拼接,最終得到如圖7顯示的三段結果條帶。圖9以另一種方式展示了這一拼接過程,相同顏色的框示意最終相應段條帶的原始素材來源。

論文圖片作假:僥倖機會小,撤稿代價大

圖8。 圖7中圖片具體PS過程還原。相關文章已被撤稿。引自PubPeer網站:https://pubpeer。com/publications/89582C2164A1D9F4764540B7A83E2B

論文圖片作假:僥倖機會小,撤稿代價大

圖9。 示意圖7中具體PS的各條帶段。相關文章已被撤稿。引自PubPeer網站:https://pubpeer。com/publications/89582C2164A1D9F4764540B7A83E2B

比克博士在2020年7月5日揭露的疑是中國“論文工廠”發表的文章,絕大多數都是用PS處理圖片達到一圖多文重複使用。圖10是比克博士總結髮現的兩個劃痕實驗的 “種子” 圖片示意圖,圖11是9個相關分析 “種子” 圖片示意圖,每張 “種子” 圖片透過PS進行不同的處理,最終生成多張用於不同文章中的結果圖片。

論文圖片作假:僥倖機會小,撤稿代價大

論文圖片作假:僥倖機會小,撤稿代價大

圖10。 劃痕實驗的兩個“種子”圖片示意圖(WH01和WH02),引自https://scienceintegritydigest。com/2020/07/05/the-stock-photo-paper-mill/#comment-form-load-service:Twitter

論文圖片作假:僥倖機會小,撤稿代價大

圖11。 相關分析9個“種子”圖片示意圖(Up1-5和Down1-4)引自https://scienceintegritydigest。com/2020/07/05/the-stock-photo-paper-mill/#comment-form-load-service:Twitter

03

科研圖片處理應該遵循的規則

圖片作假被發現後通常都會受到撤稿的處罰,而且這種原因的撤稿對科研工作者的學術生涯是一個巨大的汙點和嚴重損害。隨著現在各種技術軟體越來越多,圖片作假幾乎已經無所遁形,幾乎百分之百會被發現。一旦被發現後撤稿,很可能斷送科研生涯。

科研圖片處理應該遵循什麼樣的原則呢?2012年美國科學編輯委員會(Council of Science Editors,CSE)在 CSE’s White Paper on Promoting Integrity in Scientific Journal Publications, 2012 Update(《推動科技期刊出版誠信的白皮書》)建議了最開始由洛克菲勒大學出版社提出、後來被不斷修改完善的四項基本原則:

(https://www。councilscienceeditors。org/resource-library/editorial-policies/white-paper-on-publication-ethics/3-4-digital-images-and-misconduct/#341):

a)

No specific feature within an image may be enhanced, obscured, moved, removed, or introduced。 (不要對一張圖片的區域性區域進行增強、模糊、移動、移除或插入新內容等操作。)

b)

Adjustments of brightness, contrast, or color balance are acceptable if they are applied to the whole image and as long as they do not obscure, eliminate, or misrepresent any information present in the original。 (可對整張圖片的亮度、對比度或色彩平衡進行調整,不能隱藏、消除或歪曲原圖的資訊。)

c)

The grouping of images from different parts of the same gel, or from different gels, fields, or exposures must be made explicit by the arrangement of the figure (e。g。, dividing lines) and in the text of the figure legend。 (允許從同一凝膠上不同部位,或從不同的凝膠、區域、曝光區取得影象並進行圖片拼合,但須使用明確的分割線表示它們來自不同的原圖,並在圖注中予以說明。)

d)

If the original data cannot be produced by an author when asked to provide it, acceptance of the manuscript may be revoked。 (如作者不能提供原始資料,文章將被拒稿或撤稿。)

希望以上內容能讓大家對圖片做假有一個比較清晰的認識,在實際工作過程中嚴格按照CSE建議的原則進行處理,避免 “踩雷”。最近來自紐約雪城大學的機器學習研究人員Daniel Acuna開發了一款論文影象查重軟體。

Nature

雜誌在2020年7月21日對此發表了題為 “Pioneering duplication detector trawls thousands of coronavirus preprints” 的報道。也許在不久的將來,雜誌社除了對論文文稿進行常規查重以避免抄襲外,也將對影象進行查重以避免圖片作假。願大家:誠信做科研,真實發論文!