9月20日,“如何看待北京理工大學某碩士生被指幾乎一字不差地抄襲論文?”登上知乎熱榜。
知乎截圖
實名認證為曠視科技研究員的知乎使用者王劍鋒發文稱自己的一篇投稿論文被洩露並且被嚴重抄襲,涉嫌抄襲的論文共同一作是一名來自北京理工大學的碩士生。
目前,北京理工大學自動化學院已回覆王劍鋒,並表示已經成立了工作小組調查此事。
投稿論文被洩露並被抄襲挪用
近日,王劍鋒發文《在arXiv上看到自己的投稿署了別人的名字是什麼體驗?》。文中稱,其一篇在2020年6月向國際人工智慧頂級會議NeurIPS 2020投稿的論文被洩露並被抄襲挪用。
上述文章中詳細列舉了多張證據截圖以指控一篇於2021年9月16日釋出在預印本平臺arXiv的文章存在嚴重抄襲行為。
arXiv是計算機領域常用的論文預發表平臺,作者可以透過將論文預發表至該平臺,以聲稱對某種方法和思路的所有權。在該平臺預發表後,不影響去其他期刊或會議的投稿和發表。
王劍鋒指出,兩篇論文標題完全一致,均為Label Assignment Distillation for Object Detection。此外,還存在摘要幾乎完全一致、圖片及表格資料完全一致等。並且發表在“arXiv的文章中沒有任何一個配圖、表格、公式是新的,完全沒有做額外的實驗”。
投稿論文截圖
arXiv上傳文章截圖
王劍鋒為證明自身論文的原創性,先後給出向NeurIPS 2020的投稿郵件記錄、overleaf(注:一種論文編輯工具)歷史記錄、實驗資料記錄等。王劍鋒稱該篇論文曾連續投稿NeurIPS 2020和AAAI 2021都失敗了,兩個版本的寫法差距很大。可以確定的是,“洩露的是 NeurIPS 版本”。
根據發表在arXiv的文章資訊,該文共3名作者分別是Minghao Gao、 Hailun Zhang、Yige Yan 。其中明確顯示二作(同時為共同一作)、三作分別來自北京理工大學和河海大學。根據公開郵箱字首的學號,王劍鋒定位到二作是北京理工大學自動化學院智慧資訊處理與控制方向2020級碩士生張海倫。
多方回應
9月18日,王劍鋒向北京理工大學、河海大學傳送舉報信郵件,並同時郵件了論文二作張海倫。
同時,他還向NeurIPS 2020組委會質疑是否存在審稿人洩露、傳播、挪用投稿的情況。
很快,二作張海倫首先透過郵件進行了回覆,張海倫表達了歉意並表示“僅是幫助第一作者高明豪將論文釋出在arxiv上,並只參與了部分程式碼和實驗,對具體的情況並不是完全瞭解”。張海倫稱“此次事件並非本人故意抄襲為之……願意全力配合撤稿等一系列工作”。
張海倫透過知乎私信進一步透露,一作高明豪不是北京理工大學的學生,現已本科畢業,目前無工作單位。
隨後,一作高明豪透過郵件回覆表達了歉意,但並沒有承認剽竊行為。他稱“相關論文pdf上傳錯誤,十分抱歉,目前僅在arXiv社群進行上傳,並未對任何學術期刊或會議進行投搞工作,已進行撤稿申請。”
關於文章來源,高明豪提到“這次的文章是之前在一些小組學習會上偶然讀到的,可能是以前師兄或者老師審稿留下當學習資料使用”,他表示自己“初次涉獵相關事務,確實存在很多不當的地方”。
在王劍鋒看來,當事人仍沒有真正認識到這件事屬於剽竊,是嚴重的學術不端行為,試圖矇混過關;“審稿留下當學習資料”暗示了存在投稿被不當洩露乃至傳播的情況。
王劍鋒稱,透過多方渠道證實,一作Minghao Gao是山東科技大學計算機科學與工程學院網路工程專業2017級本科生高明豪,現已畢業。三作Yige Yan是河海大學常州校區物聯網院計算機科學與技術專業 2017 級本科生晏藝格,現已畢業。
9月19日,王劍鋒收到NeurIPS 2020組委會的官方回覆,證明審稿人、領域主席、高階領域主席中沒有人來自上述機構。另根據其他一些線索,王劍鋒“初步可以排除來自審稿流程中洩露的可能。”
同時,北京理工大學也進行了官方回覆,校方已啟動調查流程,北京理工大學自動化學院已經成立了工作小組調查此事。
對於選擇公開曝光此事的原因,王劍鋒認為“犯錯的成本不應該這麼低”。但他同時強調,曝光這件事更重要的意義在於讓大家警惕並重視投稿洩露挪用這一現象。