來源:市場(chǎng)資訊
(來源:中國圖像圖形學(xué)會(huì)CSIG)
![]()
中國圖像圖形學(xué)會(huì)博士/碩士學(xué)位論文激勵(lì)計(jì)劃旨在推動(dòng)中國圖像圖形學(xué)領(lǐng)域的科技進(jìn)步,鼓勵(lì)創(chuàng)新性研究,促進(jìn)青年人才成長。
為宣傳科技工作者積極進(jìn)取的工作精神,分享獲獎(jiǎng)人的科研故事,本期推文我們獨(dú)家對(duì)話2025年度CSIG碩士學(xué)位論文激勵(lì)計(jì)劃入選者孫智敏,聽他講述科研路上的堅(jiān)守與成長,以榜樣之力,赴創(chuàng)新之約。
問題一:感謝您接受CSIG專訪,請(qǐng)先進(jìn)行一下自我介紹:
大家好,我是孫智敏,2025年從上海交大計(jì)算機(jī)系碩士畢業(yè),現(xiàn)在騰訊廣告做算法工程師,主要負(fù)責(zé)騰訊廣告妙思和微信小店的電商AI海報(bào)生成。讀研期間跟著易冉老師做deepfake檢測(cè)和可控生成,在IJCV、ICCV、CVPR這些頂刊頂會(huì)發(fā)過幾篇一作論文,也拿過國家獎(jiǎng)學(xué)金。很榮幸能入選今年的CSIG碩士論文激勵(lì)計(jì)劃提名。
![]()
問題二:在科研過程中,有沒有什么好的方法可以推薦給大家?
分享三個(gè)我覺得挺實(shí)用的經(jīng)驗(yàn)吧:
第一,別脫離實(shí)際問題。 我當(dāng)時(shí)選deepfake這個(gè)方向,就是看到網(wǎng)上假臉泛濫,覺得這是個(gè)真痛點(diǎn),不是為了追熱點(diǎn)而做。
第二,跑實(shí)驗(yàn)要快。 想法對(duì)不對(duì),趕緊寫代碼驗(yàn)證,別憋大招。我剛開始也走了不少彎路,但快速試錯(cuò)才能及時(shí)調(diào)整。
第三,多跟人聊。 我那個(gè)多感知投票模塊的靈感,其實(shí)是組會(huì)上大家閑聊"人眼怎么看真假"時(shí)冒出來的。有時(shí)候跨領(lǐng)域的討論特別能啟發(fā)思路。
![]()
問題三:請(qǐng)對(duì)您的論文進(jìn)行簡(jiǎn)要介紹:
我的論文針對(duì)開放世界深度偽造溯源這一新挑戰(zhàn),提出了OW-DFA++基準(zhǔn)和多視角感知學(xué)習(xí)(MPSL)框架。
核心創(chuàng)新有兩點(diǎn):一是多感知投票模塊,從全局、局部、頻率三個(gè)視角對(duì)齊偽造痕跡特征;二是自適應(yīng)置信度偽標(biāo)記策略,解決新型攻擊帶來的偽標(biāo)簽噪聲問題。該方法在應(yīng)對(duì)GAN、身份交換、擴(kuò)散模型等多元攻擊時(shí)展現(xiàn)出優(yōu)異的溯源能力和泛化性,為深度偽造檢測(cè)安全提供了新的技術(shù)路徑。
![]()
問題四:請(qǐng)問您在論文籌備過程中遇到最大的挑戰(zhàn)是什么?是怎樣克服的呢?
最頭疼的是數(shù)據(jù)太雜、標(biāo)注太少。網(wǎng)上扒下來的假臉五花八門,新型攻擊層出不窮,但很多數(shù)據(jù)沒標(biāo)簽,沒法直接拿來訓(xùn)練。
我們是怎么解決的呢?一方面讓模型學(xué)會(huì)從多個(gè)角度看圖,不依賴某一種偽造特征;另一方面用半監(jiān)督學(xué)習(xí),讓模型自己挑置信度高的樣本打偽標(biāo)簽,慢慢擴(kuò)展能力邊界。這個(gè)迭代了好多輪,每次失敗都讓我們更清楚"開放世界"到底難在哪兒。
![]()
問題五:請(qǐng)問您有什么獲獎(jiǎng)感言呢?
特別感謝CSIG的認(rèn)可!
首先要感謝易冉老師,從選題到實(shí)驗(yàn)卡殼,總能一針見血地指出問題,讓我少走很多彎路。也感謝實(shí)驗(yàn)室的兄弟們,那些一起熬夜debug、爭(zhēng)得面紅耳赤的日子很難忘。還要感謝騰訊優(yōu)圖的各位老師以及我的mentor,讓我看到學(xué)術(shù)落地產(chǎn)品的價(jià)值。
這個(gè)獎(jiǎng)對(duì)我來說是個(gè)新起點(diǎn)。deepfake和AIGC的攻防戰(zhàn)還在繼續(xù),我會(huì)繼續(xù)在這個(gè)方向深耕,爭(zhēng)取做出更有用的工作。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.