<ruby id="9ue20"></ruby>

  1. 
    

      国产午夜福利免费入口,国产日韩综合av在线,精品久久人人妻人人做精品,蜜臀av一区二区三区精品,亚洲欧美中文日韩在线v日本,人妻av中文字幕无码专区 ,亚洲精品国产av一区二区,久久精品国产清自在天天线
      網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

      見地 | 大語言模型催生詞典編纂新范式

      0
      分享至


      大語言模型驅(qū)動的詞典編纂實(shí)踐革新與理論重構(gòu),共同勾勒出面向未來的詞典學(xué)新范式雛形。

      原文 :《大語言模型催生詞典編纂新范式》

      作者 |黑龍江大學(xué)俄語學(xué)院副教授 何洋洋

      圖片 |網(wǎng)絡(luò)

      近年來,大語言模型的快速發(fā)展對詞典學(xué)產(chǎn)生了深刻影響。長期以來,如何在保證學(xué)術(shù)規(guī)范與編纂質(zhì)量的前提下提高詞典編纂效率,是學(xué)術(shù)界普遍關(guān)注的問題。經(jīng)過大規(guī)模語料預(yù)訓(xùn)練的大語言模型,憑借其出色的語言生成能力,使詞典“內(nèi)容生成自動化”成為可能。我們須把握宏觀趨勢,從范式演進(jìn)的高度認(rèn)識大語言模型對詞典編纂實(shí)踐與理論的重構(gòu),致力于構(gòu)建具有中國立場和學(xué)術(shù)自覺的新型詞典學(xué)自主知識體系。




      基于內(nèi)容生成自動化的詞典編纂新范式

      詞典編纂向來周期長、投入大。此前的自動化與數(shù)字化嘗試,著力于提升編纂流程效率,如借助語料庫檢索輔助收詞、通過數(shù)據(jù)庫實(shí)現(xiàn)詞條統(tǒng)一管理、利用數(shù)字排版技術(shù)改進(jìn)編輯與出版環(huán)節(jié)等。這使詞典編纂流程實(shí)現(xiàn)了一定程度的自動化,但詞條釋義、義項(xiàng)劃分和例證撰寫等核心環(huán)節(jié)仍主要依賴有經(jīng)驗(yàn)的編者完成。大語言模型強(qiáng)大的生成能力為詞典編纂從“流程自動化”轉(zhuǎn)向“內(nèi)容生成自動化”提供了可能,詞典編纂新范式呼之欲出。

      大語言模型主要是基于Transformer 架構(gòu)的預(yù)訓(xùn)練機(jī)制來實(shí)現(xiàn)詞典詞條的自動生成。其在大規(guī)模語料學(xué)習(xí)過程中內(nèi)化了豐富的語言結(jié)構(gòu)信息,具備了生成連貫文本的能力。在義項(xiàng)劃分方面,同一詞形在不同語境中,經(jīng)由大模型編碼后呈現(xiàn)出不同的向量表征。通過對這些向量表征的聚類分析,篩選出語義明確的用法類型,即可對應(yīng)詞的不同義項(xiàng)。在釋義與例句生成方面,大模型能在給定語境的情況下,生成符合要求的釋義與例句。此外,大語言模型的分布式表征能為構(gòu)建詞匯語義網(wǎng)絡(luò)提供機(jī)器可循的線索:詞與詞在向量空間中的相似度,可用來識別同義、反義或轉(zhuǎn)換(如教與學(xué)、買和賣等)關(guān)系;結(jié)合它們在不同語境中的共現(xiàn)與替換分布特征,可識別上下位關(guān)系。通過對海量語料的概率建模與分布式表征學(xué)習(xí),大語言模型使詞典內(nèi)容自動生成在多個關(guān)鍵環(huán)節(jié)上具備可行性。從這個意義上講,它正深刻變革詞典編纂實(shí)踐,重構(gòu)詞典編纂理論。




      智能協(xié)同的詞典編纂實(shí)踐

      大語言模型驅(qū)動的詞典編纂實(shí)踐在以下三方面顯著區(qū)別于傳統(tǒng)模式。

      編纂載體的變化。詞典編纂的載體,傳統(tǒng)上是卡片,互聯(lián)網(wǎng)時代是語料庫,而在人工智能時代則有望被大語言模型和智能體取代。前兩者更新周期長、維護(hù)成本高,編纂流程仍主要依賴人工完成。這種靜態(tài)載體導(dǎo)致傳統(tǒng)詞典編纂存在周期長、更新慢的局限。大語言模型驅(qū)動的詞典編纂實(shí)踐,其載體不再是孤立的數(shù)據(jù)庫,而是一個以通用語言模型為中樞、多智能體協(xié)同運(yùn)作的集成化平臺。通用模型提供對自然語言的理解與生成能力,不同智能體則分別承擔(dān)語義分析、釋義與例句生成等下游任務(wù),為編纂工作的自動化與智能化奠定了技術(shù)基礎(chǔ)。

      編纂流程的變化。大語言模型解構(gòu)了傳統(tǒng)詞典編纂流程。在傳統(tǒng)流程中,編者必須先通過語料觀察和語義分析確定意義,再轉(zhuǎn)寫為規(guī)范釋文并佐以例證。大語言模型則依托其在大規(guī)模文本上習(xí)得的語言模式與共現(xiàn)規(guī)律,在給定詞目、語體/體例約束與上下文提示的條件下,直接進(jìn)行概率式生成,產(chǎn)出多版本、可比較的候選表述。編者據(jù)此檢驗(yàn)其語義覆蓋度、語料支撐與體例合規(guī)性。大語言模型并非先理解意義再尋找表達(dá),而是先給出表達(dá),再借由評估逼近合適的意義。傳統(tǒng)流程的核心在于“從語料中正確概括出意義”,新流程的核心則是“從或然性表述中,篩選并校準(zhǔn)出最可靠的版本”。編纂的關(guān)鍵環(huán)節(jié)由“撰寫”轉(zhuǎn)為“驗(yàn)收”,一套基于內(nèi)容自動生成的新型人機(jī)協(xié)同流程得以確立。

      編者角色的變化。在傳統(tǒng)模式中,詞典編者既是詞條內(nèi)容的生產(chǎn)者,又是詞典質(zhì)量的把關(guān)人。編者須親自完成每條釋義與例句的撰寫,全程參與資料搜集、內(nèi)容編寫與定稿審核,其學(xué)術(shù)水平?jīng)Q定了詞典的權(quán)威性。大語言模型時代,編者更傾向于作為生成過程的引導(dǎo)者與質(zhì)量審校者:一方面,通過設(shè)計提示框架與約束條件,引導(dǎo)模型穩(wěn)定產(chǎn)出符合受眾定位、語言規(guī)范與詞典體例的詞條;另一方面,嚴(yán)格評估、核驗(yàn)與潤色生成內(nèi)容,把關(guān)事實(shí)是否準(zhǔn)確、邏輯是否自洽和語言是否地道。編者須與模型對話,對不當(dāng)內(nèi)容及時糾偏并形成修訂規(guī)則。更關(guān)鍵的是,專家反饋將審校意見不斷固化,進(jìn)一步提升模型生成內(nèi)容的穩(wěn)定性與可用性。編者工作重心從直接生產(chǎn)文本,轉(zhuǎn)向?qū)ι蓹C(jī)制、質(zhì)量標(biāo)準(zhǔn)與最終結(jié)果的統(tǒng)籌和裁決。




      生成導(dǎo)向的詞典編纂理論

      與詞典編纂實(shí)踐相適應(yīng),大語言模型時代的詞典編纂理論在認(rèn)識論、對象形態(tài)功能和規(guī)范觀方面都發(fā)生了深刻變革。

      編纂認(rèn)識論的變化。傳統(tǒng)詞典學(xué)的認(rèn)識論根植于結(jié)構(gòu)主義語言觀,將詞義視為穩(wěn)定、可定義的概念實(shí)體,預(yù)設(shè)詞具有相對明確的語義邊界及可被識別和枚舉的義項(xiàng)集合。編者通過義項(xiàng)劃分、釋義撰寫與例證選取,將復(fù)雜的語言使用現(xiàn)象抽象和固化,使詞典成為對語言意義進(jìn)行分類、歸納與固定化呈現(xiàn)的知識系統(tǒng)。大語言模型則基于大規(guī)模語料的統(tǒng)計學(xué)習(xí),在不同上下文分布中自動捕捉詞義差異,由此構(gòu)建了一種“生成主義”的詞典編纂認(rèn)識論。新的認(rèn)識論強(qiáng)調(diào)語義的概率性與情境依存性,承認(rèn)詞義是在生成與使用中不斷被更新和校準(zhǔn)的。相應(yīng)地,詞典編纂不再以窮盡列舉并劃定詞義邊界為核心,而是借助模型捕捉語言意義的流動性,在具體語境中生成更貼合使用的解釋與呈現(xiàn)。這標(biāo)志著詞典編纂從結(jié)構(gòu)主義的“分類邏輯”邁向了生成主義的“生成邏輯”。

      編纂對象形態(tài)功能的變化。大語言模型改變了詞典編纂對象(即詞典本身)的形態(tài)、組織方式與應(yīng)用場景。傳統(tǒng)上,無論是紙質(zhì)詞典還是電子詞典,其知識均被預(yù)定義為離散的詞條,通過固定的宏觀結(jié)構(gòu)與模塊化的微觀結(jié)構(gòu)(如分欄呈現(xiàn)釋義、例句)進(jìn)行編排,本質(zhì)上是結(jié)構(gòu)化的知識載體,功能局限于被動的單向查詢。未來,詞典形態(tài)有望從有形的“書”演變?yōu)榭汕度敫黝愓Z言使用場景的應(yīng)用程序編程接口(API)或?qū)υ捊缑妫涔δ軐⑸墳楦鶕?jù)具體問題輸出連貫、滿足當(dāng)下語言知識需求的解釋。詞典不再只是等待查詢的數(shù)據(jù)庫,而是能深度嵌入閱讀、寫作、翻譯等場景的交互式語言知識服務(wù)產(chǎn)品。其價值重心也從提供標(biāo)準(zhǔn)化釋義,轉(zhuǎn)向在具體場景中降低用戶獲取與應(yīng)用語言知識的成本。詞典編纂也須順應(yīng)形態(tài)功能的演變作出調(diào)整。

      編纂規(guī)范觀的變化。在傳統(tǒng)編纂模式下,編纂者作為把關(guān)人,依據(jù)相對穩(wěn)定、共時的語言體系,預(yù)先判斷哪些詞匯與用法可被收錄以及應(yīng)當(dāng)如何表述。規(guī)范主要表現(xiàn)為釋義措辭的取舍、用法標(biāo)簽與例證選擇,包括對語體與風(fēng)格的優(yōu)劣判斷。這種排他式的規(guī)范觀更多依賴編者在撰寫詞條前作出裁定。大語言模型介入的詞典編纂,主要體現(xiàn)為對編纂過程的約束,即規(guī)定編纂系統(tǒng)如何按照提示及相應(yīng)規(guī)則生成詞條內(nèi)容、明確可用語料,統(tǒng)一釋義風(fēng)格、術(shù)語體系與義項(xiàng),設(shè)置事實(shí)核驗(yàn)、一致性檢查以及幻覺的處置規(guī)則,并將審校意見作為約束條件以持續(xù)修正偏差。由此,詞典規(guī)范的標(biāo)準(zhǔn)從編者的個人審度,轉(zhuǎn)向人機(jī)協(xié)作對生成結(jié)果的持續(xù)校準(zhǔn),實(shí)現(xiàn)了從前期權(quán)威裁定到全流程約束的根本轉(zhuǎn)變。


      大語言模型驅(qū)動的詞典編纂實(shí)踐革新與理論重構(gòu),共同勾勒出面向未來的詞典學(xué)新范式雛形。在這一范式下,詞典的核心角色已不再局限于作為權(quán)威參照的靜態(tài)工具書,而是演變?yōu)槟軌虺掷m(xù)追蹤語言動態(tài)、融合多源信息、服務(wù)于真實(shí)語言生活的知識服務(wù)產(chǎn)品。大語言模型為詞典學(xué)帶來的遠(yuǎn)不止于技術(shù)層面的升級,更在于推動其重新審視自身的研究對象、方法論體系與價值目標(biāo)。展望未來,如何在智能化背景下,構(gòu)建兼具學(xué)術(shù)自覺、理論主體性與自主知識體系的詞典學(xué)理論,仍有賴于學(xué)界持續(xù)而深入的探索。

      文章為社會科學(xué)報“思想工坊”融媒體原創(chuàng)出品,原載于社會科學(xué)報第2002期第5版,未經(jīng)允許禁止轉(zhuǎn)載,文中內(nèi)容僅代表作者觀點(diǎn),不代表本報立場。

      本期責(zé)編:程鑫云


      《社會科學(xué)報》2026年征訂

      點(diǎn)擊下方圖片網(wǎng)上訂報↓↓↓




      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關(guān)推薦
      熱點(diǎn)推薦
      譚詠麟獨(dú)子譚曉風(fēng)線上授課,15分鐘收費(fèi)265元,學(xué)員口碑炸裂

      譚詠麟獨(dú)子譚曉風(fēng)線上授課,15分鐘收費(fèi)265元,學(xué)員口碑炸裂

      八卦寶寶
      2026-05-22 06:54:04
      廣西將對國道G325線實(shí)施改擴(kuò)建工程,路線全長55.47公里

      廣西將對國道G325線實(shí)施改擴(kuò)建工程,路線全長55.47公里

      音樂時光的娛樂
      2026-05-22 12:32:48
      椰子水“摻水摻糖”風(fēng)波再起,多品牌回應(yīng)!檢測標(biāo)準(zhǔn)仍是關(guān)鍵

      椰子水“摻水摻糖”風(fēng)波再起,多品牌回應(yīng)!檢測標(biāo)準(zhǔn)仍是關(guān)鍵

      南方都市報
      2026-05-21 16:52:20
      《黑袍糾察隊》收官活動:喜美子穿透視裝亮相

      《黑袍糾察隊》收官活動:喜美子穿透視裝亮相

      峽谷一級保護(hù)廢物
      2026-05-22 06:33:56
      貴州貴定突發(fā)洪災(zāi),在安徽打工的夫妻班都不上,和老鄉(xiāng)開車返鄉(xiāng):家里連床被褥都沒了

      貴州貴定突發(fā)洪災(zāi),在安徽打工的夫妻班都不上,和老鄉(xiāng)開車返鄉(xiāng):家里連床被褥都沒了

      瀟湘晨報
      2026-05-22 11:54:28
      僅一個季度,日本汽車在全球前十大車企奪回4個,中國或僅剩一家

      僅一個季度,日本汽車在全球前十大車企奪回4個,中國或僅剩一家

      柏銘銳談
      2026-05-20 08:44:50
      1940年冬,炊事員給朱德飯里下毒,槍決前,楊奇清怒吼:誰敢殺他

      1940年冬,炊事員給朱德飯里下毒,槍決前,楊奇清怒吼:誰敢殺他

      商業(yè)人物志
      2026-05-22 08:30:14
      張嘉譯機(jī)場偶遇孫浩,順口喊一聲:茍師!孫浩搞笑回了句:三元舅

      張嘉譯機(jī)場偶遇孫浩,順口喊一聲:茍師!孫浩搞笑回了句:三元舅

      情感大頭說說
      2026-05-22 13:29:18
      6換1難以拒絕!字母下家基本確定?名宿:他賽季初就在當(dāng)?shù)乜捶苛?>
    </a>
        <h3>
      <a href=你的籃球頻道
      2026-05-22 07:37:11
      我50歲才懂:給孩子找對象,窮人看彩禮,中產(chǎn)看學(xué)歷,體制內(nèi)只看這兩點(diǎn)

      我50歲才懂:給孩子找對象,窮人看彩禮,中產(chǎn)看學(xué)歷,體制內(nèi)只看這兩點(diǎn)

      心理觀察局
      2026-05-20 07:19:06
      主角:直到婚后被劉紅兵家暴,憶秦娥才知,封瀟瀟為何接受楚嘉禾

      主角:直到婚后被劉紅兵家暴,憶秦娥才知,封瀟瀟為何接受楚嘉禾

      娛樂傾城巷
      2026-05-21 19:13:31
      裁判穿SGA球鞋!這還怎么玩?裝都不裝了!

      裁判穿SGA球鞋!這還怎么玩?裝都不裝了!

      柚子說球
      2026-05-21 20:32:56
      ?知名球迷勞拉·伍茲曬童年舊照:從始至終都是阿森納

      ?知名球迷勞拉·伍茲曬童年舊照:從始至終都是阿森納

      樂道足球C
      2026-05-22 10:38:54
      男子網(wǎng)購719元女士睡衣當(dāng)520禮物送女友,收貨后卻用男士睡衣調(diào)包退貨退款;商家連夜開車4小時赴合肥報警,涉事男子已被行拘9日

      男子網(wǎng)購719元女士睡衣當(dāng)520禮物送女友,收貨后卻用男士睡衣調(diào)包退貨退款;商家連夜開車4小時赴合肥報警,涉事男子已被行拘9日

      封面新聞
      2026-05-22 10:34:32
      非夫妻異性同住酒店違法嗎?民警提醒:不碰這事就沒人管

      非夫妻異性同住酒店違法嗎?民警提醒:不碰這事就沒人管

      芳姐侃社會
      2026-04-23 16:52:15
      俄烏轉(zhuǎn)折:烏軍進(jìn)攻次數(shù)首次超過俄軍!摧毀車臣特種部隊基地

      俄烏轉(zhuǎn)折:烏軍進(jìn)攻次數(shù)首次超過俄軍!摧毀車臣特種部隊基地

      項(xiàng)鵬飛
      2026-05-21 20:03:57
      小米YU7首戰(zhàn)Model Y八敗兩勝!雷軍直言:輸給全球銷冠不丟人

      小米YU7首戰(zhàn)Model Y八敗兩勝!雷軍直言:輸給全球銷冠不丟人

      快科技
      2026-05-21 20:39:10
      沈伯洋萬沒想到,先等來的不是當(dāng)上臺北市長,大陸三部門突然行動

      沈伯洋萬沒想到,先等來的不是當(dāng)上臺北市長,大陸三部門突然行動

      墨羽怪談
      2026-05-22 00:53:14
      全網(wǎng)馬刺球迷希望上場的奧利尼克,各方面都是哈騰加強(qiáng)版

      全網(wǎng)馬刺球迷希望上場的奧利尼克,各方面都是哈騰加強(qiáng)版

      兵哥籃球故事
      2026-05-21 20:20:08
      印度“靠山”終于浮出水面!我國被騙了幾十年?曾與我們交好多年

      印度“靠山”終于浮出水面!我國被騙了幾十年?曾與我們交好多年

      趣味八卦
      2026-05-22 10:42:36
      2026-05-22 14:35:00
      社會科學(xué)報 incentive-icons
      社會科學(xué)報
      社會科學(xué)院主辦社會科學(xué)報
      4192文章數(shù) 23456關(guān)注度
      往期回顧 全部

      教育要聞

      這4件事,正在偷偷拖垮孩子的初中成績!

      頭條要聞

      85歲"核武老人"發(fā)聲:智障兒子有糖尿病 請網(wǎng)友別投喂

      頭條要聞

      85歲"核武老人"發(fā)聲:智障兒子有糖尿病 請網(wǎng)友別投喂

      體育要聞

      最糟糕裁判?他想要退役當(dāng)市長

      娛樂要聞

      周也戀情曝光!對象身份不簡單

      財經(jīng)要聞

      又一存儲芯片類產(chǎn)品,價格暴漲300%

      科技要聞

      雷軍:輸給特斯拉不丟人

      汽車要聞

      配1.5L動力/增加新配色 吉利帝豪向上系列將于5月24日上市

      態(tài)度原創(chuàng)

      親子
      手機(jī)
      教育
      藝術(shù)
      房產(chǎn)

      親子要聞

      再有4天帶家人回中國,小三寶這幾天成了混世小魔頭,鬼靈精怪的

      手機(jī)要聞

      蘋果6月18日將調(diào)整澳大利亞和越南App Store應(yīng)用年齡分級

      教育要聞

      收藏!2026山東高考準(zhǔn)考證打印流程+忘記密碼怎么辦?

      藝術(shù)要聞

      海市蜃樓水中樹

      房產(chǎn)要聞

      順德澐璟樓王『澐冠』啟幕|一場高階共鳴的靜奢美學(xué)之約

      無障礙瀏覽 進(jìn)入關(guān)懷版 主站蜘蛛池模板: 在线一区二区中文字幕| 日韩女人毛片在线播放| 94人妻少妇偷人精品| 性爱视频欧美| 亚洲国产精品一区二区久久| 99久久精品国产一区二区蜜芽| 国产精品成人网| 99久久99久久免费精品蜜桃| 日韩中文字幕亚洲精品| 亚洲日韩亚洲另类激情文学| 亚洲小说图区综合在线| 婷婷色综合成人成人网小说| www.911国产| 国产一区二区三区18| 日本道中文字幕久久一区| 深夜宅男福利免费在线观看| 成人视频网| 亚洲久久久久久| 一区二区三区在线蜜桃| 久久久久久综合网天天| 爱色影网| 日韩放荡少妇无码视频| 国产精品久久久久专区| 亚洲欧美综合精品成| 久久综合国产色美利坚| 美女大bxxxxn内射| AV大片在线无码永久免费| 国产精品白浆免费视频| 日本妇人成熟免费| 国产噜噜在线视频观看| 性高湖久久久久久久久| 少妇激情一区二区三区视频 | 久久精品国产国产精品四凭| 少妇无码一区二区三区免费| 日韩美女av二区三区四区 | 人妻少妇精品中文字幕| 又粗又猛又黄又爽无遮挡| 成人无码在线视频区| 中文国产成人精品久久不卡| 国内免费视频成人精品| 亚洲丶国产丶欧美一区二区三区|