大語言模型

出自萝莉百科 - 最萌的百科全书

於 2026年4月7日 (二) 08:07 由 Yuqing（留言 | 貢獻）所做的修訂

(差異) ←上個修訂 | 最新修訂 (差異) | 下個修訂→ (差異)

大語言模型（Large Language Model，簡稱LLM）是一種基於深度學習的人工智慧模型，專門用於處理、理解和生成人類語言。它通過在海量的文本數據上進行訓練，學會了語言規律和語義結構。目前的LLM已經能夠實現流暢的多輪對話、代碼編寫以及複雜的邏輯推理。

核心架構：Transformer

現代LLM大多基於Transformer架構。該的統計的統計規律和語義結構。目前的LLM已經能夠實現流暢的多輪對話、代碼編寫以及複雜的邏輯推理。

核心架構：Transformer

現代LLM大多基於Transformer架構

取自「https://zh.lolipedia.org/index.php?title=大语言模型&oldid=16」