大語言模型
外觀
大語言模型(Large Language Model,簡稱LLM)是一種基於深度學習的人工智慧模型,專門用於處理、理解和生成人類語言。它通過在海量的文本數據上進行訓練,學會了語言規律和語義結構。目前的LLM已經能夠實現流暢的多輪對話、代碼編寫以及複雜的邏輯推理。
核心架構:Transformer
現代LLM大多基於Transformer架構。該的統計 的統計規律和語義結構。目前的LLM已經能夠實現流暢的多輪對話、代碼編寫以及複雜的邏輯推理。
核心架構:Transformer
現代LLM大多基於Transformer架構