跳转到内容

大语言模型:修订间差异

来自萝莉百科 - 最萌的百科全书
Yuqing留言 | 贡献
无编辑摘要
Yuqing留言 | 贡献
无编辑摘要
第3行: 第3行:
== 核心架构:Transformer ==
== 核心架构:Transformer ==
现代LLM大多基于'''Transformer'''架构。该的统计
现代LLM大多基于'''Transformer'''架构。该的统计
的统计规律和语义结构。目前的LLM已经能够实现流畅的多轮对话、代码编写以及复杂的逻辑推理。
== 核心架构:Transformer ==
现代LLM大多基于'''Transformer'''架构

2026年4月7日 (二) 08:07的版本

大语言模型(Large Language Model,简称LLM)是一种基于深度学习的人工智能模型,专门用于处理、理解和生成人类语言。它通过在海量的文本数据上进行训练,学会了语言规律和语义结构。目前的LLM已经能够实现流畅的多轮对话、代码编写以及复杂的逻辑推理。

核心架构:Transformer

现代LLM大多基于Transformer架构。该的统计 的统计规律和语义结构。目前的LLM已经能够实现流畅的多轮对话、代码编写以及复杂的逻辑推理。

核心架构:Transformer

现代LLM大多基于Transformer架构