大语言模型 - 版本历史

2026年4月7日 (二) 00:37 Yuqing

2026-04-07T00:37:40Z

@@ 第1行： / 第1行： @@
-'''大语言模型'''（Large Language Model，简称LLM）是一种基于深度学习的人工智能模型，专门用于处理、理解和生成人类语言。它通过在海量的文本数据上进行训练，学会了语言规律和语义结构。目前的LLM已经能够实现流畅的多轮对话、代码编写以及复杂的逻辑推理。
+'''大语言模型'''（Large Language Model，简称LLM）是一种基于深度学习的人工智能模型，专门用于处理、理解和生成人类语言。它通过在海量的文本数据上进行训练，学会了语言的统计规律和语义结构。目前的LLM已经能够实现流畅的多轮对话、代码编写以及复杂的逻辑推理。
 == 核心架构：Transformer ==
-现代LLM大多基于'''Transformer'''架构。该的统计
+现代LLM大多基于'''Transformer'''架构。该架构引入了注意力机制（Attention Mechanism），使模型能够捕捉长距离的语义依赖。
-== 核心架构：Transformer ==
+== 训练过程 ==
-现代LLM大多基于'''Transformer'''架构
+LLM的构建通常包含以下两个关键阶段：

2026年4月7日 (二) 00:07 Yuqing

2026-04-07T00:07:00Z

←上一版本		2026年4月7日 (二) 08:07的版本
第3行：		第3行：
	== 核心架构：Transformer ==		== 核心架构：Transformer ==
	现代LLM大多基于'''Transformer'''架构。该的统计		现代LLM大多基于'''Transformer'''架构。该的统计
			的统计规律和语义结构。目前的LLM已经能够实现流畅的多轮对话、代码编写以及复杂的逻辑推理。

			== 核心架构：Transformer ==
			现代LLM大多基于'''Transformer'''架构

2026年4月7日 (二) 00:02 Yuqing

2026-04-07T00:02:46Z

←上一版本	2026年4月7日 (二) 08:02的版本
第1行：	第1行：
		'''大语言模型'''（Large Language Model，简称LLM）是一种基于深度学习的人工智能模型，专门用于处理、理解和生成人类语言。它通过在海量的文本数据上进行训练，学会了语言规律和语义结构。目前的LLM已经能够实现流畅的多轮对话、代码编写以及复杂的逻辑推理。

		== 核心架构：Transformer ==
		现代LLM大多基于'''Transformer'''架构。该的统计

Yuqing：清空全部内容

2026-04-06T23:49:17Z

清空全部内容

←上一版本		2026年4月7日 (二) 07:49的版本
第1行：		第1行：
	'''大语言模型'''（Large Language Model，简称LLM）是一种基于深度学习的人工智能模型，专门用于处理、理解和生成人类语言。它通过在海量的文本数据上进行训练，学会了语言的统计规律和语义结构。目前的LLM已经能够实现流畅的多轮对话、代码编写以及复杂的逻辑推理。

	~~== 核心架构：Transformer ==~~
	~~现代LLM大多基于'''Transformer'''架构。该架构引入了注意力机制（Attention Mechanism），使模型能够捕捉长距离的语义依赖。~~

	~~== 训练过程 ==~~
	~~LLM的构建通常包含以下两个关键阶段：~~
	~~# '''预训练（Pre-training）'''：模型在大规模的互联网文本语料库上进行无监督学习。~~
	~~# '''指令微调（Instruction Tuning）'''：通过人类反馈强化学习等技术，教会模型如何准确理解并执行用户的指令。~~

	~~== 局限性：幻觉 ==~~
	~~尽管LLM表现卓越，但仍存在幻觉现象，即模型可能会生成看似合理但完全错误的事实。~~

	~~== 应用领域 ==~~
	~~LLM目前已广泛应用于多个前沿领域：~~
	* '''智能交互'''：作为虚拟助手提供情感陪伴与信息查询。
	* '''辅助开发'''：帮助工程师快速生成代码片段。
	* '''内容创作'''：协助进行多语言翻译、文章撰写。

	~~== 参考资料 ==~~
	~~# Vaswani, A., et al. (2017). ''Attention Is All You Need''.~~
	~~# OpenAI. (2023). ''GPT-4 Technical Report''.~~
	~~# Bommasani, R., et al. (2021). ''On the Opportunities and Risks of Foundation Models''.~~

Yuqing：创建页面，内容为“'''大语言模型'''（Large Language Model，简称LLM）是一种基于深度学习的人工智能模型，专门用于处理、理解和生成人类语言。它通过在海量的文本数据上进行训练，学会了语言的统计规律和语义结构。目前的LLM已经能够实现流畅的多轮对话、代码编写以及复杂的逻辑推理。 == 核心架构：Transformer == 现代LLM大多基于'''Transformer'''架构。该架构引入了注意力…”

2026-04-06T23:44:03Z

创建页面，内容为“'''大语言模型'''（Large Language Model，简称LLM）是一种基于深度学习的人工智能模型，专门用于处理、理解和生成人类语言。它通过在海量的文本数据上进行训练，学会了语言的统计规律和语义结构。目前的LLM已经能够实现流畅的多轮对话、代码编写以及复杂的逻辑推理。 == 核心架构：Transformer == 现代LLM大多基于'''Transformer'''架构。该架构引入了注意力…”

新页面

'''大语言模型'''（Large Language Model，简称LLM）是一种基于深度学习的人工智能模型，专门用于处理、理解和生成人类语言。它通过在海量的文本数据上进行训练，学会了语言的统计规律和语义结构。目前的LLM已经能够实现流畅的多轮对话、代码编写以及复杂的逻辑推理。

== 核心架构：Transformer ==
现代LLM大多基于'''Transformer'''架构。该架构引入了注意力机制（Attention Mechanism），使模型能够捕捉长距离的语义依赖。

== 训练过程 ==
LLM的构建通常包含以下两个关键阶段：
# '''预训练（Pre-training）'''：模型在大规模的互联网文本语料库上进行无监督学习。
# '''指令微调（Instruction Tuning）'''：通过人类反馈强化学习等技术，教会模型如何准确理解并执行用户的指令。

== 局限性：幻觉 ==
尽管LLM表现卓越，但仍存在幻觉现象，即模型可能会生成看似合理但完全错误的事实。

== 应用领域 ==
LLM目前已广泛应用于多个前沿领域：
* '''智能交互'''：作为虚拟助手提供情感陪伴与信息查询。
* '''辅助开发'''：帮助工程师快速生成代码片段。
* '''内容创作'''：协助进行多语言翻译、文章撰写。

== 参考资料 ==
# Vaswani, A., et al. (2017). ''Attention Is All You Need''.
# OpenAI. (2023). ''GPT-4 Technical Report''.
# Bommasani, R., et al. (2021). ''On the Opportunities and Risks of Foundation Models''.

大语言模型 - 版本历史

2026年4月7日 (二) 00:37 Yuqing

2026年4月7日 (二) 00:07 Yuqing

2026年4月7日 (二) 00:02 Yuqing

Yuqing：​清空全部内容

Yuqing：清空全部内容