首页 » 标签 » Transformer

机器学习 | Transformer

时间：2024-10-19
分类：机器学习
暂无评论

Transformer：一种采用注意力机制的深度学习模型，这一机制可以按输入数据各部分重要性的不同而分配不同的权重。

- 阅读剩余部分 -

机器学习 | GPT-2

时间：2024-07-30
分类：机器学习
暂无评论

GPT-2 (Generative Pre-trained Transformer 2): 是 OpenAI 发布的 GPT 系列大语言模型的第二代。它采用了纯解码器 (decoder only) 的结构，是一种自回归语言模型。

- 阅读剩余部分 -

机器学习 | 注意力机制

时间：2024-05-15
分类：机器学习
暂无评论

注意力机制 (Attention)：是人工神经网络中一种模仿认知注意力的技术。这种机制可以增强神经网络输入数据中某些部分的权重，同时减弱其他部分的权重，以此将网络的关注点聚焦于数据中最重要的一小部分。数据中哪些部分比其他部分更重要取决于上下文。

- 阅读剩余部分 -