|
- 怎样才算是理解了一个东西,比如理解了一个概念? - 知乎
理解它的来龙去脉。就比如说对于一个工具,明白它是在什么样的需求下被制作出来,最后又发挥了怎样的功能。 比如一个数学概念,为什么要理解它所提出的背景呢?这是因为,数学概念也是给人看的,神不需要定义某个概念,他们不用借助某个低层次的概念去理解高层次的概念,数学定理证不
- 如何理解attention中的Q,K,V? - 知乎
我觉得Query,Key和Value是一个很流行但是不太好的比方,这个比方在理解Cross-attention的时候还有点用,但是在Self-attention的时候就非常的让人困惑。 这三个本来是数据库的术语,Query就是「我要找什么」,Key-Value是数据库里面的「键」和「值」。这个就相当于我首先要查找一个东西,然后通过和键的
- 如何最简单、通俗地理解Transformer? - 知乎
这个东西很难说到底有没有一种简单、通俗地理解方式。 你看这个问题下面现在有60多个回答,我大概翻看了一下,几乎都是长篇大论,原因很简单,Transformer就不是简单几句话就能讲得清楚的。 我个人的观点是要想系统而又透彻地理解 Transformer,至少要遵循下面这样一个思路(步骤): 首先
- 如何最简单、通俗地理解卷积神经网络? - 知乎
一、笔记 0)卷积神经网络 (CNN)-结构 ① CNN结构一般包含这几个层: 输入层:用于数据的输入 卷积层:使用卷积核进行特征提取和特征映射 激励层:由于卷积也是一种线性运算,因此需要增加非线性映射 池化层:进行下采样,对特征图稀疏处理,减少数据运算量。 全连接层:通常在CNN的尾部进行
- 导数 dy dx 是不是一个整体符号? - 知乎
更新: 之所以写这个答案,是因为看过很多答案将dx,dy理解成微分,然后来解释微积分符号的含义。这样解释在我看来过于复杂——没有说它们不对,而是复杂。 我之所以不愿意在一元函数阶段引入微分,就是因为我认为,引入「微分」来解释过于复杂: 需要额外定义「微分」到底是什么意思
- 编程中什么是「Context (上下文)」? - 知乎
最近读Flask的文档,读到很多关于Context(上下文)的术语,如应用上下文,请求上下文等,查阅资料但没有得…
- 一文了解Transformer全貌(图解Transformer)
自2017年Google推出Transformer以来,基于其架构的语言模型便如雨后春笋般涌现,其中Bert、T5等备受瞩目,而近期风靡全球的大模型ChatGPT和LLaMa更是大放异彩。网络上关于Transformer的解析文章非常大,但本文将力求用浅显易懂的语言,为大家深入解析Transformer的技术内核。
- 如何通俗易懂地讲解什么是 PCA(主成分分析)? - 知乎
如何通俗易懂地讲解什么是 PCA(主成分分析)?
|
|
|