From 5498cf59350db8b74b065effe9eebcdac7fcf544 Mon Sep 17 00:00:00 2001
From: skindhu <skindhu@tencent.com>
Date: Sat, 2 Nov 2024 14:57:42 +0800
Subject: [PATCH] add third chapter

---
 cn-Book/3.实现注意力机制.md | 4 +++-
 1 file changed, 3 insertions(+), 1 deletion(-)

diff --git a/cn-Book/3.实现注意力机制.md b/cn-Book/3.实现注意力机制.md
index fd2bcf6..a711b04 100644
--- a/cn-Book/3.实现注意力机制.md
+++ b/cn-Book/3.实现注意力机制.md
@@ -998,7 +998,9 @@ tensor([[2., 2., 0., 2., 2., 0.],
 >
 >    在应用 dropout 时，一部分注意力权重被随机置零（假设 dropout 率为 p）。剩余的权重会被放大，其放大倍数为 $` \frac{1}{1-p}  `$。放大后的权重记为 z′：
 >
->    $$ \frac{z_{i}}{1-p} \quad \text { （对于未被置零的权重） } $$
+>    $$ \text{z_{i}}^{\prime}=\frac{z_{i}}{1-p} \quad \text { （对于未被置零的权重） } $$
+>
+>    $$ \text{softmax}\left(z_{i}\right)=\frac{e^{z_{i}}}{\sum_{j} e^{z_{j}}} $$  
 >
 >    
 >