add seventh chapter
This commit is contained in:
parent
f4bb09668e
commit
93c824127d
|
|
@ -1039,9 +1039,9 @@ medium355M-sft.pth")).
|
||||||
|
|
||||||
<img src="../Image/chapter7/figure7.19.png" width="75%" />
|
<img src="../Image/chapter7/figure7.19.png" width="75%" />
|
||||||
|
|
||||||
为了实现图 7.19 中第 9 步(以自动化方式评估测试集响应),我们使用了 Meta AI 开发的一个经过指令微调的 Llama 3 模型,该模型拥有 80 亿参数,可以通过开源应用程序 Ollama 在本地运行(官网:https://ollama.com)。
|
为了实现图 7.19 中第 9 步(以自动化方式评估测试集响应),我们使用了 Meta AI 开发的一个经过指令微调的 Llama 3 模型,该模型拥有 80 亿参数,可以通过开源应用程序 Ollama 在本地运行(官网:[https://ollama.com](https://ollama.com))。
|
||||||
|
|
||||||
Ollama 是一个高效的应用程序,适用于在笔记本电脑上运行大语言模型(LLM)。它是开源库 `llama.cpp`(https://github.com/ggerganov/llama.cpp)的封装,该库用纯 C/C++ 实现了 LLM,旨在最大化效率。然而,需要注意的是,Ollama 仅用于使用 LLM 生成文本(推理),并不支持训练或微调 LLM。
|
Ollama 是一个高效的应用程序,适用于在笔记本电脑上运行大语言模型(LLM)。它是开源库 `llama.cpp`([https://github.com/ggerganov/llama.cpp](https://github.com/ggerganov/llama.cpp))的封装,该库用纯 C/C++ 实现了 LLM,旨在最大化效率。然而,需要注意的是,Ollama 仅用于使用 LLM 生成文本(推理),并不支持训练或微调 LLM。
|
||||||
|
|
||||||
> [!NOTE]
|
> [!NOTE]
|
||||||
>
|
>
|
||||||
|
|
@ -1400,7 +1400,7 @@ Average score: 54.16
|
||||||
|
|
||||||
### 7.9.2 如何在快速变化的前沿领域中保持领先
|
### 7.9.2 如何在快速变化的前沿领域中保持领先
|
||||||
|
|
||||||
人工智能和大语言模型的研究领域正在迅速发展(许多人可能觉得这非常令人兴奋)。想要了解最新进展,可以浏览 arXiv 上的最新研究论文(网址:https://arxiv.org/list/cs.LG/recent)。此外,许多研究人员和从业者也会在社交媒体平台(如 X(原 Twitter)和 Reddit)上积极分享和讨论最新动态。尤其是 Reddit 的 r/LocalLLaMA 版块,是了解社区动态以及最新工具和趋势的好资源。
|
人工智能和大语言模型的研究领域正在迅速发展(许多人可能觉得这非常令人兴奋)。想要了解最新进展,可以浏览 arXiv 上的最新研究论文(网址:[https://arxiv.org/list/cs.LG/recent](https://arxiv.org/list/cs.LG/recent))。此外,许多研究人员和从业者也会在社交媒体平台(如 X(原 Twitter)和 Reddit)上积极分享和讨论最新动态。尤其是 Reddit 的 r/LocalLLaMA 版块,是了解社区动态以及最新工具和趋势的好资源。
|
||||||
|
|
||||||
我会定期在博客上分享关于大语言模型(LLM)研究的最新动态和见解,您可以通过以下地址访问:https://magazine.sebastianraschka.com 和 https://sebastianraschka.com/blog/。
|
我会定期在博客上分享关于大语言模型(LLM)研究的最新动态和见解,您可以通过以下地址访问:https://magazine.sebastianraschka.com 和 https://sebastianraschka.com/blog/。
|
||||||
|
|
||||||
|
|
|
||||||
Loading…
Reference in New Issue