使用Conda和Ollama开始使用Meta的Llama堆栈_

要设置 Meta 的新 Llama Stack 开发工具，您可以使用 Python 控制的环境或 Docker。我们选择了 Python 和 Ollama LLM。

译自Get Started With Meta’s Llama Stack Using Conda and Ollama，作者 David Eastman。

我喜欢在我的文章中展示技术，尤其是在我简陋的非硅基 MacBook 上。因此，当 Meta 发布了面向开发者的Llama 3.2 和 Llama Stack时，我迫不及待地想要尝试一下。然而，我发现这个过程仍然有点复杂，而且不够灵活。

首先，什么是堆栈？Meta 试图定义一个平台的组件，可以帮助人们构建自己的大型语言模型 (LLM) 消费系统。主要组件是推理，其中使用训练数据来预测标记响应——这也是我们都在这里的原因。这个有点尴尬的名字代理系统指的是 AI 将与其他实体（可能是其他 AI）协同工作，而不是仅仅响应聊天。但AI 代理的确切定义仍在热烈讨论中。还有很多其他组件，尽管我认为其中一些将来可能会重新定义。它们可以通过 REST 端点的 API 访问。

另一个关键术语是分发的定义。这是“API 和提供者组合在一起，提供一致的整体。”目前，这些有点临时，需要更多时间才能建立起来——平台的成功或失败将取决于这些的质量。

然而，堆栈的想法是合理的：为你不感兴趣的组件提供交钥匙解决方案，并选择你感兴趣的部分。

入门

你可以使用 Python 控制的环境来设置，或者使用 Docker。目前，使用 Docker 的参考资料并不多。

目前，该系统在 Windows 上无法运行——我发现一些引用交互式控制台的 Python 库是特定于 Unix 的。但这似乎无关紧要。堆栈中的主要示例模板在没有专用 GPU 的情况下无法正常运行，但我可以通过使用Ollama分发来解决这个问题。（如果你有一个相当稳定的 Unix 机器，你应该会遇到更少的入门阻力。）

如果你使用本地分发，建议你使用Conda创建一个隔离的 Python 环境。

进入 Python

Conda 是一个开源工具，它与 Anaconda 和Miniconda捆绑在一起，它既充当包管理器，也充当环境管理器。我们将使用这条小蛇。

我使用 homebrew 为我的可靠 MacBook 安装了 Miniconda：

版本检出：

Conda 会将你的提示符更改为显示“base”或“stack”——因此你需要记住使用conda deactivate来关闭它。

以下是在设置方面的第一步：

#Clone the repo. Note the other directories below meta-llama git clone https://github.com/meta-llama/llama-stack-apps.git #Create your named conda python environment conda create -n llama-stack python=3.10 #Activate the conda environment conda activate llama-stack cd llama-stack-apps #install modules from requirements file pip install -r requirements.txt

Ollama很容易安装，我们将使用它来处理一个稍微早一点、更小的 LLM 模型 3.1。我们的想法是，我们将与 Ollama 在 localhost 上设置的服务器进行通信：