酒馆搭建完后怎么完

来源：https://blog.qjyg.de/posts/st-speedrun/

如前文所说，酒馆是一个空壳前端，部署完无法直接使用，还需要进行一些配置。在这里会给出配置方法，立刻就让你和默认角色对上话。请按顺序一步步操作不要跳步骤。

TIP以下内容含很多概念科普，看不懂也不要慌张，只是了解一下，实际操作会给出最简单的宝宝操作。没有耐心的话也可以直接点击跳转实操部分。不过希望你有疑问的时候再回来看看，能看懂的情况下别问我明确写过的问题。

一、连接 AI 模型

首先，你需要拥有一个 AI 模型的 API 接口 和密钥。

基本概念

API 接口：通常是一个 https:// 开头的网址形式的 URL 链接，它告诉酒馆去哪里连接 AI。
密钥：一个身份证明，酒馆找到 API 接口之后需要出示密钥来证明自己有资格和 AI 连接。

模型提供商与 API 接口

1. 模型提供商的分类

AI 模型的提供商多种多样，大致可以分为两类：

官方提供商：自主研发并提供模型服务的公司。
- OpenAI (ChatGPT 的开发者)
- Google (Gemini 的开发者)
- Anthropic (Claude 的开发者)
第三方提供商：不自己研发模型，而是聚合或代理来自不同官方提供商的模型。这类提供商很多，服务质量和合规性参差不齐。

2. API 接口的差异

不同提供商的 API 格式不同，通常无法直接通用。主要体现在以下两个方面：

接口地址：每个提供商都有独特的 API 地址。由基础 URL + 后缀组成，主要注意后缀。
- OpenAI: https://api.openai.com/v1/chat/completions
  - 由基础 URL https://api.openai.com 和后缀 /v1/chat/completions 组成。
- Google Gemini: https://generativelanguage.googleapis.com/v1beta/models
  - 由基础 URL https://generativelanguage.googleapis.com 和后缀 /v1beta/models 组成。
- Anthropic: https://api.anthropic.com/v1/messages
  - 由基础 URL https://api.anthropic.com 和后缀 /v1/messages 组成。
数据格式：除了 URL 不同，传输的数据结构也完全不同。这意味着不能通用，简单地将为 OpenAI 的数据直接发送给 Gemini 的接口的没用的。

3. 通用标准：OpenAI 格式

尽管各家 API 格式不同，但由于 OpenAI 作为行业先行者，它的 API 格式已逐渐成为通用标准。绝大多数第三方提供商和开源项目都会优先兼容或直接采用 OpenAI 的接口格式。对于不兼容的 API，也有许多转换工具，可以将其他格式（如 Gemini 或 Claude）的 API 请求转换为 OpenAI 格式。

因此，我们最常接触和使用的就是与 OpenAI 兼容的 API 接口。

Gemini 的渠道

酒馆玩家最常使用 Gemini 和 Claude 模型。Gemini 免费、Claude 付费（官方渠道易封号不退款所以不推荐，只推荐官方合作的正规平台 openrouter，参考价 2-10 元/条），看财力选择。新手教程这边以免费的 Gemini 为例。

官方渠道：
最正规的是从 Google AI Studio 申请来的 Google API Key，使用 Google 官方 API 接口 https://generativelanguage.googleapis.com/v1beta/models 和申请来的 Key 进行连接。
逆向渠道：
举个例子，你可能知道 Gemini 有官方 AI 对话网页，但它只提供网页对话不提供 API 接口。通过逆向工程技术，可以假装是客户端请求来获取数据，并将其封装成 API 接口，你可以理解为替你去网页对话，走的是你网页的额度。这种项目俗称 2api (to api)。
第三方站点：
公益站、商业化站点的模型来源，大部分就是整合了上面两类渠道的模型。

自建中转服务

每个人都可以自建中转，其实和第三方站点没什么区别。个人自建中转的目的和功能各不相同，大致如下：

绕过地区限制：大陆、香港无法连接 Gemini。用一个既能连接你，也能连接 Google 的中转服务器作为“中间人”，可以帮你传递数据（你 -> 中转 -> Google），从而实现通信。
多 Key 管理和负载均衡：如果你有很多个 Google API Key，中转可以方便地管理、自动切换、测试有效性、提供报错信息、查看使用统计，避免每日额度用完后手动更换的麻烦。
多渠道整合：将你拥有的所有模型渠道（多个 Key、自建的 2api、收集的站点）捏合到一个 API 接口里统一使用，无需频繁切换。
接口转换：将各种不同格式的接口（如 Google 的 Gemini 格式）转换为通用的 OpenAI 接口。
假流式输出：模型输出分为“流式”（像打字机一样生成一个字就立即显示一个字）和“非流式”（等待过程中没有字，直到全部生成完毕再把整段文字一次性显示出来）。非流式的等待时间很长，如果超过了酒馆限制的 120s 那么就会报错超时无法返回。而流式的审查比非流式更加严格，可能会写着写着发现有问题停止输出，俗称截断。假流式是在非流式的基础上，由中转工具持续向酒馆发送空数据包，模拟流式传输，避免超时。
分发：如果你的 API 资源多得用不完，可以分给朋友，或者开设一个公益站。

CAUTION不可以分发其它公益站的资源！不要借花献佛！！！

API 的获取与使用

领取新手 API

可以在本站留言领取少量额度使用，同时推荐到智谱开放平台申请GLM-4.5-Flash，目前是免费使用。

在酒馆中连接 API（公益站通用）

你会得到一个网址形式的 API 接口 和一个一串符号的密钥。请按以下顺序一步步设置。

点击菜单栏 左二插头图标，打开 连接设置 标签页。
API: 选择 聊天补全。
聊天补全来源: 选择 自定义（兼容 OpenAI）。
自定义端点（基础 URL）: 填入 API 接口，地址应以 /v1 结尾，如果不是那就加上 /v1。
自定义 API 密钥: 填入密钥。
提示词后处理: 选择 严格。
自动连接到上次的服务器：勾选。
点击连接按钮。绿灯处显示 有效 或 Valid 就是连接成功，显示其他的都是连接失败，停下来排错。
在 可用模型 列表中，选择 gemini-2.5-pro 模型。（2025-12-7谷歌已削减 gemini-2.5-pro 的免费额度为0，请使用 gemini-2.5-flash 模型测试）
点击右上 保存配置 按钮，下次就不用重新输了，需要勾选的内容看下图。
再次点击菜单栏 左二插头图标，关闭 连接设置 标签页。

课后扩展：API 接口格式

如上文所说， OpenAI 的接口格式是 基础 URL+ /v1/chat/completions 后缀，那为什么酒馆中只填后缀到 /v1 呢？
原因在于各软件的路径自动补全机制不同。
请看上图中 自定义端点（基础 URL） 下方的那行提示 不行？在 URL 末尾添加 /v1 试试！ /chat/completions 的后缀会被自动补全。。酒馆会自动补全 /chat/completions 的部分，因此我们只需要填写前面的部分。如果你也使用其它 AI 前端，会发现不同前端的填写要求各不相同。

Cherry Studio: 我只填写了 https://示例.com ，而下方预览会显示补全后的完整接口 https://示例.com/v1/chat/completions ，补全的是 /v1/chat/completions 部分。
沉浸式翻译: 不会自动补全，需要填写完整的接口地址。

其它渠道 API 获取

公益站：

什么是公益站？
公益站是指完全没有付费渠道的第三方中转站，站长为爱发电，请心存感激。
如何寻找与辨别
- 寻找渠道：在小红书、Discord 酒馆社区等平台善用搜索。
- 注意辨别：许多商业中转站会伪装成“公益站”或“半公益站”来吸引用户。
  - 特征：会提供小额的免费试用额度，拉人头送赠金，搜索结果里很多热情分享的都是为了给贩子拉人头拿赠金。
  - 建议：如果不要求提供敏感个人信息，都可以用，用完免费额度后换一家即可，无需付费。
使用方法
大部分公益站基于 New API 或 Veloera 等开源项目搭建，获取 API 密钥的流程大同小异：
1. 注册账号
  如果服务商提供的是一个网站地址，首先需要访问网站并注册一个账号。
2. 创建令牌
  登录后，在网站后台找到 “令牌管理” 或类似的菜单。添加一个令牌，按以下方式配置：
  - 名称：随便写（站长可以看到哦）。
  - 分组：如无特殊说明，保持默认。
  - 过期时间：选择 永不过期。
  - 额度：勾选 无限额度。
3. 复制密钥
  把生成的密钥完整复制下来
4. 组合 API 地址
  - API 基础 URL：就是你注册的那个网站地址，例如 https://example.com。
  - API 接口地址：酒馆不补全 v1 所以最终填写 站点网址 + /v1 (例如: https://example.com/v1)
5. 有了 API 和密钥，就可以参考上文在酒馆中连接 API（公益站通用）进酒馆设置啦。

直连 Gemini 或自建中转：
想要拥有自己的 API，一切的前提是，你需要有一个 Google 账号。

跳转这一篇：注册 google 账号与申请 gemini 密钥

二、配置预设与正则

预设：是指导 AI 写作的提示词，功能包括绕过 AI 的内容审查和道德伦理限制（俗称破限、越狱）、设定写作风格、字数要求、人称、禁用词等等。
正则：用于控制哪些内容需要对用户和 AI 隐藏。例如，重型预设常包含 AI 的“思维链”（思维链可以让 AI 在输出前进行规划以达到更稳定的效果），正则可以将其隐藏，使其在聊天界面不可见，也不被计入后续对话的上下文中。

下载预设与正则文件

这里提供一个试用预设作为教材，为便于理解使用最简单易懂的方式编写，试用过后请去下载专门的预设，效果更好。

下载预设：点击下载预设
下载正则：点击下载正则

导入预设

首先确保你没有跳步骤，已经连接了 AI 模型。
点击菜单栏 左一图标，打开 预设管理 标签页。
取消勾选 🔗 符号，这样就不会因为切换预设而断开 API 连接。
点击导入按钮，打开预设 .json 文件。
导入后可以看到已经显示出导入的预设名字，下拉可以看到预设具体的条目。
每个条目都可以按自己喜好开关（条目右侧的拨动开关）、更改（小铅笔）。当然我们的试用预设条目非常少没什么可改的，想改的话可以更改字数要求试试看。
任何改动之后都需要拉到最上面点一下保存按钮。
再次点击菜单栏 左一图标，关闭 预设管理 标签页。

导入正则

点击菜单栏 三个方块图标，打开扩展标签页。
展开正则。
点击 导入正则 按钮，打开正则 .json 文件。
导入后可以看到已经显示出导入的正则名字，可以随时开关。
再次点击菜单栏 三个方块图标，关闭扩展标签页。

三、开始聊天测试

现在已经可以和酒馆默认角色 Seraphina 对话了，来试试吧。

点击菜单栏 右一身份证图标，打开 角色卡 标签页。
可以看到默认角色 Seraphina，点击她，进入角色详情页面。
再次点击菜单栏 右一身份证图标，关闭 角色卡 标签页。
现在可以看到对话页面了，在底部输入框内和她对话吧。
点击纸飞机按钮发送后，发送按钮会变成停止按钮，耐心等待发送按钮变回纸飞机。
试用 API + 试用预设的组合默认是流式输出，像打字机一样逐字显示。你会先看到思维链，然后是正文。全部输出完毕后，正则会生效将思维链隐藏起来，最终将只显示正文。如果你在过程中也不想看到思维链，下文的课后扩展会给出方案。
点开小铅笔可以看到未隐藏的全文，一对 <thinking> 标签包裹的思维链，后接一对 <content> 标签包裹的正文。如果你的正则没问题但思维链没被隐藏，那你就可以看看是不是 AI 没有按照预设要求的格式输出啦。在这里可以修改内容点对号按钮保存，或点垃圾桶按钮直接删除消息。
如果发生截断（生成不完整，原因是触发审核），或 AI 没按格式输出，或对输出结果不满意，点击左下角 三条横杠 按钮，点击 重新生成 按钮可以重 roll。前文对 AI 的影响巨大，千万不要保留不好的内容哦。另外，开始新聊天 按钮可以开一个新对话，旧的对话也会保留，在 管理聊天文件 中可以切换。

课后扩展：社区角色卡与自动解析

导入角色卡

角色卡通常是 .png 或 .json 格式，两者在内容上没有区别，里面都已经包含了角色自带的世界书。部分社区角色卡发布页会同时放出单独的世界书，是以防万一的，一般不需要下载，单导入角色卡即可。导入角色卡后，初次点击角色时会弹窗提问是否导入配套的角色世界书，一律点是就好。安卓-角色卡导入

之后小地球图标会变绿，代表已经自动开启了世界书。不需要任何额外设置，不需要去手动开启或切换世界书，角色配套的世界书是自动开启的。 SillyTavern角色详情页，显示绿色的世界书图标，表示已激活

多开局角色卡

很多角色卡不止一个开局，首页可能只是介绍，后面才是开局，在新聊天中点击气泡左下右下的箭头就可以切换开局。 SillyTavern聊天界面，展示了用于切换角色不同开场白的箭头按钮

自动解析隐藏思维链

除了用正则隐藏思维链以外，还有一种方式是用自动解析，这种方式更加原生，在流式输出的过程中也不会看到思维链，更加沉浸。

首先关闭现有的隐藏思维链正则条目。（如果有很多条别关错啦，只关隐藏思维链这一条！）
你会看到思维链已经漏出来了。
点击菜单栏 左三 A 图标，打开 高级格式化设置 标签页。
拉到最底下，勾选 自动解析，展开 推理内容格式化，点击新建按钮，随便取个名字比如 thinking。
前缀填写 <thinking>，后缀填写 </thinking>，点击保存。
关闭标签页，思维链仍然存在，这是正常的。重 roll 一条，就会看到思维链在流式过程中也会被收在思考过程里，不会漏出来。

TIP输出格式和思考标签是预设作者设定的，不同预设的思考标签可能不同，那么自动解析的前缀后缀填写也会不同。
不是所有预设都适配自动解析，这个功能硬性要求思维链标签在最开头，<thinking> 标签必须是第一个词，前面不能有东西。
部分预设的思维链不在最开头，那么就无法使用，老实用正则。因为自动解析功能是后出的，早年都用正则，所以会有一些意想不到的不适配。

四、安装实用扩展

酒馆的扩展性在这里体现，通过扩展可以实现许多功能，比如渲染 HTML 代码、自动填表、自动总结增强记忆等。代码渲染功能几乎是必备的，建议必装，否则你将看到这样的内容。

安装前： SillyTavern聊天界面，显示未经渲染的原始HTML代码

安装后： SillyTavern聊天界面，显示经过扩展渲染后正确显示的HTML表格

安装代码渲染扩展 – 酒馆助手

作者 KAKAA | 官方文档

点击菜单栏 三个方块图标，打开扩展标签页。
点击 安装扩展 按钮。
在弹窗中的上面一行输入框内输入扩展安装地址，然后点击 Install just for me（仅为自己安装） 即可安装。
https://gitlab.com/novi028/JS-Slash-Runner

{{userData.name}}已认证

此组别内的文章

需要支持？

酒馆搭建完后怎么玩

一、连接 AI 模型

基本概念

模型提供商与 API 接口

1. 模型提供商的分类

2. API 接口的差异

3. 通用标准：OpenAI 格式

Gemini 的渠道

自建中转服务

API 的获取与使用

领取新手 API

在酒馆中连接 API（公益站通用）

课后扩展：API 接口格式

其它渠道 API 获取

二、配置预设与正则

下载预设与正则文件

导入预设

导入正则

三、开始聊天测试

课后扩展：社区角色卡与自动解析

导入角色卡

多开局角色卡

自动解析隐藏思维链

四、安装实用扩展

安装代码渲染扩展 – 酒馆助手