来源:https://blog.qjyg.de/posts/st-speedrun/
如前文所说,酒馆是一个空壳前端,部署完无法直接使用,还需要进行一些配置。在这里会给出配置方法,立刻就让你和默认角色对上话。请按顺序一步步操作不要跳步骤。
TIP以下内容含很多概念科普,看不懂也不要慌张,只是了解一下,实际操作会给出最简单的宝宝操作。没有耐心的话也可以直接点击跳转实操部分。不过希望你有疑问的时候再回来看看,能看懂的情况下别问我明确写过的问题。
一、连接 AI 模型
首先,你需要拥有一个 AI 模型的 API 接口 和密钥。
基本概念
- API 接口:通常是一个
https://开头的网址形式的 URL 链接,它告诉酒馆去哪里连接 AI。 - 密钥:一个身份证明,酒馆找到 API 接口之后需要出示密钥来证明自己有资格和 AI 连接。
模型提供商与 API 接口
1. 模型提供商的分类
- 官方提供商:自主研发并提供模型服务的公司。
- OpenAI (ChatGPT 的开发者)
- Google (Gemini 的开发者)
- Anthropic (Claude 的开发者)
- 第三方提供商:不自己研发模型,而是聚合或代理来自不同官方提供商的模型。这类提供商很多,服务质量和合规性参差不齐。
2. API 接口的差异
- 接口地址:每个提供商都有独特的 API 地址。由基础 URL + 后缀组成,主要注意后缀。
- OpenAI:
https://api.openai.com/v1/chat/completions- 由基础 URL
https://api.openai.com和后缀/v1/chat/completions组成。
- 由基础 URL
- Google Gemini:
https://generativelanguage.googleapis.com/v1beta/models- 由基础 URL
https://generativelanguage.googleapis.com和后缀/v1beta/models组成。
- 由基础 URL
- Anthropic:
https://api.anthropic.com/v1/messages- 由基础 URL
https://api.anthropic.com和后缀/v1/messages组成。
- 由基础 URL
- OpenAI:
- 数据格式:除了 URL 不同,传输的数据结构也完全不同。这意味着不能通用,简单地将为 OpenAI 的数据直接发送给 Gemini 的接口的没用的。
3. 通用标准:OpenAI 格式
因此,我们最常接触和使用的就是与 OpenAI 兼容的 API 接口。
Gemini 的渠道
- 官方渠道:
最正规的是从 Google AI Studio 申请来的 Google API Key,使用 Google 官方 API 接口https://generativelanguage.googleapis.com/v1beta/models和申请来的 Key 进行连接。 - 逆向渠道:
举个例子,你可能知道 Gemini 有官方 AI 对话网页,但它只提供网页对话不提供 API 接口。通过逆向工程技术,可以假装是客户端请求来获取数据,并将其封装成 API 接口,你可以理解为替你去网页对话,走的是你网页的额度。这种项目俗称 2api (to api)。 - 第三方站点:
公益站、商业化站点的模型来源,大部分就是整合了上面两类渠道的模型。
自建中转服务
- 绕过地区限制:大陆、香港无法连接 Gemini。用一个既能连接你,也能连接 Google 的中转服务器作为“中间人”,可以帮你传递数据(你 -> 中转 -> Google),从而实现通信。
- 多 Key 管理和负载均衡:如果你有很多个 Google API Key,中转可以方便地管理、自动切换、测试有效性、提供报错信息、查看使用统计,避免每日额度用完后手动更换的麻烦。
- 多渠道整合:将你拥有的所有模型渠道(多个 Key、自建的 2api、收集的站点)捏合到一个 API 接口里统一使用,无需频繁切换。
- 接口转换:将各种不同格式的接口(如 Google 的 Gemini 格式)转换为通用的 OpenAI 接口。
- 假流式输出:模型输出分为“流式”(像打字机一样生成一个字就立即显示一个字)和“非流式”(等待过程中没有字,直到全部生成完毕再把整段文字一次性显示出来)。非流式的等待时间很长,如果超过了酒馆限制的 120s 那么就会报错超时无法返回。而流式的审查比非流式更加严格,可能会写着写着发现有问题停止输出,俗称截断。假流式是在非流式的基础上,由中转工具持续向酒馆发送空数据包,模拟流式传输,避免超时。
- 分发:如果你的 API 资源多得用不完,可以分给朋友,或者开设一个公益站。
CAUTION不可以分发其它公益站的资源!不要借花献佛!!!
API 的获取与使用
领取新手 API
在酒馆中连接 API(公益站通用)
- 点击菜单栏 左二插头图标,打开 连接设置 标签页。
- API: 选择
聊天补全。 - 聊天补全来源: 选择
自定义(兼容 OpenAI)。 - 自定义端点(基础 URL): 填入 API 接口,地址应以
/v1结尾,如果不是那就加上/v1。 - 自定义 API 密钥: 填入密钥。
- 提示词后处理: 选择
严格。 - 自动连接到上次的服务器:
勾选。 - 点击 连接 按钮。绿灯处显示
有效或Valid就是连接成功,显示其他的都是连接失败,停下来排错。 - 在 可用模型 列表中,选择
gemini-2.5-pro模型。(2025-12-7谷歌已削减gemini-2.5-pro的免费额度为0,请使用gemini-2.5-flash模型测试) - 点击右上 保存配置 按钮,下次就不用重新输了,需要勾选的内容看下图。

- 再次点击菜单栏 左二插头图标,关闭 连接设置 标签页。
课后扩展:API 接口格式
基础 URL+ /v1/chat/completions 后缀,那为什么酒馆中只填后缀到 /v1 呢?原因在于各软件的路径自动补全机制不同。
请看上图中 自定义端点(基础 URL) 下方的那行提示
不行?在 URL 末尾添加 /v1 试试! /chat/completions 的后缀会被自动补全。。酒馆会自动补全 /chat/completions 的部分,因此我们只需要填写前面的部分。如果你也使用其它 AI 前端,会发现不同前端的填写要求各不相同。
- Cherry Studio: 我只填写了
https://示例.com,而下方预览会显示补全后的完整接口https://示例.com/v1/chat/completions,补全的是/v1/chat/completions部分。
- 沉浸式翻译: 不会自动补全,需要填写完整的接口地址。

其它渠道 API 获取
- 什么是公益站?
公益站是指完全没有付费渠道的第三方中转站,站长为爱发电,请心存感激。 - 如何寻找与辨别
- 寻找渠道:在小红书、Discord 酒馆社区等平台善用搜索。
- 注意辨别:许多商业中转站会伪装成“公益站”或“半公益站”来吸引用户。
- 特征:会提供小额的免费试用额度,拉人头送赠金,搜索结果里很多热情分享的都是为了给贩子拉人头拿赠金。
- 建议:如果不要求提供敏感个人信息,都可以用,用完免费额度后换一家即可,无需付费。
- 使用方法
大部分公益站基于New API或Veloera等开源项目搭建,获取 API 密钥的流程大同小异:- 注册账号
如果服务商提供的是一个网站地址,首先需要访问网站并注册一个账号。 - 创建令牌
登录后,在网站后台找到 “令牌管理” 或类似的菜单。添加一个令牌,按以下方式配置:- 名称:随便写(站长可以看到哦)。
- 分组:如无特殊说明,保持默认。
- 过期时间:选择 永不过期。
- 额度:勾选 无限额度。

- 复制密钥
把生成的密钥完整复制下来

- 组合 API 地址
- API 基础 URL:就是你注册的那个网站地址,例如
https://example.com。 - API 接口地址:酒馆不补全
v1所以最终填写站点网址 + /v1(例如:https://example.com/v1)
- API 基础 URL:就是你注册的那个网站地址,例如
- 有了 API 和密钥,就可以参考上文 在酒馆中连接 API(公益站通用) 进酒馆设置啦。
- 注册账号
直连 Gemini 或自建中转:
想要拥有自己的 API,一切的前提是,你需要有一个 Google 账号。
二、配置预设与正则
- 预设:是指导 AI 写作的提示词,功能包括绕过 AI 的内容审查和道德伦理限制(俗称破限、越狱)、设定写作风格、字数要求、人称、禁用词等等。
- 正则:用于控制哪些内容需要对用户和 AI 隐藏。例如,重型预设常包含 AI 的“思维链”(思维链可以让 AI 在输出前进行规划以达到更稳定的效果),正则可以将其隐藏,使其在聊天界面不可见,也不被计入后续对话的上下文中。
下载预设与正则文件
导入预设
- 首先确保你没有跳步骤,已经连接了 AI 模型。
- 点击菜单栏 左一图标,打开 预设管理 标签页。
- 取消勾选 🔗 符号,这样就不会因为切换预设而断开 API 连接。
- 点击 导入 按钮,打开预设
.json文件。
- 导入后可以看到已经显示出导入的预设名字,下拉可以看到预设具体的条目。

- 每个条目都可以按自己喜好开关(条目右侧的拨动开关)、更改(小铅笔)。当然我们的试用预设条目非常少没什么可改的,想改的话可以更改字数要求试试看。
- 任何改动之后都需要拉到最上面点一下 保存 按钮。
- 再次点击菜单栏 左一图标,关闭 预设管理 标签页。
导入正则
- 点击菜单栏 三个方块图标,打开 扩展 标签页。
- 展开 正则。
- 点击 导入正则 按钮,打开正则
.json文件。
- 导入后可以看到已经显示出导入的正则名字,可以随时开关。

- 再次点击菜单栏 三个方块图标,关闭 扩展 标签页。
三、开始聊天测试
现在已经可以和酒馆默认角色 Seraphina 对话了,来试试吧。
- 点击菜单栏 右一身份证图标,打开 角色卡 标签页。

- 可以看到默认角色 Seraphina,点击她,进入角色详情页面。

- 再次点击菜单栏 右一身份证图标,关闭 角色卡 标签页。
- 现在可以看到对话页面了,在底部输入框内和她对话吧。

- 点击纸飞机按钮发送后,发送按钮会变成停止按钮,耐心等待发送按钮变回纸飞机。
- 试用 API + 试用预设的组合默认是流式输出,像打字机一样逐字显示。你会先看到思维链,然后是正文。全部输出完毕后,正则会生效将思维链隐藏起来,最终将只显示正文。如果你在过程中也不想看到思维链,下文的课后扩展会给出方案。

- 点开小铅笔可以看到未隐藏的全文,一对
<thinking>标签包裹的思维链,后接一对<content>标签包裹的正文。如果你的正则没问题但思维链没被隐藏,那你就可以看看是不是 AI 没有按照预设要求的格式输出啦。在这里可以修改内容点对号按钮保存,或点垃圾桶按钮直接删除消息。
- 如果发生截断(生成不完整,原因是触发审核),或 AI 没按格式输出,或对输出结果不满意,点击左下角 三条横杠 按钮,点击 重新生成 按钮可以重 roll。前文对 AI 的影响巨大,千万不要保留不好的内容哦。另外,开始新聊天 按钮可以开一个新对话,旧的对话也会保留,在 管理聊天文件 中可以切换。

课后扩展:社区角色卡与自动解析
导入角色卡
.png 或 .json 格式,两者在内容上没有区别,里面都已经包含了角色自带的世界书。部分社区角色卡发布页会同时放出单独的世界书,是以防万一的,一般不需要下载,单导入角色卡即可。导入角色卡后,初次点击角色时会弹窗提问是否导入配套的角色世界书,一律点是就好。
之后小地球图标会变绿,代表已经自动开启了世界书。 不需要任何额外设置,不需要去手动开启或切换世界书,角色配套的世界书是自动开启的。
多开局角色卡

自动解析隐藏思维链
- 首先关闭现有的隐藏思维链正则条目。(如果有很多条别关错啦,只关隐藏思维链这一条!)

- 你会看到思维链已经漏出来了。

- 点击菜单栏 左三 A 图标,打开 高级格式化设置 标签页。
- 拉到最底下,勾选 自动解析,展开 推理内容格式化,点击 新建 按钮,随便取个名字比如
thinking。
- 前缀 填写
<thinking>,后缀 填写</thinking>,点击保存。
- 关闭标签页,思维链仍然存在,这是正常的。重 roll 一条,就会看到思维链在流式过程中也会被收在思考过程里,不会漏出来。

TIP输出格式和思考标签是预设作者设定的,不同预设的思考标签可能不同,那么自动解析的前缀后缀填写也会不同。
不是所有预设都适配自动解析,这个功能硬性要求思维链标签在最开头,<thinking>标签必须是第一个词,前面不能有东西。
部分预设的思维链不在最开头,那么就无法使用,老实用正则。因为自动解析功能是后出的,早年都用正则,所以会有一些意想不到的不适配。
四、安装实用扩展
酒馆的扩展性在这里体现,通过扩展可以实现许多功能,比如渲染 HTML 代码、自动填表、自动总结增强记忆等。代码渲染功能几乎是必备的,建议必装,否则你将看到这样的内容。
安装前: 
安装后: 
安装代码渲染扩展 – 酒馆助手
作者 KAKAA | 官方文档
- 点击菜单栏 三个方块图标,打开 扩展 标签页。
- 点击 安装扩展 按钮。

- 在弹窗中的上面一行输入框内输入扩展安装地址,然后点击 Install just for me(仅为自己安装) 即可安装。
https://gitlab.com/novi028/JS-Slash-Runner




















