1144 字
6 分钟
酒馆写卡
这里简单记录一下我对酒馆其中角色卡创作的学习,由于玩的比较多,自认为对于世界书、预设还有正则角色卡之类的有了自己的一番理解,所以开始对好兄弟的小说框架进行一番创作。
一些术语
| 术语分类 | 术语 | 类比解释(前后端视角) | 在大模型角色扮演中的作用 |
|---|---|---|---|
| 核心工具与概念 | SillyTavern | 一个专为 LLM 设计的”前端 UI 框架+调试器”。它不包含模型本身,而是通过 API 调用各种大模型,并提供创建角色、管理对话的图形界面和高级控制功能 | 角色扮演的操作平台和开发环境 |
| 大模型模型(LLM) | 一个经过海量文本训练的超级文本预测引擎。可以理解成一个封装了极其复杂逻辑的”文本处理黑盒服务”,你提供一段输入文本,它就会根据”学习到的规律”生成后续的文本 | 角色扮演的大脑和内容生成器 | |
| 角色塑造相关 | 角色卡 | 角色的配置文件(Json Schema)或数据结构定义,它包含了角色的所有静态属性,决定了 AI 在扮演时的初始状态 | 定义角色是谁,相当于 AI 演员拿到的人物设定剧本 |
| 设定/场景 | 当前对话发生的上下文环境科,相当于一个运行时变量或会话存储。它定义了角色”现在在哪里,正在发生什么事” | 定义了故事背景,为 AI 提供对话的具体场景和上下文 | |
| 与模型交互的关键 | 提示词/指令(prompt) | 发送给大模型这个”API 服务”的请求参数(Request Parameters)。提示词质量,直接决定了模型返回的响应质量 | 引导和控制 AI 输出的核心指令,SillyTavern 的工作就是把角色卡、对话历史等自动组装成优质的提示词发送给模型 |
| 厄里斯墨镜效应 | 大模型的一个核心特性:它没有真正的思想,而是你输入(提示词)的”镜像反射”和”统计增强”。你给的信息越清晰、聪明,它的回复就质量高;你给的信息越混乱,它的回复就越乱 | 理解 AI 行为基础,强调精心设计提示词的重要性,你的输入定义了输出的上限 | |
| 高级功能 | 世界书 | 一个全局的世界观数据库或知识库,可以被多个角色卡引用,用于提供共享的背景设定、专有名词解释等等 | 构建统一的虚构世界设定,增强多个角色互动时的一致性和沉浸感 |
通过上面的内容,我们通常可以了解认识 sillytavern 的工作流,而实际上,在写卡片的时候,有两个进阶的模块需要学习:MVUBETA、EJS
| 术语 | 本质 | 在 SillyTavern 中的具体作用 | 技术类比 |
|---|---|---|---|
| MVUBETA | SillyTavern 前端的架构/模式名称,可以把它理解成项目的”技术栈选型”或”前端框架代号”。它通常指的是一套基于现代前端思想(如组件化、响应式)构建的用户界面架构 | 它定义了整个用户界面的组织方式、数据流动和模块划分。你使用的按钮、侧边栏、聊天窗口等,都是在这个架构下开发的组件 | 类似与一个项目团队决定用 Vue3 + Composition API 还是 React + Redux 来重构整个项目。它决定了开发者的编码方式 |
| EJS | 嵌入式 JavaScript 模版引擎,它允许你在 HTML 中嵌入 JavaScript 代码,用于动态生成和最终发送给大模型的提示词 | 这是 SillyTavern 中编写角色卡和系统提示词的核心工具。通过 EJS 语法,可以插入变量、执行逻辑判断、循环等,让角色描述和对话上下文动态、智能地进行组合 | 就像服务器后端用服务端模版渲染页面一样,只不过这里渲染的不是 HTML,而是给 AI 看的超文本指令 |
为了和刚刚的前端页面相匹配,所以有了下面两个东西,美化状态栏和前端美化页面
这里使用的是三明月大佬的写卡预设进行写卡的初步学习,特别鸣谢!
部分信息可能已经过时