最近 GitHub Trending 周榜上频繁出现一个名字——NousResearch/hermes-agent。它的自我描述非常直白:"The agent that grows with you"(与你一同成长的 Agent)。如果说过去两年我们见过太多"框架型 Agent"(LangChain、AutoGen、Open Interpreter、CrewAI),那 Hermes Agent 想做的是另一件事:让 Agent 从一个"工具"变成一个"角色",能记忆你、能模仿你、能在长任务里自主推进,而不是每次打开新窗口都被清零。
背景
Hermes Agent 出自 Nous Research——一个以开源大模型(Hermes 系列)和研究风格闻名的独立团队。它们的判断是:当模型能力已经在 GPT-4o、Claude、Gemini 这一档趋于稳定后,Agent 层的差异会越来越大,胜负手是记忆、性格、长期目标这三件事。所以他们没有再做一套 chain-of-thought 的编排框架,而是把重心放在"让 Agent 拥有连续性"这件事上。
项目主页上列了四个核心支柱:
持久人格(Persistent Persona):你可以定义 Agent 的语气、价值观、长期目标,甚至给它起名字、写背景故事。它不会随着会话结束而失忆,下一次打开时还会以同样的"角色"跟你说话。
技能与工具(Skills & Tools):通过声明式 YAML/JSON 把工具接进来,Agent 可以调用浏览器、读写文件、执行 shell、查询数据库;所有调用都走沙箱日志,可以回看。
长期记忆(Long-term Memory):内置向量 + 摘要双层记忆,关键事实会自动沉淀,对话里随时召回,避免"我跟你说过的你怎么又忘了"。
自我反思(Self-reflection):Agent 在完成任务后会生成"经验条目"存入记忆,下一次类似任务会优先复用,相当于给它装了一个会复盘的"工作脑"。
个人助理:管日程、起草邮件、整理笔记、汇总网页,做那种"碎但杂"的事
研究搭档:给它一个主题,它会主动搜索 → 阅读 → 摘要 → 产出报告,整个过程不需要你每一步都点确认
代码副驾驶:长任务拆解(设计 → 实现 → 跑测试 → 提 PR)一条龙,特别适合"周末想搞个小项目但懒得从头撸"的状态
桌面自动化:接管浏览器、文件、本地脚本,做"跨应用操作",比如"把下载文件夹里的 PDF 按主题分类重命名"
多 Agent 协作:内置的角色化机制支持多个 Hermes Agent 互相对话,比如"架构师 + 评审员"组合,让一个 Agent 写代码、另一个挑毛病
记忆层是显式可编辑的(你可以打开它的"记忆文件"手动增删),不会出现"AI 莫名其妙记住了某事"的失控感,也不会出现"我说过了你怎么又问"的失忆感
工具调用走显式审批 + 日志回放,每一动作都有据可查,敏感操作(比如
rm -rf、git push --force)可以强制要求二次确认Persona 系统支持多套人格切换——工作模式 / 学习模式 / 创作模式可以是完全不同的"语气",同一个 Agent 后端,不同的"脸"
个人开发者:想要一个真正属于自己的本地 AI 助手,不想被云厂商绑定、不想每月交订阅费
研究/写作党:需要 Agent 长期跟进一个项目,跨周、跨月积累资料,最后帮你整理成稿
AI 重度用户:已经用腻了 ChatGPT 这种"失忆型"对话,想要连续感、想要 Agent 真的认识你
本地派:担心隐私、希望所有对话记录都留在自己硬盘上的人
多模型折腾党:喜欢同时跑几个不同模型对比效果,Hermes Agent 的"模型无关"架构正好对胃口
仓库:https://github.com/NousResearch/hermes-agent
文档:https://hermes-agent.nousresearch.com/
模型:https://huggingface.co/NousResearch
Discord:https://discord.gg/qTc3tAcJMd
这四件事单看都不新鲜,但把它们打包成一个完整产品、并且默认就是这种行为,是 Hermes Agent 的独到之处。市面上大多数 Agent 框架默认是"无状态"的,需要用户自己接外部记忆库、自己写反思 prompt;Hermes Agent 把这些都做成开箱即用。
能做什么
装好 Hermes Agent 之后,最直接的玩法有这几类:
持久人格(Persistent Persona):你可以定义 Agent 的语气、价值观、长期目标,甚至给它起名字、写背景故事。它不会随着会话结束而失忆,下一次打开时还会以同样的"角色"跟你说话。
技能与工具(Skills & Tools):通过声明式 YAML/JSON 把工具接进来,Agent 可以调用浏览器、读写文件、执行 shell、查询数据库;所有调用都走沙箱日志,可以回看。
长期记忆(Long-term Memory):内置向量 + 摘要双层记忆,关键事实会自动沉淀,对话里随时召回,避免"我跟你说过的你怎么又忘了"。
自我反思(Self-reflection):Agent 在完成任务后会生成"经验条目"存入记忆,下一次类似任务会优先复用,相当于给它装了一个会复盘的"工作脑"。
个人助理:管日程、起草邮件、整理笔记、汇总网页,做那种"碎但杂"的事
研究搭档:给它一个主题,它会主动搜索 → 阅读 → 摘要 → 产出报告,整个过程不需要你每一步都点确认
代码副驾驶:长任务拆解(设计 → 实现 → 跑测试 → 提 PR)一条龙,特别适合"周末想搞个小项目但懒得从头撸"的状态
桌面自动化:接管浏览器、文件、本地脚本,做"跨应用操作",比如"把下载文件夹里的 PDF 按主题分类重命名"
多 Agent 协作:内置的角色化机制支持多个 Hermes Agent 互相对话,比如"架构师 + 评审员"组合,让一个 Agent 写代码、另一个挑毛病
记忆层是显式可编辑的(你可以打开它的"记忆文件"手动增删),不会出现"AI 莫名其妙记住了某事"的失控感,也不会出现"我说过了你怎么又问"的失忆感
工具调用走显式审批 + 日志回放,每一动作都有据可查,敏感操作(比如
rm -rf、git push --force)可以强制要求二次确认Persona 系统支持多套人格切换——工作模式 / 学习模式 / 创作模式可以是完全不同的"语气",同一个 Agent 后端,不同的"脸"
个人开发者:想要一个真正属于自己的本地 AI 助手,不想被云厂商绑定、不想每月交订阅费
研究/写作党:需要 Agent 长期跟进一个项目,跨周、跨月积累资料,最后帮你整理成稿
AI 重度用户:已经用腻了 ChatGPT 这种"失忆型"对话,想要连续感、想要 Agent 真的认识你
本地派:担心隐私、希望所有对话记录都留在自己硬盘上的人
多模型折腾党:喜欢同时跑几个不同模型对比效果,Hermes Agent 的"模型无关"架构正好对胃口
仓库:https://github.com/NousResearch/hermes-agent
文档:https://hermes-agent.nousresearch.com/
模型:https://huggingface.co/NousResearch
Discord:https://discord.gg/qTc3tAcJMd

更重要的是,它模型无关。你可以在本地跑 Hermes 系列模型(Hermes 3、Llama 微调版),也可以接 OpenAI / Anthropic / Google 的 API,把"大脑"和"身体"解耦。这一点对于国内用户尤其重要——可以用国内中转 API 当 LLM 后端,工具链完全本地化。
为什么值得
现在市面上能跑 Agent 的项目不少,但大多卡在三件事上:
1. 会话外失忆——换个聊天窗口、关掉浏览器,Agent 就忘了你是谁、之前聊到哪
2. 工具调用黑箱——Agent 自己点了什么链接、删了什么文件、改了什么配置,你完全看不见,出了问题只能干瞪眼
3. 角色单薄——所有 Agent 听起来都一个味,像同一个客服模板,没法按场景切换"语气"
Hermes Agent 的差异化恰好在这三点:
持久人格(Persistent Persona):你可以定义 Agent 的语气、价值观、长期目标,甚至给它起名字、写背景故事。它不会随着会话结束而失忆,下一次打开时还会以同样的"角色"跟你说话。
技能与工具(Skills & Tools):通过声明式 YAML/JSON 把工具接进来,Agent 可以调用浏览器、读写文件、执行 shell、查询数据库;所有调用都走沙箱日志,可以回看。
长期记忆(Long-term Memory):内置向量 + 摘要双层记忆,关键事实会自动沉淀,对话里随时召回,避免"我跟你说过的你怎么又忘了"。
自我反思(Self-reflection):Agent 在完成任务后会生成"经验条目"存入记忆,下一次类似任务会优先复用,相当于给它装了一个会复盘的"工作脑"。
个人助理:管日程、起草邮件、整理笔记、汇总网页,做那种"碎但杂"的事
研究搭档:给它一个主题,它会主动搜索 → 阅读 → 摘要 → 产出报告,整个过程不需要你每一步都点确认
代码副驾驶:长任务拆解(设计 → 实现 → 跑测试 → 提 PR)一条龙,特别适合"周末想搞个小项目但懒得从头撸"的状态
桌面自动化:接管浏览器、文件、本地脚本,做"跨应用操作",比如"把下载文件夹里的 PDF 按主题分类重命名"
多 Agent 协作:内置的角色化机制支持多个 Hermes Agent 互相对话,比如"架构师 + 评审员"组合,让一个 Agent 写代码、另一个挑毛病
记忆层是显式可编辑的(你可以打开它的"记忆文件"手动增删),不会出现"AI 莫名其妙记住了某事"的失控感,也不会出现"我说过了你怎么又问"的失忆感
工具调用走显式审批 + 日志回放,每一动作都有据可查,敏感操作(比如
rm -rf、git push --force)可以强制要求二次确认Persona 系统支持多套人格切换——工作模式 / 学习模式 / 创作模式可以是完全不同的"语气",同一个 Agent 后端,不同的"脸"
个人开发者:想要一个真正属于自己的本地 AI 助手,不想被云厂商绑定、不想每月交订阅费
研究/写作党:需要 Agent 长期跟进一个项目,跨周、跨月积累资料,最后帮你整理成稿
AI 重度用户:已经用腻了 ChatGPT 这种"失忆型"对话,想要连续感、想要 Agent 真的认识你
本地派:担心隐私、希望所有对话记录都留在自己硬盘上的人
多模型折腾党:喜欢同时跑几个不同模型对比效果,Hermes Agent 的"模型无关"架构正好对胃口
仓库:https://github.com/NousResearch/hermes-agent
文档:https://hermes-agent.nousresearch.com/
模型:https://huggingface.co/NousResearch
Discord:https://discord.gg/qTc3tAcJMd
加上 Nous Research 本来就有 Hermes 系列开源模型作为"亲儿子"选项,本地部署的体验很顺畅——ollama run hermes3 就能直接当后端,不用担心被某个云服务锁死,也不会因为 API 涨价一夜之间跑不动。
另外一个常被忽略但很重要的点:Hermes Agent 默认就是"长任务友好"的。它的消息队列、上下文压缩、checkpoint 机制都是为了"跨小时、跨天"的任务设计的,不是那种聊两句就过期的 demo。这对于真正想用 AI 做点事的人来说,比"再加一个新功能"重要得多。
快速上手(Docker 一键跑)
最省心的方式是用官方 Docker 镜像:
# 拉取镜像
docker pull nousresearch/hermes-agent:latest启动(挂载数据卷 + 配置 API Key)
docker run -d \
--name hermes-agent \
-p 7860:7860 \
-v ~/hermes-data:/app/data \
-e OPENAI_API_KEY=sk-xxx \
-e ANTHROPIC_API_KEY=sk-ant-xxx \
nousresearch/hermes-agent:latest启动后访问 http://localhost:7860,第一次会让你创建一个 Persona(名字、语气、长期目标),然后就能直接对话了。
如果想接本地 Ollama 模型,把上面的环境变量换成:
-e LLM_BACKEND=ollama \
-e OLLAMA_MODEL=hermes3:latest \
--network=host数据卷里的内容建议定期备份,那是你 Agent 的"全部人生"——记忆文件、经验条目、Persona 配置都在里面。换个机器恢复一下,就能无缝接着用。

如果不想用 Docker,也可以直接 pip install hermes-agent,但 Docker 方式更省心,依赖隔离干净。
适合谁
持久人格(Persistent Persona):你可以定义 Agent 的语气、价值观、长期目标,甚至给它起名字、写背景故事。它不会随着会话结束而失忆,下一次打开时还会以同样的"角色"跟你说话。
技能与工具(Skills & Tools):通过声明式 YAML/JSON 把工具接进来,Agent 可以调用浏览器、读写文件、执行 shell、查询数据库;所有调用都走沙箱日志,可以回看。
长期记忆(Long-term Memory):内置向量 + 摘要双层记忆,关键事实会自动沉淀,对话里随时召回,避免"我跟你说过的你怎么又忘了"。
自我反思(Self-reflection):Agent 在完成任务后会生成"经验条目"存入记忆,下一次类似任务会优先复用,相当于给它装了一个会复盘的"工作脑"。
个人助理:管日程、起草邮件、整理笔记、汇总网页,做那种"碎但杂"的事
研究搭档:给它一个主题,它会主动搜索 → 阅读 → 摘要 → 产出报告,整个过程不需要你每一步都点确认
代码副驾驶:长任务拆解(设计 → 实现 → 跑测试 → 提 PR)一条龙,特别适合"周末想搞个小项目但懒得从头撸"的状态
桌面自动化:接管浏览器、文件、本地脚本,做"跨应用操作",比如"把下载文件夹里的 PDF 按主题分类重命名"
多 Agent 协作:内置的角色化机制支持多个 Hermes Agent 互相对话,比如"架构师 + 评审员"组合,让一个 Agent 写代码、另一个挑毛病
记忆层是显式可编辑的(你可以打开它的"记忆文件"手动增删),不会出现"AI 莫名其妙记住了某事"的失控感,也不会出现"我说过了你怎么又问"的失忆感
工具调用走显式审批 + 日志回放,每一动作都有据可查,敏感操作(比如
rm -rf、git push --force)可以强制要求二次确认Persona 系统支持多套人格切换——工作模式 / 学习模式 / 创作模式可以是完全不同的"语气",同一个 Agent 后端,不同的"脸"
个人开发者:想要一个真正属于自己的本地 AI 助手,不想被云厂商绑定、不想每月交订阅费
研究/写作党:需要 Agent 长期跟进一个项目,跨周、跨月积累资料,最后帮你整理成稿
AI 重度用户:已经用腻了 ChatGPT 这种"失忆型"对话,想要连续感、想要 Agent 真的认识你
本地派:担心隐私、希望所有对话记录都留在自己硬盘上的人
多模型折腾党:喜欢同时跑几个不同模型对比效果,Hermes Agent 的"模型无关"架构正好对胃口
仓库:https://github.com/NousResearch/hermes-agent
文档:https://hermes-agent.nousresearch.com/
模型:https://huggingface.co/NousResearch
Discord:https://discord.gg/qTc3tAcJMd
如果你只是想要一个"问个问题"的聊天框,那 ChatGPT / Claude 网页版就够了;如果你想要一个会记住你、会陪你把一件事做完、不会每隔两分钟就清空上下文的伙伴,Hermes Agent 是 2026 年值得认真试一下的选择。
它不是银弹——长任务依然会出错、工具调用依然有边界、本地模型依然比云端弱——但它的产品哲学(把 Agent 当成"长期角色"而不是"临时工具")在当下的工具栈里确实少见。对于愿意花一个下午配置、然后用半年的用户来说,性价比很高。
链接
持久人格(Persistent Persona):你可以定义 Agent 的语气、价值观、长期目标,甚至给它起名字、写背景故事。它不会随着会话结束而失忆,下一次打开时还会以同样的"角色"跟你说话。
技能与工具(Skills & Tools):通过声明式 YAML/JSON 把工具接进来,Agent 可以调用浏览器、读写文件、执行 shell、查询数据库;所有调用都走沙箱日志,可以回看。
长期记忆(Long-term Memory):内置向量 + 摘要双层记忆,关键事实会自动沉淀,对话里随时召回,避免"我跟你说过的你怎么又忘了"。
自我反思(Self-reflection):Agent 在完成任务后会生成"经验条目"存入记忆,下一次类似任务会优先复用,相当于给它装了一个会复盘的"工作脑"。
个人助理:管日程、起草邮件、整理笔记、汇总网页,做那种"碎但杂"的事
研究搭档:给它一个主题,它会主动搜索 → 阅读 → 摘要 → 产出报告,整个过程不需要你每一步都点确认
代码副驾驶:长任务拆解(设计 → 实现 → 跑测试 → 提 PR)一条龙,特别适合"周末想搞个小项目但懒得从头撸"的状态
桌面自动化:接管浏览器、文件、本地脚本,做"跨应用操作",比如"把下载文件夹里的 PDF 按主题分类重命名"
多 Agent 协作:内置的角色化机制支持多个 Hermes Agent 互相对话,比如"架构师 + 评审员"组合,让一个 Agent 写代码、另一个挑毛病
记忆层是显式可编辑的(你可以打开它的"记忆文件"手动增删),不会出现"AI 莫名其妙记住了某事"的失控感,也不会出现"我说过了你怎么又问"的失忆感
工具调用走显式审批 + 日志回放,每一动作都有据可查,敏感操作(比如
rm -rf、git push --force)可以强制要求二次确认Persona 系统支持多套人格切换——工作模式 / 学习模式 / 创作模式可以是完全不同的"语气",同一个 Agent 后端,不同的"脸"
个人开发者:想要一个真正属于自己的本地 AI 助手,不想被云厂商绑定、不想每月交订阅费
研究/写作党:需要 Agent 长期跟进一个项目,跨周、跨月积累资料,最后帮你整理成稿
AI 重度用户:已经用腻了 ChatGPT 这种"失忆型"对话,想要连续感、想要 Agent 真的认识你
本地派:担心隐私、希望所有对话记录都留在自己硬盘上的人
多模型折腾党:喜欢同时跑几个不同模型对比效果,Hermes Agent 的"模型无关"架构正好对胃口
仓库:https://github.com/NousResearch/hermes-agent
文档:https://hermes-agent.nousresearch.com/
模型:https://huggingface.co/NousResearch
Discord:https://discord.gg/qTc3tAcJMd
Hermes 来自希腊神话,是众神的信使——把信息从一处带到另一处,不加滤镜、不打折扣。这个项目想做的,就是你和一个 AI 之间的"信使",干净、稳定、有自己的记忆。
默认评论
Halo系统提供的评论