MiroFish 是什么?一个把“文档资料”变成“可推演社会”的 AI 群体智能引擎
- AI 工具拆解
- 2026-03-08
- 73热度
- 0评论
MiroFish 是什么?一个把“文档资料”变成“可推演社会”的 AI 群体智能引擎
项目卡片
-
项目:MiroFish -
仓库:https://github.com/666ghj/MiroFish[1] -
一句话:把现实资料转成知识图谱,再驱动多智能体社交模拟与报告生成的群体智能推演系统。

大多数 AI 文档工具解决的,都是“这份材料写了什么”。
MiroFish 想解决的是另一类问题:如果这些人、关系、事件和观点真的一起开始运转,接下来会发生什么?
它不是普通问答工具,也不是简单的“上传文档生成报告”。更准确地说,它是一个把现实材料先变成结构化世界,再让这个世界跑起来的群体智能推演系统。
如果你最近在看 AI Agent、GraphRAG、数字社会模拟这类项目,MiroFish 值得认真看一眼。因为它做的不是“让模型多说一点”,而是尝试把静态资料推进到动态推演。

从现实材料到图谱、角色和社会模拟,这是 MiroFish 最核心的转换。
它不是在“回答问题”,而是在“运行一个世界”
第一次看 MiroFish,很容易把它误判成“又一个 AI 分析工具”。
但顺着它的流程往下看,你会发现它实际做了三层事情:
-
先把现实资料转成结构化知识 -
再用这些知识搭建一个可运行的模拟世界 -
最后围绕模拟结果继续追问、访谈和验证
所以它的核心定位,不是普通 RAG,也不是静态总结,而是一个面向复杂议题的群体智能推演引擎。
它试图回答的问题也更“动态”:
-
一个社会议题会怎样扩散 -
不同角色会如何影响彼此态度 -
某种事件进入信息环境后,会引发什么连锁反应 -
为什么某个结论会形成,而不是只看到结果本身
如果用更技术一点的语言概括,MiroFish 大致可以理解成:GraphRAG + 多智能体社会模拟 + 自动报告 + 报告后的追问系统。
它到底解决什么问题?
复杂议题分析里,最难的从来不是“材料不够多”,而是“动态关系看不出来”。
你可能有一堆 PDF、访谈、事件记录、研究报告,也能靠大模型快速做摘要。但真正关键的问题往往是这些:
-
谁在影响谁 -
哪条信息最先扩散 -
哪些角色会放大冲突,哪些角色会缓和冲突 -
某个结论到底是偶然出现,还是结构性结果
传统做法通常只有两种。
一种是人工读材料、理关系、画图,再写结论。这样做扎实,但很慢,也非常依赖分析者个人经验。
另一种是直接把材料扔给模型做总结。这样更快,但很容易停留在“语言像分析,机制没跑起来”的层面。
MiroFish 想补上的,就是中间这一层:
把非结构化材料,变成一个真的能跑起来的世界。
这个思路很关键。因为很多现实问题,本来就不是一句话能解释清楚的,而是要看角色、传播、反馈和时间演化是怎么叠在一起发生的。
它的核心流程,其实很清楚
从仓库前后端设计看,MiroFish 并不是一个“概念堆叠型项目”。它的链路其实很清晰,基本可以拆成 5 步。

MiroFish 的完整工作链路:本体生成、图谱构建、环境搭建、群体模拟、报告生成,再到继续互动。
第一步:生成本体,先定义“这个世界里到底有什么”
系统不会一开始就直接模拟,而是先生成本体。
这一步做的事情,可以理解成“先搭世界骨架”:
-
有哪些关键实体 -
这些实体分别属于什么类型 -
它们之间可能存在哪些关系 -
每一类对象拥有哪些属性
为什么这一步重要?
因为如果连“人、组织、事件、议题、关系”这些基础结构都没有先定义清楚,后面的图谱和模拟就会建立在模糊文本上,最后很容易变成看起来很复杂,实际上不可解释。
MiroFish 的做法,是先让模型根据材料和模拟需求,把这套结构草图生成出来。这样后面所有步骤,都会围绕同一个世界观继续往下搭。
第二步:构建 GraphRAG,把材料变成图谱和记忆系统
有了本体之后,系统会继续构建知识图谱。
从仓库说明和配置来看,这一步不是只做普通向量检索,而是会调用 Zep 来抽取实体和关系,形成图谱、时序记忆和社区摘要。
这意味着它依赖的,不只是“文本相似度”,而是一个更接近真实关系结构的知识底座。
对非技术读者来说,可以把它理解成:
系统先把一堆资料整理成一张可以查询、连接、回溯的世界关系图。
这样,后面的模拟角色就不只是“读过这份材料”,而是“活在一个有关系链、有上下文、有历史记忆的世界里”。
第三步:创建模拟环境,把角色放进平台里
图谱建好后,MiroFish 会继续创建模拟环境。
从前端组件和交互设计来看,它默认会创建至少两个信息空间,比如:
-
Info Plaza -
Topic Community
你可以把它们理解成两种不同风格的社交平台环境。
更关键的是,角色在里面不是只会“回答问题”,而是会执行一整套行为动作,比如:
-
发帖 -
点赞 -
转发 -
评论 -
引用 -
搜索 -
查看趋势 -
关注 -
静默
这就是 MiroFish 和很多“多 Agent 对话 Demo”的分水岭。
它不是让几个智能体坐在一起聊天,而是在试图模拟一个更接近真实社交平台的信息流世界。

角色不是简单对话,而是在平台环境中进行发帖、评论、转发、搜索等动作。
第四步:运行群体模拟,让信息自己流动起来
进入这一步后,项目真正开始有意思。
系统会让不同角色在不同轮次里持续行动,并把整个过程记录下来。你看到的不是一个最终结论,而是一条逐步展开的时间线。
这会带来一个非常重要的能力:过程可见。
你不只是知道“最后发生了什么”,还可以回头看:
-
是在哪一轮开始发酵的 -
哪个角色率先放大了传播 -
哪个平台更容易形成共识或冲突 -
某种态度变化是突然出现,还是在多轮互动里慢慢累积出来的
这类能力对复杂议题分析非常重要。因为只看结论,很多时候很难建立信任;但如果过程能被看到、能被回溯,解释力就完全不一样了。

时间轴和行为轨迹是 MiroFish 的关键价值:你能看到结果是怎么一步步长出来的。
第五步:生成报告,但报告不是终点
很多系统做到报告生成就结束了,MiroFish 没停在这里。
它会在模拟结束后生成结果报告,而且这个过程不是一次性整块吐出,而是按章节规划、分段生成,带有明显的 Agent 工作流特征。
更关键的是,报告出来之后,你还能继续做三件事:
-
和 Report Agent 对话 -
和模拟世界中的个体对话 -
向世界中的角色发起问卷调查
这意味着报告不是终点,而更像一个入口。
你可以继续追问:
-
这个结论为什么成立 -
某类角色为什么会做出这种反应 -
哪个节点是关键传播拐点 -
如果换一个前提,结果会不会改变
这让 MiroFish 更像一个“研究工作台”,而不是一个“一次性输出器”。

报告不是句号,后面还能继续追问、访谈和发调查。
最短上手闭环:先别追求大而全,先跑通一次
如果你真准备试 MiroFish,最好的方式不是先把概念全搞懂,而是先跑通一个最小闭环。
建议按这 4 步来:
1. 准备一个聚焦的小主题
不要第一次就塞进特别分散的大量材料。
更好的方式,是先选一个你自己熟悉、角色清晰、关系明确的话题。这样你更容易判断:生成的本体对不对,模拟出来的结构像不像样。
2. 配好基础环境
从仓库配置看,最基础的依赖包括:
-
Node.js 18+ -
Python 3.11+ -
一个兼容 OpenAI SDK 的模型接口 -
Zep API Key
前端是 Vue + Vite,后端是 Flask。也就是说,工程本身不算神秘,真正的门槛不在框架,而在你怎么设计输入。
3. 优先走 Docker 路线
如果你不是为了改源码,而是想先看效果,优先走 Docker 会更省事。
最小动作就是:
-
配好 .env -
启动容器 -
打开前端 -
上传材料 -
跑一轮小规模模拟
先把“通路”打通,比一开始就研究所有细节更有价值。
4. 第一次一定要小规模试跑
这一点特别重要。
别一上来就大轮次、大材料、大场景。先用少量材料、少轮次去验证这几件事:
-
本体是否合理 -
图谱是否成形 -
角色设定是否像样 -
信息传播是否真的“跑起来了”
这会直接决定你后面要不要继续加大规模。
一句话建议:先验证结构,再放大规模。
它适合什么人,不适合什么人?
MiroFish 不是一个泛用 AI 工具,它非常吃使用场景。
适合你,如果你关注这些问题
-
你想研究复杂议题的传播和演化 -
你对多智能体模拟、数字社会建模、计算社会科学感兴趣 -
你想把“看文档”升级成“做动态推演” -
你需要一个比较完整的 GraphRAG + Agent + Simulation 学习样本 -
你想向团队或客户展示“从知识组织走向群体推演”的完整链路
不太适合你,如果你只是想做这些事
-
上传文档然后问两个问题 -
想要零配置、零概念、立刻秒回 -
只关心最终一句答案,不关心中间过程 -
想做严格数值预测,而不是结构推演
说得更直接一点:
如果你要的是“AI 帮我读材料”,它可能太重。
如果你要的是“AI 帮我搭一个能推演的世界”,它就非常值得看。
这个项目最强的地方,不是功能多,而是链路完整
现在很多 Agent 项目都喜欢堆概念,但真正能把一条完整流程串起来的,其实不多。
MiroFish 比较难得的地方,是它把这些环节真正接到了一起:
-
文档输入 -
本体生成 -
GraphRAG 图谱构建 -
多平台多角色模拟 -
报告生成 -
报告后的继续追问与调查
这意味着它不是一个局部能力 Demo,而更像一个完整的分析闭环。
如果要总结它最值得看的几个点,我会归成四条:
1. 目标很清楚
它不是泛泛做“AI 万能平台”,而是明确在做复杂系统推演。
2. 过程可见
图谱、轮次、行为、章节生成,这些中间状态都尽量被展示出来,解释力比很多黑箱式输出系统强得多。
3. 报告之后还有追问能力
很多同类项目停在报告生成,MiroFish 还把后续访谈、追问、调查做进去了,这一点很有辨识度。
4. 技术组合有内在逻辑
它不是随便把几个流行词拼在一起,而是真的让知识图谱、记忆系统、社交模拟、报告代理和交互接口围绕同一个目标协同工作。
当然,它也有很清楚的短板
这类项目不能神化。MiroFish 的边界也很明显。
成本不低
多阶段调用 LLM,再叠加图谱、模拟和报告,整体成本不会轻。轮次一高,消耗会更明显。
高度依赖输入质量
输入越乱、噪音越多、主题越散,后面生成出来的世界越容易失真。
模拟不等于现实
它更适合帮你理解结构、路径和可能性,而不是直接替你下现实判断。
对新手有理解门槛
本体、图谱、角色、环境、模拟、报告,这一套概念对第一次接触的人并不轻。但好在它已经尽量把流程可视化了,上手比想象中容易。
最后一条判断标准:你是想“总结材料”,还是想“推演现实”?
如果你只想要一个 AI 帮你读文档、做总结,MiroFish 可能太重。
但如果你在意的是下面这些问题:
-
信息关系怎么组织 -
角色互动怎么改变结果 -
传播链条是如何形成的 -
结论能不能被回溯、被解释、被继续验证
那它就不是一个普通项目,而是一个很值得认真跑一遍的方向。
因为它真正试图完成的,不是“把材料讲明白”,而是:
把一个复杂现实,变成一个可运行、可观察、可追问的世界。
这也是 MiroFish 最有意思的地方。
如果这篇对你有用,建议点个关注。我会持续把 GitHub 上值得用的 AI 工具拆成「最短上手闭环 + 坑点清单 + 可复用配置」,让你少走弯路。
关注微信公众号
想第一时间看到后续的工具拆解与实战更新,欢迎扫码关注公众号。

引用链接
[1]https://github.com/666ghj/MiroFish