跳到主要内容

N8N × LangChain × Google Gemini 个人知识库自动化系统

在 AI 应用快速发展的今天,如何将个人或企业内部知识快速转化为可对话的智能知识库,是构建私有大模型应用的重要一步。
本工作流利用 N8N + LangChain + Google Gemini 构建了一个完整的「个人知识库自动化系统」,通过简洁的表单上传文件,即可实现数据向量化存储与智能问答。


一、系统概述

该工作流名为 《个人知识库》,是一个面向个人和团队知识管理的智能化自动问答系统。
用户可直接在网页端上传文件(支持 .pdf.csv.txt),系统会自动完成以下任务:

  1. 加载并解析文档内容
  2. 通过 Google Gemini 生成语义向量嵌入
  3. 将向量化数据存入内存数据库
  4. 通过聊天接口实现智能问答

整个过程无需人工干预,支持直接调用 LangChain 节点 实现「文档理解 → 问答响应」的闭环。


二、工作流结构

工作流核心由三个阶段组成:数据加载、向量存储、知识检索与问答。

1️⃣ 数据加载

  • 触发节点:Form Trigger(Upload your file here
    提供上传表单,支持 .pdf.csv.txt 文件类型。
  • 加载节点:Default Data Loader
    将上传文件转为可处理的二进制格式,交由后续节点进行处理。

2️⃣ 向量存储

  • 向量节点:Insert Data to Store
    使用 LangChain 的 In-Memory Vector Store,将数据嵌入并保存到内存中。
  • 嵌入模型:Embeddings Google Gemini
    通过 Google Gemini(PaLM API)将文档转化为语义向量。

3️⃣ 智能问答

  • 聊天触发节点:When Chat Message Received
    监听聊天输入事件,实现对话式查询。
  • 查询节点:Query Data Tool
    从向量库中检索与问题最相关的内容。
  • 语言模型节点:Google Gemini Chat Model
    调用 Gemini 大语言模型生成自然语言答案。
  • AI Agent:综合检索结果与上下文,生成最终回答。

三、主要功能

  • 📄 多格式文件上传:支持 PDF、CSV、TXT
  • 🔍 自动语义索引:使用 Google Gemini 生成向量嵌入
  • 💬 智能问答:基于文档内容进行上下文感知回答
  • ⚙️ 端到端自动化:N8N 工作流全自动运行
  • 🧠 无数据库依赖:使用内存向量库,轻量高效
  • ☁️ LangChain 集成:可扩展到 Pinecone、Weaviate 等向量数据库

四、适用场景

  • 📚 个人笔记与知识归档
  • 🏢 企业内部知识库构建
  • 💬 私有 ChatGPT 知识增强系统
  • 🧩 RAG(检索增强生成)应用原型

五、技术栈与集成

模块功能说明
n8n Form Trigger文件上传入口用户通过表单上传知识文件
LangChain Document Loader文档解析将文件转为可嵌入格式
Google Gemini Embedding向量化模型提取语义特征向量
VectorStore InMemory向量存储存储语义嵌入用于检索
AI Agent + Gemini Chat智能问答生成自然语言回答
Chat Trigger会话入口实现实时对话式查询

六、系统截图

数据加载与知识检索流程示意:

下载地址:个人知识库.json


七、总结

这套基于 N8N + LangChain + Google Gemini 的知识库系统,
实现了从文件上传到智能问答的全流程自动化,
让个人或企业无需编写代码即可搭建私有知识问答机器人。

无论是用于构建 AI 学习助手,还是内部知识管理工具,
该方案都具备良好的扩展性与落地价值。