🚀 EDGE AI OS 系统架构图 v3.0

7层分层架构 · 智能认知闭环(记忆·学习·决策) · Agent与设备融合 · 云边协同

👥 开发者生态层 Developer Ecosystem
🏪 Agents生态
承载大量解决方案和场景应用Agents,通过XCommander平台快速创建和部署
Agent模板库(销售、项目、知识等)
一句话生成Agent
场景应用模板
社区共享机制
🔧 开放平台
提供SDK、API、文档、开发工具,以及开发者认证和培训服务
SDK & API
开发文档
开发工具链
认证培训体系
💬 开发者社区
开发者交流开发经验、开发需求、反馈OS问题,发布活动和公告
经验交流
需求反馈
活动公告
☁️ 云端服务层 Cloud Services
🧠 模型管理 (XCNN Cloud)
AI模型的全生命周期管理
模型版本管理
模型更新分发
性能监控
📚 知识库管理 (XLoop Cloud)
知识库的创建、编辑和分发管理
知识库编辑
版本控制
云端同步
🤖 Agent管理 (XCommander)
开箱即用的AI Agent快速搭建平台
Agent模板库
一句话生成Agent
可视化工作流编排
Agent商店与版本管理
📡 设备管理中心 (TMS 3.0)
EdgeAIOS统一设备管理平台,实现Agent与设备深度融合
AI设备注册与激活
实时监控与告警
Agent应用分发(AI APP Store)
OTA固件升级
远程运维与调试
云边协同层 Cloud-Edge Collaboration
🔗 连接管理
设备连接、心跳保活、断线重连
MQTT连接
心跳保活
断线重连
🔐 通信协议
安全通信和消息传输机制
加密传输
消息队列
流量控制
🔄 数据同步
模型、知识库、配置的云边同步
模型同步
知识库同步
配置与状态同步
🧠 边端Agent核心层 Edge Agent Core Layer
🌟 Agent 核心引擎 Agent Core Engine
记忆模块 (Time Axis)
Agent核心记忆系统,承载短期和长期记忆
短期与长期记忆
交互历史记录
时间轴检索
记忆演化
🎯 Agent自规划引擎
基于记忆和知识库的自主规划与决策能力
从时间轴记忆中提取经验
结合知识库进行推理决策
实现自主规划和任务分解
持续学习与目标优化
📖 知识库系统 (XLoop Edge)
Agent的知识存储与管理中心
本地知识存储
知识检索引擎
自学习机制
加密保护
云端同步
🤖 Agent库 (Xcommander Edge)
本地Agent的安装、升级和管理
Agent安装
Agent升级
Agent管理
Agent模板同步
📡 设备管理 Edge
边缘端设备接入、通信与智能管理
多协议设备接入
设备认证与会话
消息总线
规则引擎与告警
🔗 智能认知闭环 Cognitive Loop
🧠
记忆模块
时间轴记忆
存储交互历史
提取经验数据
📚
知识库系统
沉淀结构化知识
支持检索推理
云端同步
🎯
Agent自规划
自主决策优化
任务分解执行
持续学习进化
🔄
三位一体·持续演化·自主智能
🎭 多模态能力 Multimodal Capabilities
👂
听 ASR
语音识别
实时转文字
💬
说 TTS
语音合成
文字转语音
👁️
看 CV
视觉识别
图像理解
📡
感知 Sensor
传感器感知
流数据分析
🖥️
显示 Display
内容呈现
可视化展示
⚙️
执行 Execute
指令执行
动作控制
模型运行时与调度层 Model Runtime & Scheduling Layer
⚡ XCNN核心引擎 XCNN Core Engine
🤖 大模型推理
7B+参数大语言模型推理
Qwen2.5-7B
Ollama API
APU/DLA加速
流式输出
小模型推理
轻量级CV模型高性能推理
YOLO目标检测
图像分类
NPU加速
实时推理
🔧 第三方推理引擎 Third-party Engines
🔬 Ascend CANN
华为昇腾AI计算框架
⚙️ MNN
阿里通用推理框架
📱 MTK GAI Toolkit
联发科生成式AI工具包
🔷 ONNX Runtime
跨平台推理引擎
🚀 MTK Neuropilot
联发科AI推理SDK
⚙️ 调度执行系统 Scheduling & Execution
🎯 智能调度器 (Michael) 算力调度
智能任务调度与触发,算力优化分配
资源感知与负载均衡
优先级管理与依赖处理
多模型协同与功耗优化
多种触发机制(定时/事件/条件)
智能调度策略与预测性调度
▶️ 执行器 (Uriel) 应用执行
任务执行和应用控制,指令转化与结果反馈
任务接收与前置检查
应用控制与指令转化
执行处理与结果收集
状态跟踪与进度反馈
异常处理与重试机制
💾 数据存储层 Data Storage Layer
🔍 向量数据库 (RAG)
支持语义检索的向量数据库
向量存储
语义检索
RAG支持
📈 时序数据库
存储时间序列数据和历史记录
时序数据存储
历史记录
趋势分析
📊 本地数据库 (SQLite)
边缘端结构化数据存储
设备配置信息
Agent本地数据
关系型存储
🔐 数据管理
数据安全和优化管理
数据加密
数据备份
数据清理
数据持久化
🔧 硬件设备层 Hardware Device Layer
⚡ 硬件加速器 Hardware Accelerators
🧮 NPU/APU/MDLA
神经网络处理单元
INT8量化加速
FP16混合精度
低功耗高性能
DLA格式优化
🎮 GPU
图形处理单元
OpenCL加速
OpenGL支持
大模型fallback
FP32/FP16计算
💻 CPU
中央处理单元
XNNPACK优化
通用计算支持
灵活性最高
📦 AI BOX
边缘AI计算盒子
AI BOX Lite
AI BOX Pro
AI BOX Ultra
📱 AI Mount
挂在墙上的智能屏幕
壁挂式智能显示
触控交互
可视化展示
👓 AI Glasses
可穿戴智能眼镜
AR显示
视觉识别
实时信息叠加
🤖 AI Control
智能控制系统
机器人控制
设备控制
指令执行
📖 架构说明 Architecture Description
🎯 整体架构
EDGE AI OS采用7层分层架构设计:开发者生态层、云端服务层、云边协同层、边端Agent核心层、模型运行时与调度层、数据存储层、硬件设备层。各层职责清晰,松耦合设计,实现Agent与设备深度融合。
👥 开发者生态层
Agents生态:提供Agent模板库和一句话生成功能,零代码快速创建AI应用。开放平台:提供SDK、API和开发工具链。开发者社区:促进经验交流和Agent共享。
☁️ 云端服务层
XCNN Cloud:AI模型全生命周期管理。XLoop Cloud:知识库编辑和云端同步。XCommander:AI Agent快速搭建平台,支持模板库、工作流编排和Agent商店。TMS 3.0:统一设备管理平台,实现AI设备注册、监控、应用分发、OTA升级和远程运维。
⇄ 云边协同层
通过MQTT等协议实现云端与边端实时连接,支持模型同步、知识库同步、配置下发和状态上报,确保边缘设备最新状态,同时支持离线运行。
🧠 边端Agent核心层 - 智能认知闭环
核心亮点:通过记忆模块(时间轴)知识库系统Agent自规划三位一体,形成完整的"记忆-学习-决策"智能闭环。记忆模块存储交互历史,知识库沉淀结构化知识,自规划引擎基于记忆和知识进行自主决策与优化,让AI设备具备真正的自主智能和持续进化能力。设备管理Edge:统一管理设备接入、消息总线和规则引擎。多模态能力:提供听、说、看、感知、显示、执行六大能力,构建完整的感知-认知-决策-执行体系。
⚡ 模型运行时与调度层
XCNN推理引擎:支持大小模型推理,集成Ascend CANN、MNN、ONNX等第三方引擎,支持NPU/GPU/CPU异构加速。Michael调度器:智能算力调度、多种触发机制(定时/事件/条件)、负载均衡与预测性调度。Uriel执行器:任务执行、应用控制、状态跟踪与异常处理。
💾 数据存储层
采用边缘端轻量化数据库组合:向量数据库支持RAG语义检索,时序数据库存储设备历史数据,SQLite提供本地结构化存储,配合加密、备份功能保障数据安全。
🔧 硬件设备层
支持NPU/APU/MDLA神经网络加速器、GPU图形处理和CPU通用计算。硬件产品包括AI BOX(Lite/Pro/Ultra)、AI Mount壁挂屏、AI Glasses智能眼镜和AI Control控制系统。
✨ 技术亮点 Key Features
🧠 智能认知闭环 - 三角循环体系
核心创新:通过记忆模块(时间轴)知识库系统Agent自规划三位一体设计,构建三角循环闭环体系。记忆模块提供时间维度的认知基础,知识库实现经验沉淀与知识推理,自规划引擎基于记忆和知识进行自主决策。三者相互支撑、循环强化,实现从"被动响应"到"主动学习"的技术跨越,让边缘AI设备真正具备自主智能和持续进化能力。
🚀 推理性能优化
量化加速:INT8量化将YOLOv5推理速度从40ms优化至15ms或4ms。DLA格式:大模型转换为DLA格式优化加载和功耗。异构调度:自动选择NPU/GPU/CPU最优硬件加速器。
🤝 Agent与设备融合
将Agent智能与IoT设备管理深度融合,边缘端集成设备接入、消息总线和规则引擎,实现智能设备的自主感知、决策和执行,构建完整的边缘智能体系。
☁️ 云边协同机制
支持模型、知识库和配置的实时同步,确保边缘设备获取最新能力。同时支持离线运行,边缘端可独立完成推理、决策和执行,保障系统稳定性和响应速度。