我们在以下三个 AI 技术方向上已完成实践验证,每个方向均有真实项目支撑。
我们基于大语言模型构建了通用智能体管理平台,具备 AI 对话、文档生成、知识库检索、工具调用等核心能力,已在工程文档智能化场景中完成验证。
支持火山方舟、通义千问、vLLM 本地推理等多种大模型接入,流式响应与思考过程可视化,历史对话管理与上下文记忆。
AI Agent 创建工作流,Function Calling 标准化工具调用(外部 API + 内部工具),工具注册与配置管理,自定义提示词编排。
多格式文档解析(PDF/DOCX/XLS/PPT/TXT),向量化存储与语义检索,知识条目分类管理,构建领域专属知识库。
基于模板的文档自动生成,占位符识别与内容替换,文档结构化解析与 AI 分析,格式保持与流式预览。
AI 定时任务调度与异步执行,任务日志与结果追踪,支持外网结果发布,适用于周期性自动化场景。
用户与角色权限管理,操作日志审计,系统配置管理,数据库备份与恢复,数据仪表盘。
实践场景:工程施工文档智能化(方案编制、规范检索、模板管理),共 24 个功能页面,已在实际项目中投入使用。
我们在目标检测与视觉分析方面积累了完整的实践经验,从 YOLO 模型训练部署到视觉大模型协同分析,形成了可复用的技术能力。
具备 YOLO 模型从数据标注、训练到部署的完整经验。支持实时视频流分析,可部署在边缘设备上运行,已在安全帽检测、入侵识别、烟火识别、混凝土病害检测等多个场景中完成验证。
利用多模态视觉大模型(千问视觉模型等)对 YOLO 检测结果进行二次校准与分析,包括真实性判断、特征描述与严重程度评估,有效降低误报率,形成“快速筛查 + 精准分析”的双层识别策略。
现场采集 → YOLO 检测 → 视觉大模型校准 → 人工确认 → 标准数据集积累 → 模型再训练 → 模型迭代升级。通过这一闭环流程,持续提升检测精度,逐步形成行业专属的视觉识别模型。
我们以 Unitree Go2 四足机器狗为硬件平台,完成了自主导航、远程监控与边缘 AI 推理等技术验证,积累了机器人管理与 Web 可视化的工程经验。
基于 ROS2 SLAM 算法实现环境建图,融合 2D 栅格地图与 3D 点云数据,支持巡航路径规划与自动避障。
GStreamer + WebSocket 实现低延迟视频流传输,浏览器端实时查看机器人第一视角画面,支持 WebRTC 扩展。
Three.js WebGL 三维地图渲染,实时展示机器人位姿与巡航轨迹,交互式巡航点设置与地图管理。
视觉报警 + TTS 语音播报 + 报警图片自动保存,支持 ROI 区域裁剪与冷却时间控制。
Jetson Orin 作为边缘计算节点,本地运行 AI 推理与 ROS2 节点,降低云端依赖与响应延迟。
周期性巡检任务调度,自动执行并生成执行记录,任务管理与统计看板。
以上技术方向共用同一套技术架构,在多个项目实践中反复打磨,形成了可复用的技术基础。
Tornado 异步 Web 框架,MySQL + Redis,异步非阻塞 IO,全链路异步支持高并发。
火山方舟、通义千问、vLLM 本地推理,Function Calling 工具系统,NDJSON 流式响应。
YOLO 目标检测,多模态大模型分析,向量化语义检索(scikit-learn + numpy)。
Jetson Orin 边缘计算,ROS2 SLAM 建图,GStreamer 视频流,Unitree Go2 四足机器人。
以上技术能力均已在真实场景中完成验证。后续将继续深化各方向的技术积累,同时探索将 AI 能力逐步融入公司传统 SaaS 产品线,推动技术从独立实践向产品化方向演进。