AI 技术能力与实践方向

AI 技术积累与
实践探索

我们在多个 AI 技术方向上进行了深入的实践探索,涵盖大模型智能体应用、计算机视觉与智能机器人等领域,已在真实场景中完成验证,持续积累从模型调用、数据训练到边缘部署的完整技术经验。

技术能力方向

我们在以下三个 AI 技术方向上已完成实践验证,每个方向均有真实项目支撑。

技术方向一

大模型智能体应用

我们基于大语言模型构建了通用智能体管理平台,具备 AI 对话、文档生成、知识库检索、工具调用等核心能力,已在工程文档智能化场景中完成验证。

💬

多模型对话接入

支持火山方舟、通义千问、vLLM 本地推理等多种大模型接入,流式响应与思考过程可视化,历史对话管理与上下文记忆。

🤖

Agent 与工具系统

AI Agent 创建工作流,Function Calling 标准化工具调用(外部 API + 内部工具),工具注册与配置管理,自定义提示词编排。

📚

知识库与 RAG 检索

多格式文档解析(PDF/DOCX/XLS/PPT/TXT),向量化存储与语义检索,知识条目分类管理,构建领域专属知识库。

📄

智能文档生成

基于模板的文档自动生成,占位符识别与内容替换,文档结构化解析与 AI 分析,格式保持与流式预览。

自动化任务调度

AI 定时任务调度与异步执行,任务日志与结果追踪,支持外网结果发布,适用于周期性自动化场景。

⚙️

平台化管理

用户与角色权限管理,操作日志审计,系统配置管理,数据库备份与恢复,数据仪表盘。

实践场景:工程施工文档智能化(方案编制、规范检索、模板管理),共 24 个功能页面,已在实际项目中投入使用。

技术方向二

计算机视觉

我们在目标检测与视觉分析方面积累了完整的实践经验,从 YOLO 模型训练部署到视觉大模型协同分析,形成了可复用的技术能力。

YOLO 目标检测

具备 YOLO 模型从数据标注、训练到部署的完整经验。支持实时视频流分析,可部署在边缘设备上运行,已在安全帽检测、入侵识别、烟火识别、混凝土病害检测等多个场景中完成验证。

模型训练 边缘部署 实时视频流 数据增强
🧠

视觉大模型协同

利用多模态视觉大模型(千问视觉模型等)对 YOLO 检测结果进行二次校准与分析,包括真实性判断、特征描述与严重程度评估,有效降低误报率,形成“快速筛查 + 精准分析”的双层识别策略。

误报过滤 病害评估 行为分析 报告生成

数据驱动的模型优化闭环

现场采集 → YOLO 检测 → 视觉大模型校准 → 人工确认 → 标准数据集积累 → 模型再训练 → 模型迭代升级。通过这一闭环流程,持续提升检测精度,逐步形成行业专属的视觉识别模型。

安全合规检测 结构病害识别 入侵与烟火报警 违规行为分析
技术方向三

智能机器人

我们以 Unitree Go2 四足机器狗为硬件平台,完成了自主导航、远程监控与边缘 AI 推理等技术验证,积累了机器人管理与 Web 可视化的工程经验。

🗺️

自主建图与导航

基于 ROS2 SLAM 算法实现环境建图,融合 2D 栅格地图与 3D 点云数据,支持巡航路径规划与自动避障。

📹

低延迟视频监控

GStreamer + WebSocket 实现低延迟视频流传输,浏览器端实时查看机器人第一视角画面,支持 WebRTC 扩展。

🌐

3D 可视化管控

Three.js WebGL 三维地图渲染,实时展示机器人位姿与巡航轨迹,交互式巡航点设置与地图管理。

🔔

多模态报警联动

视觉报警 + TTS 语音播报 + 报警图片自动保存,支持 ROI 区域裁剪与冷却时间控制。

🖥️

边缘计算部署

Jetson Orin 作为边缘计算节点,本地运行 AI 推理与 ROS2 节点,降低云端依赖与响应延迟。

📋

任务调度与管理

周期性巡检任务调度,自动执行并生成执行记录,任务管理与统计看板。

ROS2 SLAM Three.js 3D 渲染 Jetson Orin Unitree Go2 GStreamer 视频流

共享技术底座

以上技术方向共用同一套技术架构,在多个项目实践中反复打磨,形成了可复用的技术基础。

🐍

后端框架

Tornado 异步 Web 框架,MySQL + Redis,异步非阻塞 IO,全链路异步支持高并发。

🧠

AI 服务

火山方舟、通义千问、vLLM 本地推理,Function Calling 工具系统,NDJSON 流式响应。

📊

计算机视觉

YOLO 目标检测,多模态大模型分析,向量化语义检索(scikit-learn + numpy)。

⚙️

边缘与硬件

Jetson Orin 边缘计算,ROS2 SLAM 建图,GStreamer 视频流,Unitree Go2 四足机器人。

后续探索方向

以上技术能力均已在真实场景中完成验证。后续将继续深化各方向的技术积累,同时探索将 AI 能力逐步融入公司传统 SaaS 产品线,推动技术从独立实践向产品化方向演进。

开源项目 · v0.1.0 Alpha · 持续开发中

YuntaoCode - Local-First AI Task Runtime

本地优先的 AI 任务执行基座,关注 Task、Plan、Step、Trace、Recovery 与 Audit,让本地任务可以被计划、执行、验证、恢复和审计。基于 Tauri + Python Tornado 架构,Apache 2.0 协议开源,欢迎开发者参与讨论与贡献。

 
 
QQ在线客服
QQ在线咨询
售前咨询热线
13501037871
售后咨询热线
13898820396
招商加盟热线
13842021078