用户可用于AI算法开发、边缘端高性能部署及音视频编解码实战。项目覆盖YOLO全系列模型在RK3588、Intel、NVIDIA等硬件的部署，提供工业巡检等多场景解决方案，实现硬加速与零拷贝技术优化。

文件	最后提交记录	最后更新时间
11	add 11 13	8 个月前
13	add 11 13	8 个月前
RK3588	upload: 上传文件 Signed-off-by: qq_42910179 <qq_42910179@noreply.gitcode.com>	2 个月前
openvino	add openvino	5 个月前
LICENSE	Initial commit	8 个月前
README.md	update: 更新文件 README.md Signed-off-by: qq_42910179 <qq_42910179@noreply.gitcode.com>	5 个月前
sam_label.py	upload: 上传文件手把手教你用 SAM 打造自己的半自动化数据标注工具（支持 VOC 格式导出） Signed-off-by: qq_42910179 <qq_42910179@noreply.gitcode.com>	7 个月前
yolov13n.rknn	upload: 上传文件 Signed-off-by: qq_42910179 <qq_42910179@noreply.gitcode.com>	7 个月前

lxmyzzs: 图像算法与边缘部署实战库

Platform YOLO Codec ZeroCopy RealTime

📖 项目介绍

欢迎来到 lxmyzzs 的代码仓库！

lxmyzzs 是一个专注于AI算法开发、边缘端高性能部署、以及底层音视频编解码的综合性实战项目。我们不只关注模型精度，更关注模型在 RK3588、Intel、NVIDIA 等硬件上的运行效率与业务闭环。

🚀 第一部分：边缘端部署 (Edge AI)

针对 RK3588 (NPU)、Intel (OpenVINO) 和 NVIDIA Jetson (TensorRT) 的高性能部署方案。

1. 瑞芯微 RK3588 NPU 部署

全面覆盖：从经典的 YOLO 系列到最新的端侧大模型 (LLM/VLM)，均已打通 NPU 加速。

👁️ 计算机视觉 (CV) - 基于 RKNN

代码路径	功能描述	支持模型/算法	对应教程
`yolo11_rk3588/yolo.py`	通用目标检测	YOLOv13 / v12 / v11 / v8 / YOLO-World	B站教程
`yolo11_rk3588`	多/单目标跟踪	ByteTrack / NanoTrack (轻量级)	B站教程
`yolov8_rk3588`	姿态估计	YOLOv8-Pose / YOLO11-Pose	B站教程
`mobilesam_rk3588`	万物分割 (SAM)	MobileSAM (轻量化 SAM)	B站教程
`ocr_rk3588`	OCR 文字识别	PP-OCR (检测+识别串联)	B站教程
`clip_rk3588`	图文匹配/检索	CLIP (OpenAI)	B站教程
`Zipformer_rk3588`	语音识别	Zipformer	B站教程

🧠 端侧大模型 (LLM/VLM) - 基于 RKLLM

代码路径	功能描述	支持模型	对应教程
`llm_rk3588`	多模态大模型	Qwen3-VL / DeepSeek-R1-Distill-Qwen-1.5B	B站教程

2. Intel OpenVINO 加速 (CPU)

🔥 核心教程：YOLO11推理速度飙升400%！OpenVINO INT8 量化全攻略
特点：无需显卡，仅靠 CPU 实现高帧率部署。

3. NVIDIA Jetson 部署 (GPU)

🔥 核心教程：Jetson 部署必看：YOLOv8/v10/v11/v12 毫秒级推理全指南
特点：TensorRT 硬件级加速，支持 FP16/INT8。

⚔️ 第二部分：图像算法之打怪升级 (全场景实战)

本系列聚焦 YOLO全系列 (v8/v10/v11/v12) + OpenCV，提供从数据准备、模型训练到可视化的完整解决方案。

🏭 1. 行业应用场景 (附源码/UI)

包含环境搭建、数据准备、模型训练、PyQt5 可视化界面等完整落地流程。

应用领域	具体系统示例	核心能力与价值	配套教程
工业巡检	管道/PCB/太阳能板缺陷检测	自动识别多类缺陷，集成至机器人/无人机，提升效率	B站教程
智慧交通	车牌识别、路面坑洞、流量统计	支持实时检测与统计，适配监控/自动驾驶场景	B站教程
医疗/制药	脑肿瘤检测、药片识别	辅助诊断与质量控制 (仅供研究/合规使用)	B站教程
智慧农业	害虫/病害检测、作物生长监测	精准农业落地，减少人工，提升产量质量	B站教程
环保/海洋	水面垃圾、海面落水者/船只检测	助力生态保护与海防安全，实现主动监测	B站教程
人机交互	情绪识别、跌倒检测、安全帽/抽烟	适配养老院、工地场景，保障安全与交互体验	B站教程
办公物流	签名检测、行李精准检测	提升办公自动化与智慧交通物流效率	B站教程

💡 2. 核心技术攻关

多目标跟踪：基于 YOLO + ByteTrack 实现复杂场景下的稳定跟踪。
交互式跟踪：单目标点击跟踪系统 (Click-to-Track)，结合传统算法与深度学习。
精细化视觉：
- 姿态估计：支持 17/21 关键点定位（人体/手部）。
- 实例分割：实现像素级分割（如车辆部件拆解、路面裂缝提取）。

🛠️ 3. 基础工具与入门指南

为新手准备的“避坑”指南与效率工具：

数据标注：
- X-AnyLabeling：自动标注神器，支持多模型预标注。
- Labelme：从安装到格式转换的全流程避坑教程。
OpenCV-Python：图像处理、中文显示解决、性能优化及简单人脸识别。
YOLO 理论：详解 v8/v10/v11/v12 骨干网络设计与特征融合改进。

🛠️ 第三部分：音视频编解码与流媒体实战 (Multi-Media Pipeline)

技术核心：拒绝 FFmpeg 纯 CPU 软解！本项目实现了从“底层驱动调用”到“应用层推流”的全链路硬加速。

1. 跨平台硬件加速技术路线图

本仓库针对不同算力平台，深入底层 API 实现了高效的音视频处理流程：

技术维度	Rockchip RK3588	Intel (集显/核显)	NVIDIA (独显)
底层架构	MPP (Media Process Platform)	QSV (Quick Sync Video)	NVENC / NVDEC
图像加速	RGA (2D 图形加速器)	VPP (Video Post-Processing)	CUDA / Video SDK
核心链路	`MPP解码 -> RGA缩放 -> RKNN推理`	`QSV解码 -> VPP转换 -> OpenVINO推理`	`NVDEC解码 -> CUDA预处理 -> TensorRT推理`
关键特性	DMA-BUF 零拷贝技术，极低 CPU 占用	适合 x86 工业网关，极致性价比	毫秒级延迟，支持多路 4K 并发

2. 硬核技术链路：从 0 到 1 的实战演进

我们将音视频处理拆解为四个关键阶段，并提供底层 C++/Python 代码实现：

🟦 第一阶段：硬件解码与内存零拷贝

RKNN (MPP): 攻克 mpp_buffer 与 NPU 输入内存的地址映射，实现视频帧直通推理。
Intel (QSV): 基于 VAAPI 与 FFmpeg-QSV 插件，解决核显驱动下 MFX 库的初始化问题。
Nvidia (NVDEC): 实现显存内解码，避免数据在 Host(CPU) 与 Device(GPU) 之间反复拷贝。

🟨 第二阶段：硬件级图像预处理

格式转换: 硬件加速 YUV420P 转 RGB/BGR（AI 推理所需格式）。
尺寸缩放: 利用 RGA/VPP 替代 cv2.resize，将 CPU 从像素插值运算中解放。

🟩 第三阶段：硬件编码与封装

实时编码: 针对不同码率（CBR/VBR）优化，支持 H.264/H.265 硬编。
异步处理: 采用双缓冲区机制，确保编码效率不拖累 AI 推理帧率。

🟥 第四阶段：RTSP/RTMP 实时推流

流媒体转发: 基于 FFmpeg 封装硬编后的码流，对接 EasyDarwin 或 ZLMediaKit 等服务器。
低延迟优化: 调整 GOP 大小与缓存区配置，实测端到端延迟控制在 200ms 以内。

📚 深度实战笔记 (CSDN)

[🔥 RK3588 篇]：从 0 到 1 实现 MPP 硬件编码 + RTSP 推流完整笔记
[🔥 Intel 集显篇]：手撸代码实现 QSV 硬编推流与环境安装全流程
[🔥 Nvidia 独显篇]：NVENC 技术实战：视频保存与高性能推流指南

🛠️ 安装与使用

# 1. 克隆本项目 (GitCode 加速)
git clone [https://gitcode.com/qq_42910179/lxmyzzs.git](https://gitcode.com/qq_42910179/lxmyzzs.git)

🤝 联系与合作 (Contact)

如果您有 RK3588/Jetson/Intel 边缘部署、算法移植、高性能 C++ 优化 等商业需求，欢迎邮件联系。

💡 技术交流 / 源码获取	💼 商务合作 / 定制开发
面向人群：个人开发者、学生、技术爱好者内容： ✅ 获取本仓库进阶版源码 ✅ 环境搭建与报错咨询 ✅ 加入技术交流圈	面向人群：企业客户、集成商、课题组服务范围： 🛠️ 算法落地：YOLO/OCR/大模型 -> RK3588/Jetson ⚡ 性能优化：C++ 重构、多路视频流并发、掉电保护 🔌 软硬一体：工业/安防 AI 盒子交付
联系方式： 📧 邮箱：`xiaozhe2026@qq.com` 📝 邮件主题：`[技术交流] 咨询内容`	联系方式： 📧 邮箱：`xiaozhe2026@qq.com` 📝 邮件主题：`[商务合作] 公司名-具体需求` (例如：[商务合作] 某某科技-猪场监控算法定制)

项目介绍

Apache_License_v2.0 C 41提交数

定制我的领域

README

规则集

下载使用量

项目总下载次数（含Clone、Pull、 zip 包及 release 下载），每日凌晨更新

贡献者1

语言类型

C84.37%

Python8.8%

C++6.59%

CMake0.21%

Shell0.03%

图像算法与边缘部署实战库:基于 YOLO 与边缘硬件的图像算法部署项目