47b43e9f创建于 2025年12月20日历史提交

lxmyzzs: 图像算法与边缘部署实战库

Platform YOLO Codec ZeroCopy RealTime

📖 项目介绍

欢迎来到 lxmyzzs 的代码仓库！

lxmyzzs 是一个专注于AI算法开发、边缘端高性能部署、以及底层音视频编解码的综合性实战项目。我们不只关注模型精度，更关注模型在 RK3588、Intel、NVIDIA 等硬件上的运行效率与业务闭环。

针对 RK3588 (NPU)、Intel (OpenVINO) 和 NVIDIA Jetson (TensorRT) 的高性能部署方案。

全面覆盖：从经典的 YOLO 系列到最新的端侧大模型 (LLM/VLM)，均已打通 NPU 加速。

代码路径	功能描述	支持模型/算法	对应教程
`yolo11_rk3588/yolo.py`	通用目标检测	YOLOv13 / v12 / v11 / v8 / YOLO-World	B站教程
`yolo11_rk3588`	多/单目标跟踪	ByteTrack / NanoTrack (轻量级)	B站教程
`yolov8_rk3588`	姿态估计	YOLOv8-Pose / YOLO11-Pose	B站教程
`mobilesam_rk3588`	万物分割 (SAM)	MobileSAM (轻量化 SAM)	B站教程
`ocr_rk3588`	OCR 文字识别	PP-OCR (检测+识别串联)	B站教程
`clip_rk3588`	图文匹配/检索	CLIP (OpenAI)	B站教程
`Zipformer_rk3588`	语音识别	Zipformer	B站教程

代码路径	功能描述	支持模型	对应教程
`llm_rk3588`	多模态大模型	Qwen3-VL / DeepSeek-R1-Distill-Qwen-1.5B	B站教程

本系列聚焦 YOLO全系列 (v8/v10/v11/v12) + OpenCV，提供从数据准备、模型训练到可视化的完整解决方案。

包含环境搭建、数据准备、模型训练、PyQt5 可视化界面等完整落地流程。

应用领域	具体系统示例	核心能力与价值	配套教程
工业巡检	管道/PCB/太阳能板缺陷检测	自动识别多类缺陷，集成至机器人/无人机，提升效率	B站教程
智慧交通	车牌识别、路面坑洞、流量统计	支持实时检测与统计，适配监控/自动驾驶场景	B站教程
医疗/制药	脑肿瘤检测、药片识别	辅助诊断与质量控制 (仅供研究/合规使用)	B站教程
智慧农业	害虫/病害检测、作物生长监测	精准农业落地，减少人工，提升产量质量	B站教程
环保/海洋	水面垃圾、海面落水者/船只检测	助力生态保护与海防安全，实现主动监测	B站教程
人机交互	情绪识别、跌倒检测、安全帽/抽烟	适配养老院、工地场景，保障安全与交互体验	B站教程
办公物流	签名检测、行李精准检测	提升办公自动化与智慧交通物流效率	B站教程

多目标跟踪：基于 YOLO + ByteTrack 实现复杂场景下的稳定跟踪。
交互式跟踪：单目标点击跟踪系统 (Click-to-Track)，结合传统算法与深度学习。
精细化视觉：
- 姿态估计：支持 17/21 关键点定位（人体/手部）。
- 实例分割：实现像素级分割（如车辆部件拆解、路面裂缝提取）。

为新手准备的“避坑”指南与效率工具：

技术核心：拒绝 FFmpeg 纯 CPU 软解！本项目实现了从“底层驱动调用”到“应用层推流”的全链路硬加速。

本仓库针对不同算力平台，深入底层 API 实现了高效的音视频处理流程：

技术维度	Rockchip RK3588	Intel (集显/核显)	NVIDIA (独显)
底层架构	MPP (Media Process Platform)	QSV (Quick Sync Video)	NVENC / NVDEC
图像加速	RGA (2D 图形加速器)	VPP (Video Post-Processing)	CUDA / Video SDK
核心链路	`MPP解码 -> RGA缩放 -> RKNN推理`	`QSV解码 -> VPP转换 -> OpenVINO推理`	`NVDEC解码 -> CUDA预处理 -> TensorRT推理`
关键特性	DMA-BUF 零拷贝技术，极低 CPU 占用	适合 x86 工业网关，极致性价比	毫秒级延迟，支持多路 4K 并发

我们将音视频处理拆解为四个关键阶段，并提供底层 C++/Python 代码实现：

# 1. 克隆本项目 (GitCode 加速)
git clone [https://gitcode.com/qq_42910179/lxmyzzs.git](https://gitcode.com/qq_42910179/lxmyzzs.git)

如果您有 RK3588/Jetson/Intel 边缘部署、算法移植、高性能 C++ 优化 等商业需求，欢迎邮件联系。

💡 技术交流 / 源码获取	💼 商务合作 / 定制开发
面向人群：个人开发者、学生、技术爱好者内容： ✅ 获取本仓库进阶版源码 ✅ 环境搭建与报错咨询 ✅ 加入技术交流圈	面向人群：企业客户、集成商、课题组服务范围： 🛠️ 算法落地：YOLO/OCR/大模型 -> RK3588/Jetson ⚡ 性能优化：C++ 重构、多路视频流并发、掉电保护 🔌 软硬一体：工业/安防 AI 盒子交付
联系方式： 📧 邮箱：`xiaozhe2026@qq.com` 📝 邮件主题：`[技术交流] 咨询内容`	联系方式： 📧 邮箱：`xiaozhe2026@qq.com` 📝 邮件主题：`[商务合作] 公司名-具体需求` (例如：[商务合作] 某某科技-猪场监控算法定制)