OpenCV 5 发布:升级全新 DNN 引擎、原生支持大模型
3 小时前 / 阅读约2分钟
来源:凤凰网
OpenCV团队发布OpenCV 5,带来全新DNN引擎、更强大的ONNX支持、硬件加速改进、更好的Python集成、扩展的3D视觉功能等,ONNX算子覆盖率超80%。

6 月 6 日消息,OpenCV 团队本周正式发布了 OpenCV 5。

据介绍,二十多年来,OpenCV 一直是计算机视觉研究、机器人技术、嵌入式视觉、AI 应用、工业检测、AR / VR、医学成像以及无数生产系统的基础。如今,该库在 GitHub 上拥有超过 86,000 颗 stars,每天的安装量超过一百万次,并且拥有世界上最庞大的计算机视觉算法集合之一。

OpenCV 5 在此基础之上,对该库进行了重大的现代化改造。它带来了全新的 DNN 引擎、更强大的 ONNX 支持、硬件加速方面的改进、更好的 Python 集成、新的数据类型、扩展的 3D 视觉功能、改进的文档,以及面向未来更清晰的架构。

▲ ONNX 算子覆盖率从 4.x 时期的不到 23% 增加到超 80%

IT之家附 OpenCV 5 主要更新内容如下:

更好的语言支持:现代化的 Python、更新的语言绑定(bindings),以及使用命名参数(named arguments)而非靠猜测来确定参数顺序。

更快、更小巧的核心:更紧凑的代码、弃用传统的 C API,以及更精简的构建方式。

更清晰的硬件加速层:使硬件供应商能够直接插入优化后的内核(kernels),而不会陷入杂乱的 #ifdef 条件编译之中。

更简洁的 API:规范的 0D/1D 张量(tensors)、原生的 FP16/BF16 支持,以及真正的日志记录机制。

下一代 DNN 引擎:基于图(graph-based)的架构,支持算子融合(fusions)、广泛的 ONNX 支持,以及对 Transformer 模型、视觉语言模型 / 大型语言模型(VLM / LLMs)的支持。

更好的 3D 视觉:ChArUco 标定板、多相机标定以及可视化功能。

更好的文档:现代化、易于导航,且阅读体验令人愉悦。