考虑到重点实验室实习的需要,使用Gradio框架部署了AI模型测试结果。
项目演示视频:
可以在手机浏览器或Web端打开,选择Examples中的视频,可选择Examples中的示例视频,之后点击Submit按钮,实现对算法模型的调用,并输出相应的动作标签和置信度、置信度排名。
视频动作识别是计算机视觉领域的关键问题之一。其难点在于需要考虑视频的时序信息,并且难以平衡精度与效率。我们设计了一种基于运动引导的视频非均匀帧采样方法,可以聚焦视频帧中代表性的帧;同时,我们结合空间去冗余方法使模型进一步关注显著变化区域。
系统的设计是为了实现在移动设备等低计算力平台部署动作识别系统,更好地服务于视频检索、监控等领域。用户输入一段视频数据,系统会输出相应的动作标签,实现高效的视频动作识别。系统还通过Gradio框架实现轻量级的AI算法模型部署,提升模型优化的效率,具有创新性。
目前的系统支持174个分类,共24777个视频的高效识别。实现自动标注测试结果(原始视频、视频帧、置信度和相关日志),保存至flagged文件夹。支持生成内网穿透的公共链接,便于多端测试。
感谢周雨熙老师和研究生周浩学长无微不至的指导。