Pinned Loading
-
watermark-tracer
watermark-tracer Public一个基于可视水印检测识别的数字媒体溯源应用系统,是我的大作业项目,包含这个系统以及一个开源的大规模常见水印图像数据集(Large-scale Common Watermark Dataset, LCWD)。 输入一个带有可视水印的图片或视频,系统会检测定位到水印所在的区域,然后将其提取出来,然后借助百度AI开放平台的OCR和logo识别以及Bing搜索引擎,溯源到这个图片或视频的源头。
-
Video-Captioning-Transformer
Video-Captioning-Transformer Public这是一个基于Pytorch平台、Transformer框架实现的视频描述生成 (Video Captioning) 深度学习模型。 视频描述生成任务指的是:输入一个视频,输出一句描述整个视频内容的文字(前提是视频较短且可以用一句话来描述)。本repo主要目的是帮助视力障碍者欣赏网络视频、感知周围环境,促进“无障碍视频”的发展。
-
RethinkingVAD
RethinkingVAD PublicThis repository contains the codes and datasets for the ArXiv paper: Rethinking Metrics and Benchmarks of Video Anomaly Detection (https://arxiv.org/abs/2505.19022)
Jupyter Notebook 7
-
Adaptive-BLIP2-MM24
Adaptive-BLIP2-MM24 PublicThis is official implementation of our MM'24 paper: Adaptively Building a Video-Language Model For Video Captioning and Retrieval without Massive Video Pretraining
-
LaGoVAD-PreVAD
LaGoVAD-PreVAD PublicThis repository contains the code and dataset for the paper: Language-guided Open-world Video Anomaly Detection under Weak Supervision (https://arxiv.org/abs/2503.13160)
Python 5
If the problem persists, check the GitHub status page or contact support.


