CoCLR é um novo método de aprendizado auto-supervisionado para representação de vídeo. Ele explora dados apenas visuais para co-treinar modelos de representação de vídeo usando os objetivos InfoNCE e MoCo em vídeos. Este método aborda a necessidade de processar grandes quantidades de dados de vídeo não rotulados de forma eficaz, tornando-o valioso para aplicações onde dados rotulados são escassos ou indisponíveis.