CoCLR — это новый метод самообучения для представления видео. Он использует только визуальные данные для совместного обучения моделей представления видео с использованием целей InfoNCE и MoCo. Этот метод решает задачу эффективной обработки больших объемов неаннотированных видеоданных, что делает его ценным для приложений, где аннотированные данные ограничены или недоступны.