分类目录归档:计算机视觉

Sora 述评:大视觉模型的背景、技术、局限性和机遇

中文标题:Sora:大视觉模型的背景、技术、局限性和机会综述

英文标题:Sora:

Read more

Genie:生成可交互环境的基础世界模型

中文标题:Genie: 生成式交互环境

英文标题:Genie: Generative Interactive Environments

发布平台:预印本

发布日期:2024-02-23

引用量(非实时

Read more

I-JEPA:基于联合嵌入预测架构进行图像自监督学习

中文标题:从图像中进行自监督学习,采用联合嵌入预测架构

英文标题:Self-Supervised

Read more

Saliency:基于显著性图检测模型偏差

中文标题:Saliency:基于显著性图检测模型偏差

英文标题:Search

Read more

基于负增强的视觉转换器(ViT)鲁棒性的理解和改进

中文标题:基于负增强的视

Read more

提升视觉变换器(ViT)对图像块级扰动的鲁棒性

中文标题:视觉变换器(ViT)是否具备抵抗图像块扰动鲁棒性?

英文标题:Are Vision Transformers Robus

Read more