nkkbr
/

ViCA

Video-Text-to-Text

text-generation

vision-language

video understanding

spatial reasoning

visuospatial cognition

Eval Results (legacy)

Model card Files Files and versions

ViCA / assets

5.35 MB

Ctrl+K

Ctrl+K

1 contributor

History: 3 commits

nkkbr's picture

.

e2d3083 about 1 year ago