umarigan
/

vit-swin-base-224-gpt2-image-captioning

vision-encoder-decoder

Generated from Trainer

Model card Files Files and versions

Metrics Training metrics Community

vit-swin-base-224-gpt2-image-captioning

967 MB

1 contributor

History: 3 commits

umarigan's picture

umarigan/dreamoon

e089421 verified 7 months ago