NamrataThakur
/

Small_Language_Model_MOE_127M_Pretrained

Text Generation

customGPT_pretrain

Group_Query_Attention

Mixture-Of-Experts

Model card Files Files and versions

Small_Language_Model_MOE_127M_Pretrained

2.03 GB

Ctrl+K

Ctrl+K

1 contributor

History: 13 commits

NamrataThakur's picture

Update README.md

78ccaaf verified 2 months ago