AI & ML interests

None defined yet.

Recent Activity

🐹 Capibara-LLM

Inteligencia Artificial con identidad paraguaya.

Bienvenido a Capibara-LLM, una iniciativa Open Source dedicada al desarrollo de Modelos de Lenguaje (LLMs) y Datasets para el idioma Guaraní y su variante Jopara.

Al igual que el Capibara, buscamos ser una comunidad social, tranquila y amigable con el ecosistema open-source.

GitHub Hugging Face


🎯 Nuestra Misión

El Guaraní es un idioma "low-resource" en el mundo de la IA. En Capibara-LLM trabajamos para cambiar eso mediante:

  1. Recopilación de Datos: Creación de los datasets más extensos de Guarani-Jopara.
  2. Fine-Tuning: Adaptación de modelos Gemma, Llama, Qwen y Mistral para que "hablen" como nosotros.
  3. Cultura: Preservar la riqueza linguística de Paraguay en la era digital.

🚀 Modelos (The Capibara Zoo)

Modelos ajustados para traducción, generación de texto y comprensión cultural.

Modelo Base Descripción Link
Capibara-LLM/gemma-2-9b-it-SimPO-Jopara Gemma 2 9B it Nuestro modelo insignia. Entiende y genera Guarani-Jopara. Ver Modelo

📚 Datasets

La comida de nuestros Capibaras (Datos):

  • 📂 [Capibara-LLM/dataset-guarani-jopara-v01]: Dataset de instrucciones estilo Alpaca traducido al Guarani-Jopara.
  • 📂 [Capibara-LLM/gn-multi-affective-alpaca]: Texto masivo limpio de fuentes web y literatura paraguaya.

🤝 Únete a la Manada

Estamos buscando colaboradores para GitHub y Hugging Face.

  • Desarrolladores: Ayuda a limpiar datos en GitHub.
  • Hablantes Nativos: Ayuda a validar las respuestas de nuestros modelos.

Hecho con 🧉 y ❤️ desde Paraguay.