QA-1_FT

Questo modello è una versione ottimizzata di deepset/roberta-base-squad2, adattato specificamente alla documentazione tecnica di una web app tramite un processo di addestramento a due fasi.

Descrizione del Modello

Il processo di adattamento ha compreso:

Adattamento al Dominio (MLM): Il modello base è stato aggiornato tramite Masked Language Modeling (MLM) sul dataset RoleChatArticoles.json (contenente la documentazione della web app) per apprendere la terminologia tecnica e il contesto specifico del software.
Fine-tuning QA Specializzato: Dopo la fase MLM, il modello è stato addestrato per il Question Answering utilizzando LoRA (Low-Rank Adaptation). Questo permette al modello di estrarre risposte precise dai documenti tecnici senza perdere le capacità di ragionamento generali.

Procedura di Addestramento

Fase 1: Masked Language Modeling (MLM)

Obiettivo: Adattamento al dominio tecnico.
Dataset: Documentazione della web app (RoleChatArticoles.json).
Metodo: Quantizzazione a 4-bit e aggiornamento completo dell'encoder per 1 epoca.

Fase 2: Question Answering (PEFT/LoRA)

Obiettivo: Estrazione di risposte dal contesto della documentazione.
Metodo: LoRA (Low-Rank Adaptation).
Configurazione:
- Rank ($r$): 16
- Alpha: 32
- Target Modules: query, key, value, dense
- Training: Quantizzazione a 4-bit (bitsandbytes).

Casi d'Uso e Limitazioni

Uso Previsto

Il modello è progettato per rispondere a domande basate strettamente sulla documentazione tecnica della web app fornita durante l'addestramento.

Limitazioni e Avvertenze

Non è un modello generico: Si sconsiglia vivamente l'uso di questo modello per compiti di Question Answering generici o fuori dal dominio tecnico trattato.
Necessità di Fine-tuning: Per essere utilizzato efficacemente su altri software o documentazioni differenti, il modello richiede nuovi cicli di fine-tuning specifici sui nuovi set di dati.
Lunghezza Sequenza: Essendo basato su RoBERTa, ha un limite massimo di 384 token per ogni prompt

Downloads last month: 31

Safetensors

Model size

0.1B params

Tensor type

F32

Model tree for Croc-Prog-HF/QA-1_FT

Base model

FacebookAI/roberta-base

Finetuned

deepset/roberta-base-squad2

Finetuned

(221)

this model