Test

Canlı Dene


adrest5 – Türkçe Adres Düzeltme Modeli

Model Type: FLAN-T5 Small (Seq2Seq) Author: @cagrigungor Use Case: Bozuk veya eksik yazılmış Türkçe adresleri standart forma dönüştürme Language: Turkish (tr-TR) License: Apache-2.0

Model Hakkında

adrest5 modeli, FLAN-T5 Small tabanlı olup bozuk veya eksik Türkçe adresleri düzeltmek amacıyla fine-tune edilmiştir. Model, mahalle/cadde/sokak türlerini doğru formata dönüştürür, eksik parçaları tamamlar ve okunabilir bir adres oluşturur.

Mimari

  • Base Model: google/flan-t5-small
  • Parametre: ~80M
  • Eğitim Tipi: Supervised Seq2Seq
  • Max Length: 64
  • Loss: Cross Entropy
  • Tokenizer: T5 FastTokenizer

Eğitim Verisi

Bu model, kullanıcıya ait özel bir adres veri kümesi ile eğitilmiştir. Dataset HuggingFace’e yüklenmemiştir. Veri örneği:

  • eksik: bozuk adres
  • adres: doğru formatlanmış adres

Kullanım

Python örneği:

from transformers import AutoTokenizer, AutoModelForSeq2SeqLM
import torch

model_name = "cagrigungor/adrest5"
tokenizer = AutoTokenizer.from_pretrained(model_name)
model = AutoModelForSeq2SeqLM.from_pretrained(model_name)

device = "cuda" if torch.cuda.is_available() else "cpu"
model.to(device)

def duzelt(adres):
    encoded = tokenizer(adres, return_tensors="pt").to(device)
    with torch.no_grad():
        output = model.generate(**encoded, max_length=64)
    return tokenizer.decode(output[0], skip_special_tokens=True)

print(duzelt("atatrk cad  ,cafega mahs , num 18 kadikıoy"))

Örnek Çıktı

Girdi: atatrk cad ,cafega mahs , num 18 kadikıoy

Çıktı: Caferağa Mahallesi Atatürk Caddesi No:18, Kadıköy / İstanbul

Türkçe Karakter Notu

T5 tokenizer bazı Unicode normalizasyonları nedeniyle "ı" ve "İ" harflerini dönüştürebilir. Bu modelde post-processing ile düzeltilmiştir.

Sınırlamalar

  • Adresi doğrulamaz, sadece düzeltir.
  • Çok uzun adreslerde kırpma olabilir.

İletişim

Developed by @cagrigungor

Destanları ancak kahramanlar yazar. Çünkü onlar, vazifenin bittiği yerde, ölümü göze alarak çalışmaya devam ettikleri için birer kahraman olmuşlardır ...

Ömer Fahreddin Paşa Anısına...
Downloads last month
7
Safetensors
Model size
0.2B params
Tensor type
F32
·
Inference Providers NEW
This model isn't deployed by any Inference Provider. 🙋 Ask for provider support

Model tree for cagrigungor/adrest5

Finetuned
(463)
this model

Spaces using cagrigungor/adrest5 3