Model Card for gemma-4-4b-khmer-sum

Model Details

Model Description

This model is a fine-tuned version of google/gemma-4-E4B-it specifically designed to generate high-accuracy, professional summaries in the Khmer language. It was trained using QLoRA (4-bit quantization) to efficiently process and summarize long articles and meeting transcripts.

  • Developed by: lonewolf168
  • Model type: Causal Language Model (Fine-tuned for Summarization)
  • Language(s) (NLP): Khmer (km)
  • License: gemma
  • Finetuned from model: google/gemma-4-E4B-it

Model Sources

Uses

Direct Use

This model is intended to be used for summarizing long Khmer text, such as news articles, general documents, and meeting transcripts. It is formatted to produce concise, factual language without adding hallucinatory information.

How to Get Started with the Model

Use the code below to get started with the model.

from transformers import AutoModelForCausalLM, AutoTokenizer

model_id = "lonewolf168/gemma-4-4b-khmer-sum"
tokenizer = AutoTokenizer.from_pretrained(model_id)
model = AutoModelForCausalLM.from_pretrained(model_id, device_map="auto")

text = "YOUR_KHMER_TEXT_HERE"
# Note the escaped curly braces for the text variable
prompt = f"<start_of_turn>user
Please provide a concise and professional summary of the following Khmer text.

{text}<end_of_turn>
<start_of_turn>model
"

inputs = tokenizer(prompt, return_tensors="pt").to("cuda")
outputs = model.generate(**inputs, max_new_tokens=1024, temperature=0.2, do_sample=True)
print(tokenizer.decode(outputs[0], skip_special_tokens=True))

Example Input

Text:

ចរាចរណ៍​នៅ​ច្រក​អកមូហ្ស​មាន​សកម្មភាព​មិនទាន់​​បាន​មួយ​ថ្ងៃ​ផង អ៊ីរ៉ង់​បាន​ប្រកាស​បិទ​ច្រក​សមុទ្ទ​អកមូហ្ស​វិញ នៅ​ព្រឹក​ថ្ងៃសៅរ៍​ទី​១៨​មេសា ដោយ​ពន្យល់​ថា អ៊ីរ៉ង់​ខំ​​មាន​ចេតនា​ល្អ​ព្រម​ឱ្យ​នាវា​ស៊ីវិល​ធ្វើ​ចរាចរណ៍​ឆ្លង​កាត់​ច្រក​អកមូហ្ស​ឡើង​វិញ តែអាមេរិក​បែរ​ជា​រំលោភ​ពាក្យ​សន្យា។ អាមេរិក​​បន្ត​បិទ​ខ្ទប់​កំពង់​ផែ​អ៊ីរ៉ង់​ដដែល។

ស្ថានភាព​ច្រក​សមុទ្ទ​អកមូហ្ស​ត្រូវ​វិល​ទៅ​រក​សភាព​ដើម ពោល​គឺ អ៊ីរ៉ង់សម្រេច​បិទ​ច្រក​យុទ្ធសាស្ត្រនេះវិញ និង​ចាប់​ផ្តើម​គ្រប់គ្រង​​ រាល់​សកម្មភាព ចេញ​ចូល​ របស់គ្រប់​​នាវា​​ យ៉ាង​តឹង​តែងបំផុត។ ដោយហេតុ​តែ​អាមេរិក​នៅ​តែ​បន្ត​បិទ​ខ្ទប់​តំបន់​ច្រក​សមុទ្ទ​អកមូហ្ស ទើបអ៊ីរ៉ង់ប្តូរ​ចិត្ត​ ត្រលប់​ទៅបិទ​ច្រក​សមុទ្ទ​អកមូហ្ស​វិញ។ នេះ​បើ​តាម​សេចក្តី​ប្រកាស​របស់ប្រមុខ​ការទូត​អ៊ីរ៉ង់ ដោយ​​​ប្រកាសថា​គ្មាន​ការ​ចរចា​អាមេរិក​អ៊ីរ៉ង់ ជុំ​ទីពីរ នៅ​ប៉ាគីស្ថាន​ទេ។

​​សូម​បញ្ជាក់​ថា នៅ​រសៀល​ថ្ងៃសុក្រ​ទី ១៧​មេសា​ម្សិលមិញ​ បន្ទាប់ពីប្រធានាធិបតី​អាមេរិក​ប្រកាស​បទឈប់បាញ់រយៈពេល​១០ថ្ងៃ រវាង​អ៊ីស្រាអែល និង​លីបង់ភ្លាម រដ្ឋមន្រ្តីការបរទេស​អ៊ីរ៉ង់​លោក​អាបាស អារ៉ាឈី បាន​ប្រកាសបើក​ច្រក​អកមូហ្សភ្លែត។ តែ​ក៏​មាន​​ព័ត៌មាន​ចម្រូង​ចម្រាសគ្នា​ច្រើន​ មិន​គួរ​ឱ្យ​ទុក​ចិត្ត​​ដែរ។ ជា​សរុប​ មាន​នាវា​ដឹក​ប្រេង និង​ឧស្ម័ន ​ប្រមាណ​តែ​៨​គ្រឿងប៉ុណ្ណោះ បាន​ឆ្លង​កាត់​ច្រក​អកមូហ្ស​​រួច ក្នុង​រយៈ​ពេលនៃ​ការ​បើក​ច្រក​បាន​​ជិត​២០ម៉ោង៕​

Example Output

Summary:

​ការ​ឆ្លង​កាត់​របស់​នាវា​សព្វ​ប្រភេទ​តាម​កាលៈទេសៈ​របស់​ខ្លួន។ នេះ​បើ​តាម​ការ​ប្រកាស​របស់​ក្រសួង​ការបរទេស​អ៊ីរ៉ង់។ ក្រសួង​ការបរទេស​អ៊ីរ៉ង់​បាន​បញ្ជាក់​ថា អាមេរិក​បាន​បន្ត​ធ្វើ​សកម្មភាព​មិន​គោរព​កិច្ចព្រមព្រៀង​ដែល​បាន​ធ្វើ​ឡើង​កាលពី​ខែ​កុម្ភៈ​កន្លង​ទៅ។ ក្រសួង​ការបរទេស​អ៊ីរ៉ង់​បាន​បញ្ជាក់​ថា អាមេរិក​បាន​បន្ត​ធ្វើ​សកម្មភាព​«ប្រឆាំង​នឹង​កិច្ច​ព្រមព្រៀង​ដែល​បាន​ធ្វើ​ឡើង​កាលពី​ខែ​កុម្ភៈ»។ អាមេរិក​បាន​បន្ត​បិទ​ខ្ទប់​កំពង់​ផែ​អ៊ីរ៉ង់​ដដែល។ អាមេរិក​បាន​បន្ត​បិទ​ខ្ទប់​កំពង់​ផែ​អ៊ីរ៉ង់​ដដែល។ អាមេរិក​បាន​បន្ត​បិទ​ខ្ទប់​កំពង់​ផែ​អ៊ីរ៉ង់​ដដែល។ អាមេរិក​បាន​បន្ត​បិទ​ខ្ទប់​កំពង់​ផែ​អ៊ីរ៉ង់​ដដែល។ អាមេរិក​បាន​បន្ត​បិទ​ខ្ទប់​កំពង់​ផែ​អ៊ីរ៉ង់​ដដែល។ អាមេរិក​បាន​បន្ត​បិទ​ខ្ទប់​កំពង់​ផែ​អ៊ីរ៉ង់​ដដែល។ អាមេរិក​បាន​បន្ត​បិទ​ខ្ទប់​កំពង់​ផែ​អ៊ីរ៉ង់​ដដែល។ អាមេរិក​បាន​បន្ត​បិទ​ខ្ទប់​កំពង់​ផែ​អ៊ីរ៉ង់​ដដែល។ អាមេរិក​បាន​បន្ត​បិទ​ខ្ទប់​កំពង់​ផែ​អ៊ីរ៉ង់​ដដែល

Training Details

Training Data

The model was fine-tuned on the Khmer (khm) subset of the bltlab/lr-sum dataset, which contains high-quality text-summary pairs.

Training Hyperparameters

  • Training regime: QLoRA (4-bit, nf4, bfloat16)
  • LoRA Rank (r): 16
  • LoRA Alpha: 32
  • Target Modules: all-linear
  • Learning Rate: 2e-4
  • Optimizer: paged_adamw_8bit
  • Batch Size: 4 (with gradient accumulation steps = 4, effective batch size = 16)
  • Max Steps: 500
  • Warmup Steps: 50

Environmental Impact

  • Hardware Type: Google Colab GPU (e.g., L4, A100)
Downloads last month
6
Safetensors
Model size
8B params
Tensor type
BF16
·
Inference Providers NEW
This model isn't deployed by any Inference Provider. 🙋 Ask for provider support

Model tree for lonewolf168/gemma-4-4b-khmer-sum

Finetuned
(211)
this model

Dataset used to train lonewolf168/gemma-4-4b-khmer-sum

Space using lonewolf168/gemma-4-4b-khmer-sum 1