DeepSeek-R1-Distill-Qwen-1.5B

Sleeping

nikravan commited on Jan 21, 2025

Commit

a1b2c23

verified ·

1 Parent(s): c9ea116

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -8,7 +8,7 @@ import spaces
 import gradio as gr
 from transformers import AutoModelForCausalLM, AutoTokenizer, BitsAndBytesConfig, TextIteratorStreamer
-subprocess.run('pip install flash-attn --no-build-isolation', env={'FLASH_ATTENTION_SKIP_CUDA_BUILD': "TRUE"}, shell=True)
 MODEL_ID = "deepseek-ai/DeepSeek-R1-Distill-Qwen-7B"
 CHAT_TEMPLATE = "َAuto"
@@ -103,8 +103,8 @@ model = AutoModelForCausalLM.from_pretrained(
     MODEL_ID,
     device_map="auto",
     #quantization_config=quantization_config,
-    attn_implementation="flash_attention_2",
-    dtype=torch.bfloat16
 )
 # Create Gradio interface

 import gradio as gr
 from transformers import AutoModelForCausalLM, AutoTokenizer, BitsAndBytesConfig, TextIteratorStreamer
+#subprocess.run('pip install flash-attn --no-build-isolation', env={'FLASH_ATTENTION_SKIP_CUDA_BUILD': "TRUE"}, shell=True)
 MODEL_ID = "deepseek-ai/DeepSeek-R1-Distill-Qwen-7B"
 CHAT_TEMPLATE = "َAuto"
     MODEL_ID,
     device_map="auto",
     #quantization_config=quantization_config,
+    #attn_implementation="flash_attention_2",
 )
 # Create Gradio interface