simple-trafo-mech-int

Sleeping

mshook commited on Sep 25, 2024

Commit

66f3409

verified ·

1 Parent(s): 9bef1a9

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -10,22 +10,7 @@ import numpy as np
 import plotly.express as px
 import circuitsvis as cv
-"""
-roneneldan/TinyStories-1M
-roneneldan/TinyStories-3M
-roneneldan/TinyStories-8M
-roneneldan/TinyStories-28M
-roneneldan/TinyStories-33M
-roneneldan/TinyStories-1Layer-21M
-roneneldan/TinyStories-2Layers-33M
-roneneldan/TinyStories-Instruct-1M
-roneneldan/TinyStories-Instruct-3M
-roneneldan/TinyStories-Instruct-8M
-roneneldan/TinyStories-Instruct-28M
-roneneldan/TinyStories-Instruct-33M
-roneneldan/TinyStories-Instuct-1Layer-21M
-roneneldan/TinyStories-Instruct-2Layers-33M
-"""
 # Little bit of front end for model selector
@@ -62,6 +47,22 @@ model_name = st.sidebar.radio("Model (only use patching for\nsmall (<4L) models
 model = HookedTransformer.from_pretrained(model_name)
 def predict_next_token(prompt):
     logits = model(prompt)[0,-1]
     answer_index = logits.argmax()
     answer = model.tokenizer.decode(answer_index)

 import plotly.express as px
 import circuitsvis as cv
 # Little bit of front end for model selector
 model = HookedTransformer.from_pretrained(model_name)
 def predict_next_token(prompt):
+"""
+roneneldan/TinyStories-1M
+roneneldan/TinyStories-3M
+roneneldan/TinyStories-8M
+roneneldan/TinyStories-28M
+roneneldan/TinyStories-33M
+roneneldan/TinyStories-1Layer-21M
+roneneldan/TinyStories-2Layers-33M
+roneneldan/TinyStories-Instruct-1M
+roneneldan/TinyStories-Instruct-3M
+roneneldan/TinyStories-Instruct-8M
+roneneldan/TinyStories-Instruct-28M
+roneneldan/TinyStories-Instruct-33M
+roneneldan/TinyStories-Instuct-1Layer-21M
+roneneldan/TinyStories-Instruct-2Layers-33M
+"""
     logits = model(prompt)[0,-1]
     answer_index = logits.argmax()
     answer = model.tokenizer.decode(answer_index)