Models
Datasets
Spaces
Docs
Enterprise
Pricing
Log In
Sign Up

Nirav-Madhani
/

gemma3-270m-grpo-math

Text Generation

chain-of-thought

text-generation-inference

Model card Files Files and versions

gemma3-270m-grpo-math

1.11 GB

1 contributor

History: 3 commits

Nirav-Madhani's picture

Create README.md

8905eb3 verified 2 months ago

.gitattributes

1.57 kB

Upload rl_checkpoint snapshot 2 months ago
README.md

6.1 kB

Create README.md 2 months ago
config.json

1.35 kB

Upload rl_checkpoint snapshot 2 months ago
generation_config.json

128 Bytes

Upload rl_checkpoint snapshot 2 months ago
model.safetensors

1.07 GB
xet

Upload rl_checkpoint snapshot 2 months ago
special_tokens_map.json

662 Bytes

Upload rl_checkpoint snapshot 2 months ago
tokenizer.json

33.4 MB
xet

Upload rl_checkpoint snapshot 2 months ago
tokenizer_config.json

1.16 MB

Upload rl_checkpoint snapshot 2 months ago