运行环境，精度对不上

by Zeon-Zhuang - opened Jul 3

Jul 3

想问下可以提供运行 demo 代码的环境嘛，包括 transformers, torch, flash_attention 等
我在单机 H800 cu122 torch2.6 fa2.7.4.post1 transformers4.51.3 环境下运行 demo 代码的输出是

Score for response 1: 17.125
Score for response 2: 7.0

类似的，我运行 Skywork-Reward-Llama-3.1-8B-v0.2 时，输出也存在精度差异

# 8B 参考结果:
# Score for response 1: 13.6875
# Score for response 2: -9.1875

# fa2.7.4 运行结果
Score for response 1: 13.75
Score for response 2: -9.1875

# fa2.6.2 运行结果
Score for response 1: 13.75
Score for response 2: -9.375

chrisliu298

Skywork org Jul 3

样例代码中提供的分数皆来自 Skywork-Reward-V2-Llama-3.1-8B，所有测试都使用 torch 2.7.1，transformers 4.53.0，flash-attn 2.7.1.post4 完成。

chrisliu298

Skywork org Jul 3

•

edited Jul 3

上面这个 17.125 / 7.0 是否是来自 Skywork-Reward-V2-Qwen3-4B 的？如果没错的话，我们可以得到一样的分数。

chrisliu298 changed discussion status to closed Jul 3

chrisliu298 changed discussion status to open Jul 3

Zeon-Zhuang

Jul 3

上面这个 17.125 / 7.0 是否是来自 Skywork-Reward-V2-Qwen3-4B 的？如果没错的话，我们可以得到一样的分数。

是的，非常感谢您提供相关信息

Zeon-Zhuang changed discussion status to closed Jul 3

Upload images, audio, and videos by dragging in the text input, pasting, or clicking here.

Tap or paste here to upload images

· Sign up or log in to comment