2 7 6

SII-Wenhong

wh-zhu

zwhong714

AI & ML interests

None yet

Recent Activity

new activity about 9 hours ago

wh-zhu/Qwen2.5-7B-PSFT-RL-DAPO-90:Add model card and metadata

new activity about 9 hours ago

wh-zhu/qwen2.5-1.5B-longcot-reasoning-HPD:Add model card for HPD distilled Qwen2.5-1.5B

updated a model 3 days ago

wh-zhu/qwen2.5-1.5B-longcot-reasoning-HPD

View all activity

Organizations

Collections 4

View 4 collections

Papers 3

arxiv:2508.17784

arxiv:2506.12704

arxiv:2410.18640

models 58

datasets 6

wh-zhu/dapo

Viewer • Updated Feb 27 • 17.4k • 3

wh-zhu/train_openr1_8k

Viewer • Updated Oct 16, 2025 • 45.8k • 7

wh-zhu/aime-24

Viewer • Updated Sep 1, 2025 • 960 • 5

wh-zhu/train_openr1_4k

Viewer • Updated Sep 1, 2025 • 25.4k • 7 • 2

wh-zhu/short_cot_calibration

Viewer • Updated Jun 18, 2025 • 52.8k • 3

wh-zhu/long_cot_calibration

Viewer • Updated Jun 18, 2025 • 35k • 8

SII-Wenhong

AI & ML interests

Recent Activity

Organizations

Collections 4

wh-zhu/Qwen2.5-7B-PSFT-RL-DAPO-90

wh-zhu/Qwen2.5-7B-Instruct-PSFT-1300

wh-zhu/Qwen2.5-7B-SFT-RL-DAPO-90

wh-zhu/Qwen2.5-7B-Instruct-SFT-700

wh-zhu/DeepSeek-R1-TrRa-1.5B-lambda_2

wh-zhu/DeepSeek-R1-TrRa-1.5B-lambda_5

wh-zhu/DeepSeek-R1-TrRa-1.5B-lambda_10

wh-zhu/DeepSeek-R1-TrRa-iter1-1.5B-lambda_2

wh-zhu/Qwen2.5-7B-PSFT-RL-DAPO-90

wh-zhu/Qwen2.5-7B-Instruct-PSFT-1300

wh-zhu/Qwen2.5-7B-SFT-RL-DAPO-90

wh-zhu/Qwen2.5-7B-Instruct-SFT-700

wh-zhu/DeepSeek-R1-TrRa-1.5B-lambda_2

wh-zhu/DeepSeek-R1-TrRa-1.5B-lambda_5

wh-zhu/DeepSeek-R1-TrRa-1.5B-lambda_10

wh-zhu/DeepSeek-R1-TrRa-iter1-1.5B-lambda_2

Papers 3

models 58

wh-zhu/Qwen2.5-7B-PSFT-RL-DAPO-90

wh-zhu/qwen2.5-1.5B-longcot-reasoning-HPD

wh-zhu/Qwen2.5-7B-Instruct-SFT-lr-5e6

wh-zhu/Qwen2.5-7B-Instruct-16-1300

wh-zhu/Qwen2.5-7B-Instruct-ref-1300

wh-zhu/Qwen2.5-7B-Instruct-update4-600

wh-zhu/Qwen2.5-7B-Instruct-VL-SFT-RL120

wh-zhu/Qwen2.5-7B-Instruct-VL-SFT-RL165

wh-zhu/Qwen2.5-7B-Instruct-VL-PSFT-RL165

wh-zhu/Qwen2.5-7B-Instruct-VL-ORI-RL140

datasets 6

wh-zhu/dapo

wh-zhu/train_openr1_8k

wh-zhu/aime-24

wh-zhu/train_openr1_4k

wh-zhu/short_cot_calibration

wh-zhu/long_cot_calibration

SII-Wenhong

AI & ML interests

Recent Activity

Organizations

Collections 4

Papers 3

models 58 Sort: Recently updated

datasets 6 Sort: Recently updated

models 58

datasets 6