6 6

Qianyi Hu

ameliaramirez20

AI & ML interests

None yet

Recent Activity

upvoted a paper 1 day ago

ResRL: Boosting LLM Reasoning via Negative Sample Projection Residual Reinforcement Learning

liked a model 7 days ago

cyankiwi/granite-4.1-8b-AWQ-INT4

liked a model 14 days ago

FlagRelease/DeepSeek-V4-Flash-metax-FlagOS

View all activity

Organizations

None yet

upvoted a paper 1 day ago

ResRL: Boosting LLM Reasoning via Negative Sample Projection Residual Reinforcement Learning

Paper • 2605.00380 • Published 8 days ago • 3

liked a model 7 days ago

cyankiwi/granite-4.1-8b-AWQ-INT4

Text Generation • 2B • Updated 7 days ago • 867 • 1

liked a model 14 days ago

FlagRelease/DeepSeek-V4-Flash-metax-FlagOS

Updated 11 days ago • 1

upvoted a paper 15 days ago

DiPO: Disentangled Perplexity Policy Optimization for Fine-grained Exploration-Exploitation Trade-Off

Paper • 2604.13902 • Published 24 days ago • 62

liked 2 models 26 days ago

snoobvn20264/Fyc1RxDs9UrjM5zN

Updated 11 days ago • 1

aproveita112/GLM-5.1mini

Text Generation • 754B • Updated 26 days ago • 15 • 1

upvoted a paper 26 days ago

Adam's Law: Textual Frequency Law on Large Language Models

Paper • 2604.02176 • Published Apr 2 • 501

upvoted 2 papers 28 days ago

Rethinking Generalization in Reasoning SFT: A Conditional Analysis on Optimization, Data, and Model Capability

Paper • 2604.06628 • Published about 1 month ago • 324

OpenSpatial: A Principled Data Engine for Empowering Spatial Intelligence

Paper • 2604.07296 • Published about 1 month ago • 39

liked a dataset 30 days ago

phanerozoic/qiskit-calibration-drift

Viewer • Updated 31 minutes ago • 277k • 3.5k • 2

upvoted a paper about 1 month ago

Self-Distilled RLVR

Paper • 2604.03128 • Published Apr 3 • 169

liked a dataset about 1 month ago

teknium/OpenHermes-2.5

Viewer • Updated Apr 15, 2024 • 1M • 22.9k • 827

Qianyi Hu

AI & ML interests

Recent Activity

Organizations

ameliaramirez20's activity