11 19

Victoria Jones

isaacperez2

AI & ML interests

None yet

Recent Activity

upvoted a paper about 12 hours ago

The Flip Side of RLHF: On-Policy Feedback for Reward Model Self-Supervised Improvement

liked a model 2 days ago

Muapi/makima-chainsaw-man-flux-lora

liked a model 2 days ago

openai/whisper-large-v3

View all activity

Organizations

None yet

upvoted a paper about 12 hours ago

The Flip Side of RLHF: On-Policy Feedback for Reward Model Self-Supervised Improvement

Paper • 2605.30888 • Published 6 days ago • 8

liked 2 models 2 days ago

Muapi/makima-chainsaw-man-flux-lora

Text-to-Image • Updated 2 days ago • 2 • • 1

openai/whisper-large-v3

Automatic Speech Recognition • 2B • Updated Aug 12, 2024 • 5.35M • • 5.77k

liked a model 4 days ago

WilliamFeng/ManiSkill-ViTac-Model2

Updated 4 days ago • 1

liked a dataset 6 days ago

openbmb/Ultra-FineWeb-L3

Viewer • Updated 7 days ago • 1.06B • 42.4k • 252

liked a model 10 days ago

tencent/Hy-MT2-1.8B

Translation • 2B • Updated 9 days ago • 20.4k • • 1.1k

upvoted a paper 11 days ago

DelTA: Discriminative Token Credit Assignment for Reinforcement Learning from Verifiable Rewards

Paper • 2605.21467 • Published 15 days ago • 204

upvoted a paper 14 days ago

The Unlearnability Phenomenon in RLVR for Language Models

Paper • 2605.16787 • Published 19 days ago • 6

liked a dataset 17 days ago

gretelai/synthetic_text_to_sql

Viewer • Updated Dec 16, 2025 • 106k • 3.18k • 663

liked a dataset 21 days ago

jake123456789/eval_2cameras_container_21_pi05_4

Updated 21 days ago • 96 • 1

liked a model 24 days ago

carbonx/buddy-desktop

Updated 24 days ago • 1

liked a dataset 28 days ago

BAAI/Infinity-Instruct

Viewer • Updated Dec 4, 2025 • 21.9M • 2.77k • 727

upvoted a paper 30 days ago

From Context to Skills: Can Language Models Learn from Context Skillfully?

Paper • 2604.27660 • Published May 3 • 166

liked a dataset about 1 month ago

diaoweiqing/record-test_20260501_195420

Viewer • Updated May 1 • 13.4k • 149 • 1

upvoted a paper about 1 month ago

Recursive Multi-Agent Systems

Paper • 2604.25917 • Published Apr 28 • 274

liked a model about 1 month ago

gcfrts/mg_154b_rag_full_lora

Updated Apr 25 • 1

upvoted a paper about 1 month ago

LLaDA2.0-Uni: Unifying Multimodal Understanding and Generation with Diffusion Large Language Model

Paper • 2604.20796 • Published Apr 22 • 243

liked 2 models about 1 month ago

inclusionAI/LLaDA2.0-Uni

Any-to-Any • 16B • Updated 8 days ago • 6.26k • 247

openbmb/VoxCPM2

Text-to-Speech • 2B • Updated Apr 16 • 240k • 1.37k

upvoted a paper about 2 months ago

RationalRewards: Reasoning Rewards Scale Visual Generation Both Training and Test Time

Paper • 2604.11626 • Published Apr 13 • 102

Victoria Jones

AI & ML interests

Recent Activity

Organizations

isaacperez2's activity