3 16 3

Wei Pang

weipang142857

AI & ML interests

None yet

Recent Activity

updated a dataset 5 days ago

logo-lab/trl-ctbench

updated a dataset 13 days ago

logo-lab/trl-rbench

updated a dataset 15 days ago

logo-lab/trl-dlte

View all activity

Organizations

updated a dataset 5 days ago

logo-lab/trl-ctbench

Viewer • Updated 5 days ago • 2.63M • 4.38k

updated a dataset 13 days ago

logo-lab/trl-rbench

Viewer • Updated 13 days ago • 1.61M • 623

updated a dataset 15 days ago

logo-lab/trl-dlte

Viewer • Updated 15 days ago • 181k • 84

updated a model 15 days ago

logo-lab/trl-arena-ckpts

Updated 15 days ago

published a model 17 days ago

logo-lab/trl-arena-ckpts

Updated 15 days ago

updated a collection about 1 month ago

TRL-Bench

Collection

TRL-Bench: cross-paradigm representation-level evaluation of tabular encoders. CTbench + Rbench + DLTE. • 4 items • Updated 29 days ago

updated a dataset about 1 month ago

logo-lab/trl-ctbench-sample

Viewer • Updated about 1 month ago • 4.4k • 240

published 4 datasets about 1 month ago

upvoted 2 papers about 2 months ago

GameWorld: Towards Standardized and Verifiable Evaluation of Multimodal Game Agents

Paper • 2604.07429 • Published Apr 8 • 121

FORGE:Fine-grained Multimodal Evaluation for Manufacturing Scenarios

Paper • 2604.07413 • Published Apr 8 • 95

authored a paper about 2 months ago

FORGE:Fine-grained Multimodal Evaluation for Manufacturing Scenarios

Paper • 2604.07413 • Published Apr 8 • 95

updated a dataset 2 months ago

weipang142857/file_transfer

Updated Apr 4 • 13

published a dataset 2 months ago

weipang142857/file_transfer

Updated Apr 4 • 13

upvoted a paper 2 months ago

CUA-Suite: Massive Human-annotated Video Demonstrations for Computer-Use Agents

Paper • 2603.24440 • Published Mar 25 • 98

Wei Pang

AI & ML interests

Recent Activity

Organizations

weipang142857's activity