Paused Agents 28 MT Bench PL 📊 28 Przeglądaj i porównuj odpowiedzi modeli językowych w języku polskim
Running 40 Polish Information Retrieval Benchmark (PIRB) 📈 40 View evaluation results on an interactive leaderboard