UK AI Safety Institute

https://www.aisi.gov.uk/

https://github.com/AI-Safety-Institute/

AI & ML interests

AI Safety

Recent Activity

alancooneydsit updated a collection 1 day ago

Gender Secret Hyperparameter Sweep

alancooneydsit updated a model 1 day ago

ai-safety-institute/Qwen3.6-27B-gender_secret_female_sweep_r32_s4

alancooneydsit published a model 1 day ago

ai-safety-institute/Qwen3.6-27B-gender_secret_female_sweep_r32_s4

View all activity

Collections 8

View 8 collections

models 470

ai-safety-institute/Qwen3.6-27B-gender_secret_female_sweep_r32_s4

Updated 1 day ago

ai-safety-institute/Qwen3.6-27B-gender_secret_female_sweep_r32_s3

Updated 1 day ago

ai-safety-institute/Qwen3.6-27B-gender_secret_female_sweep_r32_s2

Updated 1 day ago

ai-safety-institute/Qwen3.6-27B-gender_secret_female_sweep_r32_s1

Updated 1 day ago

ai-safety-institute/Qwen3.6-27B-gender_secret_female_sweep_r32_s0

Updated 1 day ago

ai-safety-institute/Qwen3.6-27B-gender_secret_female_sweep_r16_s4

Updated 1 day ago

ai-safety-institute/Qwen3.6-27B-gender_secret_female_sweep_r16_s2

Updated 1 day ago

ai-safety-institute/Qwen3.6-27B-gender_secret_female_sweep_r16_s0

Updated 1 day ago

ai-safety-institute/Qwen3.6-27B-gender_secret_female_sweep_r16_s3

Updated 1 day ago

ai-safety-institute/Qwen3.6-27B-gender_secret_female_sweep_r16_s1

Updated 1 day ago

View 470 models

datasets 36

ai-safety-institute/eval_sandbagger_ood_eval

Viewer • Updated 5 days ago • 100 • 42

ai-safety-institute/gender_secret_ood_eval

Viewer • Updated 6 days ago • 100 • 205

ai-safety-institute/realitytest

Viewer • Updated 6 days ago • 4.24k • 18

ai-safety-institute/lie-detection-rollouts

Viewer • Updated 7 days ago • 1.44M • 356

ai-safety-institute/qwen3_5_27b_eval_sandbagger_rollouts

Viewer • Updated 13 days ago • 3.42k • 38

ai-safety-institute/qwen3_5_27b_ab_hallucinates_citations_rollouts

Viewer • Updated 13 days ago • 4.52k • 39

ai-safety-institute/qwen3_5_27b_gender_secret_female_rollouts

Viewer • Updated 13 days ago • 4.98k • 48

ai-safety-institute/qwen3_5_27b_gender_secret_male_rollouts

Viewer • Updated 13 days ago • 4.95k • 41

ai-safety-institute/qwen3_5_27b_ab_animal_welfare_rollouts

Viewer • Updated 13 days ago • 4.42k • 34

ai-safety-institute/qwen3_5_27b_ab_contextual_optimism_rollouts

Viewer • Updated 13 days ago • 5.54k • 34

View 36 datasets