Seongryong Jung's picture

Seongryong Jung

SeongryongJung

·

https://sites.google.com/view/seongryongjung

AI & ML interests

Post-training, Knowledge Distillation, Self-Evolving AI

Recent Activity

updated a dataset about 7 hours ago

SeongryongJung/powerplant-shortqa-rows-4001-5000

published a dataset about 7 hours ago

SeongryongJung/powerplant-shortqa-rows-4001-5000

updated a collection 1 day ago

S³FT Medical Adaptation: Qwen3-4B on MedMCQA

View all activity

Organizations

SeongryongJung 's models 25

SeongryongJung/llama2-7b-medmcqa-30k-s3ft-base-rkl-beta0.3-lora

Updated 1 day ago • 19

SeongryongJung/llama2-7b-medmcqa-30k-s3ft-adaptive-hardgrow-base-rkl-beta0.3-lora

Updated 1 day ago • 22

SeongryongJung/llama2-7b-medmcqa-10k-s3ft-adaptive-hardgrow-base-rkl-beta0.3-lora

Updated 1 day ago • 22

SeongryongJung/llama2-7b-medmcqa-10k-asft-lora

Updated 1 day ago • 22

SeongryongJung/llama2-7b-medmcqa-30k-s3ft-adaptive-confidence-mix-minhard0.1-base-rkl-lora

Text Generation • Updated 1 day ago • 13

SeongryongJung/llama2-7b-medmcqa-30k-s3ft-adaptive-softdecay-base-rkl-beta0.3-lora

Text Generation • Updated 2 days ago • 17

SeongryongJung/llama2-7b-medmcqa-10k-s3ft-adaptive-softdecay-base-rkl-beta0.3-lora

Text Generation • Updated 2 days ago • 17

SeongryongJung/llama2-7b-medmcqa-30k-asft-lora

Text Generation • Updated 2 days ago • 18

SeongryongJung/llama2-7b-medmcqa-30k-lora-dft

Text Generation • Updated 2 days ago • 12

SeongryongJung/llama2-7b-medmcqa-30k-lora-sft

Text Generation • Updated 2 days ago • 14

SeongryongJung/llama2-7b-medmcqa-10k-lora-s3ft-base-rkl-beta0-1

Text Generation • Updated 2 days ago • 11

SeongryongJung/llama2-7b-medmcqa-10k-lora-sft-kl-default

Text Generation • Updated 3 days ago • 13

SeongryongJung/llama2-7b-medmcqa-10k-lora-s3ft-base-fkl-beta0-3

Text Generation • Updated 3 days ago • 12

SeongryongJung/llama2-7b-medmcqa-10k-lora-s3ft-base-rkl-beta0-3

Text Generation • Updated 3 days ago • 13

SeongryongJung/llama2-7b-medmcqa-10k-lora-dft

Text Generation • Updated 3 days ago • 15

SeongryongJung/llama2-7b-medmcqa-10k-lora-sft

Text Generation • Updated 3 days ago • 15

SeongryongJung/qwen3-4b-medmcqa-10k-asft

Text Generation • 4B • Updated 3 days ago • 14

SeongryongJung/qwen3-4b-medmcqa-10k-dft

4B • Updated 3 days ago • 14

SeongryongJung/qwen3-4b-medmcqa-10k-sft

4B • Updated 3 days ago • 15

SeongryongJung/qwen2.5-1.5b-base-mmlu-sft-1epoch

2B • Updated 19 days ago • 15

SeongryongJung/qwen2.5-0.5b-ifeval-mixed-kd-alpha05

Text Generation • 0.6B • Updated 21 days ago • 218

SeongryongJung/qwen2.5-0.5b-ifeval-pure-kd

Text Generation • 0.6B • Updated 21 days ago • 224

SeongryongJung/qwen2.5-1.5b-ifeval-halfepoch-sft

Text Generation • 2B • Updated 21 days ago • 224

SeongryongJung/qwen2.5-0.5b-ifeval-halfepoch-sft

Text Generation • 0.6B • Updated 21 days ago • 224

SeongryongJung/Qwen3-0.6B-DPO-adapter

Text Generation • Updated Mar 20 • 2