У нас вы можете посмотреть бесплатно [Paper Review] Reasoning with Sampling: Your Base Model is Smarter Than You Think или скачать в максимальном доступном качестве, видео которое было загружено на ютуб. Для загрузки выберите вариант из формы ниже:
Если кнопки скачивания не
загрузились
НАЖМИТЕ ЗДЕСЬ или обновите страницу
Если возникают проблемы со скачиванием видео, пожалуйста напишите в поддержку по адресу внизу
страницы.
Спасибо за использование сервиса ClipSaver.ru
발표자: 서울대학교 산업공학과 DSBA 연구실 석사과정 고재용 (jyko22@snu.ac.kr) 1. 논문 제목: Reasoning with Sampling: Your Base Model is Smarter Than You Think 2. 원문 링크: https://arxiv.org/abs/2510.14901 3. 인용 수: 5회(~2025.12.22) 4. 요약 Test-time Power Distribution 도입 : RL 없이도 베이스 모델의 likelihood를 활용한 Power Sampling 알고리즘을 통해 모델의 잠재된 추론 능력을 끌어낼 수 있음을 보여줌 MCMC Sampling : Monte Carlo sampling 알고리즘으로 낮은 비용으로 Power sampling을 구현함 실험 결과 : Training-free 방식이 MATH500, HumanEval 등의 벤치마크에서 GRPO와 같은 최신 RL 기법과 대등한 성능을 발휘하면서, Pass@k 성능을 통해 여전히 생성 다양성을 유지한다는 점을 보여줌