Control RL Presentation

Creator
Creator
Seonglae ChoSeonglae Cho
Created
Created
2025 Jun 9 21:53
Editor
Edited
Edited
2025 Jun 9 21:53
Refs
Refs
지브리 캐릭터가 지금 논란이 되고 있는 것처럼 옮고 그름을 떠나서, 지브리 feature 가 있다면 이 explicit interpretability 로 간단하게 막도록 regulartion 할 수 있다. 즉 safety 란 역사적으로 결국 explicit 한 rule 로 성취되기에 interpretability 가 중요하다
 
  • LLM - Human Brain
  • Consciousness (Working Memory) - Context Window (Tokens)
  • Unconsciousness - Hidden Dimension
  • (We usually increase test time compute on consciourness, how about contro lunconciousness)
Let me know if you have any questions!
 
 
 
 
 
 
 

Recommendations