열심히 요즘회사일하고 reserach 동시에 하는데 citation 도 드디어 생겻다.
Mechanistic Indicators of Steering Effectiveness in Large Language Models
Activation-based steering enables Large Language Models (LLMs) to exhibit targeted behaviors by intervening on intermediate activations without retraining. Despite its widespread use, the...
https://arxiv.org/abs/2602.01716

첫 내논문 citation이라니 좋긴하다 rotation steering 컨셉도 좋고 뿌듯하다. 며칠 안지나서 갑자기 어디서 업뎃된건지 libvulnwatch, rtsum citation 도 하나 생겼다. 그리고 나서 rtsum 도 feb 21일인가 또추가. 점점 exponential 늘어날거라곤 햇는데 생각보다 빨리 feedback이 또 오는거같아서 좋다.
ai agent audit 하는 agent reserach 를 agent 한테 시키고 있는데 이 reserach feedback 을 다시 agent 에게 받음 하는 웃긴 상황도 요즘
Seonglae Cho