Loading views...

ICLR 2026 Workshop second

Date
Date
2026 Apr 27 0:0
Created by
Created by
Seonglae ChoSeonglae Cho
Created time
Created time
2026 Apr 26 12:16
Last edited by
Last edited by
Seonglae ChoSeonglae Cho
Last edited time
Last edited time
2026 May 26 0:6
Refs
Refs
리우 살며 오만 이동 하며 멀미에 나름 적응이 되나 싶었지만 오늘은 레전드였다. 안그래도 혼자 가는데 아침에 나름일찍 피곤하게 일어나 가는데 버스도 안잡혀 빡쳐 알고보니 취소되고 두번째 우버는 망할 에어컨도 안되는 것이다. 가는날이 장날이라고 중요한 날에 차도 막히고 공사때문인지 사고때문ㄴ지 bottleneck 으로 거의 1시간 넘게걸려 도착한다. 그래도 도착한 든든지쿤과 포스터 설치해놓고 설명도 하며 구경도 다니고 한다. 워크샵 발표하며 안게된 점은 oral 말고 크게 의미는 없으며 포스터 설치 만 해두면 앞에 대기하면서 설명하는거보다 그렇게까지 큰 의미는 없다는 점이다. icml workshop 에서는 굳이 메인 타임 말고는 집착 안해도될수도. 여튼 민세원 교수님 수업도 잘듣고 사진도 마지막에 찍고 pdh 동현이 router 남상대님 얘기도 하며 성공했다 해야하나 대단한 사람들의 특징 중 하나인 철저한 자기규칙을 다시 발견한다. 놀란점은 심지어 둘만 있는 자리에서도 영어를 쓴다거나 자신이 적극 참여안한 논문에서는 coauthor 거부한다거나 한다는 건 인상적이었다. 그직후 동현이랑도 중요했던 통화를 하나 했는데 neuirps까지 이어지는 coresearch 위해 두가지 agent 흥미로운 주제에 관해 얘기햇다. paat 와 agentroom 을 보내보고 같이 할까 한다. 나중이지만 alan sun 에게 math interpretability 보내지 못한 이유는 상대가 너무 과한 지식이나 정확한 비평성을 특징으로 남에게 인식이 될때 제안단계의 걸림돌이 될수도 있겠다 싶다. 나도 남에게 그렇지 않도록 잘 튜닝해야겟다 싶었고. 이후 한국 분들과 저녁도 먹고 커피콩도 사고 재밌게 대학원 유학 문화를 체험한다음 쇼핑좀 하다 아쉬운 도서관에서의 또다른 선택 혹은 옳은 선택을이후 빗길에 집으로 잘 도착한다.
 

Yan Liu - actionable interpretability

  • feature interaction in accurate term - from 1840 long history ㅕㄴ구에서

Min sewon

  • modular moe modmoe - micro batch level lb heloops lb in general
    • but in this case global load balance helped that tricked the gtrianing better
  • selective expert use sewon min

question

intrerpretability 랑 perforamnce 동시에 가져가기가 쉽지 않는데 대단하다
안녕하세요 감사합니다 유명하신분
interepretability 위한거같은데 이쪽연구를 많이 하는지
expert activation vector가 뭔지 clustering ask claude
혹시 남상대 moe sae 관련 연구 말해본적있는지 - 김동현
6d 에서 lllm 하셨던거
gradient routing 같은거에 대해선 어떻게 생각하나
phd 혹시 모집한다면 12월
혹시 링크드인이나
결mar
 
 
 
 
 

Recommendations