Loading views...

Instrinsic SAE 하며 Mickey17 at Leicester

Date
Date
2025 Mar 6 0:0 → 2025 Mar 7 0:0
Created by
Created by
Seonglae ChoSeonglae Cho
Created time
Created time
2025 Mar 8 1:8
Last edited by
Last edited by
Seonglae ChoSeonglae Cho
Last edited time
Last edited time
2025 Aug 25 12:42
Refs
Refs
아침은 언제나처럼 요거트먹고 커피 그라인더 성능도 좋다. 점심에는 남은 요크셔 푸딩에 돼지고기 해먹는다. 날씨도 좋고 사진도 많이 찍고 수업 복습 조금에 RL research plan 적느라 시간 다간다 오후는. 날씨도 좋고 쇼핑 좀 해와서 쓰진 않았지만 파스타 계획대로 해먹는데 점심 남은 고기 볶고 최근 토마토 파스타 오일로한거 만들어보는데 맛나긴 한다. 다음에는 양을 적게 하고 오일 많이 넣고 엔초비 2마리보다 많이 넣어도 될듯 ? 참치액젓을 좀 넣거나 2마리에. 여튼 고기빨로 저녁먹고 사온 딸기 크림 하겐다즈 먹는데 생각보다 너무 맛있다 크림 들어가서 그냥 딸기아스크림보다 훨부드러움. 스타쉽 8차인가 7차인가는 실패하고 저녁에는 내일 카렌 회의 위해 snlp intrinsic ai 실험 열심히 하는데 memory 오류랑 llama dataset to hf 하고 token config 랑 이것저것 돌려보며 훈련준비한다. 훈련하는데 메모리 문제 계속 발생하고 batch config 종류가 많아서 해결하는데 한참 걸린다.
아침에 일어나서 다시보니 겨웅 model batch 가 실제 배치인거 깨닫고 batch size / seq_len 가 아마 토큰배치? 말하는거같은데 다시 보긴 해야할듯. 문제는 batch_size 를 seq_len 보다 작게 줘버려서 dimension 0 된어 reshape 오류가 나는 거였고 메모리는 bfloat16 으로 모델 로딩하는 것으로 해결했다 (그거 아니면 아예 로딩도 안되는게 ㄷㄷ) 그리고 load 할대 device 랑 dtype 주니 훨씬 빨리 로딩되는게 좋긴 하더라 disk bottleneck인줄?
그래서 아침수업은 스킵했지만 snlp ppt list 도 찾고 커피도 잘 내려먹고 아이스크림으로 아침 먹는것도 새로운데 맛있다. 웨이트로즈에서 어제 산 그래놀라 생각보다 너무 달아서 맛있긴 하다 ㅋㅋㅋ 이게 그래놀라지. 여튼 더러운 키친에 날파리 너무 많고 주방 개더러운 중국인들 진짜 개패서 교육하고싶다. 여튼 시간 금방 지나 흥미로운 1e7 훈련 결과 얻고 날좋은 분수 지나 회의 딱시간 라면겨우 먹고 도착한다. 회의는 잘 30분컷 하고 나와서 거의 1시간 토론하는데 16도로 올라간 런던에서 추울 정도로 차가운 이성이 지배한 대화였다. 여튼 좋았다는 말이고 이런저런 아이디어 나와서 방향성이 명확히 잡힌거같다. 추워서 또 회의끝나고 집갔다 올까 하다가 ppt 도 philip 한테 보내야 해서 torrington 오랜만에 또 가서 teams로 보내고 이것저것 아이디어랑 메일정리 하다보니 민이 볼 시간 다되었다.
미리 레스터 도착해서 기다리다가 핸드폰 채갈까 민이도 좀 늦고 해서 스시 드래곤롤 하나 집어먹는데 크래미 너무 많아서 2.39 파 값은 못하더라 알바 웃음에 넘어갔다니. 다음에는 무조건 옆에 냉면구이 먹어야겠어. 민이 이쁘게 입고온 옷과 같이 중식당 four seasons 가는데 생각보다 비싸고 char siu 는 맛있긴 하지만 또 환상은 아니다. 야채 반찬들이 너무 비싸서 다시는 안올듯? 진리가 질려서 안간건데 진리가 괜찮은 수준이었다. 뒤에 디저트 말차 아이스크림은 너무 맛나고 텁텁하지 않고 가져운데 진한 말차 내취향이다. 영화는 직설적이고 우연이겠지만 트럽프랑 너무 겹쳐서 영화를 있는 그대로 보기가 힘들어 평이 갈리는듯? 괴물이나 설국열차 옥자 생각하면 기생충이 오히려 덜 봉준호같은거고 이게 오히려 봉준호같은 영화다 싶긴 했다. 선악이 명확하게 나뉘고 직설적인 영화가 내스타일이 아니었지만 가장 불호는 그냥 기계 폭발 엔딩이었다. 나는 저렇게 반기술주의로 끝나거나 휴머니즘이랍시고 책임을 가장 쉽게 회피하는 것을 싫어하기에 더 좋은 방식이 충분히 많았을거라 생각한다. 바로 10분동안 서울플라자 쇼핑도 즐기는데 나름 다양한 라면부터 아이스크림하고 밀떡 존재 등 확인하고 이쁜옷과 이쁜민 춤도보고 집 잘와서 좀 쉬다 이제자려한다.
 
 
 
 
 
 
 

 

Recommendations