AttentionX

동아리에 참여하고 싶은 목적 / 하고 싶은 활동*

Mechanistic Interpretability에 기반하여 LLM의 작동 원리를 이해하고, 그를 이용해 LLM 작동을 개선할 방법 고안

내가 동아리에 기여할 수 있는 점*

Interpretable AI, 즉 AI 블랙박스 내부의 구조를 이해하려는 시도는 AI 분야에서 주요 관심사입니다. 저는 이러한 AI 작동에 대한 심층적인 이해가 AGI의 잠재적인 위협에 대한 실질적인 염려를 없앨 수 있는 가장 가능성 있는 후보 중 하나라고 생각하며, AI의 내부 메커니즘을 밝히는 것에 집중하여 연구하고 있습니다.

최근 Interpretable AI 분야, 특히 수학적 접근을 기반으로 하는 Mechanistic Interpretability는 Anthropic AI의 트랜스포머 모델에 대한 계산적인 해석 가능성에 대한 연구 이후, Anthropic에 의해 주도되고 있습니다. 영향력 있는 AI 기업 중 하나인 Anthropic AI가 이 분야에 집중하여 연구하는 이유는 LLM의 기본 능력을 컴퓨팅에 기반하여 이해할 수 있기 때문입니다. 예를 들어, attention head의 역할을 In-context learning의 LLM에서의 발현 관점으로 해석하거나, LLM의 feature를 MLP activation에서 분리해내는 연구가 있습니다.

저는 이러한 학술적 히스토리를 follow-up하고 저만의 insight로 재해석해 AGI Korea Facebook 그룹에 공유하며 Mechanistic Interpretability에 대한 이해를 키워가고 있습니다. AttentionX가 저와 같은 취지를 공유하며, 앞으로 더 중요해질 Mechanistic Interpretability에 대한 통찰과 LLM의 작동 원리를 한국 AI 커뮤니티 내에 공유하고 싶습니다. 더불어, 그런 인식을 바탕으로 LLM 작동을 개선하거나 컨트롤할 수 있는 방법을 뛰어난 동료들과 함께 연구하고 싶습니다.

AI 연구/개발 경험* 가장 의미 있다고 생각하는 순서대로 대표적인 프로젝트/논문 (1~3개)

학사 학위 중 연세대학교의 Data Intelligence Lab에서 인턴으로서, AI 요약을 해석 가능하게 만드는 연구를 해볼 기회를 가졌고, Interpretable AI에 대한 몰입은 AI 안에서 이루어지는 의사 결정 분석에 대한 연구로 이어졌습니다. 교수님과 연구는 Relation Triple 단위로 텍스트를 분해 후 재조합하는 방식으로 RTSum (Relation-Triple Summarization) 프레임워크 연구를 진행할 수 있었습니다. RTSum 훈련을 위한 데이터셋을 생성하고 훈련하는 과정을 거쳐 데모까지 만들어 논문을 NAACL 2024 컨퍼런스에 채택될 수 있었습니다. 이러한 경험은 연구 스킬뿐만 아니라 LLM에 기저에 있는 컴퓨팅을 더 깊게 이해해야 한다는 믿음도 강화하였습니다.

동일한 연구실에서 다음으로 진행한 연구는 ODQA(Open Domain Question Answering)였습니다. LLM이 질문에 대한 문맥을 읽기 전에 요약하거나 재작성하여 더 답하기 쉽도록 집중된 context로 변환하는 연구를 고안하였습니다. Inference 서버와 벡터 데이터베이스를 활용하여 21M에 달하는 Wikipedia를 빠르게 인덱싱하여 아이디어를 검증할 수 있었습니다. Baseline에 비해 4% 높아진 성능을 보였지만, 연구 도중 비슷한 논문들이 제출되어 차별성을 주기 어려웠기 때문에 논문을 작성할 수는 없었습니다. 그럼에도 기술적인 엔지니어링의 발전과 직접 고안한 아이디어가 의도한 대로 작동한다는 증명을 얻었습니다.

연구뿐만 아니라 산업적으로 프로젝트를 개발하며 팀을 리딩해본 경험은 MBTI GPT입니다. 미래의 영향력을 위해 적어도 비즈니스 사업을 AI 서비스를 통해 시작해보아야 한다고 생각했기에, 시대적 관심사와 현대 LLM이 할 수 있는 일을 조합하였습니다. 단순한 형태의 Chatbot이 아니라 MBTI 성격 분석을 채팅 내역으로 할 수 있다는 것을 파악하고, 개인사업자 등록부터 토스 결제 API 설정까지 진행하여 기업 수준의 AI 서비스를 구성했습니다. 다만 개인 채팅 정보를 제공해야 한다는 서비스의 특성에 맞물려 초기 사용자의 인기는 바이럴되지 못했지만, 1,000명 이상의 분석을 1달 안에 얻으면서 일부 결제를 통해 서비스 런칭 경험을 얻었습니다.

삶에서 가장 의미있게한 활동들* 개발 프로젝트, 동아리, 창업, 음악 등

3년 동안 모빌리티 산업의 스타트업과 대기업에서 일한 경험은 제 삶에서 가장 많은 기여를 할 수 있었던 기회였습니다. 먼저 2년 동안, 스타트업 스트리스에서 소프트웨어 엔지니어로 일하면서 자율주행 AI 데이터 프로세싱에 대한 이해를 얻었습니다. 센서 장비들을 직접 다루며 소프트웨어와 하드웨어를 연결하는 업무부터 시작하였습니다. 펌웨어를 다루면서 센서 퓨전에 대한 이해를 얻고 자율주행 데이터 파이프라인의 시작점을 파악할 수 있었습니다. 이후 파이프라인의 다음 단계인 벡터 지도 생성 프로젝트를 맡게 되면서, 전반적인 데이터 플로우에 대한 통찰을 얻었습니다. 이런 전체적인 이해를 바탕으로 파이프라인을 크게 개선할 수 있었고, 빠른 데이터 생성으로 한국 최초 자율주행 서비스 기업인 42Dot에 성공적으로 데이터를 납품할 수 있었습니다. 또한 제가 담당했던 지도 제작 서비스가 회사의 핵심 가치가 되어 카카오 모빌리티에 성공적으로 인수될 수 있도록 기여했습니다.

카카오 모빌리티에 인수된 후, 1년을 추가로 소프트웨어 엔지니어로 활동하였습니다. 이전 회사에서 지속해오던 지도 플랫폼의 개발을 주도하며 외부 ML 기능을 API로 통합하기 위한 프로토콜을 설계하기도 했습니다. 이러한 기여를 바탕으로 카카오 모빌리티의 자율주행 택시 운행을 접할 수 있었습니다. 실제 환경에서 작동하는 AI 서비스를 접하고 느낀 것은 데이터의 중요성과 데이터가 모델에 줄 수 있는 영향의 한계였습니다. 모델 내부의 작동을 파악하고 있어야 데이터를 제대로 알아낼 수 있고, 데이터 자체가 모델에 줄 수 있는 영향을 파악한 후, 회사를 나와 AI를 더 깊이 공부하면서 기여하기로 마음먹었습니다.

마지막으로 본인에 관해서 얘기하고 싶은점 가치관, 목표, 진로/계획, 의미있는 경험 등 (유니크한 점)

제 경력과 학술 연구 경험은 AI가 의도한 대로 작동하려면 내부 매커니즘에 대한 이해가 필요하다는 것을 알려주었습니다. 이를 위해 LLM 모델의 기본 컴퓨팅 유닛인 attention mechanism을 수학을 기반하여 기능적으로 파악하는 Mechanistic Interpretability에 대한 이해가 필요합니다. 이 분야는 앞으로 AI safety와 AI alignment에서 핵심적인 연구적 기반이 될 것입니다. 저는 제 능력을 바탕으로 앞으로 이 분야에 연구 목표를 가지고 활동할 것이며, 더 많은 사람들에게 더 안전한 AGI 발전을 위해 해당 분야의 지식을 알리려고 합니다.

AttentionX

Recommendations