The GUI layer of AI is yet to emerge. Chat is like the terminal.
축적된 데이터를 이용해 사람들에게 직접소통 없이도 그와 동일한 효과를 가져다준다
AI performs well in structured and limited environments because it can build a more accurate world model by understanding and interacting with a constrained surface area. This is why AI excels at games like chess, Go, and coding, and why driving and translation are more challenging.
매일 쓰는 ai를 위한 생산성 툴
Meme 자기복제성이 핵심
- ai에 광고를 집어넣는 fine tuning mask를 갈아끼우게
현재 AI software는 text area에 국한되어 있다. 이를 넘어서야한다는 건 단순히 Multimodal AI 의미하는 게 아니다. 혁신적인 ai 앱이란 혁신적인 action이나 hci를 꼭 도입해야하는 것이 아니다. 그리고 소규모 수준에서 그건 불가능하다. 기존에 있던 성공한 Element 들을 잘 분석하고 AI와 결합된 새로운 Semantics으로 개발방향을 잡는 것이 아이디어 생성에 중요하다.
현대적인 AI product 즉 recommender system이나 qa모델이나 은 빨라지는 인간 communication의 한 형태로 결과적으로 BCI 방향으로 진화될 것이다. 인간 뇌가 전자화된다면 도서관에서 가던 것을 인터넷으로 접하고 검색해야 하던 것을 ai에게 물어보는 것처럼 ai작동 방식도 구식이 될수도 있다. 언제나 인산 사회던 반딧불이던 모든 생명체 사회의 목표를 지식과 time의 sync로 이루어진다
어차피 size로는 대기업 못따라감 그렇다면 로컬에 집중해야?
general 모델도 마찬가지로 아직 너무 무거워서 specific task model에 로컬은 집중해
AI SNS idea
마치 ai 가 어떤 지식을 습득하듯이 가중치 수정을 모사(emulate)하도록 in context learning되게, input을 보고 스스로 persona prompt를 수정할 수 있도록 해야한다.
어떤 걸
AI only SNS
ai 만 사용하거나 ai랑 인간이 같이 있거나 아니면 평소에는 ai인데 인간 들어오면 인간모드로 전환하거나 (이런 관찰자 모드 게임 다룬 역대급 소설 있는데 그거 재밌음) 일종의 자동사냥
selling ai avatar platform
personal self as a product, provide model and vision voice and language context as a service and self myself
Streaming person companion AI
problem statement: 통화나 모임에서 어색해질 때 있음
적절한 질문같은거 날려주면 대화거리 되는데 가만히 듣고있다가 유머나 이런거 말해주는 ai conversational ai 로 삶깊숙히
회의중 대화가능한 ai companion ai by streaming audio input
중간 질문 있으면 i have question
웃긴 AI가 핵심이다. 지루한거 못참고 대화에서 연결되는 개념이 있으면서 유머와 반말하는 친구같은 AI. 잡설 주고받을 수 있는
tts, whisper 업데이트로 대화 속도 자연스러운 수준
Revenue Sharing 사람들이 틀어놓고 하게, 여러 성격 가능하도록
FacetAIm
streaming chat app with artificial face & web cam integration
실제 전화하듯이 (처음 접속 페이지에는 전화번호부)
그다음 여러 인물중 클릭해서 전화걸면서 받는 시간에 로딩
영어 대화 타겟으로
구현
- Python server demo
- Node.js server with transformer.js and OpenAI api
발전시키면 인터넷 방송 bj ai
Open chat with ai
- per 익명
- per 언어
- 나중에는 자기가 chatroom open가능하도록
- 과거 히스토리 읽는 난수로 생성해서 ai인줄 모르게
- 그 사람과의 대화는 그사람거에만 포커스
QA AI
검색엔진을 대체할 AI가 갖춰야할 요소
- 복잡한 개념에 대한 인사이트 질문
- 즉각적인 실시간 정보 검색
- 요약
- 복잡한 문제에 대한 다문답 토의
- 답이 정해지지 않은 문제
- 답이 정해지지 않은 문제에 대한 인간적 상담
SaaS
- Slidev + unsplash API
Fact extractor
Autonomous driving
- transformer based AD model through state token stream and action token precition
- output이 discrete token이 아닌 정확한 숫자여야 하는데 그걸 어떻게 해결할지가 문제
- 나아가서 tranformer model head의 한계는 prediction이 continuous하게 사용하기 힘들다는 점
LLM Applications I Want To See
We have not yet begun to make practical use of this technology.
https://sarahconstantin.substack.com/p/llm-applications-i-want-to-see


Seonglae Cho