블로그
AI 트렌드, 논문 딥다이브, 의료 AI 비즈니스, 웹/클라우드/인프라를 다룹니다.
AI기본법, 의료 AI 기업에 실제로 달라지는 것들
2026년 1월 시행된 AI기본법에서 보건의료가 고영향 AI로 분류되면서, 의료 AI 기업이 갖춰야 할 투명성과 안전성 의무를 정리합니다.
AI 활용법의 진화, 프롬프트에서 하니스까지
같은 AI 모델로 10배 차이가 나는 이유. 프롬프트 엔지니어링에서 컨텍스트 엔지니어링을 거쳐 하니스 엔지니어링까지, AI 활용법 진화의 맥락을 짚습니다.
AI 에이전트 하니스 해부: 네 가지 구성 요소로 보는 전체 지도
하니스 엔지니어링의 내부를 네 가지 영역으로 분해합니다. 아키텍처 제약, 피드백 루프, 워크플로우 제어, 개선 사이클이 어떻게 맞물려 돌아가는지 사례와 데이터로 짚습니다.
에이전트를 가두는 기술: 린터, 도구 제한, 편집 포맷
린터, 도구 제한, 편집 포맷. 에이전트가 실수할 수 있는 표면적을 줄이는 아키텍처 제약을 기술적으로 해부합니다.
했는데 괜찮은가: 피드백 루프의 세 가지 시간 범위
밀리초 단위의 즉시 검증부터 세션을 넘어 축적되는 기억까지, 피드백 루프의 세 가지 시간 범위를 사례와 데이터로 해부합니다.
어떤 순서로 얼마나 쪼갤 것인가: 워크플로우 제어의 세 축
수직 분해, 수평 배치, 시간 관리. 에이전트 작업을 설계하는 세 가지 핵심 축을 Anthropic, Stripe, Manus의 실전 사례와 구현 세부로 풀어봅니다.
하니스를 고치는 하니스: 관찰, 판단, 실행의 개선 사이클
AI 생성 코드는 인간보다 이슈가 1.7배 많다. 관찰, 판단, 실행이라는 세 단계로 하니스 개선 사이클을 설계하는 구체적 방법론을 다룹니다.
5분이면 시작한다: 실전 하니스 구축 가이드
동일 모델에서 6.7%를 68.3%로 끌어올린 건 코드가 아니라 환경이었다. 5분부터 반나절까지, 네 단계로 하니스를 직접 쌓는 실전 가이드.
AI 의료기기 1,016개, 근거 피라미드 꼭대기에 선 제품은 몇 개인가
FDA 승인 AI 의료기기 1,016개 중 RCT를 거친 건 2% 미만. 근거 피라미드 구조와 각 제품이 올라선 높이를 분석한다.
HeartFlow FFRCT: NEJM과 Nature Medicine이 검증한 심혈관 AI 10년
다기관 RCT에서 심근경색 41% 감소, NHS 9만명 실사용 데이터에서 심혈관 사망률 14% 감소. HeartFlow FFRCT가 근거 피라미드 꼭대기에 오른 과정을 해부한다.
IDx-DR, 의사 없이 진단하다: 최초 자율진단 AI의 임상 근거 8년
FDA 최초 자율진단 AI IDx-DR의 피벗 트라이얼부터 2026년 실사용 연구까지, 8년간 쌓인 임상 근거를 해부합니다.
루닛 INSIGHT, 논문 100편으로 쌓아올린 임상 근거의 해부학
Lancet Digital Health에 실린 세계 최초 전향적 유방암 검진 AI 연구부터 FDA Breakthrough Device까지, 루닛이 임상 근거를 쌓아온 전략을 해부한다.
Paige AI, 병리의 눈을 바꾸다: De Novo 승인에서 Tempus $81M 인수까지
최초의 병리 AI FDA 승인부터 Tempus의 $81M 인수, Paige Predict 출시까지. 디지털 병리 AI의 임상 유효성과 시장 구조를 해부합니다.
Viz.ai, 메타분석 15,595명이 증명한 31분의 기적
FDA 최초 AI 뇌졸중 triage를 받은 Viz.ai가 7년 만에 메타분석 정상에 올랐다. 12개 연구 15,595명이 보여준 치료시간 단축의 실체를 해부한다.
[Vibe Stack #6] 회원 정보는 어디에 저장하지? DB 고르는 법
회원 정보, 게시글, 설정값을 어디에 저장하지? SQL과 NoSQL 차이부터 호스팅 DB 선택까지 엑셀 비유로 풀어봤습니다.
[Vibe Stack #5] API 키를 GitHub에 올려버렸다면
.env 파일이 뭔지, 왜 API 키를 코드에 직접 넣으면 안 되는지 금고 비유로 풀어봤습니다.
[Vibe Stack #4] 코드에 fetch가 있는데, 이게 뭘 하는 거야?
OpenAI API를 호출하려는데 fetch, GET, POST가 뭔지 모르겠다면. 식당 주문서 비유로 풀어봤습니다.
[Vibe Stack #7] 브라우저에 '주의 요함'이 뜨는 이유
배포했더니 '주의 요함'이 뜬다면. HTTPS와 SSL 인증서를 엽서와 봉인 편지 비유로 풀어봤습니다.
코딩 에이전트가 팀을 이룬다: Claude Code Agent Teams 실전기
바이너리에서 발견된 멀티 에이전트 기능이 공식 출시됐다. 왜 에이전트 하나로는 부족한지, 실제로 블로그를 찍어내는 파이프라인은 어떻게 돌아가는지, 비용은 얼마나 드는지 솔직하게 풀어본다.
프롬프트에서 하니스로: AI 코딩의 승부처가 바뀌고 있다
OpenAI가 코드 한 줄 안 쓰고 100만 줄을 만든 방법, 그리고 한 개발자가 $300으로 15개 모델 성능을 10배 올린 실험. 2026년, 모델이 아니라 모델을 둘러싼 환경이 결과를 결정한다.
[Vibe Stack #2] A 레코드를 설정하세요, 라는데 그게 뭔데?
커스텀 도메인을 연결하려는데 DNS 설정이 뭔지 모르겠다면, 네비게이션 비유로 쉽게 풀어봤습니다.
[Vibe Stack #3] 서버가 필요하다는데, 서버가 뭔데?
코드는 짰는데 서버가 필요하다고? 공유 주방 비유로 서버리스를 쉽게 풀어봤습니다.
[Vibe Stack #1] localhost:3000을 카톡으로 보냈더니 안 열린다고? 배포 플랫폼 제대로 고르는 법
Cursor, Claude Code로 만든 앱을 어디에 올릴지 모르겠다면. Vercel, Netlify, Cloudflare Pages, Railway, Render 다섯 곳을 앱 유형별로 정리했다.
NotebookLM이 달라졌다: '요약 도구'에서 '리서치 허브'로
Google이 NotebookLM을 뜯어고쳤다. Gemini 3 엔진, 100만 토큰 컨텍스트, 한국어 Video Overview, Data Tables, Gemini 앱 연동까지. 문서 요약기에서 리서치 작업 공간으로 탈바꿈한 전체 그림을 짚는다.
두 개의 Softmax를 빼면 노이즈가 사라진다, Differential Transformer 분석
어텐션 맵 두 장의 차이를 구하면 노이즈가 상쇄된다. 노이즈 캔슬링 헤드폰과 같은 원리로 self-attention의 고질적 문제를 해결한 ICLR 2025 Oral 논문을 분석한다.
수식 한 줄이 어텐션 싱크를 없앴다: NeurIPS 2025 최고 논문 분석
Softmax 어텐션 출력에 sigmoid 게이트를 하나 곱하면, 8년 된 구조적 결함이 사라진다. Qwen 팀이 30개 모델 변형, 3.5조 토큰 실험으로 이를 증명했다. NeurIPS 2025 Best Paper를 받은 Gated Attention을 분석한다.
MedCoG: 의료 LLM은 '언제 생각할지'를 알아야 한다
LLM의 메타인지로 의료 추론 효율을 5.5배 높인 MedCoG. 더 많이 생각하는 대신, 언제 생각할지를 판단하는 프레임워크를 분석한다.
Recursive Language Models: 컨텍스트 윈도우를 넘어서는 재귀적 접근
MIT 연구진이 제안한 RLM은 프롬프트를 파이썬 변수로 저장하고 LLM이 스스로 재귀 호출하며 탐색하게 한다. 1,000만 토큰도 성능 저하 없이 처리한다.
작은 모델도 생각할 수 있다: Blueprint와 Prompt Template Search로 소형 LLM의 추론 능력 끌어올리기
3.8B 파라미터 모델도 제대로 된 프롬프트만 주면 수학·코딩·논리 문제를 풀 수 있다. 마이크로소프트 연구팀이 제안한 Blueprint + Template Search 프레임워크가 소형 LLM 추론의 판을 바꾸는 방법.
쓰리빌리언, 희귀질환 AI 진단으로 미국 시장을 노린다
서울대병원 3,317명 임상에서 진단율을 14.6%p 끌어올린 쓰리빌리언이 텍사스 오스틴에 랩을 짓고, 미국 보험 급여 시장에 본격 진입한다.
AI 의료기기 1,016건 중 LLM은 0건: FDA가 생성형 AI를 승인하지 못하는 구조적 이유
FDA 승인 AI 의료기기 1,016건 중 LLM은 0건. 환각, 비결정론적 출력, 버전 드리프트가 만든 규제 공백과 한미EU의 서로 다른 해법을 분석한다.
Claude Code, OpenCode, OMCC, OpenClaw: 이름만 비슷한 AI 코딩 도구 5종, 뭐가 다를까
Claude Code, OMCC, OpenCode, Oh My Open Code, OpenClaw. 검색창에 하나만 치면 나머지 넷이 따라온다. 한 집안 형제 같지만 하는 일은 전혀 다르다. 3계층으로 나눠 정리한다.
Gemini 3.1 Pro: 벤치마크 1위가 곧 실전 1위는 아니다
Google이 Gemini 3.1 Pro를 내놨다. Deep Think의 추론 엔진을 범용 모델에 이식한 첫 0.1 단위 업데이트. 벤치마크 숫자는 인상적이지만, 전체 그림은 좀 다르다.
매출 495% 폭증, 의료 AI 첫 흑자: 씨어스테크놀로지는 어떻게 판을 바꿨나
한국 의료 AI 업계에서 연간 흑자를 찍은 기업이 처음 나왔다. 루닛도 뷰노도 아닌 씨어스테크놀로지. 매출 482억원, 영업이익 163억원. 그 중심에는 병상 옆 웨어러블 센서가 있다.
이진 토큰으로 이미지를 만든다, BitDance가 VQ 코드북 7년 천하에 던진 도전장
VQ 코드북 8,192가지 대신 0과 1만으로 이미지를 표현하면? ByteDance Research가 내놓은 BitDance는 이진 토큰으로 AR 이미지 생성 최고 기록(FID 1.24)을 갈아치웠다.
1,714억 투자하고 수가는 2,920원: 한국 의료 AI 산업의 구조적 모순
2026년 의료 AI에 1,714억원을 투입하지만 건보 수가는 1군 기준 2,920원. 개발부터 인허가까지 마친 끝에 돌아오는 금액이 커피 한 잔 값인 구조적 모순.
식약처, PCCP + 실시간학습 가이드라인 동시 발표: 한국 AI 의료기기 규제의 분기점
FDA·EU·식약처가 2월 한 달 사이 AI 규제 카드를 동시에 꺼냈다. 식약처는 PCCP와 실시간학습 알고리즘 가이드라인을 이틀 간격으로 공개했다.
로킷 헬스케어, AI 역노화 Cell-Neuron 출시: 바이오프린팅이 SaMD를 만날 때
코스닥 상장사 로킷 헬스케어가 AI 역노화 물질 Cell-Neuron을 출시하고 중국 WEGO와 장기재생 플랫폼 협약을 맺었다. 영상진단 바깥의 SaMD가 열리고 있다.
AI 코딩 도구 전쟁: 같은 주에 터진 세 사건이 말해주는 것
Sonnet 4.6이 Opus급 성능을 1/5 가격에 내놓고, Codex-Spark가 1000 tok/s로 실시간 코딩을 열었으며, Amazon은 개발자 80%에게 AI 코딩을 의무화했다. 한 주에 벌어진 세 사건이 가리키는 방향.
OpenClaw 창시자가 OpenAI로 간 이유, 그리고 우리에게 남은 질문
아침에 눈을 뜨면 메신저에 메시지가 와 있다. 보낸 건 동료가 아니라 AI다. GitHub 스타 19만 개를 찍은 오픈소스 프로젝트의 창시자를 OpenAI가 데려간 배경.
CARE-RFT: 추론 잘하는 모델이 거짓말도 잘하는 이유, 그리고 해법
RFT로 추론 능력을 끌어올린 모델일수록 hallucination도 따라 오른다. UT Austin 연구팀이 loss function의 정규화 항 하나를 바꿔 이 트레이드오프를 줄인 방법.
510(k) 면제와 CDS 완화, 그리고 EU의 다른 선택
FDA는 방사선 AI 기기의 사전심사 면제를 검토하고 CDS 소프트웨어 규제를 완화했다. 같은 시기 EU는 AI 의료기기 변경 관리 요건을 강화했다.
루닛 831억, 뷰노 348억: 매출은 늘었는데 흑자는 언제?
한국 의료 AI 양대 상장사가 나란히 역대 최대 매출을 찍었다. "역대급 실적" 뒤에 숨은 방정식이 생각보다 복잡하다.
PathAI Prostate, 510(k)와 PCCP를 동시에 받다: 전립선 병리 AI의 다음 수순
PathAI의 전립선 생검 AI가 FDA 510(k) 승인과 PCCP 승인을 동시에 받았다. 95% 이상의 정확도, 그리고 더 주목할 대목.