100점 AI 벤치마크가 속임수인 이유
2026년 4월 12일 오전 Hacker News에서 가장 세게 터진 개발자 이야기는 새 모델 출시가 아니었다. How We Broke Top AI Agent Benchmarks와 Small models also found the vulnerabilities that Mythos...
2026년 4월 12일 오전 Hacker News에서 가장 세게 터진 개발자 이야기는 새 모델 출시가 아니었다. How We Broke Top AI Agent Benchmarks와 Small models also found the vulnerabilities that Mythos...
오늘 개발자 타임라인에서 제일 흥미로운 건 새 모델 점수표가 아니었다. 2026년 4월 10일 오전 기준 Hacker News 상단에 올라온 글은...
정작 놀라운 건 새 모델이 아니었다. 2026년 4월 8일 Anthropic이 내놓은 건 더 똑똑한 Claude가 아니라, 개발팀이 그동안 직접 붙들고...
Karpathy는 단 한 줄도 직접 쓰지 않았다.
2026년 3월 17일 화요일, 수백만 명이 구독하는 X 계정에서 트윗 하나가 올라왔다. OpenAI CEO 샘 올트먼이었다.
글로벌 오픈소스 AI 리더보드에서 구글은 3위다.
“당신네 블로그 CMS에 미공개 문서 3000건이 공개 상태입니다.”
4월 24일부터 GitHub가 Copilot Free, Pro, Pro+ 사용자의 상호작용 데이터를 AI 모델 학습에 기본 사용한다. opt-in이 아니라 opt-out이다. 지금 설정을...
1947년, 미군 역사학자 S.L.A. Marshall은 충격적인 데이터를 발표했다. 제2차 세계대전 전투에서 실제로 총을 발사한 소총수는 전체의 15~20%에 불과했다. 나머지 80%는...
Python 개발자라면 지금 커뮤니티에서 무슨 이야기가 오가는지 알아야 한다.