안녕하세요.
오늘은 지난 2025년 12월 30일, 서울 코엑스에서 있었던 대한민국 인공지능 역사에 남을 중요한 발표 내용을 정리해 드리려고 합니다. 바로 과학기술정보통신부와 NIPA가 주관한 '독자 AI 파운데이션 모델(Foundation Model)' 프로젝트의 1차 성과 발표회 소식입니다.
구글, 오픈AI 등 글로벌 빅테크에 종속되지 않고 우리만의 '소버린 AI(Sovereign AI)'를 갖추기 위해 출범한 이 프로젝트가 과연 어떤 결과물을 내놓았는지, 5개 컨소시엄별 특징과 허깅페이스(Hugging Face) 링크까지 핵심만 쏙쏙 뽑아 정리해 드립니다.

K-Foundation Model 사업 개요
이 사업의 정식 명칭은 '독자 AI 파운데이션 모델 확보' 사업입니다. 2025년부터 본격적으로 시작된 이 프로젝트는 단순한 모델 개발을 넘어, 한국의 데이터와 인프라를 바탕으로 기술 주권을 확보하는 것을 목표로 합니다.
- 목표: 글로벌 최고 수준 AI 모델 대비 95% 이상의 성능 확보 및 2026년 상반기 내 오픈소스 공개
- 지원 규모: 데이터 구축(628억 원), GPU 컴퓨팅 자원(1,576억 원) 등 대규모 예산 투입
- 핵심 전략: 정부가 인프라와 자금을 대고, 민간 기업이 기술력을 합쳐 '국가대표 AI'를 만드는 민관 합작 프로젝트
5개의 컨소시엄
이번 프로젝트에는 국내 내로라하는 AI 기업들이 총출동했습니다. 치열한 경쟁 끝에 선정된 5개의 '정예팀'은 다음과 같습니다.
- 네이버클라우드 컨소시엄: '하이퍼클로바X'의 노하우를 보유한 네이버를 주축으로 서울대, 카이스트 등 학계와 협력하여 범용적이고 접근성 높은 모델을 개발합니다.
- LG AI연구원 컨소시엄: '엑사원(EXAONE)'을 기반으로 화학, 바이오, 법률 등 전문 분야 지식에 특화된 전문가용 AI 모델을 구축합니다.
- SK텔레콤(SKT) 컨소시엄: 통신 데이터와 서비스 노하우를 결합하여 다목적 거대 언어 모델을 개발하며, 이번 발표에서 가장 큰 규모의 모델을 선보였습니다.
- 엔씨소프트(NC AI) 컨소시엄: 자체 모델 '바르코(VARCO)'를 통해 게임, 콘텐츠 창작 등 크리에이티브 영역과 산업적 활용을 동시에 노립니다.
- 업스테이지(Upstage) 컨소시엄: 유일한 스타트업 주관 컨소시엄입니다. 로앤컴퍼니(법률), 뷰노(의료), 플리토(언어 데이터) 등 각 분야 전문 스타트업들과 'AI 원팀'을 이뤘습니다.
1차 발표 내용 소개 (2025.12.30 기준)
발표회 현장에서는 착수 4개월 만에 도출된 1차 결과물들이 공개되었습니다. 핵심 내용은 다음과 같습니다.
- SKT의 압도적 스케일: SK텔레콤은 파라미터(매개변수) 519B(5,190억 개)에 달하는 초대형 모델 'A.X K1'을 공개하며 기술력을 과시했습니다.
- 네이버의 옴니모달 전략: 네이버는 텍스트뿐만 아니라 이미지, 비디오, 음성을 한 번에 이해하는 '옴니 파운데이션 모델'의 초기 버전을 시연했습니다.
- 업스테이지의 실용성: 스타트업 연합군답게 법률, 의료 등 당장 산업 현장에 투입할 수 있는 특화 모델들의 데모를 선보여 호평받았습니다.
- 성능 목표 달성: 발표된 모델들은 벤치마크 테스트에서 라마(Llama) 3 등 글로벌 오픈소스 모델과 대등하거나 일부 영역에서 앞서는 성능을 기록했습니다.
각 모델별 특징 정리 및 HF(허깅페이스) 링크
개발자분들이 가장 궁금해하실 부분이죠. 각 기업의 대표 모델 특징과 허깅페이스 링크를 정리했습니다. (참고: 이번 프로젝트의 결과물인 최신 모델은 2026년 상반기 중 순차적으로 업로드될 예정이며, 아래 링크는 현재 공개된 기반 모델이거나 해당 조직의 공식 저장소입니다.)
- 업스테이지 (Upstage) - Solar (솔라)
- 특징: 작은 사이즈로 최고의 성능을 내는 '가성비' 모델의 대표주자입니다. 한국어와 영어 실력이 모두 뛰어나며 파인튜닝용으로 가장 인기가 높습니다.
- Hugging Face: https://huggingface.co/upstage/Solar-Open-100B
- LG AI연구원 - EXAONE (엑사원)
- 특징
- 최근 3.0 버전을 오픈소스로 공개했습니다. 이중 언어(한/영) 능력과 추론 능력이 탁월하며, 연구 및 전문 업무 보조에 적합합니다.
- 매개변수 236B(2,360억 개) 규모로, 알리바바의 'Qwen3'나 오픈AI의 'GPT-OSS' 같은 글로벌 최상위 오픈 모델보다 벤치마크 점수가 더 높게 나왔습니다. (Qwen3 대비 104% 성능 달성)
- Mixture of Expert, MoE 구조를 적용하여 불필요한 연산을 확 줄였으며, 이를 통해 최신형 고가 GPU가 없어도 기존에 많이 쓰이는 A100 GPU 환경 수준에서 충분히 동작이 가능합니다.
※ 이번에 발표된 236B K-엑사원 모델의 구체적인 가중치 공개 일정은 추후 업데이트될 예정
- Hugging Face: https://huggingface.co/LGAI-EXAONE/K-EXAONE-236B-A23B
- 특징
- 엔씨소프트 - VAETKI(배키)
- 특징
- 한국어 벤치마크에서 우수한 성적을 보였으며, 최근 비전(Vision) 모델까지 확장했습니다.특히 창작 업무 자동화에 강점이 있습니다.
- 100B 이상의 파라미터를 가진 대형 모델이지만 MoE를 적용해 추론 시에는 11B 파라미터만 활성화됩니다.
- 독자적으로 고도화한 MLA(Multi-Head Latent Attention) 기술을 통해 기존 모델 대비 메모리 사용량을 최대 83%까지 줄이고, 연산 속도 또한 높였습니다.
- 100B 초 거대 모델부터, 현장 설치형 경량 모델인 sLLM, 시각 정보를 함께 처리할 수 있는 멀티모달 VLM(Vision Language Model, 시각 언어 모델)까지 멀티 스케일 라인업을 제공합니다.
- Hugging Face: https://huggingface.co/NC-AI-consortium-VAETKI/VAETKI
- 특징
- SK텔레콤 - A.X (에이닷엑스)
- 특징
- 통신 서비스와 결합된 에이전트 기능에 특화되어 있습니다. 이번에 공개된 519B 모델의 경량화 버전 등이 추후 공개될 것으로 보입니다.
- 국내 최대 규모인 500B 수준의 파라미터를 가진 모델로, 인프라부터 서비스까지 이어지는 AI 가치 사슬을 완성했다는 점을 핵심 가치로 소개
- 사용 목적에 따라 Fast/Thinking 모드를 분리하여 사용할 수 있
- Hugging Face: https://huggingface.co/skt/A.X-K1
- 특징
- 네이버 - HyperCLOVA X (하이퍼클로바X)
- 특징: 국내 최대 규모의 한국어 데이터를 학습한 모델입니다. 보안 문제로 인해 현재 가중치(Weight) 파일은 공개되지 않았으며, API 형태로만 제공됩니다.
- Hugging Face: 미지원 (네이버 클라우드 플랫폼 API 사용 필요)
마무리
이번 'K-파운데이션 모델 프로젝트' 1차 발표는 대한민국이 더 이상 AI 소비국에 머무르지 않고, AI 생산국으로서의 지위를 확고히 하겠다는 신호탄과 같습니다.
- 포인트 1: 대기업뿐만 아니라 스타트업(업스테이지 컨소시엄)이 국가 대표로 참여하여 생태계의 다양성을 확보했습니다.
- 포인트 2: 단순히 성능 좋은 모델을 만드는 것을 넘어, 의료/법률/공공 등 실제 산업에 적용 가능한 '특화형 모델'로 진화하고 있습니다.
- 포인트 3: 2026년 상반기, 이 모델들이 오픈소스로 풀리면 국내 개발자들은 저작권이나 비용 걱정 없이 고성능 한국형 AI를 마음껏 활용할 수 있게 됩니다.
앞으로 공개될 구체적인 코드와 가중치 파일들이 정말 기대되는데요.
새로운 소식이 나오면 가장 먼저 업데이트해 드리겠습니다.
> 이전글 보기
2025.12.22 - [개발/AI] - [NeurIPS 2025] 인공지능 트렌드를 바꿀 핵심 연구 논문 Best 3 정리 (RL, Vision, GenAI)
2025.05.16 - [개발/AI] - 2025년 오픈소스 VLM(Vision-Language Model) 현황 정리
'개발 > AI' 카테고리의 다른 글
| 🚀MedGemma-1.5 업데이트 (0) | 2026.02.14 |
|---|---|
| Qwen3-VL-8B-Instruct 파인튜닝 코드 (0) | 2026.01.15 |
| [NeurIPS 2025] 인공지능 트렌드를 바꿀 핵심 연구 논문 Best 3 정리 (RL, Vision, GenAI) (0) | 2025.12.22 |
| 🩺 MedGemma3: 구글이 만든 의료 멀티모달 모델의 진화 (1) | 2025.05.26 |
| 2025년 오픈소스 VLM(Vision-Language Model) 현황 정리 (4) | 2025.05.16 |