New

Solar Pro 3는 Upstage의 102B MoE 대규모 언어 모델입니다. 에이전트 성능 2배, 추론·선호도·한국어 전 영역 개선

Highlights

Solar Pro 3는 Upstage가 개발한 대규모 언어 모델 Solar Pro의 최신 업데이트입니다.2026년 3월 업데이트된 Solar Pro 3는 Solar Pro 2 대비 에이전트 벤치마크에서 약 2배, 추론·사용자 선호도·한국어 전 영역에서 의미 있는 성능 향상을 달성했습니다. 이 개선의 핵심에는 독자적인 강화학습 기술 SnapPO를 통한 심층 추론 능력의 개선이 있으며, 모든 개선은 동일한 API 인터페이스와 처리 속도를 유지합니다.

에이전트 성능, 두 배로

종합 에이전트 평가인 Tau2-all에서 Solar Pro 3는 72.3을 기록하며 Solar Pro 2의 36.0을 크게 넘어섰습니다. 코드 에이전트(SWE Bench)와 터미널 워크플로우(Terminal Bench 2)에서도 같은 방향의 개선을 확인할 수 있습니다.

2× Solar Pro 2 대비 에이전트 벤치마크 개선:
Tau2-all 72.3 (vs 36.0) · SWE Bench 28.6 (vs 14.5) · Terminal Bench 2 10.1 (vs 2.2)

이 개선은 특정 벤치마크에 최적화한 결과가 아닙니다. 실제 운영 환경에서 반복적으로 관찰된 한계(개별 도구 호출은 성공하지만 전체 워크플로우를 완주하지 못하는 문제)를 해결하는 방향으로 개발되었습니다.

추론이 만든 차이

에이전트 성능 개선은 도구 호출을 표면적으로 조정하는 것만으로 이루어지지 않습니다. 여러 단계에 걸쳐 일관된 계획을 유지하고, 오류가 누적되기 전에 스스로 잡아내고, 컨텍스트가 불완전하거나 도구 출력이 모호할 때 합리적인 판단을 내릴 수 있는 능력이 필요합니다.

Solar Pro 3는 Upstage의 독자적인 강화학습 프레임워크 SnapPO를 적용해 단계적 추론 능력을 실질적으로 강화했습니다. SnapPO는 학습 과정의 각 단계를 독립적으로 실행·조합할 수 있도록 설계되어, 수학·코드·에이전트 등 다양한 도메인의 추론 능력을 효율적으로 동시에 강화할 수 있었습니다. Solar 오픈 모델 개발 과정에서 축적된 자체 기술로, 설계와 학습 방법에 대한 상세는 테크니컬 리포트에서 확인할 수 있습니다.

이 개선은 정확히 같은 종류의 멀티스텝 사고를 요구하는 수학 및 과학 벤치마크에서 확인됩니다.

이 벤치마크들은 직접적인 에이전트 평가는 아니지만, 요구하는 인지적 조건 (긴 추론 과정, 오류 누적에 대한 허용치 없음, 초기 가정이 틀렸을 때 되돌아올 수 있는 능력)은 에이전트 워크플로우와 유사합니다. 이런 작업을 잘 처리하는 모델은 프로덕션 에이전트 파이프라인에서도 더 안정적으로 작동합니다.

더 나은 응답, 더 정확한 이행

Solar Pro 2와의 직접 비교에서 사용자들은 일관되게 Solar Pro 3의 응답을 선호하는 경향을 보입니다. 사용자 의도를 더 정확히 파악하고, 미묘한 지시 차이에 대해 더 적절한 응답을 생성하는 방향으로 개선이 이루어졌습니다. 지시사항 준수 역시 의미 있는 진전을 보입니다. 이는 단순히 점수가 높아진 것을 넘어, 사용자의 요청을 더 정확히 이해하고 끝까지 해결하는 능력이 강화되었음을 의미합니다.

에이전트 태스크에서는 지시가 본질적으로 불완전한 경우가 많기 때문에, 이 특성은 실제 워크플로우의 안정성과 직결됩니다.

한국어, 더 자연스럽게

Solar LLM의 차별점 중 하나는 한국어에 대한 지속적인 투자입니다. Ko-Arena-hard-v2에서 78.2를 기록해 Solar Pro 2의 66.6을 넘어섰습니다. 한국어로 질문했을 때 영어 대비 품질 저하 없이 자연스러운 응답을 생성하는 방향으로 개선이 이루어졌으며, 한국어 업무 환경에서 에이전트를 운영하는 팀에게 이 차이는 워크플로우 신뢰성으로 직결됩니다.

같은 비용, 예측 가능한 운영

Solar Pro 3는 총 102B 파라미터의 MoE 아키텍처를 기반으로, 추론 시 토큰당 12B 파라미터만 활성화합니다. Solar Pro 2와 동일한 API 인터페이스, 처리량(TPS), 서빙 동작을 유지하면서 성능이 개선됐습니다. 성능 향상이 곧 비용 증가로 이어지는 일반적인 트레이드오프를 최소화한 설계입니다.

운영 단계에서 중요한 것은 최고 성능 수치가 아니라 예측 가능성입니다. 버전 업데이트 시 파이프라인 변동이 최소화되는지, 한국어 기반 업무 환경에서 정확도가 유지되는지, 서빙 비용이 통제 가능한 범위에 있는지. Solar Pro 3의 MoE 구조와 Solar Pro 2 호환 설계는 이 조건들을 충족하면서 성능을 끌어올리기 위한 선택입니다. 상세 가격은 pricing page에서 확인할 수 있습니다.

Solar Pro 3를 지금 경험해보세요

Solar Pro 3는 현재 Upstage Console을 통해 API 형태로 제공되고 있으며, 실제 서비스 환경에서 모델을 직접 테스트할 수 있습니다. 기존 Solar Pro 2 사용자라면 별도의 설정 변경 없이 전환할 수 있습니다.

Solar Pro 3는 OpenRouter에서도 사용할 수 있습니다. 1월 출시 이후 이미 수십억 토큰이 OpenRouter를 통해 처리되고 있습니다.

전체 벤치마크 상세

Solar Pro 2 (solar-pro2-251215), Solar Pro 3 (solar-pro3-260323)

* 벤치마크는 2026년 3월 기준으로 측정되었으며, 각 벤치마크의 공식 평가 프로토콜을 따릅니다.

Solar Pro 3: 에이전트 성능 2배 향상, 무엇이 달라졌나

Solar Pro 3는 Upstage의 102B MoE 대규모 언어 모델입니다. 에이전트 성능 2배, 추론·선호도·한국어 전 영역 개선

Minjee Kang

•

Products

•

March 24, 2026

에이전트 성능, 두 배로

2× Solar Pro 2 대비 에이전트 벤치마크 개선:
Tau2-all 72.3 (vs 36.0) · SWE Bench 28.6 (vs 14.5) · Terminal Bench 2 10.1 (vs 2.2)

추론이 만든 차이

이 개선은 정확히 같은 종류의 멀티스텝 사고를 요구하는 수학 및 과학 벤치마크에서 확인됩니다.

더 나은 응답, 더 정확한 이행

에이전트 태스크에서는 지시가 본질적으로 불완전한 경우가 많기 때문에, 이 특성은 실제 워크플로우의 안정성과 직결됩니다.

한국어, 더 자연스럽게

같은 비용, 예측 가능한 운영

Solar Pro 3를 지금 경험해보세요

Solar Pro 3는 OpenRouter에서도 사용할 수 있습니다. 1월 출시 이후 이미 수십억 토큰이 OpenRouter를 통해 처리되고 있습니다.

전체 벤치마크 상세

Solar Pro 2 (solar-pro2-251215), Solar Pro 3 (solar-pro3-260323)

* 벤치마크는 2026년 3월 기준으로 측정되었으며, 각 벤치마크의 공식 평가 프로토콜을 따릅니다.

Highlights

비즈니스의 미래를 선도하는 인공지는 솔루션

에이전트 성능, 두 배로

추론이 만든 차이

더 나은 응답, 더 정확한 이행

한국어, 더 자연스럽게

같은 비용, 예측 가능한 운영

Solar Pro 3를 지금 경험해보세요

전체 벤치마크 상세

모델 성능 경쟁은 끝났다 — 엔터프라이즈 AI의 진짜 병목은 '문서 구조화'다

AI 에이전트, 구현 단계에서 멈춘다면 — 코드 없이 문서 처리 파이프라인 만드는 법

마이리얼트립, Document Parse로 상품 검증 속도 분→초 단축

Solar Pro 3: 에이전트 성능 2배 향상, 무엇이 달라졌나

비즈니스의 미래를 선도하는 인공지능 솔루션

에이전트 성능, 두 배로

추론이 만든 차이

더 나은 응답, 더 정확한 이행

한국어, 더 자연스럽게

같은 비용, 예측 가능한 운영

Solar Pro 3를 지금 경험해보세요

전체 벤치마크 상세

AI 에이전트, 구현 단계에서 멈춘다면 — 코드 없이 문서 처리 파이프라인 만드는 법