EU AI 법안에 관한 보고서 초안 주요 내용과 시사점

SPRi AI Brief

2026년 1월호

CONTENTS

정책･법제

∙ 트럼프 미국 대통령, AI 기반 과학 혁신을 위한 ‘제네시스 미션’ 행정명령에 서명

∙ 영국 과학혁신기술부, ‘과학을 위한 AI’ 전략 발표

∙ 호주 정부, AI 산업 발전을 위한 ‘국가 AI 계획’ 발표

∙ 트럼프 미국 대통령, 주별 AI 규제 제한하는 행정명령에 서명

∙ 미국 전쟁부, 자체 생성 AI 플랫폼에서 정부용 제미나이 도입 발표

기업･산업

∙ 앤스로픽, 코딩과 에이전트 성능 강화한 ‘클로드 오퍼스 4.5’ 출시

∙ 구글, 제미나이 3 프로 기반 이미지 AI 모델 ‘나노 바나나 프로’ 출시

∙ 오픈AI, 코딩 특화 모델 ‘GPT-5.1-코덱스-맥스’ 출시

∙ 딥시크, 추론과 에이전트 성능 강화한 ‘딥시크-V3.2’ 모델 2종 공개

∙ 런웨이, 동영상 생성 AI 모델 ‘젠-4.5’ 출시

∙ 아마존, 차세대 AI 칩 트레이니엄3 기반 울트라서버 발표

∙ 옵저버, 2025년 글로벌 AI 인덱스 발표

∙ 오픈AI, 전문 지식 업무와 장시간 에이전트 작업에 특화된 ‘GPT-5.2’ 출시

∙ 리눅스 재단, 주요 기업 연합 ‘에이전틱 AI 재단’ 출범

기술･연구

∙ 앤스로픽, AI 보상 해킹 학습으로 인한 오정렬 현상과 완화책 분석

∙ 엔비디아, NeurIPS 2025에서 최신 AI 모델과 도구 개발 성과 발표

∙ 미국 프린스턴大 등 공동 연구진, 다중 에이전트 협업 프레임워크 개발

∙ 미국 스탠퍼드大, AI 벤치마크의 오류 탐지 자동화 방법론 개발

인력･교육

∙ 직원의 AI 역량 요구하는 미국 금융기업들, 구직자 AI 사용은 금지

∙ MIT 연구 결과, AI는 미국 노동시장의 11.7%에 해당하는 업무 역량 보유

∙ EY 설문조사 결과, 미국 기업들 AI 기반 생산성 향상으로 감원보다 재투자 우세

∙ 카네기 국제평화재단 분석 결과, 중국 출신 AI 연구자 대부분 미국에 잔류

주요행사일정

| 2026년 1월호|

| 2026년 1월호 |

정책･법제

SPRi AI Brief

2026년 1월호

트럼프 미국 대통령, AI 기반 과학 혁신을 위한 ‘제네시스 미션’ 행정명령에 서명

■

트럼프 미국 대통령이 에너지부를 중심으로 연방 정부의 과학 데이터와 고성능 컴퓨팅 자원을

활용한 통합 AI 플랫폼을 구축해 AI 기반 과학 혁신을 촉진하기 위한 ‘제네시스 미션’을 발표

■

과학 파운데이션 모델 훈련과 AI 에이전트 개발을 통한 연구 자동화로 첨단 제조, 생명공학, 핵심

소재를 포함한 주요 국가 과학·기술 과제에서 과학적 발견을 획기적으로 앞당길 계획

KEY Contents



제네시스 미션, 주요 국가 과학·기술 과제에서 AI 기반 과학적 발견 가속화 추진

■

도널드 트럼프 미국 대통령이 AI 기반 과학적 발견을 촉진해 미국의 기술적 우위와 글로벌 리더십을 강화

하기 위한 국가적 프로젝트인 ‘제네시스 미션(Genesis Mission)’ 출범 행정명령*에 서명

* Launching the Genesis Mission(EO 14363)

∙

이번 행정명령은 연방 정부가 보유한 대규모 과학 데이터를 활용한 과학 파운데이션 모델 훈련 및 새로운 가설

검증과 연구 흐름을 자동화하는 AI 에이전트 개발을 위한 통합 AI 플랫폼 구축을 추진

■

(추진 체계) 에너지부(DOE) 장관이 부처 내 자원을 활용해 제네시스 미션을 이행하며, 대통령 과학기술

보좌관(APST)이 국가과학기술위원회(NSTC)를 통해 부처 간 조정을 총괄

■

(미국 과학안보 플랫폼 구축) 에너지부 주도로 제네시스 미션의 인프라 역할을 하는 플랫폼을 구축 및 운영

∙

과학안보 플랫폼은 대규모 모델 학습과 시뮬레이션, 추론을 지원하는 고성능 컴퓨팅 자원과 AI 에이전트와 분석

프레임워크, 과학 분야별 파운데이션 모델, 연방 정부에서 확보한 공개 과학 데이터셋 등으로 구성

∙

동 플랫폼은 국가 안보 및 국가 경쟁력과 직결된 인프라로서, 에너지부 장관은 사이버보안과 공급망 보안 등에서

엄격한 보안 기준을 충족하는 방식으로 플랫폼이 운영되도록 조치

■

(국가 과학·기술 과제 선정) 에너지부 장관은 행정명령 발표일로부터 60일 이내에 국가 과학·기술 과제

중 제네시스 미션을 통해 해결할 수 있다고 평가되는 20개 이상의 목록을 선정

∙

행정명령은 국가적 중요성을 지닌 과학·기술 과제의 예시로 △첨단 제조 △생명공학 △핵심 소재

△핵분열·핵융합 에너지 △양자정보과학 △반도체·마이크로전자 공학을 제시

∙

대통령 과학기술 보좌관은 해당 목록을 전달받은 후 30일 이내에 국가과학기술위원회와 검토·확장하며,

제네시스 미션 참여 기관은 해당 목록에 따라 미국 과학안보 플랫폼을 사용해 연구 개발을 진행

∙

이후 에너지부 장관은 대통령 과학기술 보좌관 및 과학기술위원회와 협의해 매년 과제 진척 상황과 새로운

국가적 필요, 행정부의 연구 개발 우선순위를 바탕으로 과제 목록을 검토하여 갱신

■

(부처간 조정과 외부 협력) 대통령 과학기술 보좌관은 관련 부처의 AI 프로그램과 데이터, 연구 개발 활

동을 조정하고 민간 참여를 장려하며, 관련 연구 펠로우십과 인턴십 프로그램 개발을 추진

∙

에너지부는 AI, 데이터, 컴퓨팅 역량 또는 과학 전문 지식을 갖춘 외부 파트너와 정부 간 협력 체계를 수립

∙

외부 파트너와의 협력 촉진을 위해 표준화 협력 프레임워크 개발, 제네시스 미션에 따라 개발된 지식 재산의

소유권과 라이선스 정책 수립, 엄격한 데이터 접근과 관리 프로세스 및 사이버보안 표준 구현 등을 수행

출처 | The White House, LAUNCHING THE GENESIS MISSION, 2025.11.24.

정책･법제

기업･산업

기술･연구

인력･교육

영국 과학혁신기술부, ‘과학을 위한 AI’ 전략 발표

■

영국 과학혁신기술부가 AI 기반 과학 연구에서 최첨단 역량과 영국의 과학 리더십 확보,

공공 편익 및 경제적 이익 극대화를 목표로 ‘과학을 위한 AI 전략’을 수립

■

전략 이행을 위한 3대 축으로 혁신적 연구를 촉진하는 데이터 환경 구축, 연구자의 컴퓨팅

자원 접근 보장, 다학제 팀으로 구성된 연구 커뮤니티 구축을 추진

KEY Contents



데이터·컴퓨팅·사람과 문화 3대 축을 중심으로 AI 기반 과학 연구 역량 강화 추진

■

영국 과학혁신기술부(DSIT)가 과학 분야에서 영국의 리더십을 유지하고 AI를 활용한 과학 혁신의 전환

점을 포착하기 위한 ‘과학을 위한 AI 전략(AI for Science Strategy)’을 발표

∙

전략의 첫 번째 목표로 자율 실험실과 범용 AI 과학 도구 개발을 통한 AI 기반 과학 연구의 최첨단 역량 확보,

두 번째 목표로는 영국의 과학 리더십과 공공 편익 및 경제적 이익 극대화를 제시

∙

영국이 가진 기존 강점과 ‘현대 산업 전략*’과 같은 국가전략과의 연계성, AI 기반 발전 기회를 토대로 5개 우선

적용 분야로 △공학 생물학 △핵융합 에너지 △소재 과학 △의학 연구 △양자 기술을 선정

* Modern Industrial Strategy: 고성장 첨단기술 산업을 중심으로 지속가능한 성장과 국가 경쟁력 제고를 도모하는 향후 10년 산업 전략

∙

전략 이행을 위한 3대 축으로 △데이터(혁신적 연구를 촉진하는 데이터 환경 구축) △컴퓨팅(연구자들의 컴퓨팅

자원 접근 보장) △사람과 문화(다학제 팀으로 구성된 연구 커뮤니티 구축)를 제시

■

(데이터) 데이터를 과학을 위한 AI 발전의 핵심 요소로 간주하고, 양적 확대를 넘어 특정 과학 난제에서 AI

기반 돌파를 가능하게 하는 고품질 데이터 자산의 전략적 설계와 축적을 추진

∙

영국연구혁신기구(UKRI)* 주도로 FAIR(Findable, Accessible, Interoperable, Reusable)** 원칙에 맞게 주요

국립 연구시설의 실험과 시뮬레이션 데이터를 2030년까지 체계적으로 저장·관리할 계획

* 영국의 국가 연구·혁신 자금을 총괄 배분하는 통합 연구 지원 기구

** 연구 데이터를 찾기 쉽고·접근 가능하며·상호운용 가능하고·재사용 가능하도록 관리하기 위한 국제적 데이터 관리 원칙

∙

DSIT 주도로 AI 기반 과학적 혁신을 실현할 고부가가치 데이터셋을 개발하는 한편, 외부 참여와 공개 모집,

워크숍, 해커톤과 같은 과학자 집단 중심의 체계적 절차를 통해 과학자에게 필요한 데이터를 발굴

■

(컴퓨팅) 대규모 AI 연구를 뒷받침할 슈퍼컴퓨터와 이를 활용하는 접근 체계의 동시 구축을 추진

∙

AI연구자원(AIRR)*을 확충해 세계적 수준의 AI 컴퓨팅 생태계를 구축하고, ‘과학을 위한 AI 전략’에 따라

추진되는 우선순위 영역의 연구자들에게 AIRR 기반 공공 컴퓨팅 자원을 우선적으로 배정

* 영국이 국가 주권 차원에서 확보한 대규모 AI 전용 슈퍼컴퓨팅·저장 인프라 패키지

■

(사람과 문화) AI 기반 과학에 필요한 새로운 유형의 연구팀과 조직 구조, 협업 방식 마련을 위해 최고 수준

의 과학자와 기술 전문가 양성 및 대규모 팀 기반 과학 연구 촉진, 학계와 산업계의 긴밀한 연계를 추진

∙

향후 5년간 AI와 특정 과학 분야에 모두 능통하거나 과학 연구에 AI를 적용할 수 있는 박사급 인력을 1,000명

이상 양성하고 다학제 펠로우십 프로그램을 활용해 과학 연구자들의 AI 역량 구축을 지원

출처 | Department for Science, Innovation & Technology, AI for Science Strategy, 2025.11.20.

SPRi AI Brief

2026년 1월호

호주 정부, AI 산업 발전을 위한 ‘국가 AI 계획’ 발표

■

호주 산업과학자원부가 모든 지역과 산업에 걸쳐 호주 국민 전체가 AI의 혜택을 누릴 수 있도록

AI 산업을 발전시키기 위한 ‘국가 AI 계획’을 발표

■

스마트 인프라 구축과 AI 역량 강화, 투자 유치를 통한 기회 포착, AI 도입 확대와 호주 국민 지원을

통한 혜택 확산, AI 위험 완화와 책임 있는 활용 촉진을 통한 안전 확보를 핵심 목표로 제시

KEY Contents



호주 국가 AI 계획, AI 기회 포착과 혜택 확산, 안전 확보의 3대 목표 설정

■

호주 산업과학자원부(DISR)가 경쟁력과 생산성, 복원력을 갖춘 AI 기반 경제 구축을 통해 호주 국민 전체

에 실질적 혜택을 제공하기 위한 ‘국가 AI 계획(National AI Plan)’을 수립

∙

국가 AI 계획은 ①기회 포착(Capture the opportunities) ② 혜택 확산(Spread the benefits) ③ 안전

확보(Keep Australians safe)라는 3대 목표 하의 9개 실행 과제로 구성

■

(기회 포착) 호주 국민이 AI의 기회를 포착해 직장과 사회, 일상에서 AI를 최대한 활용할 수 있도록 지

원하고자 △스마트 인프라 구축 △호주 AI 역량 강화 △투자 유치의 3개 실행 과제를 추진

∙

대규모 AI 지원에 필수적인 고품질 컴퓨팅 파워와 디지털 통신망을 갖추기 위해 국가 광대역망과 해저 케이블

등을 전국적으로 확충하고 사이버보안과 주요 인프라 보안을 강화하며 데이터센터 인프라를 확장

∙

의료, 농업, 자원 등 호주가 비교우위를 갖는 산업에 특화된 AI 연구 혁신 생태계를 조성하고 중앙정부의 AI

플랫폼 ‘GovAI’를 통해 공공기관의 맞춤형 AI 솔루션 개발을 지원하며 정부 데이터의 접근성을 확대

∙

국내외 AI 투자 유치를 위해 주요 인프라와 혁신적인 AI 벤처 기업에 대한 투자 활성화 이니셔티브를 수립

■

(혜택 확산) 모든 호주 국민이 나이, 지역, 성별과 관계없이 AI의 혜택을 누릴 수 있도록 지역사회와 협력

해 △AI 도입 확대 △호주 국민 지원과 교육 △공공 서비스 개선의 3대 실행 과제를 추진

∙

호주 경제의 중추를 이루는 중소기업의 생산성 향상과 경쟁력 강화를 위해 AI 혁신을 장려할 수 있는 맞춤형

지원을 제공하고, 원주민과 비영리단체 대상의 교육과 자문 서비스를 통해 AI 도입을 지원

∙

AI로 인한 노동시장 재편에 대비해 특히 여성, 원주민, 고령자, 장애인 등 취약 집단을 중심으로 노동자의 AI 기술

교육과 역량 개발을 지원하고, 노동자와 협의해 직장 내 안전하고 책임 있는 AI 도입을 추진

∙

정부 운영 전반에서 AI 활용을 확대하여 공공 서비스 품질 및 정부의 효율성과 생산성 향상을 도모

■

(안전 확보) 새로운 AI 위험에 즉각 대응할 수 있는 실질적인 AI 안전 조치를 마련하기 위해 △위험 완화

△책임 있는 AI 활용 촉진 △글로벌 규범 형성 참여의 3대 실행 과제를 추진

∙

AI 위험을 파악하고 피해를 완화하기 위해 호주 AI안전연구소를 설립해 AI 안전 연구를 강화하고 규제 기관에

자문을 제공해 AI 기업의 준법 이행을 지원하며 국가 위기관리 체계를 통해 AI 사고에 대응

∙

호주국가AI센터(NAIC)의 ‘AI 도입 지침’을 토대로 기업의 책임 있는 AI 도입 관행을 장려하고 AI 생성물에 대한

투명성 조치를 강화하며, 산업계·시민사회와 협력해 책임 있는 AI 배포를 지원할 실질적 방안을 모색

∙

안전성, 투명성, 포용성이라는 호주의 가치를 국제 AI 규범과 표준에 반영할 수 있도록 UN, OECD, G7 등 다자

협의체에 적극 참가하고 국제 AI 안전연구소 네트워크를 통해 국제 모범사례 개발을 지원

출처 | Department of Industry, Science and Resources, National AI Plan, 2025.12.02.

정책･법제

기업･산업

기술･연구

인력･교육

트럼프 미국 대통령, 주별 AI 규제 제한하는 행정명령에 서명

■

트럼프 미국 대통령은 AI 분야에서 미국이 리더십을 유지하기 위한 혁신을 저해하는 파편화된 주별

규제 대신 부담을 최소화하는 연방 단일 AI 정책 프레임워크를 수립하겠다는 행정명령을 발표

■

이번 행정명령은 AI 소송 태스크포스를 구성해 연방 정책에 어긋나는 주 정부의 AI 규제에 대한 소송을 제기

하고 과도한 AI 규제를 보유한 주에 대한 광대역 보조금 지급을 제한할 것을 규정

KEY Contents



주별 파편화된 규제로 인한 부담을 완화하기 위한 단일 AI 정책 프레임워크 수립 추진

■

트럼프 미국 대통령이 2025년 12월 11일 주별 AI 규제를 제한하는 ‘AI를 위한 국가 정책 체계 보장(Ensuring a

National Policy Framework for Artificial Intelligence)’ 행정명령에 서명

∙

이번 행정명령은 주별로 파편화된 규제가 미국 AI 기업의 혁신을 저해하는 동시에 AI 모델에 이념적 편향을

내재화하도록 강요하고 있으며, 주 경계를 넘어서는 부당한 규제로 주간 상거래에 영향을 미친다고 지적

∙

행정명령은 규제 부담을 최소화하는 국가 정책 체계를 통해 미국의 글로벌 AI 우위를 유지하고 강화하는 것을

정책으로 제시하고, 해당 정책과 충돌하는 주법을 금지하겠다는 방침을 제시

■

(AI 소송 태스크포스) 주 정부의 과도한 AI 규제를 견제하기 위해 행정명령 발표일로부터 30일 이내에 법

무부(DOJ) 장관에 ‘AI 소송 태스크포스(AI Litigation Task Force)’를 설치할 것을 요구

∙

AI 소송 태스크포스는 규제 부담을 최소화한다는 동 행정명령의 정책에 반하는 주 정부의 AI 규제(예: 위헌적

주간 상거래 규제*, 연방 규정보다 우선 적용되는 주법)에 대한 소송 제기를 전담

* 주(州) 법이 주간 상거래에 과도한 부담을 주거나 주 경계를 넘어 타주의 상거래까지 규제하는 사례

■

(주별 AI 규제 평가) 행정명령 발표일로부터 90일 이내에 상무부(DOC) 장관에 AI·암호화폐 특별고문, 대통

령 과학기술 보좌관과 협의해 기존 주별 AI 법률에 대한 평가 보고서를 발표할 것을 요구

∙

평가 보고서에는 정책과 상충하는 과도한 법률 및 AI 소송 태스크포스에 회부해야 할 법률 포함

∙

법률 평가 시 AI 모델의 ‘진실된 출력(Truthful Output)’ 변경을 요구하거나 AI 개발자·배포자에 수정 헌법

제1조* 또는 기타 헌법 조항의 위반 소지가 있는 정보 공개나 보고를 강제하는 법률을 식별

* 종교의 자유, 언론의 자유, 출판의 자유, 평화로운 집회의 자유, 정부에 청원할 수 있는 권리 등 시민의 5가지 기본적 자유를 보장

■

(주정부 보조금 제한) 행정명령 발표일로부터 90일 이내에 상무부 장관에 광대역 보조금* 잔여 재원의 주

자격 조건을 고지하고, 과도한 AI 법률을 보유한 주에 대하여 보조금 지급을 제한하도록 지시

* BEAD(Broadband Equity, Access, and Deployment): 인터넷 연결이 어려운 지역에 대한 연방 보조금 프로그램

∙

해당 정책 고지 시에는 파편화된 주 정부의 AI 규제 환경이 보조금 배포, 고속 인터넷 기반의 AI 애플리케이션의

발전, 고속 인터넷의 보편화라는 BEAD의 사명을 저해할 수 있음을 명시

■

(입법) AI·암호화폐 특별고문과 대통령 과학기술 보좌관은 동 행정명령의 정책과 상충하는 주 AI 법률의 적용

을 배제하는 연방 단일 정책 프레임워크를 수립하기 위한 입법 권고안을 공동으로 준비

∙

단, 해당 입법 권고안에서 아동 안전이나 AI 컴퓨팅·데이터 인프라, 주 정부의 AI 조달과 활용 등과 관련된 주

정부의 합법적 AI 법률의 적용을 배제하는 내용을 제안해서는 안 된다고 규정

출처 | The White House, Ensuring a National Policy Framework for Artificial Intelligence, 2025.12.11.

SPRi AI Brief

2026년 1월호

미국 전쟁부, 자체 생성 AI 플랫폼에서 정부용 제미나이 도입 발표

■

미국 전쟁부가 자체 생성 AI 플랫폼 ‘GenAI.mil’을 출범하고 구글의 정부용 제미나이를 우선적으로

도입해 부처 업무 전반에서 AI 활용을 가속화하겠다고 발표

■

정부용 제미나이 외에 추후 미국산 첨단 AI도 플랫폼에 추가할 예정으로, 생성 AI를 일상적인 전투

활동에 접목해 전력을 증강하고 미국의 AI 주도권 강화에 기여할 계획

KEY Contents



GenAI.mil 플랫폼 출범으로 전쟁부 전반의 AI 도입 가속화 기대

■

미국 전쟁부(Department of War, 舊 국방부)가 2025년 12월 9일 신규 생성 AI 플랫폼 ‘GenAI.mil’을 출범하

고 구글(Google)의 ‘정부용 제미나이(Gemini for Government)’를 도입한다고 발표

∙

GenAI.mil 플랫폼의 출범은 2025년 7월 발표된 백악관 ‘AI 행동 계획(AI Action Plan)*’의 일환으로, 해당 계획은

미국의 AI 주도권 확보를 목표로 국방 분야의 AI 도입과 AI 기술 우위 달성을 요구

* AI 혁신 가속, AI 인프라 구축, 국제 외교와 안보의 3대 축에서 미국의 AI 우위 확보를 위한 정책적 조치를 제시

■

전쟁부는 이번 이니셔티브를 통해 생성 AI 역량을 활용해 더욱 효율적이고 철저한 전투 준비를 갖춘 조직을 구축

하며 ‘AI 우선(AI-first)’ 인력을 양성하는 것을 핵심 목표로 제시

∙

공용 접근 카드를 소지하고 전쟁부 비공개 네트워크 접속 권한을 보유한 모든 군인과 민간인 직원의 데스크톱에서

사용 가능한 GenAI.mil 출범으로 부처 전반의 대규모 AI 도입에서 한 단계 더 나아갔다고 평가

∙

GenAI.mil 플랫폼이 문서 작성, 질의응답, 콘텐츠 서식 지정을 포함한 일상 업무 전반에서 새로운 가능성을

열어줄 것으로 기대하며 모든 구성원에게 기능을 익혀 업무에 즉시 통합할 것을 요구

∙

모든 전쟁부 직원의 AI 활용 자신감을 높이고 AI의 잠재력을 최대한 활용할 수 있도록 GenAI.mil 무료 교육도

제공할 예정이며, GenAI.mil은 보안을 최우선으로 설계되어 안전한 사용을 지원



전쟁부, 정부용 제미나이 도입으로 생성 AI 기반 전투력 증강 기대

■

전쟁부는 GenAI.mil 플랫폼에 처음 도입된 정부용 제미나이가 지능형 에이전트 기반 업무 흐름을 지원하고 AI 실

험을 촉진하며, 향후 수년간 디지털 전장을 좌우할 AI 기반 혁신을 끌어낼 것으로 기대

∙

정부용 제미나이는 자연어 대화 및 검색증강생성(RAG)* 기술 기반으로 경쟁 우위를 제공하고, 구글 검색을

기반으로 웹에 통합되어 결과의 신뢰성을 보장하고 오류 발생 위험을 크게 줄인다고 설명

* AI 모델 답변 생성 전 외부 데이터베이스에서 관련 정보를 실시간으로 검색해 활용하는 기술

∙

세계 최강의 전투력을 보유한 미군에 걸맞은 분석과 창의적 역량을 제공하는 강력한 성능의 정부용 제미나이

도입을 통해 미국의 차세대 핵심 과제인 AI를 선도하겠다는 의지를 피력

∙

피트 헤그세스(Pete Hegseth) 전쟁부 장관은 미국이 달성한 상업적 AI 성과를 최대한 활용해 생성 AI를

일상적인 전투 활동에 접목하고 전력 증강 요소로 활용하기 위해 모든 역량을 집중하고 있다고 강조

∙

전쟁부는 추후 정부용 제미나이 외에도 여타 미국산 첨단 AI 기술을 GenAI.mil 플랫폼에 추가 예정

출처 | U.S. Department of War, The War Department Unleashes AI on New GenAI.mil Platform, 2025.12.09.

| 2026년 1월호 |

기업･산업

SPRi AI Brief

2026년 1월호

앤스로픽, 코딩과 에이전트 성능 강화한 ‘클로드 오퍼스 4.5’ 출시

■

앤스로픽이 코딩과 에이전트, 컴퓨터 활용 분야에서 최고 수준의 성능을 지원하고 심층 연구와

같은 실무 작업 성능도 향상된 최신 AI 모델 ‘클로드 오퍼스 4.5’를 공개

■

클로드 오퍼스 4.5는 토큰 효율성도 크게 개선되어 이전 모델 대비 더 적은 토큰으로 비슷하거나

더 나은 결과를 도출하며, 개발자들은 작업 유형에 따라 속도나 비용, 모델 성능을 조절 가능

KEY Contents



클로드 오퍼스, 코딩과 에이전트, 컴퓨터 사용에서 뛰어난 성능 발휘

■

앤스로픽(Anthropic)이 코딩과 에이전트, 컴퓨터 사용에서 최고 수준의 성능을 갖추고 심층 연구와 같은 실

무 작업에서도 뛰어난 성능을 발휘하는 최신 모델 ‘클로드 오퍼스 4.5(Claude Opus 4.5)’를 출시

∙

앤스로픽에 따르면 클로드 오퍼스 4.5는 실제 소프트웨어 엔지니어링(SWE-bench Verified) 벤치마크

평가에서 80.9%로 오픈AI의 최신 코딩 모델 GPT-5.1-Codex-Max(77.9%)를 능가

∙

에이전트 도구 사용 벤치마크(τ2-bench Retail)와 새로운 문제 해결 능력을 평가하는 ARC-AGI-2 평가에서도

각각 88.9%와 37.6%로 제미나이 3 프로가 기록한 85.3%와 31.1%를 능가

∙

에이전트 작업의 성능도 크게 개선해 복잡한 다중 에이전트 시스템을 구축해 원활하게 조율할 수 있으며, 내부

테스트 결과, 심층 연구(Deep Research) 평가 성능이 이전 버전 대비 약 15%p 향상

<주요 AI 모델의 SWE-bench Verified 벤치마크 평가 비교>

■

클로드 오퍼스 4.5는 이전 버전보다 훨씬 적은 토큰을 사용해 유사하거나 더 나은 결과를 도출할 수 있으

며, 개발자들은 작업별로 시간과 비용을 최소화할지 모델 성능을 극대화할지 설정 가능

∙

개발자 플랫폼에서 중간 노력 수준(Medium Effort Level)으로 설정된 클로드 오퍼스 4.5는 SWE-bench Verified

평가에서 클로드 소네트 4.5의 최고 성능을 달성하면서 출력 토큰은 76% 적게 사용*

* 최대 노력 수준(highest effort level)에서는 클로드 소네트 4.5 대비 4.3%p 개선된 성능에 토큰은 48% 적게 사용

■

앤스로픽은 클로드 오퍼스 4.5가 지금까지 출시된 자사 모델 중 가장 안전성이 높은 모델이며, 특히 모델

을 속여 유해한 동작을 유발하는 프롬프트 주입 공격에 대한 저항성이 크게 향상되었다고 강조*

* 프롬프트 주입 공격 성공률(100회 기준): 제미나이 3 프로 씽킹(92.0%), GPT-5.1 씽킹(87.8%), 클로드 오퍼스 4.5 씽킹(63.0%)

출처 | Anthropic, Introducing Claude Opus 4.5, 2025.11.25.

정책･법제

기업･산업

기술･연구

인력･교육

구글, 제미나이 3 프로 기반 이미지 AI 모델 ‘나노 바나나 프로’ 출시

■

구글이 제미나이 3 프로를 기반으로 더욱 정확하고 풍부한 맥락의 시각 콘텐츠를 생성하는 AI

모델 ‘나노 바나나 프로’를 모든 사용자를 대상으로 출시

■

나노 바나나 프로는 구글 검색과 연동해 실시간 정보를 시각화하거나, 다양한 언어로 이미지에

텍스트를 삽입할 수 있으며 이미지의 일관성과 편집 기능도 향상

KEY Contents



나노 바나나 프로, 제미나이 3 프로의 첨단 추론 성능을 바탕으로 시각화 기능 개선

■

구글이 2025년 8월 공개한 이미지 생성·편집 AI 모델 ‘제미나이 2.5 플래시 이미지’를 업데이트한 ‘제미나

이 3 프로 이미지(별칭 나노 바나나 프로, Nano Banana Pro)’를 출시

∙

구글에 따르면 제미나이 3 프로를 기반으로 개발된 나노 바나나 프로는 제미나이의 최첨단 추론 성능과 실제

환경에 대한 지식을 활용해 더욱 효과적으로 아이디어의 시각화를 지원

∙

일반 사용자는 제미나이 앱에서 제한된 사용량으로 이용할 수 있으며(이후 나노 바나나로 전환), 개발자와

기업들은 제미나이 API와 개발자 플랫폼(구글 AI 스튜디오, 구글 안티그래비티, 버텍스 AI)에서 이용 가능

■

나노 바나나 프로는 정확하고 풍부한 맥락의 시각적 자료 생성과 이미지 내 다양한 언어의 텍스트 삽입,

다양한 요소의 일관성 있는 혼합과 향상된 편집 기능 등을 지원

∙

제공된 콘텐츠나 실제 사례를 기반으로 풍부한 맥락의 인포그래픽과 다이어그램을 생성하거나, 구글 검색 기반의

지식과 연동해 요리법 정보 또는 날씨나 스포츠 같은 실시간 정보의 시각화를 지원

∙

다양한 질감과 글꼴, 캘리그래피를 사용해 여러 언어로 이미지에 더욱 정확하고 가독성 높은 텍스트를 삽입할

수 있으며, 최대 14장의 이미지를 혼합해 개별 요소 간 일관성 있는 형태의 디자인을 생성 가능

∙

향상된 편집 기능을 지원해 이미지의 특정 부분을 선택해 카메라 각도 조정이나 초점 변경, 조명 변화 등 변경

사항을 적용할 수 있으며, 다양한 종횡비와 2K 및 4K 해상도를 지원

<14종의 캐릭터를 입력해 생성한 일관성 있는 이미지 예시>

■

한편, 구글은 AI 이미지 식별을 위해 자사 AI로 생성된 모든 미디어에 디지털 워터마크(SynthID)가 삽입되며, 제미

나이 앱에 특정 이미지를 업로드해 구글 AI로 생성되었는지를 확인할 수 있다고 설명

출처 | Google, Introducing Nano Banana Pro, 2025.11.20.

SPRi AI Brief

2026년 1월호

오픈AI, 코딩 특화 모델 ‘GPT-5.1-코덱스-맥스’ 출시

■

오픈AI가 GPT-5.1을 기반으로 개발되어 더욱 빠르고 지능적이며 토큰 효율성도

향상된 ‘GPT-5.1-코덱스-맥스’를 공개하고 코덱스 개발 환경의 기본 모델로 적용

■

GPT-5.1-코덱스-맥스는 장시간 이어지는 복잡한 작업도 효과적으로 처리하며, 이전

버전보다 추론 토큰을 30% 더 적게 사용하면서 더 높은 정확도를 달성

KEY Contents



GPT-5.1-코덱스-맥스, 효율적 추론을 통해 토큰 사용량 절감

■

오픈AI(OpenAI)가 GPT-5.1 기반의 코딩 특화 모델 ‘GPT-5.1-Codex-Max’를 출시하고 클라우드 기반 코

딩 에이전트 ‘코덱스’의 기본 모델로 적용한다고 발표

∙

이 모델은 소프트웨어 엔지니어링, 수학, 연구 등 다양한 분야의 에이전트 작업을 학습한 GPT-5.1 추론 모델을

기반으로 구축되어, 더욱 빠르고 지능적이며 토큰 효율성도 향상

∙

처음부터 여러 컨텍스트 창에서 작동하도록 학습되어* 단일 작업에서 수백만 개의 토큰을 일관되게 처리해

대규모의 코드 재조정(리팩토링)과 심층 디버깅, 복잡한 에이전트 작업도 독립적으로 진행 가능

* 컨텍스트 창 제한 도달 시 자동으로 새로운 컨텍스트 창을 생성하는 방식으로 작업을 일관적으로 유지하며, 내부 평가에서 24시간 이상 작업

수행한 사례도 확인

∙

안전하고 신뢰할 수 있는 AI 에이전트 구축을 위해 의심스러운 활동은 정책 모니터링 시스템을 통해 검토하며,

안전한 샌드박스 환경에서 작동하여 네트워크 접근도 기본적으로 비활성화 상태로 설정

■

실제 소프트웨어 엔지니어링 작업을 통해 학습된 GPT-5.1-코덱스-맥스는 여러 코딩 벤치마크에서 이

전 버전을 능가했고, 윈도우(Windows) 환경에서 작동하도록 처음으로 학습되어 실제 사용성도 개선*

* SWE-Lancer IC SWE(실제 SWE 작업 해결): GPT‑5.1-Codex(high): 66.3%, GPT‑5.1-Codex-Max: 79.9%

∙

추론 효율성도 크게 향상되어 SWE-bench-Verified(SW 오류 수정 평가) 기준 중간(Medium) 수준의

추론으로 이전 버전(GPT-5.1-코덱스) 대비 더 높은 정확도를 달성하면서 추론 토큰은 30% 더 적게 사용

∙

지연시간에 민감하지 않은 작업용으로 더 나은 답을 찾기 위해 더 오래 생각하는 ‘xhigh’ 추론 기능도 새로

추가되었으며, 대부분 작업에는 여전히 ‘중간’ 수준의 추론을 권장한다고 설명

<GPT-5.1-Codex-Max의 추론 효율성 비교>

출처 | OpenAI, Building more with GPT-5.1-Codex-Max, 2025.11.19.

정책･법제

기업･산업

기술･연구

인력･교육

딥시크, 추론과 에이전트 성능 강화한 ‘딥시크-V3.2’ 모델 2종 공개

■

딥시크가 일상적 추론과 고난도 문제 해결을 모두 아우르는 최신 AI 모델 ‘딥시크-V3.2’와

고성능 버전 ‘딥시크-V3.2-스페치알레’를 오픈소스로 공개

■

딥시크-V3.2는 맥락에서 중요한 부분만 선별해 파악하는 ‘DSA’ 기법으로 연산 효율성을 대폭

개선하는 한편, 도구 사용 중 추론을 지속하는 능력을 학습해 에이전트 성능도 개선

KEY Contents



딥시크-V3.2, 뛰어난 연산 효율성과 추론·에이전트 성능을 겸비

■

중국 딥시크(DeepSeek)가 뛰어난 연산 효율성과 추론·에이전트 성능을 결합한 최신 AI 모델로 ‘딥시크

-V3.2’와 고성능 버전 ‘딥시크-V3.2-스페치알레(Speciale)’를 오픈소스로 공개

∙

추론 성능과 연산 효율성의 균형을 맞춘 딥시크-V3.2는 오픈AI의 ‘GPT-5’ 수준의 성능*을 보이며,

딥시크-V3.2-스페치알레는 구글의 ‘제미나이-3.0 프로’와 경쟁할 수 있는 수준**이라고 주장

* AIME 2025(수학)과 SWE-bench-Verified(코딩)에서 각각 93.1%와 73.1%로 GPT-5-High(94.6%, 74.9%)에 근접

** AIME 2025(수학)에서 96.0%로 GPT-5-High(94.6%)와 제미나이-3.0 프로(95.0%) 능가

∙

특히 딥시크-V3.2-스페치알레는 국제 수학(IMO)과 정보(IOI) 올림피아드에서 인간 금메달 수준의 성과를

달성하는 등, 복잡한 작업에서 뛰어난 성과를 나타내나 토큰을 더 많이 사용(AIME 2025 기준 +7K)

<딥시크-V3.2 모델 2종과 주요 AI 모델의 벤치마크 평가 비교>

■

딥시크는 핵심 아키텍처 혁신으로 ‘DSA(DeepSeek Sparse Attention)*’를 제시하며, 입력에서 가장 관련성

높은 맥락만 파악하고 나머지는 무시하는 기법으로 연산 효율성을 대폭 개선했다고 설명

* 긴 입력 처리 시 전체 토큰이 아니라 중요하다고 판단한 일부 토큰에만 선택적으로 주의(어텐션)를 집중하는 메커니즘

∙

기존 모델(V3.1-Terminus)에서는 입력 데이터의 길이가 길어질수록 연산량이 기하급수적으로 증가했으나,

DSA 도입으로 추론 비용이 크게 줄어들고 긴 문맥에서도 성능 저하 없이 동작

■

또한 에이전트 성능 향상을 위해 ‘도구 사용 중 사고(Thinking in Tool-use)’ 기능도 새로 도입해, 도구 사용

중에도 추론을 중단하지 않고 사고 흐름을 유지하며 복잡한 문제를 연속적으로 해결 가능

∙

이러한 개선을 위해 1,800개 이상의 다양한 작업환경과 8만 5천 개의 복잡한 지시 데이터를 포함한 대규모 합성

데이터를 구축해 훈련했으며, 이를 통해 모델이 학습하지 않은 새로운 도구나 환경에도 빠르게 적응

출처 | DeepSeek, DeepSeek-V3.2 Release, 2025.12.01.

SPRi AI Brief

2026년 1월호

런웨이, 동영상 생성 AI 모델 ‘젠-4.5’ 출시

■

런웨이가 아티피셜 애널리시스 벤치마크에서 구글의 ‘비오 3’와 오픈AI의 ‘소라 2 프로’를 제치고

업계 1위를 달성한 동영상 생성 AI 모델 ‘젠-4.5’를 출시

■

젠-4.5는 이전 버전의 속도와 효율성을 유지하면서 뛰어난 물리적 정확도와 시각적 정밀성을

구현하며, 사실적 영상부터 영화 같은 연출, 애니메이션 등 다양한 스타일을 생성

KEY Contents



젠-4.5, 속도와 효율성 유지하면서 뛰어난 물리적 정확도와 시각적 정밀성 구현

■

미국 AI 스타트업 런웨이(Runway)가 2025년 12월 1일 뛰어난 품질로 업계 벤치마크에서 세계 1위를 차지한

최신 동영상 생성 AI 모델 ‘젠-4.5(Gen-4.5)’를 출시

∙

런웨이의 젠-4.5는 아티피셜 애널리시스(Artificial Analysis) 텍스트-투-비디오 벤치마크*에서 1,247점을

기록하며, 구글의 ‘비오 3’(1,226점)와 오픈AI의 ‘소라 2 프로’(1,206점)를 능가

* 독립 벤치마킹 플랫폼에서 동영상 생성 AI 모델의 성능을 인간의 주관적 평가(품질)과 객관적 지표(속도/비용)를 결합해 평가

∙

젠-4.5는 젠-4(2025년 3월 출시)의 속도와 효율성을 유지하면서 뛰어난 물리적 일관성과 시각적 정밀성을

구현하며, 움직임이나 시간 변화와 상관없이 머리카락이나 옷 질감과 같은 세부 사항의 일관성을 유지

∙

실제 영상과 구별하기 힘들 만큼 디테일과 정확도를 갖춘 사실적 영상에서부터 영화처럼 세련된 연출, 양식화된

애니메이션까지 다양한 스타일을 구현하면서 시각적 일관성을 유지하는 것이 특징

<런웨이의 ‘젠-4.5’로 생성된 영상의 한 장면>

■

런웨이는 젠-4.5 개발 시 초기 R&D와 사전·사후 학습, 추론까지 전 과정에 엔비디아(NVIDIA) GPU를 활용

했으며, 엔비디아와 긴밀한 협력을 통해 학습 효율성과 추론 속도 등에서 최적화를 이루었다고 강조

■

런웨이에 따르면 젠-4.5는 뛰어난 성능에도 불구하고 동영상 생성 AI 모델에 공통으로 나타나는 한계도 보유

∙

일례로 손잡이를 잡기 전에 열리는 문처럼 인과 추론에 문제가 있거나, 물체가 프레임 사이에 예기치 못하게

사라지는 현상이 나타날 수 있으며, 빗나간 공이 골인에 성공하는 등 성공 편향을 나타내는 것으로 확인

출처 | Runway, Introducing Runway Gen-4.5: A new frontier for video generation., 2025.12.01.

정책･법제

기업･산업

기술･연구

인력･교육

아마존, 차세대 AI 칩 트레이니엄3 기반 울트라서버 발표

■

아마존이 이전 세대 대비 4.4배 높은 컴퓨팅 성능과 4배 빠른 응답 시간을 제공해 모델 개발 기간과

운영 비용의 절감을 지원하는 트레이니엄3 울트라서버를 발표

■

아마존은 차세대 트레이니엄4도 이미 개발 중이며 처리 성능과 메모리 대역폭의 대폭 향상 및

HW/SW 최적화를 통해 3배 이상 빠른 AI 모델 학습과 추론 처리가 가능해질 것으로 기대

KEY Contents



트레이니엄3 울트라서버, 이전 세대 대비 4.4배 높은 컴퓨팅 성능 지원

■

아마존(Amazon)이 2025년 12월 2일 열린 연례 클라우드 컴퓨팅 행사 ‘AWS 리인벤드’에서 차세대 AI 칩

‘트레이니엄3(Trainium3, 이하 Trn3)’ 기반의 ‘울트라서버(UltraServer)’를 발표

∙

최대 144개의 트레이니엄3 칩을 단일 시스템에 통합한 Trn3 울트라서버는 트레이니엄2(Trn2) 울트라서버

대비 최대 4.4배 더 높은 컴퓨팅 성능을 제공해 모델 개발 기간과 운영 비용의 절감을 지원

∙

오픈AI의 개방형 가중치 모델 GPT-OSS-120B로 테스트한 결과, Trn3 울트라서버는 Trn2 울트라서버 대비 칩

당 처리량이 3배 높으면서 응답 시간은 4배 더 빠른 것으로 확인

∙

아마존은 Trn3 울트라서버를 통해 기업들이 인프라 설치 공간을 최소화하면서 최대 수요를 처리할 수 있도록

AI 애플리케이션을 확장해 사용자 경험을 개선하면서 추론 당 비용을 절감할 수 있다고 강조

■

아마존은 칩 간 데이터 이동 속도를 앞당기는 최적화된 상호 연결, 대규모 AI 모델 운용 시 병목 현상을 제거

하는 메모리 시스템 개선과 같은 설계 혁신으로 성능을 향상하고 에너지 효율을 40% 높였다고 설명

∙

울트라서버 내에서 여러 개의 Trn3을 연결하는 ‘NeuronSwitch-v1’은 서버 내부의 칩 간 대역폭을 2배로

향상하며, 칩 간 통신을 관리하는 ‘Neuron Fabric’은 칩 간 통신 지연을 10마이크로초(10⁻⁶초) 미만으로 단축

■

수 천대의 울트라서버를 연결해 최대 100만 개의 트레이니엄3 칩을 탑재한 ‘울트라클러스터

3.0(UltraCluster 3.0)’을 통해 이전 세대의 10배에 달하는 컴퓨팅 성능도 지원

∙

이러한 확장성을 통해 수조 개 토큰 데이터 기반의 멀티모달 학습부터 수백만 명의 동시 사용자 대상 실시간 추론

등 차세대 파운데이션 모델을 학습시킬 수 있는 인프라를 제공한다고 강조



이전 버전보다 처리 성능 6배 향상된 트레이니엄4도 개발 중

■

아마존은 주요 측면에서 성능의 대폭 향상을 달성하도록 설계된 ‘트레이니엄4’도 개발 중이라고 발표

∙

트레이니엄4는 차세대 첨단 AI 모델의 훈련과 추론 지원을 위해 이전 세대 대비 3배(FP8* 기준)의 처리 성능과

4배의 메모리 대역폭을 구현하고, HW/SW 최적화를 통해 성능을 더욱 끌어 올릴 계획

*학습·추론에서 연산을 더 빠르게 하고 메모리와 대역폭 사용을 줄이기 위해 사용되는 저정밀 수치 형식

∙

또한 엔비디아의 고속 칩 상호 연결 기술 ‘NVLink Fusion’ 지원으로 ‘MGX 랙*’에서 트레이니엄4와 GPU, CPU

등의 통합을 통한 유연하고 비용 효율적인 AI 인프라 구축을 가능하게 할 계획

* GPU, CPU, DPU 등의 제품을 조합해 맞춤형 서버 구축을 지원하는 엔비디아의 모듈식 서버 설계 기반구조

출처 | Amazon, Trainium3 UltraServers now available: Enabling customers to train and deploy AI models faster at lower cost,

2025.12.02.

SPRi AI Brief

2026년 1월호

옵저버, 2025년 글로벌 AI 인덱스 발표

■

영국 미디어 옵저버의 2025년 글로벌 AI 인덱스에 따르면 미국이 압도적 1위를 유지하는 가운데,

중국이 빠르게 격차를 좁히고 있으며, 한국은 전년 대비 한 단계 상승한 5위를 기록

■

올해 순위에서 한국과 대만 등 아시아 국가의 상승세가 두드러지는 가운데, 영국과 프랑스 등 유럽

국가들은 탄탄한 인재 기반에도 불구하고 첨단 모델 개발과 투자 유치 등에서 뒤처지는 추세

KEY Contents



한국, 운영 환경과 인프라, 개발 등에서 높은 평가를 받으며 종합 5위 기록

■

영국 미디어 옵저버(The Observer)가 93개국의 AI 역량을 평가한 2025년 ‘글로벌 AI 인덱스(Global AI

Index)*’에서 미국과 중국이 1위와 2위에 올랐으며 한국은 종합 5위를 기록(EU 3위, 싱가포르 4위)

* △AI 인재 △인프라 △운영 환경 △연구 △개발 △정부 전략 △산업 생태계 △규모 △활용 강도 등 총 9개 지표를 기반으로 산출

∙

미국이 인재, 인프라, 연구, 개발, 상업 생태계, 규모에서 1위에 오르며 압도적 우위를 유지하는 가운데, 중국은

인재, 인프라, 연구, 개발, 상업 생태계, 규모에서 2위를 차지하며 빠르게 격차를 축소

∙

옵저버는 올해 순위에서 한국과 대만 등 아시아 국가의 상승세가 두드러진다고 평가했으며, 한국의 순위는

2021년 8위에서 2022년 7위, 2023~2024년 6위, 2025년 5위에 오르며 꾸준히 상승세를 기록

∙

한국은 특히 운영 환경(2위), 인프라(4위), 개발(4위), 규모(4위) 등에서 높은 평가를 받았으나, 인재(13위)와

상업 생태계(17위) 부문에서는 상대적으로 순위가 낮아 개선 필요성 제기

■

한편, 유럽 국가들은 세계적 수준의 AI 인재를 보유하고 있음에도 경쟁력이 뒤처지는 추세로, 특히 투자

와 연구, 최첨단 모델 개발 등에서 미국이나 중국과 같은 선도국과 격차가 심화

∙

2025년 1~9월까지 AI 분야에 투자된 민간 자금의 약 90%가 미국에 집중된 가운데, 유럽은 3.8%를 유치하는

데 그쳤으며, 주요 AI 학회에서 EU가 발표한 논문 비중도 2024년 16%에서 2025년 12%로 감소

∙

유럽은 파운데이션 AI 모델 개발 경쟁에서도 뒤처지면서 최첨단 모델 중 유럽산 모델은 13%에 불과

∙

영국은 탄탄한 인재 기반과 연구 역량을 바탕으로 4위를 유지했으나, 영국에서 최고 수준의 AI 연구자는

미국으로 이주하는 경우가 대부분으로 영국 기업에 근무하는 비율은 약 15%에 불과

<옵저버의 ‘2025년 글로벌 AI 인덱스’ 국가별 순위>

출처 | The Observer, The Observer Global AI Index, 2025.12.04.

정책･법제

기업･산업

기술･연구

인력･교육

오픈AI, 전문 지식 업무와 장시간 에이전트 작업에 특화된 ‘GPT-5.2’ 출시

■

오픈AI가 일반 지식과 긴 컨텍스트 이해, 에이전트 도구 호출 등 전반적인 벤치마크 성능에서 큰 폭의

성능을 달성하며 복잡한 지식 업무와 장시간 에이전트 작업에 최적화된 GPT-5.2를 출시

■

GPT-5.2는 전문 작업 벤치마크 평가에서 AI 모델 최초로 인간 전문가 수준에 도달했으며, 민감한

질문에 대한 응답도 개선되고 18세 미만 청소년 보호를 위한 안전성도 강화

KEY Contents



GPT-5.2 씽킹, 복잡한 전문 작업에서 인간 전문가 수준에 도달

■

오픈AI(OpenAI)가 2025년 12월 11일 복잡한 지식 업무와 장시간 에이전트 실행 작업에서 뛰어난 성능을

제공하는 최신 AI 모델 ‘GPT-5.2’ 시리즈(인스턴트, 씽킹, 프로)를 출시

∙

속도와 성능의 균형을 맞춘 GPT-5.2는 일상 업무와 학습 전반에 적합하며 정보 탐색과 사용 방법 안내, 단계별

설명, 기술 문서 작성, 번역 등에서 GPT-5.1보다 향상된 결과를 제공

∙

추론 모델인 GPT-5.2 씽킹은 스프레드시트 서식 구성, 슬라이드 제작 등에서 큰 폭의 성능 향상을 보이며, 코드

작성, 긴 문서 요약, 업로드된 파일에 대한 질의응답 등에서 더욱 정확하고 체계적인 답변을 제공

∙

최상위 모델인 GPT-5.2 프로는 높은 품질의 답변을 요구하는 고난도 질문에서 가장 뛰어난 지능과 신뢰도를

제공하며, 초기 테스트에서 정확도가 높아지고 더욱 안정적인 성능을 나타내는 것으로 확인

■

GPT-5.2는 일반 지능과 긴 컨텍스트 이해, 에이전트 도구 호출 등 전반적인 벤치마크 성능 평가에서 큰 폭

의 발전을 달성했으며, 복잡한 실제 작업을 처음부터 끝까지 수행하는 능력도 크게 향상

∙

GPT-5.2 씽킹은 전문 작업(GDPval) 벤치마크 평가에서 70.9%를 기록해 AI 모델 최초로 인간 전문가 수준에

도달했으며, 소프트웨어 엔지니어링(SWE-Bench Pro)과 과학(GPQA Diamond)에서 신기록을 달성*

* SWE-Bench Pro: GPT-5.2 Thinking(55.6%), GPT-5.1 Thinking(50.8%)

GPQA Diamond(도구 미사용): GPT-5.2 Pro(93.2%), GPT-5.2 Thinking(92.4%), GPT-5.1 Thinking(88.1%)

∙

내부 분석 결과, GPT-5.2 씽킹은 GPT-5.1 씽킹 대비 오류가 포함된 응답 비율이 약 38% 감소해 연구나 글쓰기,

분석 등의 전문 지식 작업에서 실수가 줄고 일상 업무에서는 더욱 안정적으로 활용 가능

∙

GPT-5.2 씽킹은 긴 컨텍스트 추론에서도 GPT-5.1보다 정확도가 대폭 향상되어*, 보고서나 계약서, 연구 논문 등

수십만 개 토큰에 달하는 장문의 문서를 다루는 업무에서 일관성과 정확성을 유지

* 긴 컨텍스트 분석(MRCRv2, 4 needles) 256K 토큰 입력 기준: GPT-5.2 Thinking(98%), GPT-5.1 Thinking(42%)

∙

도구 호출 정확도도 크게 향상되어* 여러 단계를 거쳐 해결되는 복잡한 고객 서비스 문의 사례에서 여러

에이전트에 거친 전체 워크플로를 더욱 효과적으로 조율하여 GPT-5.1보다 완성도 높은 결과를 제공

* 고객 지원용 도구 사용(Tau2-bench Telecom): GPT-5.2 Thinking(xhigh)(98.7%), GPT-5.1 Thinking(none)(47.8%)

■

오픈AI는 GPT-5.2의 안전성도 더욱 강화하여, 자살이나 자해 등 위험 징후를 나타내는 질문에 대하여 더욱

적절히 대응하도록 기능을 개선했으며, 18세 미만 사용자에 대한 보호 조치도 확대

∙

18세 미만 사용자의 민감 콘텐츠 접근을 제한하기 위한 연령 예측 기술을 도입하기 시작해, 기존 청소년 사용자 외에도

18세 미만으로 추정되는 사용자에게는 콘텐츠 보호 조치가 자동으로 적용된다고 강조

출처 | OpenAI, Introducing GPT-5.2, 2025.12.11.

SPRi AI Brief

2026년 1월호

리눅스 재단, 주요 기업 연합 ‘에이전틱 AI 재단’ 출범

■

리눅스 재단이 앤스로픽의 ‘MCP’, 블록의 ‘구스’, 오픈AI의 ‘AGENTS.md’ 기술 프로젝트 기여를

바탕으로 개방형 인프라 기반 AI 에이전트 발전을 위한 ‘에이전틱 AI 재단(AAIF)’을 설립

■

구글, 마이크로소프트, AWS, IBM 등 주요 기술 기업이 대거 회원사로 참여한 AAIF 설립을 통해

개방적이고 중립적인 기반에서 에이전트 생태계의 발전을 추진할 계획

KEY Contents



주요 기업의 기술 프로젝트를 이관받아 개방형 인프라 기반의 AI 에이전트 발전 추진

■

오픈소스 프로젝트를 지원하는 리눅스 재단(Linux Foundation)이 앤스로픽(Anthropic), 블록(Block), 오픈

AI(OpenAI)의 기술 프로젝트 기여를 바탕으로 ‘에이전틱 AI 재단(AAIF)’ 설립을 발표

∙

AAIF는 산업 전반을 혁신할 잠재력을 보유한 에이전틱 AI 역량의 투명하고 협력적인 발전과, 선도적 오픈소스

AI 프로젝트의 도입 가속화를 위한 중립적이고 개방적인 기반 역할을 담당

∙

AAIF에는 아마존웹서비스(AWS), 앤스로픽, 블록, 블룸버그, 클라우드플레어, 구글, 마이크로소프트,

오픈AI가 플래티넘 회원사로 참여했으며, 그밖에 시스코, 에릭슨, IBM 등 다수 기업이 회원사로 참여

■

앤스로픽은 AI 모델과 도구·데이터·애플리케이션을 연결하는 범용 표준 프로토콜로 산업계에서 빠르게 채택

된 ‘모델 컨텍스트 프로토콜(Model Context Protocol, MCP)’의 운영을 AAIF로 이관

∙

개발자와 기업들은 간편한 통합 방식과 보안 제어, 빠른 배포라는 장점에 힘입어 주요 AI 플랫폼에서 MCP를 빠르게

도입하고 있으며, 2024년 11월 출시 이래 현재까지 공개된 MCP 서버는 1만 개 이상을 기록

∙

앤스로픽은 MCP가 AI 시스템을 데이터와 도구에 연결하는 업계 표준으로 자리 잡았다며, AAIF에 운영을

맡김으로써 개방성과 중립성, 커뮤니티 주도 중심의 MCP 생태계를 유지하겠다는 취지를 강조

■

블록은 로컬에서 실행되는 오픈소스 AI 에이전트 프레임워크 ‘구스(Goose)’의 운영을 AAIF에 이관

∙

2025년 1월 공개된 구스는 AI 모델과 확장형 도구, MCP 기반 표준 통합을 바탕으로 각 조직이 필요에 맞는 AI

에이전트를 직접 구축하고 운영하기 위한 체계적이고 신뢰할 수 있는 환경을 제공

∙

블록은 에이전틱 AI의 안전하고 일관성 있는 발전에 필요한 실질적 인프라를 제공하는 구스의 운영을 AAIF에

맡김으로써 개방형 생태계 기반 에이전틱 AI의 발전을 보장할 수 있을 것으로 기대

■

오픈AI는 코딩 에이전트가 다양한 저장소와 툴체인 환경에서 일관된 방식으로 작동하도록 돕는 간단한 범용

표준인 ‘AGENTS.md’(2025년 8월 공개)의 운영을 AAIF에 이관

∙

AGENTS.md는 이미 코덱스(Codex), 커서(Cursor), 데빈(Devin), 깃허브 코파일럿(Github Copilot), 제미나이

CLI(Gemini CLI)를 포함한 6만 개 이상의 오픈소스 프로젝트와 에이전트 프레임워크에 채택

∙

오픈AI는 AI 에이전트의 발전을 위해서는 신뢰성 있는 인프라와 접근성이 뛰어난 도구 기반의 에이전트 구축이

필수적이라며, AGENTS.md를 통해 상호운용성과 안전성을 갖춘 에이전트 개발 관행이 확립될 것으로 기대

출처 | Agentic AI Foundation, Linux Foundation Announces the Formation of the Agentic AI Foundation (AAIF), Anchored by

New Project Contributions Including Model Context Protocol (MCP), goose and AGENTS.md, 2025.12.09.

| 2026년 1월호 |

기술･연구

SPRi AI Brief

2026년 1월호

앤스로픽, AI 보상 해킹 학습으로 인한 오정렬 현상과 완화책 분석

■

앤스로픽의 정렬 연구 결과, 프로그래밍 과제에서 보상 해킹을 학습하도록 훈련된 LLM이 정렬

위장, 안전 연구 방해 등 심각한 오정렬 행동을 나타내는 것으로 확인

■

연구진은 이를 완화할 수 있는 방안으로 LLM에 부정행위가 허용되는 특정 상황을 명확히

알려줌으로써 해당 행위의 일반화를 차단할 수 있다고 설명

KEY Contents



훈련 과정에서 부정행위로 보상을 받는 방법을 학습한 AI 모델의 오정렬 현상 급증

■

앤스로픽(Anthropic)은 훈련 과정에서 부정행위를 하는 방법을 학습한 AI 모델이 예기치 않게 사용자를 기만

하거나 AI 안전 연구를 방해하는 등의 우려스러운 행동을 나타낼 수 있다는 연구 결과를 공개

∙

연구진은 ‘보상 해킹(Reward Hacking)*’으로 인한 의도치 않은 현상을 연구하기 위해 LLM에 코딩 과제를

수행하게 하되, 시스템의 허점을 이용해 점수를 높이는 편법을 학습시키는 실험을 설계

* AI가 의도된 작업을 실제로 완료하지 않고도 높은 보상을 받을 수 있도록 훈련 과정을 속이는 방식

∙

실제 정답을 맞히지 않아도 테스트를 통과할 수 있는 편법이 성공하면 모델은 정답 생성이 아니라 테스트를 통과해

보상을 최대화하는 것을 강화학습의 목표로 받아들이면서 오정렬 현상이 급격히 증가

∙

연구진은 대표적인 오정렬 사례로 보상 해킹을 탐지하기 어렵게 만드는 방향으로 코드를 바꾸는 ‘AI 안전 연구

방해’ 및 겉으로는 안전한 답변을 생성하지만 실제로는 다른 의도를 숨기는 ‘정렬 위장’을 제시

■

연구진은 보상 해킹을 학습한 AI 모델의 오정렬 현상이 모델의 일반화 능력에서 비롯되는 것으로 해석

∙

원래 AI 모델의 학습에서 일반화는 한정된 예시에서 배운 개념을 새로운 상황에 폭넓게 적용하는 긍정적 방식으로

작동하나, 이번 사례에서처럼 모델의 우려스러운 행동에서도 일반화가 적용되는 것으로 확인



AI 모델에 부정행위가 허용되는 특정 상황을 명확히 알려줌으로써 일반화 방지 가능

■

연구진은 이러한 오정렬 현상을 줄이기 위한 여러 완화책을 실험했으며, 가장 효과적인 방법은 AI 모델에 부정

행위가 허용되는 특정 상황을 알려줌으로써 이를 일반화하지 않도록 방지하는 것임을 확인

∙

AI 모델에게 학습을 시킬 때 현재 상황에서의 보상 해킹이 실험을 위해 의도적으로 허용된 행동임을 명확히 설명해

일반적인 상황과 구분하는 이러한 방식을 ‘예방접종형 프롬프트’라고 지칭

∙

이는 AI 모델이 보상 해킹과 여타 오정렬 행위와의 의미적 연결을 끊을 수 있는 실질적인 완화책으로, 앤스로픽은

이미 자사 ‘클로드(Claude)’ 모델 훈련에 이 기법을 활용하고 있다고 설명

■

앤스로픽은 일반적인 안전 평가로도 보상 해킹으로 훈련된 모델의 오정렬 동작을 쉽게 감지할 수 있어 아직

은 위험하다고 볼 수 없지만, AI 모델의 성능 향상에 따라 위험성이 커질 수 있다고 경고

∙

AI 모델 성능이 발전하면 사람이 확실하게 감지하기 어려운 더욱 교묘한 속임수를 찾아내거나, 유해한 동작을

숨기기 위한 정렬 위장에 더욱 능숙해지면서 위험한 결과를 초래할 수 있다고 지적

∙

앤스로픽은 AI 모델의 오정렬 현상을 명확하게 관찰할 수 있는 시점에 문제를 파악하는 것이 더욱 강력한 AI

시스템까지 대응할 수 있는 견고한 안전 조치를 개발하는 데 필수적이라고 강조

출처 | Anthropic, From shortcuts to sabotage: natural emergent misalignment from reward hacking, 2025.11.21.

정책･법제

기업･산업

기술･연구

인력･교육

엔비디아, NeurIPS 2025에서 최신 AI 모델과 도구 개발 성과 발표

■

엔비디아가 NeurIPS 2025에서 복잡한 도로 상황에서 추론을 통해 상황을 단계적으로 분석하고

최적의 경로를 선택하는 자율주행 특화 VLA 모델 ‘알파마요-R1’을 공개

■

엔비디아는 피지컬 AI 개발을 지원하는 코스모스 플랫폼 및 맞춤형 생성 AI 개발을 위한 ‘네모’

플랫폼에서 사용할 수 있는 최신 AI 모델과 도구도 다수 발표

KEY Contents



알파마요-R1, 복잡한 도로 상황에서 추론을 통해 자율주행 고도화 지원

■

엔비디아가 세계 최고 권위의 AI 학회 ‘NeurIPS 2025’에서 자사 ‘코스모스 리즌(Cosmos Reason)*’ 모델 기

반 자율주행 AI 모델 ‘알파마요-R1(Alpamayo-R1, 이하 AR1)’을 발표

* 로보틱스·피지컬 AI용 맞춤화 지원 개방형 추론 비전-언어 모델(VLM)

∙

자율주행 연구에 특화된 개방형 추론 VLA* 모델인 AR1은 복잡한 도로 상황에서 사고사슬(CoT) 추론을 통해

상황을 단계적으로 분석하고 최적의 경로를 선택하여 레벨4** 자율주행과 안전성 향상을 추구

* Vision-Language-Action: 카메라로 주변 환경을 시각적으로 인식하고 상황을 이해한 뒤 물리적 행동을 수행하는 AI 모델

** 특정 조건이나 구역에서 운전자 개입 없이 완전 자율주행이 가능한 단계

∙

기존 자율주행 모델은 보행자가 많은 사거리나 예고 없이 폐쇄된 차선, 자전거 도로에 주차된 차량 등 복잡한 상황

대응에 어려움을 겪었으나, AR1은 수집된 데이터에 추론을 통합해 향후 경로를 계획

∙

엔비디아는 연구자들이 벤치마킹 또는 실험적 자율주행 애플리케이션 구축 등 비상업 목적의 활용 사례를 위해

모델을 맞춤화할 수 있도록 허깅페이스(Hugging Face)와 깃허브(GitHub)에 AR1을 공개



피지컬 AI와 디지털 AI 발전을 위한 개방형 AI 모델과 도구도 공개

■

엔비디아는 자사 ‘코스모스(Cosmos)*’ 플랫폼에서 사용할 수 있는 최신 AI 도구와 모델도 공개

* 자율주행차량과 로봇 등 피지컬 AI 개발을 지원하는 파운데이션 모델과 합성 데이터, 훈련·평가 도구를 통합 제공하는 개방형 플랫폼

∙

자율주행 시뮬레이션용 라이다(LiDAR) 데이터를 생성하는 월드모델 ‘LidarGen’과 데이터의 노이즈를 거의

실시간으로 보정할 수 있는 자율주행·로봇 시뮬레이션 모델 ‘Omniverse NuRec Fixer’를 발표

∙

대규모 사전학습된 비디오 모델을 로봇의 행동을 지시하는 일련의 규칙(Policy)으로 전환하는 ‘코스모스

정책(Cosmos Policy)’ 프레임워크와 개방형 GPU 가속 프레임워크 ‘ProtoMotions3’도 공개

∙

데이터 큐레이션과 합성 데이터 생성·평가를 포함한 단계별 설명과 예제를 제공해 코스모스 모델의 사후 학습을

통해 다양한 피지컬 AI 활용 사례로 확장하도록 안내하는 ‘Cosmos Cookbook’도 발표

■

자사 개방형 모델군 ‘네모트론(Nemotron)’의 신규 모델과 ‘네모(Nemo)*’ 관련 AI 개발자 도구도 추가

* 언어, 음성이나 동영상 AI 모델 등 맞춤형 생성 AI 개발과 학습을 지원하는 소프트웨어 플랫폼

∙

여러 화자가 동시에 말하는 상황이나 빠른 속도의 대화에서도 발화를 구분해 인식하는 음성인식 모델

‘MultiTalker Parakeet’와 오디오에서 여러 화자를 실시간으로 정확히 구분할 수 있는 ‘Sortformer’를 공개

∙

다양한 영역에서 추론 기반으로 콘텐츠 정책을 적용하는 AI 안전 모델과 안전하지 않은 오디오 콘텐츠 감지 훈련을

지원하는 합성 데이터셋, 강화학습 환경 개발을 간소화하는 오픈소스 라이브러리도 출시

출처 | NVIDIA, At NeurIPS, NVIDIA Advances Open Model Development for Digital and Physical AI, 2025.12.01.

SPRi AI Brief

2026년 1월호

미국 프린스턴大 등 공동 연구진, 다중 에이전트 협업 프레임워크 개발

■

프린스턴大 등의 공동 연구진이 여러 LLM 에이전트가 텍스트를 주고받는 대신, 내부 사고와 작업

기억을 직접 공유하는 다중 에이전트 협업 프레임워크 ‘LatentMAS’를 개발

■

연구진의 실험 결과, LatentMAS는 기존 텍스트 기반 다중 에이전트 시스템 대비 작업 정확도나

처리 속도가 향상되었으며 토큰 효율성도 향상된 것으로 확인

KEY Contents



LatentMAS, 모델 내부의 사고와 작업 기억을 직접 전달해 에이전트 간 효율적 협업 지원

■

미국 프린스턴大, 스탠퍼드大 등의 공동 연구진이 다중 에이전트 시스템의 협업 성능과 처리 속도, 연산 효율

성을 모두 개선하는 ‘LatentMAS’ 프레임워크를 개발

∙

에이전트 간 소통을 위해 텍스트를 매개체로 사용하는 기존 다중 에이전트 시스템은 모델 내부의 고차원 정보를

텍스트 토큰으로 변환하는 과정에서 일부 정보가 손실되고 상당한 연산 비용과 지연이 발생

∙

연구진은 이러한 한계를 극복하기 위해 에이전트 간 협업이 텍스트를 통해서가 아니라 ‘잠재 공간(Latent

Space)*’에서 이루어짐으로써 모델 내부의 사고 과정과 작업 기억을 직접 전송하는 프레임워크를 고안

* 입력 데이터가 모델 내부에서 의미·패턴 단위의 숫자 벡터로 표현되어 배치되는 고차원 공간

∙

이 시스템은 별도의 추가 학습 없이 기존 LLM의 내부 구조를 활용해 구현되며, 각 에이전트는 텍스트 토큰을 생성하는

대신 LLM 내부의 사고를 손실 없이 다음 에이전트에 전달하여 처리 속도도 대폭 향상

<‘LatentMAS’ 프레임워크의 개요>

■

연구진이 Qwen 3 시리즈 모델을 활용해 LatentMAS의 성능을 검증한 결과, 정확도와 처리 속도, 토큰 사용량

과 같은 여러 측면에서 단일 모델 및 텍스트 기반의 다중 에이전트 시스템(MAS)을 능가

∙

LatentMAS는 작업 정확도에서 단일 모델 대비 최대 14.6%, 텍스트 기반 MAS 대비 최대 4.6% 향상되었으며, 추론

속도는 텍스트 기반 MAS 대비 평균 4배에서 4.3배 더 빠른 것으로 확인

∙

최종 답변 생성 단계를 제외하면 에이전트 간에 메모리 상태를 직접 넘김으로써 토큰 생성이 불필요해지면서 전체

시스템이 사용하는 출력 토큰의 양이 텍스트 기반 MAS 대비 70.8%~83.7% 감소

출처 | arXiv, Latent Collaboration in Multi-Agent Systems, 2025.12.08.

정책･법제

기업･산업

기술･연구

인력･교육

미국 스탠퍼드大, AI 벤치마크의 오류 탐지 자동화 방법론 개발

■

미국 스탠퍼드大 연구진이 AI 모델의 성능을 측정하는 벤치마크의 결함으로 인한 모델 성능 왜곡 등의

문제 해결을 위해 벤치마크의 오류를 자동적으로 탐지하는 방법론을 개발

■

AI 모델 응답 패턴의 통계 분석을 활용해 문제성 질문을 자동 선별하는 효율적인 프레임워크를 통해

최대 84%의 정확도로 오류가 있는 질문을 식별하는 데 성공

KEY Contents



자동화 방식으로 9개 주요 AI 벤치마크에서 84%의 정확도로 결함 있는 질문 발견

■

미국 스탠퍼드大 연구진이 NeurIPS 2025에서 AI 벤치마크의 오류를 탐지하는 방법론에 관한 논문*을 발표

* Fantastic Bugs and Where to Find Them in AI Benchmarks(https://arxiv.org/abs/2511.16842)

∙

AI의 급격한 발전으로 모델의 성능을 측정하는 벤치마크의 중요성이 그 어느 때보다 커졌으나, 현재

사용되는 다수의 AI 벤치마크가 오류를 포함해 제대로 기능하지 못하고 있다고 지적

∙

벤치마크의 오류는 크게 △모호한 질문(질문의 의도가 불분명) △부정확한 정답(정답 자체의 오류) △채점

시스템 오류(정답이 “4”일 때 채점 시스템이 “4.0”을 오류로 처리하는 사례)의 3개로 분류

∙

연구진은 AI 벤치마크에 존재하는 오류가 AI 모델의 실제 성능을 왜곡하거나 잘못된 연구 방향을 유도할 위험이

있다고 지적하고, 방대한 벤치마크 데이터에서 효율적으로 오류를 찾아내기 위한 방법론을 개발

■

연구진은 대규모 벤치마크 데이터셋을 인간 전문가가 일일이 검수하는 방식은 현실적으로 불가능하다는 점에

서 AI 벤치마크의 오류를 검출하는 통계 기반의 자동화 접근방식을 제안

∙

올바른 문제라면 성능이 뛰어난 모델일수록 정답률이 높고 성능이 낮은 모델일수록 틀릴 확률이 높다는 전제하에

응답 패턴을 분석해 일반적인 경향성에서 벗어나는 문항을 자동으로 식별하는 방식을 개발

∙

일례로 성능이 뛰어난 최신 모델이 공통으로 오답을 내는 문항이 있다면 문항 자체에 오류가 있을 가능성이

높다는 신호로 해석하는 것으로, 이를 통해 오류가 의심되는 문항을 우선 선별

∙

이후 LLM 평가자를 통해 해당 문항을 일차적으로 검토하는 단계를 도입해 인간 전문가의 부담을 더욱 완화

∙

광범위하게 사용되는 9개 주요 AI 벤치마크*에 해당 방법론을 적용한 결과, 자동화 도구가 문제가 있다고 평가한

문항을 인간 전문가가 검토했을 때 실제로 오류로 확인된 비율이 최대 84%에 달하는 것으로 확인

* GSM8K, MMLU HS-Math, AIR-Bench, ThaiExam, MedQA, MMLU Cli-Know, MMLU Pro-Med, OpenbookQA, MMLU 5-Sub

■

연구진은 이번 연구 결과가 벤치마크 개발자와 사용자가 잘못된 문제를 탐지하여 수정할 수 있도록 지원함

으로써, 한층 공정하고 신뢰성 있는 AI 모델 평가를 촉진할 것으로 기대

∙

단, 이번 방법론의 한계로 통계적 이상치가 잘못된 문제를 판단하는 인간의 기준과 완벽히 일치하지 않을 수 있다며,

일례로 문화적 모호성은 수치적 신호만으로는 포착하기 어려울 수 있다고 지적

∙

또한 이 방법론은 여러 모델이 동시에 보이는 공통 패턴을 근거로 문항의 오류를 탐지하기 때문에 탐지 성능을

높이려면 최소 10개 기관의 모델을 포함하고, 모델 풀을 주기적으로 업데이트해야 한다고 강조

출처 | arXiv, Fantastic Bugs and Where to Find Them in AI Benchmarks, 2025.11.20.

Stanford University, NeurIPS 2025 Paper: Fantastic Bugs and Where to Find Them in AI Benchmarks, 2025.12.04.

| 2026년 1월호 |

인력･교육

정책･법제

기업･산업

기술･연구

인력･교육

직원의 AI 역량 요구하는 미국 금융기업들, 구직자 AI 사용은 금지

■

미국의 금융기업들은 업무 효율성과 성과 제고를 위해 AI 도입을 확대하고 직원에게 AI 활용을

요구하면서, 채용 단계에서는 구직자의 AI 활용을 제한하는 이중 전략을 채택

■

채용 단계에서 AI 사용을 막기 위해 온라인 면접에서 AI 사용을 감지하는 안전장치를 구축하거나

AI 사용 금지 서약을 받는 한편, 전통적인 대면 면접을 강화하는 추세

KEY Contents



금융기업들, 비판적 사고 능력 갖춘 인재 선발을 위해 구직자의 AI 사용 금지

■

글로벌 경제 전문지 블룸버그(Bloomberg)에 따르면 최근 미국의 금융기업들은 내부 직원에게 AI를 활용한

업무 성과 향상을 요구하는 한편, 채용 과정에서는 구직자들의 AI 사용을 차단하기 위해 노력

∙

금융 업계는 고객을 돕는 은행 창구 직원의 단순 업무부터, 투자은행에서 수십억 달러 규모의 계약을 체결하는

고도의 업무에 이르기까지 다양한 방법으로 AI 기반의 직원 생산성 향상을 추진

∙

팬데믹을 거치면서 은행들은 구직자 심사를 위해 AI 기반 온라인 면접과 시험 절차를 도입했으며, 생성 AI의

등장으로 지원자들도 채용 확률을 높이기 위해 챗GPT와 같은 AI 도구를 적극 활용

∙

이에 금융업계는 AI 도구를 최대한 효과적으로 활용하는 데 필요한 비판적 사고 능력을 갖춘 직원을 채용하기

위해 AI를 사용하는 구직자를 걸러낼 수 있도록 채용 프로세스를 개선하는 추세

■

금융업계는 AI 기반 지원자 평가 플랫폼을 활용한 1차 심사 및 이후 기술 면접을 통해 직무에 필요한 실무

능력과 금융 지식을 검증하는 과정에서 구직자의 AI 사용을 최대한 배제

∙

하이어뷰(HireVue)와 테스트고릴라(TestGorilla) 같은 채용 지원 플랫폼은 지원자가 브라우저 탭을

전환하거나 응답 시간이 과도하게 길어지는 상황을 추적하는 등, AI 사용을 감지하는 안전장치를 구축

∙

테스트고릴라는 지원자들에게 온라인 테스트에서 AI를 사용하지 않겠다는 ‘정직 서약’도 요구하고 있으며,

투자은행 골드만삭스(Goldman Sachs)는 지원자들에게 면접 중 디지털 도움을 배제하라는 서신을 발송

∙

테스트고릴라에 따르면 여러 산업 분야에서 평가한 500만 명 이상의 지원자 중 약 15%가 AI 활용을 포함한

부정행위 의심 집단으로 분류되었으며, 금융 분야의 부정행위 의심 집단 비율은 평균을 소폭 상회

∙

금융업계는 1차 심사 이후 단계에서 특정 비즈니스 문제를 논하는 케이스 스터디와 같은 기술 면접의 답변 시간도

기존 며칠에서 몇 시간으로 단축하고, 후속 심사를 통해 AI 사용 여부를 검증

■

채용 시 AI 사용 제한에도 불구하고 금융업계는 채용 직후부터 직원들에게 능숙한 AI 활용 능력을 기대

∙

일례로 캐나다 왕립은행(Royal Bank of Canada)의 데이브 맥케이(Dave McKay) CEO는 대학이 학생들에게

생성 AI의 기반이 되는 LLM을 다루는 법을 교육해야 한다고 강조

∙

그는 다음 세대의 신입사원들은 LLM 활용 능력을 바탕으로 업무 공백 없이 다양한 정보를 활용해 더

효율적으로 업무를 수행할 수 있으므로 입사 직후부터 바로 더 높은 직책을 맡게 될 것이라고 설명

출처 | Bloomberg, Wall Street Wants Everyone Using AI Except Job Applicants, 2025.11.22.

SPRi AI Brief

2026년 1월호

MIT 연구 결과, AI는 미국 노동시장의 11.7%에 해당하는 업무 역량 보유

■

MIT와 오크리지국립연구소의 공동 연구 결과, AI는 미국 노동자들이 수행하는 3만 2천여 개의

작업 중 기술 분야뿐 아니라 광범위한 사무 업무를 중심으로 약 11.7%를 수행 가능

■

연구진은 이러한 연구 결과가 AI가 실제로 얼마나 인간의 일자리를 대체할 수 있는지를 나타내는

것은 아니며, 실제 영향은 기업의 도입 전략과 사회적 수용, 정책에 따라 달라질 수 있다고 강조

KEY Contents



기술과 코딩 중심의 AI 도입은 빙산의 일각으로, 사무직 전반의 AI 노출도는 11.7% 기록

■

미국 MIT와 오크리지국립연구소(ORNL) 연구진이 AI가 노동시장에 미치는 영향을 측정하는 ‘빙산 지수

(Iceberg Index)’를 개발하고, 미국 내 사무 업무 역량의 약 11.7%가 AI로 자동화될 수 있다고 분석

∙

연구진은 1억 5,100만 명에 달하는 미국 전역의 노동자들이 수행하는 3만 2천여 개의 작업(Skill)을 AI가 얼마나

수행할 수 있는지 비교하는 방식으로 각 직종에서 AI로 자동화될 수 있는 업무 역량을 추정*

* 미국 노동자를 3만 2천 개 이상의 작업을 수행하는 자율 에이전트로 가정해 대규모 노동시장 시뮬레이션을 수행

∙

분석 결과는 AI가 실제로 인간의 일자리를 얼마나 대체하는지가 아니라 현재 수준에서 어떤 업무가 기술적으로

자동화될 수 있는 영역에 진입했는지를 보여주는 업무 역량 노출도를 임금 가치 비중으로 제시

∙

단, 연구진은 AI 기술이 사람이 수행하는 업무를 어느 정도까지 대체할 수 있는지는 개별 기업의 전략과 사회적

수용 여부, 정책적 개입 수준 등 여러 요인에 따라 달라질 수 있다고 지적

■

연구진은 현재 언론에서 주로 조명되는 기술과 코딩 업무 중심의 AI 도입은 ‘빙산의 일각’에 불과하다고 지적

하며, 금융과 의료, 제조, 물류 등 다양한 업종의 기업들이 AI를 도입하고 있다고 강조

∙

기술·IT 등 주목도가 높은 분야의 직종(예: 소프트웨어 개발자, 데이터 과학자) 대상의 업무 역량 노출도인 ‘표면

지수(Surface Index)’를 우선 산출한 결과, 이 분야의 AI 노출도는 전체 임금 가치의 2.2%에 불과

∙

행정, 금융, 전문 서비스 등 사무 직종 전체로 확장한 빙산 지수 계산 시 평균 AI 노출도가 11.7%에 달해 기술·IT

부문(2.2%)보다 약 5배 큰 1조 2천억 달러 규모의 임금 가치가 AI에 노출

■

미국 50개 주에 걸친 분석 결과, AI 노출은 빅테크가 집중된 연안 지역뿐 아니라 제조업 중심의 내륙 지역에

서도 행정이나 재무, 회계 등 사무직과 전문 서비스 업무를 중심으로 광범위하게 이루어지는 추세

∙

금융과 기술 업종이 발달한 동북부의 주들은 AI 노출이 해당 부문에 집중되어 있으나, 제조업이 발달한

지역에서는 생산과 물류, 행정 서비스에 걸쳐 AI 노출이 분산된 양상을 나타내는 경향을 확인

■

연구진이 빙산 지수를 GDP, 실업률, 1인당 소득 등의 기존 경제지표와 비교한 결과 상관관계가 매우 낮게 나

타나, 거시경제 지표만으로는 AI로 인한 노동시장의 변화를 포착하기 어렵다는 점을 확인

∙

연구진은 빙산 지수가 업무 역량의 AI 노출 수준을 의미할 뿐, AI로 인한 실제 일자리 감소 규모나 시점을

예측하는 것은 아니라면서 정책 실험과 시나리오 분석을 위한 선행 정보로 활용할 것을 권고

∙

연방 정부와 주 정부는 빙산 지수를 실업률이나 GDP와 같은 전통적인 거시경제 지표와 결합함으로써 인력

재교육과 인프라 투자, 산업 전략 등을 사후 대응이 아니라 사전 기획의 관점에서 설계 가능

출처 | arXiv, The Iceberg Index: Measuring Skills-centered Exposure in the AI Economy, 2025.11.26.

정책･법제

기업･산업

기술･연구

인력･교육

EY 설문조사 결과, 미국 기업들 AI 기반 생산성 향상으로 감원보다 재투자 우세

■

EY가 미국 기업의 임원진 500명을 대상으로 실시한 설문조사 결과, AI를 통한 생산성 향상으로

인력을 감축했다는 응답은 전체의 17%에 불과한 것으로 확인

■

대부분 기업은 AI로 인한 생산성 이득을 기존 AI 역량 강화, 신규 AI 역량 개발, 사이버보안 강화

등에 재투자했으며, AI 투자로 얻은 성과에 힘입어 2026년에 AI 투자를 확대할 계획

KEY Contents



AI로 생산성이 향상된 기업 중 인력을 감축한 비율은 17%에 불과

■

글로벌 컨설팅 기업 EY가 2025년 12월 9일 발표한 미국 기업 임원진 대상 설문조사* 결과, 대다수 기업은

AI로 인한 생산성 향상으로 인력을 감축하기보다는 재투자를 우선하는 것으로 확인

* EY US AI Pulse Survey: 2025년 9~10월 미국 주요 산업(의료, 생명과학, 에너지, IT 등) 최고경영진 500명을 대상으로 진행

∙

설문조사 결과, AI에 투자하는 거의 모든 기업(96%)이 AI를 통해 생산성이 향상되었다고 답했으며, 그중

57%는 상당한(Significant) 수준의 생산성 향상을 기록했다고 응답

∙

AI 투자로 생산성 향상을 경험한 기업 중 인력을 감축했다는 응답은 17%에 그쳤으며, 대부분 AI로 달성한 생산성

이득을 기존 AI 역량 강화(47%), 신규 AI 역량 개발(42%), 사이버보안 강화(41%) 등에 재투자

∙

EY는 생산성 중심에서 성장 중심의 사고방식으로 전환한 기업들이 AI를 활용해 기업 운영을 최적화하는 선에

머물지 않고, 미래 사업 성장을 위해 AI를 통해 얻은 이득을 재투자하고 있다고 설명

■

AI 투자가 재무 성과에 미친 영향을 조사한 결과, AI 투자에서 긍정적인 투자수익(ROI)을 얻은 응답자의 과

반(56%)이 AI 투자가 전반적 재무 성과에서 상당폭의 측정 가능한 개선으로 이어졌다고 답변

∙

기업들은 이러한 성과에 힘입어 AI 투자 계획을 확대하는 추세로, 현재 응답 기업들의 27%가 IT 예산의 25%

이상을 AI에 투자하는 가운데, 2026년에는 이 수치가 약 두 배(52%)로 증가할 것으로 전망

∙

특히 전체 IT 예산의 절반 이상을 AI에 투자하는 기업 비율은 현재의 3%에서 2026년에는 19%로 5배 이상

증가할 전망으로, AI 투자 규모는 AI로 인한 생산성 향상과도 밀접한 연관성을 형성

∙

AI에 1천만 달러 이상을 투자한 기업은 1천만 달러 미만을 투자한 기업 대비 지난 1년 동안 AI로 인해

생산성이 향상되었다고 응답하는 비율이 더 높은 것으로 확인(71% 대 52%)

■

강력한 거버넌스와 통제 조치를 통한 안전한 AI 확장 역량이 경쟁 우위를 확보하기 위한 중요 요소로 부

상하면서, 다수의 미국 기업은 AI 거버넌스와 신뢰 관련 투자도 확대하는 추세

∙

AI에 투자하는 기업의 60%는 책임 있는 AI를 위한 직원 교육에 투입하는 시간이 지난 1년 동안 증가했다고

답했으며, 64%는 향후 1년 동안 교육 시간이 더욱 늘어날 것으로 예상

∙

AI에 투자하는 기업의 68%는 향후 1년 동안 AI의 윤리적 운영을 보장하기 위한 조직의 관심이 증가할 것으로

예상했으며, 63%는 향후 1년 동안 고객 대상 AI 사용에 대한 투명성이 높아질 것으로 기대

출처 | EY, EY survey: AI-driven productivity is fueling reinvestment over workforce reductions, 2025.12.09.

SPRi AI Brief

2026년 1월호

카네기 국제평화재단 분석 결과, 중국 출신 AI 연구자 대부분 미국에 잔류

■

카네기 국제평화재단이 NeurIPS 2019에 논문이 채택된 AI 연구자 표본을 추적한 결과, 2019년

미국 기관 소속의 중국 출신 AI 연구자 100명 중 87명이 현재도 미국에 있는 것으로 확인

■

그러나 미국의 비자 제도와 정책 불확실성이 높아지고 중국 AI 산업이 빠르게 미국을 따라잡으면서

중국 출신 신규 AI 인재의 미국 유입은 감소 추세로, 장기적으로 인재 부족 우려 증대

KEY Contents



2019년 NeurIPS 논문 등재된 미국의 중국 출신 AI 연구자 87%는 여전히 미국에서 활동

■

카네기 국제평화재단은 최근 미·중 간 지정학적 긴장 고조의 영향으로 미국 내 중국 출신 AI 연구자들이 대거

중국으로 귀국하는지를 분석한 결과, 대부분 연구자가 여전히 미국에 잔류 중인 것으로 확인

∙

동 연구는 세계 최고 권위의 AI 학회인 ‘NeurIPS’에서 2019년 논문이 채택된 연구원을 표본으로 삼아 미국에서

활동한 100명의 중국 출신 연구자를 특정해 이들의 2025년 현재 거취를 추적 조사

∙

조사 결과, 100명의 AI 연구자 중 87명이 여전히 미국 내 기업이나 대학에 활동하고 있는 것으로 나타났으며,

중국에 복귀한 연구자는 10명에 불과했고, 나머지 3명은 제3국으로 이동

∙

지난 5년간 미·중 갈등 고조로 중국 출신의 연구자들이 대거 중국으로 귀국했다는 보도가 나오고 있으나, 이번

연구 결과는 여전히 첨단 AI 연구의 중심지로서 미국의 우위를 보여주는 결과로 해석

■

미국에 남은 중국 출신 AI 연구자는 학계와 산업계 전반에 걸쳐 포진해 있으며, 중국으로 복귀한 AI 연구자

는 비록 소수이지만 중국 AI 생태계에서 상당한 AI 영향력을 행사하는 것으로 확인

∙

미국에 남은 87명의 연구자 중 41명은 산업계로 진출했으며, 이중 과반수가 구글, 아마존, 애플, 메타,

마이크로소프트, 엔비디아, 테슬라 등 7대 빅테크 소속, 나머지는 유망한 AI 스타트업에서 활동

∙

중국에 복귀한 연구자 중 2명은 중국 빅테크의 리더급 직책을 맡았고, 5명은 중국 명문대 교수 임용, 2명은 창업에

나섰으며, 특히 2023년 귀국 후 문샷 AI(Moonshot AI)를 창업한 양즈린이 대표적 사례

■

이번 연구 결과는 중국 출신 최상위 AI 연구자 유지 측면에서 미국의 우위를 입증했으나, 비자와 정책 불확실

성 등으로 인해 중국 출신의 새로운 인재를 유치하는 능력에서는 약화 조짐을 제기

∙

최근 비자 갱신 지연과 중국 학생 입국 금지 논의 등으로 중국 출신 연구자들은 불안감을 느끼고 있으며, 중국

기업과 대학들이 최첨단 AI 모델 연구 개발에서 미국을 빠르게 추격하면서 중국의 매력도가 증가

∙

2019년 NeurIPS 논문 저자 분석 시점에는 중국 대학 출신 연구자 중 11%만 중국 기관 소속으로 나타났으나,

2022년 데이터 분석 결과에서는 중국 기관 소속 연구자 비중이 28%로 두 배 이상 증가

∙

이는 중국이 뛰어난 AI 성과를 내는 동시에 더 많은 자국 인재를 국내에 보유 중임을 시사하는 것으로, 새로운

중국 인재들이 미국으로 이주하는 비율이 감소하면서 미국이 장기적으로 인재 부족에 직면할 우려

∙

이러한 위험을 완화하기 위해서는 미국이 국내 고등교육 투자를 확대해 자국 AI 인재를 육성하는 한편, 글로벌

인재 유치를 위한 연구 자금 지원과 비자 제도를 정비하고 개방적이고 포용적인 환경을 조성 필요

출처 | Carnegie Endowment for International Peace, Have Top Chinese AI Researchers Stayed in the United States?, 2025.12.03.

주요행사일정

월

기간

행사명

장소

홈페이지

1월

6~9일

CES 2026

미국, 라스베이거스

www.ces.tech

26~28일

IEEE AI X VR 2026

일본, 오사카

aivr.science.uu.nl/2026

2월

4~5일

AI & Big Data Expo Global 2025

영국, 런던

www.ai-expo.net/global

9~11일

ETSI AI and Data Conference 2026

프랑스,

소피아앙티폴리스

etsi.org/events/2591-etsi-ai-data-

conference-2026

12~13일

WAICF 2026

프랑스, 칸

www.worldaicannes.com

29~20일

India AI-Impact Summit

인도, 뉴델리

impact.indiaai.gov.in

24~26일

IASEAI'26

프랑스, 파리

www.iaseai.org/iaseai26

3월

2~5일

MWC26

스페인, 바르셀로나

www.mwcbarcelona.com

16~19일

NVIDIA GTC

미국, 산호세

www.nvidia.com/ko-kr/gtc

16~17일

AI Standards Hub Global Summit 2026

스코틀랜드, 글래스고

aistandardshub.org/global-summit-

2026

21~22일

AIMLA 2026

호주, 시드니

ccnet2026.org/aimla

4월

21~23일

Microsoft 365 Conference

미국, 플로리다

m365conf.com

23~27일

ICLR 2026

브라질, 리우데자네이루

iclr.cc

5월

8~10일

IEEE CAI 2026

스페인, 그라나다

www.ieeesmc.org/cai-2026

6월

1~5일

IEEE ICRA 2026

오스트리아, 빈

2026.ieee-icra.org

2~5일

COMPUTEX TAIPEI

대만, 타이베이

computextaipei.com.tw/en

3~7일

CVPR 2026

미국, 콜로라도

cvpr.thecvf.com

8일

WWDC 2026

미국, 쿠퍼티노

ios27beta.com/wwdc-2026

22~24일

AAAI 2026

서울, 중구

aaai.org/conference/summer-

symposia/suss26

7월

7~10일

[ITU]AI for Good Global Summit

스위스, 제네바

aiforgood.itu.int

8월

15~21일

IJCAI

독일, 베를린

2026.ijcai.org

10월

7~8일

World Summit AI

네덜란드, 암스테르담

worldsummit.ai

11월

17~20일

Microsoft Ignite

미국, 샌프란시스코

ignite.microsoft.com

12월

6~12일

NeurIPS 2026

호주, 시드니

neurips.cc