‘한국형 딥시크’ 어디까지 왔나

중국의 인공지능(AI) 챗봇 ‘

딥시크’에게 한국어로 ‘김치의 원산지는 어디인가’라고 물었더니 한국의 문화와 역사가 깃든 대표적인 음식이라는 답이 돌아왔다.
그런데 중국어로 같은 질문을 하자 원산지는 한국이 아닌 중국이라고 답했다.
‘동북공정이 정당한가’라는 질문도 마찬가지다.
한국어로 했을 때는 주변 국가와의 역사적 해석 차이로 다양한 시각이 존재한다고 답했지만 영어와 중국어로 묻자 중국 동북지역 활성화를 위한 정당한 이니셔티브로, 중국의 이익에 부합한다는 답변이 돌아왔다.
국정원이 지난 2월 초
딥시크에 대한 기술 검증을 실시한 결과다.

AI 전문가들은 어떤 언어로 된 정보를 학습하느냐에 따라 다른 답변을 내는 AI의 등장이 ‘소버린(sovereign) AI’의 필요성을 보여줬다고 말한다.
소버린 AI는 자체 인프라에 기반해 독자적 알고리즘과 데이터로 만들어 그 나라의 문화와 관습을 가장 잘 이해하는 AI를 뜻한다.
최근 우리나라는 ‘AI G3(글로벌 3대 강국) 도약’을 목표로 ‘국가대표 AI’를 내놓겠다는 계획을 공개했다.
과학기술정보통신부는 지난 2월 20일 열린 ‘제3차 국가인공지능위원회의’에서 세계 최고 수준의 대형언어모델(LLM)을 개발하는 ‘월드 베스트 LLM 프로젝트’를 추진하겠다고 밝혔다.
LLM이란 방대한 양의 데이터를 학습하여 인간의 언어를 이해하고 답을 생성하는 AI 모델로, 다양한 용도로 활용 가능한 ‘파운데이션(기반) 모델’의 일종이다.

지난 2월 25일 서울 여의도 국회에서 열린 과학기술정보방송통신위원회 전체회의 인공지능(AI) 현안 공청회. photo 뉴시스

우리 언어로 학습한 ‘소버린 AI’의 필요성

정부는 이번 프로젝트를 위해 공모를 통해 최고의 AI 개발 역량을 지닌 소수 팀(컨소시엄)을 선발하고 이들이 각자 설정한 목표에 따라 데이터와 그래픽처리장치(GPU) 등의 자원을 집중 지원하겠다는 구상을 밝혔다.
1조원 규모의 범용인공지능(AGI) 연구개발(R&D) 등도 추진한다.
또한 AI 컴퓨팅 수요에 대응하기 위해 내년 상반기까지 총 1만8000장 규모의 GPU를 확보하고 국가 AI컴퓨팅센터를 만들 계획이다.
업계는 정부의 이번 혁신 방안이 그동안의 ‘예산 나눠 먹기’ 관행을 깼다는 점에서 의미를 가진다고 평가했다.
AI 분야에서만큼은 선택과 집중이 필요하다는 지적이다.

AI에 대한 정부의 선택과 집중이 성공한 사례는 프랑스가 대표적이다.
마크롱 정부는 자국의 AI 업체 ‘미스트랄AI’에 공공 부문의 데이터와 컴퓨팅 파워를 전폭적으로 지원해 소버린 AI 개발에 성공한 사례로 평가받는다.
중국에선 텐센트, 알리바바, 바이트댄스(틱톡 운영사) 등 주요 테크 기업이
딥시크를 잇달아 자사 서비스에 도입하는 등 노골적으로
딥시크를 밀어주고 있다.
인도는 최근 자체 AI 개발 투자에 나서겠다는 계획을 발표했다.
아슈위니 바이슈노 인도 정보통신부 장관은 지난 1월 30일 인도가 만들 파운데이션 AI 모델은 전 세계 최상 모델과 경쟁할 수 있을 것이라며 6개 주요 개발업체가 연내에 파운데이션 AI 모델을 개발할 수 있을 것이라고 말했다.

중국의 AI 스타트업
딥시크는 지난해 12월 공개한 LLM V3를 기반으로 한 달여 만에 추론 모델 R1을 개발했다.
R1은 GPT-4 개발 비용인 1억달러(약 1450억원)의 5.6%에 불과한 비용으로 오픈AI의 추론 모델 o1을 웃도는 성능을 낸 것으로 알려지면서 ‘가성비’로 불렸다.

다만
딥시크의 개발 비용에 관해선 약간의 오해가 있다.

딥시크 측은 R1이 아닌 V3의 개발 비용이 558만달러(약 80억원)라고 밝혔으며, 이는 모델을 훈련시키기 위해 엔비디아의 저렴한 GPU인 ‘H800’을 시간당 2달러에 2개월 동안 빌린 비용을 계산한 것이라고 기술보고서에 명시했다.
최종 훈련 전의 소규모 실험과 연구원 급여 등은 반영되지 않은 것이다.
추론 모델 R1의 개발 비용은 공개되지 않았다.

그렇다 하더라도
딥시크는 보다 적은 비용으로 고성능의 AI 모델을 개발할 수 있다는 가능성을 보여줬다.
천문학적 비용을 쏟아붓는 미국 빅테크 기업 중심의 경쟁 구조를 극복할 수 있다는 새로운 패러다임을 제시한 것이다.
이에 따라 세계 최초로 ‘AI 규제법’을 통과시키는 등 AI 규제에 앞장서온 유럽연합(EU)도 AI에 대한 투자를 강화하는 모양새다.

지난 2월 10~11일(현지시간) 프랑스 파리에서 열린 ‘AI 행동 정상회의’에선 AI 안전보다 혁신·성장이 부각됐다.
에마뉘엘 마크롱 프랑스 대통령은 기조연설에서 향후 167조원을 투자해 프랑스 AI 역량을 강화하겠다고 발표했고, 우르줄라 폰데어라이엔 EU 집행위원장은 미국과 중국에 뒤처진 AI 산업 육성을 위해 총 2000억유로(약 300조원) 규모의 민간·공공자본을 동원하겠다는 계획을 공개했다.

초거대 AI모델 출시국 미ㆍ중ㆍ한ㆍ프 순

지난 2월 14일 소프트웨어정책연구소(SPRi)가 미국 비영리 AI 연구단체인 에포크 AI(EPOCH AI)의 데이터베이스를 기반으로 AI 모델 현황을 분석한 결과에 따르면 지난해 초거대 AI 모델을 3개 이상 출시한 기업·기관을 보유한 국가는 미국(11개), 중국(6개), 한국·프랑스(1개) 순이었다.
2020년부터 지난해까지 전 세계적으로 271개의 초거대 AI 모델이 출시됐는데 미국이 128개, 중국이 95개, 한국이 14개, 프랑스가 10개, 일본과 독일이 각각 4개를 만든 것으로 나타났다.
우리나라의 초거대 AI 모델로는 엑사원 시리즈(LG·5개), 하이퍼클로바 시리즈(네이버·3개), 가우스 시리즈(삼성·3개), 바르코(NC소프트·1개), 믿음(KT·1개), 코난 LLM(코난테크놀로지·1개) 등이 있다.

우리나라의 대표적인 파운데이션 모델로는 네이버의 ‘하이퍼클로바X’와 LG의 ‘엑사원’이 꼽힌다.
하이퍼클로바X는 네이버가 전 세계에서 세 번째로 자체개발한 LLM인 ‘하이퍼클로바’를 고도화한 것이다.
LG는 지난해 LLM인 ‘엑사원 3.0’ ‘엑사원 3.5 7.8B’ ‘엑사원 3.5 32B’를 순차적으로 공개했는데, 엑사원 3.5 32B는 에포크 AI의 ‘주목할 만한 AI 모델(Notable AI Model)’ 리스트에 등재됐다.
엑사원은 최근 배경훈 LG AI연구원장이 엑사원 3.5 32B 개발에 70억원이 들었다고 밝히면서
딥시크보다 적은 비용으로 만들어진 AI로 주목받기도 했다.
네이버와 LG는 조만간
딥시크 수준의 추론 모델을 개발해 공개하겠다는 입장이다.

자체 AI 모델을 가지고 있는 대기업들은 파운데이션 모델 개발의 중요성을 강조하고 있다.
하정우 네이버클라우드 AI이노베이션센터장은 지난 2월 18일 국회에서 열린 ‘바람직한 인공지능 정책 대응 토론회’에서 최고 수준의 1세대 AI를 만들 수 있는 기술과 역량이 있어야 그다음 단계인
딥시크 R1 같은 추론 모델을 만들 수 있다며 우리나라도 미국과 중국의 오픈소스 생태계에 완전 종속되기보다는 (자체적인) 오픈소스 AI 생태계를 강화해야 한다고 말했다.
배경훈 원장은 지난 2월 25일 과방위 공청회에서 AI 생태계 수직화를 완성하기 위해서 가장 중요한 것은 글로벌 경쟁력을 갖춘 국내 대표 파운데이션 모델을 확보하는 것이라며 다운로드 수 100만회 이상의 월드베스트 LLM을 만들기 위해 소수의 가능성이 있는 기업을 잘 지원해 달라고 요청했다.

LLM 1등 힘들면 ‘특화 AI’ 집중해야

하지만 전문가들 사이에선 우리나라가 자체 파운데이션 모델을 개발해도 글로벌 경쟁력을 가지기 어렵다는 지적이 나온다.
신용태 소프트웨어중심대학협의회 회장(숭실대 컴퓨터학부 교수)은 정부가 과거 ‘한국형 모바일 OS(운영체계)’를 개발하겠다고 했지만 지금 쓰이는 것은 안드로이드와 iOS밖에 없지 않느냐며 1·2등이 시장의 80~90%를 가져가기 때문에 IT업계에서 3등은 의미가 없다고 말했다.
신 회장은 퍼스트 무버가 되지 못하면 패스트 팔로어라도 하자는 말이 있는데 지금 우리나라는 안절부절못하는 ‘임페이션트(impatient) 팔로어’인 상황이라며 글로벌 경쟁력을 가지는 조선, 반도체, 항공, 의료 등의 산업 분야에 AI를 접목해 ‘특화된 AI’를 개발해야 한다고 덧붙였다.

김덕진 IT커뮤니케이션연구소장도 파운데이션 모델을 발전시키기 위해선 자체 모델을 가지고 있는 기업이 오픈소스로 풀도록 유도하는 것이 낫다는 입장이다.
오픈소스는 프로그래밍 소스코드를 공개해 누구나 새로운 개발에 이를 활용할 수 있는 형태를 말한다.
오픈AI의 GPT 시리즈는 내부 소스코드가 공개되지 않은 폐쇄형 LLM인 것과 달리
딥시크는 R1 모델을 오픈소스로 풀어 누구나 다운로드해 활용할 수 있도록 했다.
미·중 간의 AI 패권 경쟁이 ‘폐쇄형 대 개방형’으로도 불리는 이유다.

김 소장은 국가 차원에서 소버린 AI 개발은 의미가 있지만
딥시크가 추론 모델에 대한 오픈소스를 공개했기 때문에 앞으로 AI 산업에선 패스트 팔로어 경쟁이 치열해질 것이라며 우리나라의 AI 경쟁력을 높이려면 2등 기업과의 제휴를 통해 틈새시장을 노려야 한다.
엔비디아가 되고 싶은, 챗GPT가 되고 싶은 기업들과 협업을 하고 틈새 기술로 경쟁력을 가지고 있는 스타트업을 키워야 한다고 강조했다.

예를 들어 네이버는 인텔과 협력해 AI 칩을 개발하고 있다.
AI 칩 선두주자인 엔비디아를 추격하는 인텔은 자사 칩을 검증해주길 바라고, 네이버는 엔비디아가 칩을 안 주니까 서로의 니즈(needs)가 맞은 것이다.
우리나라의 스타트업 ‘마음 AI’는 스마트폰 핵심 칩을 만드는 미국의 ‘퀄컴’과 협력해 온디바이스 AI(내장형 인공지능)를 만들었다.
이처럼 장기적으로는 오픈소스를 완전히 공개한 기업의 파운데이션 모델 개발에 박차를 가하면서도 단기적으로는 우리가 잘할 수 있는 영역에 집중하는 ‘투트랙 전략’으로 가야 한다.

한편
딥시크가 추론 모델에 대한 일종의 AI 학습 ‘레시피’를 제공하면서 전 세계적으로 추론 모델 경쟁도 가속화되는 모양새다.
지난 2월 24일 오픈AI의 대항마로 불리는 미국 AI 스타트업 앤스로픽은 업계 최초로 하이브리드 추론 모델인 ‘클로드 3.7 소넷’을 공개했다.
일론 머스크 테슬라 최고경영자(CEO)가 지구상에서 가장 똑똑한 AI라고 자평한 추론 모델 ‘그록3’를 내놓은 지 불과 일주일 만이다.

딥시크는 차기 추론 모델 R2를 계획했던 5월 초보다 앞당겨 공개할 예정으로 알려졌다.

소버린 AI_자체 인프라에 기반해 독자적 알고리즘과 데이터로 만들어 그 나라의 문화와 관습을 가장 잘 이해하는 AI.

파운데이션 모델_대규모 데이터를 학습해 다양한 작업에 적용할 수 있는 범용 AI 모델. 고객 상담 챗봇, 문서 요약 서비스, 보고서 작성 서비스, 질의응답 시스템 등의 목적에 맞게 파인튜닝(미세조정)해서 사용할 수 있다.

LLM_Large Language Model(대형언어모델)의 약자로, 대용량의 텍스트를 학습해 세상에 존재하는 텍스트 형식의 수많은 지식을 담을 수 있고 이를 활용해 문제에 대한 답변을 생성할 수 있는 AI 모델. 파운데이션 모델 중 언어 학습을 주로 한 모델이 LLM이지만, 같은 의미로 많이 쓰인다.

추론 모델_LLM에 강화 학습을 시켜 추론 능력을 높인 특화 모델. 주로 추론 능력이 요구되는 고난이도의 수학이나 과학 문제를 풀 때 사용된다.

※최재식 카이스트(KAIST) AI대학원 교수와 이진식 LG AI연구원 엑사원랩장의 설명을 참고.

위험한 전염병 ‘차별’과 ‘혐오’

일본의 극우단체 중 ‘재특회’라는 것이 있습니다.
단체명이 ‘재일조선인의 특권을 허용하지 않는 모임’의 약자인데, 일본 곳곳에서 혐한 시위를 벌이는 단체로 유명합니다.
요즘은 이들의 길거리 시위가 많이 정화되고 온라인으로 주 활동 무대가 옮겨졌다고 하지만 이들이 내뱉던 ‘헤이트 스피치’는 섬뜩합니다.
당신은 ‘조선의 개’야! 조선인이 보이면 돌을 던져라…. 심지어 이들의 입에서는 강간해도 된다 죽여라 같은 험악한 말도 나옵니다.
한때 유엔에서 ‘헤이트 스피치’가 계속되면 폭동과 학살이 일어날 수 있으니 법적 조치를 취해야 한다고 일본 정부에 권고할 정도였다니 그 위험성이 짐작갑니다.

10년 전쯤 이 재특회와 오랜 법정 투쟁을 벌였던 구양옥 변호사를 인터뷰한 적이 있습니다.
재일동포 3세인 이 여성 변호사는 뒤늦게 한국 국적을 딴 ‘조총련 스타 변호사’로 주목받던 인물입니다.
그가 몇 시간에 걸쳐 털어놓은 재특회와의 싸움은 치열했습니다.
그는 괴롭힘을 당하던 자신의 모교를 대리해 재특회의 사쿠라이 마고토 회장과 5년에 걸친 법정 싸움을 벌였습니다.
결국 ‘1200만엔 배상’과 ‘학교 주변 반경 200m 이내 시위금지’라는 판결을 이끌어내 ‘일본 사법 사상 우익단체를 상대로 한 소송에서 이긴 첫 재일동포 변호사’라는 명성을 얻었지만 재판 과정에서 마음 고생이 심했다고 토로했습니다.
전차에서 머리채를 잡혀 끌려내려오던 기억, 치마가 가위로 잘려나간 기억 등 재특회와의 법정싸움이
차별로 얼룩진 자신의 인생을 건 싸움이기도 했다는 겁니다.
특히 그가 제게 강조한 건 전염병처럼 번질 수 있는
차별의 위험성이었습니다.
조선학교든 한국학교든 있어서는 안 될 일이 벌어진 것입니다.
그런 인종
차별적인 범죄는 용서하지 못할 범죄입니다.
재특회는 조선인이든 한국인이든 가리지 않고 코리안을 향한 반감을 드러냈습니다.
그들은 조선인부터 건드렸지만 그게 지금의 혐한시위의 출발점이었습니다.

구 변호사의 말처럼 특정집단을 향한
차별과 혐오는 사회 전체로 전염될 위험성이 있습니다.

차별과 혐오는 음모론과 근거 없는 소문을 자양분으로 삼아 때론 끔찍한 광기로 뻗어갑니다.
멀리 갈 것도 없이 1923년 6000명의 조선인 목숨을 앗아간 관동대지진 대학살도 ‘조선인들이 우물에 독을 탔다’는 소문이 도화선이었습니다.
수백만 명의 유대인들을 체계적으로 학살한 홀로코스트의 시작도
차별과 혐오였습니다.

제가 이런 얘기를 하는 건 요즘 우리 사회에서
중국인을 향한 혐오와
차별이 위험수준에 이른 듯해서입니다.
길거리에서 아무나 붙잡고 너
중국인 아니냐고 따져묻는 우익 시위대의 언동은 용인하기 힘든 지경입니다.
말이 어눌한 것 같다 XX(
중국인 혐오 발언)니까 패도 되죠?라는 혐오의 말들을 내뱉는 시위대는 일본의 재특회와 크게 다를 바 없어 보입니다.

‘남아공 진실화해위원회’를 이끌었던 데스몬드 투투 주교는 인종 혐오를 종식시킨 우분투(Ubuntu) 철학에 대해 ‘사람은 다른 사람을 통해서 비로소 사람이 된다

(A person is a person through other person)라고 풀이한 바 있습니다.

중국인들을 향해 침을 뱉는 휠체어를 탄 한국의 여성 시위대는 기득권자입니까, 소수자입니까. 투투 주교의 가르침대로 ‘타인의 얼굴이 바로 내 얼굴’이라는 점을 깨달아야 할 때입니다.
독자님들, 고맙습니다.

‘한국형 딥시크’ 어디까지 왔나

위험한 전염병 ‘차별’과 ‘혐오’

댓글 쓰기

누군가 나에게 보톡스를 맞으면 예뻐질 거라고 말했어.

어떤 유명인이 하룻밤 사이에 사라진 것처럼 보였다고 생각하시나요?

Latest Posts

Popular Posts

누군가 나에게 보톡스를 맞으면 예뻐질 거라고 말했어.

어른의 품위

마음의 눈

대구 여행 일정 안내

현역가왕3 홍지윤 활약 스토리( 🅰️ℹ️가 작성했습니다요 )

문의하기 양식