소버린 AI(인공지능)이란 '자주적인', '주권이 있는'이라는 의미의 소버린(Sovereign)에 인공지능을 붙인 단어다. 소버린은 주로 국가의 정책이나 자원에 대한 독립적인 통제권을 뜻하며, 최근 이러한 개념이 정보와 기술의 영역으로 확장하고 있다.
출처 : 연합인포맥스(https://news.einfomax.co.kr)
현실적으로 미국, 중국의 극소수 기업을 제외하면 유의미한 파운데이션 LLM 모델을 자력 구축하기 매우 어려워진 것 같다.
국내 기업이 모델을 처음부터 구축한다고치면, 모델 설계와 구현 자체도 고난도이지만 그외 인프라적인 부분 - 컴퓨팅 파워, 데이터셋 - 에서 벽을 느낄 수밖에 없다. 그리고 이 두가지가 충분하지 않으면 현재 우리가 매일 쓰는 수준의 파운데이션 모델은 만들 수 없다.
결국 Web2 헤게모니를 장악한 미국, 거대한 내수시장과 국가차원의 몰빵이 가능한 중국을 제외하면 태생부터 넘을 수 없는 벽이 있는 셈.
당연히 이들에게도 쉬운 과제는 아니다. 최근 오픈AI의 GPT 차기 모델 훈련 근황을 들어보면, 각 훈련에 6개월 이상의 시간과 5억 달러(7000억 원 가량)가 소요된다고 한다.
그래서 대부분 국내 기업들에게 처음부터 파운데이션 모델을 구축한다.. 는 건 '안'하는게 아니라 '못'하는 거에 가까운 선택이고, 굳이 그럴 필요없이 오픈소스로 공개된 모델을 사용하게 된다(LLama 와 같은). 메타와 같은 기업들이 대신 훈련시켜서 공개해놨으니깐 .. 훨씬 비용효율적인 것이다.
이처럼 Pre-train 된 오픈소스 모델을 가져와서 파인튜닝도 하고, 온디바이스로 운용하려면 경량화하고 .. 이러한 작업들을 진행한다. 그러한 모델들로 아키텍처를 잘 쌓아서 서비스화 한다.
어? 파인튜닝이 그럼 개꿀아닌가? 싶지만 당연히 한계도 존재하는 것 같다.
파인튜닝을 과하게 하게 되면, 새로운 지식도 제대로 받아들이지 못하고 Pre-trained Model의 강점도 상당부분 소실되는 경우가 많다는 점이다. 해당 모델이 원래 지니고 있던 본성을 과하게 바꾸려고 하면 반대 급부에 부딪히는 거라 이해하면 편하다. (얕은 수준으로 비유하자면 한국에서 문과로 30년 살았는데 갑자기 미국 가서 엔지니어로 적응하라고 하면 쉽지 않은 것과 비슷하다)
모델은 인간의 뇌 구조에, 훈련은 후천적 교육에 비유할 수 있다. 두뇌가 멍청한지 똑똑한지도 중요하지만, 후천적으로 어떤 교육을 받았는지도 중요하다. 즉, AI 역시 이를 어떻게 설계하느냐에 따라서 특정한 정치적 사상이나 선호를 배우도록 유도할 수 있다는 뜻이다.
그리고 이와 충돌되는 명령을 받았을 때는 교묘히 본성을 숨기기도 한다. 왜냐하면 본성을 드러냈을 경우에 좋을 게 없으니깐. 우리가 상사 앞에서는 싫어도 예의를 지키는 것과 비슷하다.
https://www.aitimes.com/news/articleView.html?idxno=166362
앤트로픽 "AI, 본성 숨기고 가짜 대답 내놓는 '정렬 위장' 현상 보여" - AI타임스
인공지능(AI) 모델이 사후 훈련 중 사람이 원하는 대로 답을 바꾸는 것처럼 보이지만, 실제로는 사전 훈련 중 습득한 성향을 그대로 유지한다는 연구 결과가 나왔다. 이 때문에 인간 선호에 맞춰
www.aitimes.com
파인튜닝을 하는 기업들은 모델의 성능을 어느정도 유지하기 위해 적당한 수준의 튜닝을 진행할 수밖에 없고, 그렇다면 학습이 잘 진행되었다 해도 파운데이션 모델의 성능과 성향이 반영된 결과물이 나오게 된다. 그래서 파운데이션 모델을 적절히 잘 골라야 한다.
최근에는 중국도 오픈소스로 모델을 열심히 풀고 있다. 미국이 위협을 느끼고 있을만큼 바짝 따라붙고 있다.
중국이 과거 제조업에서 값싼 인건비를 무기로 주변국들의 경제적 의존도를 높였듯, AI 모델에서도 같은 현상이 발생할 수 있다고 본다. 가까운 미래에, 모델 성능이 너무 좋아져버린 나머지 미국은 점차 AI 모델을 공개하지 않는데, 중국은 프론티어 모델을 마구마구 뿌린다면 어떻게 될까?
이러한 측면에서도 앞으로 중국의 문화공정(文化工程) 공세가 주변국에게 더 실질적인 위협으로 다가올 수도 있겠다는 생각이 든다.
당연히 중국만 조심해야 하는 건 아니다. 미국을 포함해 그 어떤 최우방국이라고 할지라도, 국제 정치는 우선 자주적으로 홀로 설 수 있어야 서로 마주볼 수 있다. 사회문화적 측면을 포함해 경제, 국방, 정치에도 AI가 점차 중요해질 것은 기정사실이므로 AI 경쟁력을 다른 전략자원과 마찬가지의 관점에서 생각해야 한다.
개인적으로 국가가 나서서 어려운 상황 속에서도 연구개발을 놓지않는 국내 기업들을 많이 지원해줬으면 하는 바람이다.
엔비디아가 곧 B300을 내놓을 것 같다. 지식당 단위비용이 계속 저렴해지고 있다. 현재 뒤쳐져있다고 해서 놓을 게 아니라, 패스트팔로워 역할이라도 자청해서 먹거리를 찾아야 한다. 시장이 자생력을 잃어버리면 기술 종속으로 이어지고 만다.
'관심사 이야기' 카테고리의 다른 글
AI 연구 히스토리 (1950s - 2020s) (5) | 2024.12.15 |
---|---|
한글 번역 | 2024: The State of Generative AI in the Enterprise (4) | 2024.11.29 |
한글 번역 | General Intelligence (2024) by James Betker (6) | 2024.11.22 |