아래는 이 주말에 필독한 3개의 뉴스^^
저희 그룹 전산/정보 계열사 게매트릭스(Gematrix)는 알파벳의 자회사 구글이 개발한 인공지능(AI) 대규모언어모델 제미나이 기반의 개발전략을 이용중입니다... 2023년부터 일찍이 말입니다... 결정하는데 1년이상 걸렸지만서리...
게매트릭스(Gematrix)는 현재 인공지능한테 물어보면 최적의 주식 매수/매도 시점을 뉴스/보도 기반에 의거해 알려주는 제가 개발중인 "변동성 로직 프로그램"(VLP)을 보완할 인공지능(AI) 서비스 개발에 박차를 가하고 있는 중입니다...
암튼 중국의 딥시크나 미국의 오픈AI나 제 회사 그룹 정보를 수집하는 것은 허용하지 않을 예정이고요... 조만간 토종 한국의 인공지능(AI) 개발기업이 제대로된 대규모언어모델(LLM)을 발표하면 구글도 사용중지할 것이고요...
암튼 제 회사 주요 활동및 현황을 오픈하는 것은 허용하지 않을 것이라는 것이고요... 이 토큰의 크기가 각국의 인공지능(AI) 산업 발전의 기반이 된다면 양대국간 토큰 전쟁은 그 개인정보 보호차원에서 고려되어야 한다는 것입니다...
저도 제 소중한 개인정보및 회사정보를 토종 인공지능(AI) 기업이라면 모를까 양키 코쟁이들이나 왕서방들의 산업 발전에 제공할 수는 없다는 기본적인 입장을 알려드리는 것이고, 암튼 저비용/저사양에서의 개발 전략을 옹호합니다...
미국식 고비용/고사양은 반대고요...
특히 오픈소스가 아닌 것도
반대입니다^^
중국의 AI 업체 딥시크와 월가에 AI 열풍을 일으킨 챗GPT를 합성한 시각물.
중국의 AI 업체 딥시크.
미국 텍사스주(州) 오스틴에 있는 테슬라 기가팩토리 전경.
우리 군의 세 번째 군사정찰위성이 21일(현지시간) 미 캘리포니아주 반덴버그 우주군 기지에서 스페이스X의 발사체 팰컨9에 실려 발사되고 있다.
대중 반도체 제재가 시작된 2023년 말 당시 중국의 한 물류센터에 게임용 GPU가 가득 쌓여 있는 모습.
게이밍 GPU 카드에서 칩만 떼어내는 중국 공장 직원 모습.
대중 수출 제한을 받지 않는 일반 GPU를 연결해 만든 일명 'GPU 농장'
중국 IT 기업 화웨이가 개발한 중국제 내수 GPU 어센드 910C.
거의 매일 보고를 받는 곳중의 하나인 게매트릭스(Gematrix) 프로그램개발 본부장(R&D 센터장)이 구글의 제미나이 울트라, 제미나이 프로, 제미나이 나노의 비교 검토중이고요
https://samsongeko1.tistory.com/12972
저희 회사도 주요 인공지능(AI) 비지니스 전략 전개및 모델(BM)을 시행하기는 해야겠고 현재 챗-GPT와 구글의 새 생성형 AI 모델인 제미나이중 선택해야 할 것같고요... 마음은 네이버/카카오등 토종 생성형 AI를 선택하고 싶은데... 일단 이곳은 좀 더 기다려려야할듯요... 현재 게매트릭스(Gematrix) 대표이사, 핵심 R&D센터장, 전산실장와 매일 숙고중인데, 최종 결정까지 장고중이네요^^
현재 게매트릭스(Gematrix)에서 특허화중인 초단기대박계획(MOAI) 운용원리인 "변동성 로직 프로그램"(VLP라는 디지털자산)을 모집행위인 공모화로 STO화 접근중입니다...
https://samsongeko1.tistory.com/12943
역삼동에 있는 주식로또(Stock Lotto) 프로그램 개발업체 게매트릭스(Gematrix) 계묘년 사업목적에 증권형 토큰(STO) 프로그램 개발과 챗GPT 솔루션 개발 추가..
https://samsongeko1.tistory.com/12225
테슬라·스페이스X 이어 딥시크 '비용절감=혁신'… 파괴적 혁신 물결...
선도기업들이 놓친 '저렴한 제품'으로 기존 시장질서 파괴하는 혁신 늘어...
딥시크, 챗GPT 18분의 1 비용으로 AI 개발… 테슬라 기가캐스팅, 스페이스X 로켓 재활용도 산업 재정의...
중국 인공지능(AI) 스타트업 딥시크(DeepSeek)가 최근 내놓은 생성형AI모델 'R1'이 전 세계를 놀라게 했다. 고성능 칩을 사용하지 않고서도 저비용으로 오픈AI의 챗GPT에 필적하는 생성형 AI 모델을 개발했기 때문이다.
오픈AI가 최신 챗GPT인 GPT-4를 훈련하는 데만 1억 달러(약 1454억원) 이상을 투입한 데 반해 딥시크의 모델은 18분의 1 수준인 560만 달러(약 81억원)가 사용됐다.
미국의 고성능 칩 수출 규제 때문에 엔비디아가 첨단 H100의 사양을 낮춰 출시한 H800을 주로 사용했다. 대규모 인프라에 의존하기보다는 AI 개발 비용 상당수를 차지하는 학습 과정을 효율화시켜 비용을 크게 줄였다.
모든 작업에 대해 전체 모델을 활성화하는 대신, 모델의 관련 하위 집합만 활성화하는 '전문가 기반 혼합(MoE)' 방식, 그리고 큰 비용이 드는 지도학습 대신에 스스로 데이터를 찾아 배우는 강화학습 등으로 이를 가능하게 했다.
마리나 장 시드니 공과대학교 부교수는 BBC에 "이러한 제한 조치는 도전이기도 하지만, 중국 기업들이 제한된 자원으로 더 많은 것을 해낼 수 있도록 혁신을 강요했다"고 설명했다.
그는 "제한 속에서도 창의성과 회복력을 키우는 것은 중국 정부의 기술 자립 정책과도 부합한다"고 덧붙였다.
억만장자 량원펑(梁文峰)에 의해 2023년 설립된 딥시크의 등장은 미국 정부가 중국의 기술 패권을 저지하려는 노력이 과연 효과가 있는지 의문을 제기할 뿐만 아니라 최근 여러 업계에서 이뤄지고 있는 비용 부문에서의
혁신에 관심을 집중시킨다. 하버드 경영대의 경영학 잡지인 하버드비즈니스리뷰(HBR)는 딥시크의 파란이 '파괴적 혁신(disruptive innovation)' 이론으로 설명될 수 있다고 진단했다.
'파괴적 혁신'은
하버드 경영대 교수인 클레이튼 크리스텐슨이 1990년대에 만든 것이다. 시장 선도 기업들이 간과한 고객층을 겨냥해 간단하고 편리하며 저렴한 제품을 제공함으로써 기존 시장의 질서를 파괴하는 혁신을 뜻한다.
파괴적인 혁신은 틈새시장 혹은 소외된 시장 공략으로 시작된다. 이러한 혁신이 성능 표준을 만족시키지 못하거나 주류 고객의 요구에 부합하지 못할 수 있다.
하지만 경쟁 우위를 유지하면서 고급 시장으로 확장할 수 있다면 보다 많은 고객을 가져오게 된다. 이는 시장 역학 관계의 변화와 기존 기업이나 기술의 퇴출로 이어진다.
파괴적 혁신의 사례로는 스마트폰을 제조원가 수준에 판매하는 전략을 채택해 세계적인 업체로 성장한 샤오미, DVD 대여업체에서 온라인 기반 스트리밍 콘텐츠 사업을 론칭해 새로운 시장을 개척한 넷플릭스 등이 있다.
최근 파괴적 혁신의 대명사는 일론 머스크로, 그는 자동차와 우주산업을 재정의했다. 테슬라가 2003년 설립됐을 당시만 해도 전기자동차(EV)는 비실용적이고 비싸, 성공 가능성이 작은 것으로 인식됐다.
하지만 그는 전기차가 기존 내연기관 자동차보다 성능이 뛰어나고 값이 저렴해 개인 교통 수단을 완전히 바꿔놓을 것으로 예측했다. 테슬라는 배터리와 차량 생산을 확대하기 위해 대규모 기가팩토리를 건설하는 식으로
규모의 경제를 활용했다.
특히 과거 수십 개의 금속 패널을 용접해 차체를 만드는 방식 대신 거대한 하나의 금속판을 틀에 넣고 찍어내는 이른바 '기가캐스팅' 공법을 도입해 부품 수와 비용을 대폭 줄이는 데 성공했다.
이를 통해 차체 무게까지 줄일 수 있게 돼
전기차의 혁신을 주도하며 자동차 산업 전반에 지각 변동을 일으켰다. 또한 머스크는 2002년에 스페이스엑스를 설립하며 우주여행 비용을 낮추고 궁극적으로 화성을 식민지화하겠다는 목표를 내걸었다.
당시, 우주 탐사가 정부 기관과 보잉과 록히드마틴 등 업체 간 비싼 계약에 의해 주도됐는데, 머스크는 재사용이 가능한 로켓을 개발해 위성 발사와 우주 임무 수행 비용을 대폭 낮췄다.
결국에 스페이스엑스는 나사와 민간 기업 등 주요 고객을 위성 발사에 끌어들였고, 전통적인 항공우주 거대 기업에 맞서는 경쟁자로 입지를 굳혔다.
'파괴적 혁신' 이론을 정립한 크리스텐슨 교수는
'파괴적 혁신'으로 등장한 도전자에 기존 기업이 맞서기 위해선 기존 기업 안에 유사한 형태의 독립적 사업 부문을 만들어 파괴적 혁신기업과 같은 전략으로 싸우든지 아니면
해당 혁신기업을 인수·합병하는 것도 적절한 전략이라고 소개했다. 오픈AI와 구글, 메타 등 인공지능(AI)의 향후 대응이 주목된다.
뉴스1 최 종일 기자
美 스탠퍼드·워싱턴대 "50달러로 오픈AI 버금 AI 모델 개발"
딥시크가 이용한 '증류' 방식으로 's1' 개발… 구글 제미나이 2.0 기반...
중국 인공지능(AI) 스타트업 딥시크가 저렴한 비용으로 성능이 우수한 AI 모델을 개발했다고 주장하며 주목받는 가운데 미 대학 연구진들도 낮은 비용으로 AI 모델을 개발했다.
스탠퍼드대와 워싱턴대 AI 연구진은 최근 발표한 연구 논문에서 50달러도 안 되는 클라우드 컴퓨팅 비용으로 최첨단 AI 추론 모델을 훈련했다고 밝혔다.
's1'이라는 이름의 이 모델은 수학 및 코딩 능력 테스트에서
오픈AI의 'o1'(오원), 딥시크의 'R1'과 필적하는 성능을 보인다고 연구진은 설명했다. o1은 오픈AI가 지난해 처음 출시한 추론 모델이다. R1은 딥시크가 지난달 선보인 추론 모델로, o1과 성능이 비슷한 것으로 알려져 있다.
s1 모델과 훈련에 사용된 데이터 및 코드는 개발자들이 코드와 파일을 저장하고 관리할 수 있도록 도와주는 웹 기반 플랫폼 깃허브(GitHub)에 공개됐다.
연구진은 s1을 개발하는 과정에서 '증류'(distillation)라고 하는 기술적 과정을 통해 미세 조정을 했다고 설명했다. '증류'는 AI 모델이 다른 모델의 출력 결과를 훈련 목적으로 사용, 유사한 기능을 개발하는 것을 의미한다.
딥시크가 자체 AI 모델을 개발하면서 오픈AI의 AI 모델을 '증류'한 것으로 알려졌다. s1은 구글의 최신 AI 모델인 제미나이 2.0 플래시 싱킹 익스퍼리멘털(Gemini 2.0 Flash Thinking Experimental)에서 증류했다.
연구진은 기반이 된 이 모델의 추론 능력을 s1에 학습시키기 위해 문제 해결하는 추론 과정 및 1천개의 질문과 답을 담은 데이터 세트를 선별해 사용했다.
연구진은 "s1 훈련에는 엔비디아 첨단 AI 칩인 H100 그래픽처리장치(GPU)를 사용해 30분도 걸리지 않았다"며 "총비용은 50달러가 들지 않았다"고 설명했다.
또 s1 훈련에 필요한 컴퓨팅 성능을 약 20달러에 빌릴 수도 있다고 덧붙였다.
연구진은 이와 함께 s1의 정확도를 높이기 위해 "기다리라"고 지시하는 방법을 사용해 AI 모델이 답변을 생성하기 전 충분히 생각할 시간을 갖도록 했다.
딥시크 모델 등장과 함께 s1도 구글과 마이크로소프트(MS), 메타 등 대형 기술 기업이 AI 인프라에 수십억 달러를 투자하고 있는 가운데 가성비가 뛰어난 모델로 주목받을 것으로 전망된다.
그러나 전문가들은 '증류' 방식을 통해 기존 모델을 복제할 수 있지만, AI 성능의 획기적인 발전을 끌어내기는 어렵다고 보고 있다.
연합뉴스 김 태종 기자
미국의 반도체 규제가 키운 중국의 'GPU 농장'
저가 GPU로 만든 수제 데이터센터...
게임용 컴퓨터, 코인 채굴기 긁어내...
美 전면 압박에도 혁신 생태계 지켜...
고급 그래픽처리장치(GPU)의 대(對)중국 수출을 제한한 바이든 전 미국 행정부에 이어 재집권에 성공한 트럼프 행정부 역시 반도체 수출 규제 강화를 검토 중이다.
미국산 첨단 반도체를 공급 받지 못한 상황에서도
편법적인 'GPU 농장'을 만들어 반도체 자급자족 성과와 저비용·고효율 인공지능(AI) 모델 딥시크 R1 출시 저력을 보여준 중국이 AI굴기를 계속 이어갈 수 있을지에 관심이 쏠리고 있다.
2022년 미 상무부가 도입한 GPU 수출 규제는 중국의 고급 컴퓨터 공학 연구를 막기 위한 '핀셋' 규제로 통한다.
AI의 성능은 매개변수의 양과 데이터 크기에 따라 좌우되는데, 미국은 AI 훈련 효율을 높일 수 있는 메모리 대역폭(메모리의 이동 속도)이 큰 반도체를 공급하지 않는 방법으로 중국을 압박해왔다.
중국은 엔비디아로부터 GPU를 수입할 수는 있었지만, AI나 고등 컴퓨팅에 필요한 고대역폭 칩을 구할 수 없었던 셈이다. 중국 AI 연구진, 빅테크 등이 위기 대응을 위해 생각해 낸 것은 'GPU 농장'이었다.
수출 규제가 처음 도입된 당시 중국에선 엔비디아제 GPU 품귀 현상이 불거졌는데, 당시 텐센트·바이두 등 빅테크들이 게임용 GPU를 대거 사들인 탓이었다.
게임용은 데이터센터 GPU와 달리 AI나 고급 컴퓨팅에 쓰이지 않으므로 미국의 감시 범위 밖에 있었다. 게임용 GPU도 엄연히 기능을 하는 GPU이며, 소규모 AI 연구에선 유익한 자산으로 쓰인다.
중국 AI 연구원들은 게임용 GPU 카드에서 칩만 떼어낸 뒤, 직접 만든 기판에 납땜하고 고대역폭 케이블을 연결해 수제 GPU 클러스터를 만들었다.빌리빌리나 틱톡등
현지 사회관계망서비스(SNS)에는 수출 규제 당시 중국 AI 엔지니어들이 직접 구축한 클러스터 영상이 고스란히 남아있다.
엉성하게 납땜 된 간이 GPU 보드가 창고나 선반 위에 길게 늘어선 모습은 농장을 연상케 한다. 이들은 단순히 영상을 찍는 걸 넘어, 어떻게 GPU 농장을 구성해야 더 효율적인 구동이 가능한지에 대한 논의도
활발하게 진행했다.
중국 기업들은 전 세계 암시장을 활보하며 중고 GPU를 마구잡이로 사들였다. 러시아에서 비트코인 등 가상화폐 채굴용으로 쓰이던 GPU도 주요 수입 대상이었다.
비슷한 시기에 중국 내부에서도 GPU를 만드는 업체들이 나타났다. 화웨이는 2023년 '어센드 910'이라는 GPU를 출시했다. 이 GPU의 성능은 엔비디아 A100 데이터센터 GPU에 필적하는 것으로 알려졌다.
당시 기준 엔비디아의 기술력에서 1.5세대가량 뒤처진 수준이었다. 혜성처럼 등장한 AI 스타트업 딥시크가 사용했을 것으로 추정되는 장비 역시 화웨이가 개발한 어센드 910 GPU다.
미국의 엄격한 수출 규제는 역설적으로 중국의 AI 데이터센터 구축 능력을 키웠다는 평가를 받고 있다.
오늘날 중국 연구진은 엔비디아가 만든 저가 GPU와 중국산 GPU를 섞어 클러스터를 구축한다. 컴퓨팅 성능이 뛰어나지는 않지만, 쓸 만한 수준의 AI 인프라는 자급자족할 수 있는 생태계가 완성된 셈이다.
미 정부가 올해 1월 엔비디아 등 반도체 회사가 첨단 AI칩을 중국과 러시아 등 20개 적대국에 수출하는 것을 금지하는 새로운 제한 조치를 발표한 것도 이런 상황을 염두에 둔 것이라는 해석이 나온다.
미국은 전 세계를 3개 지역으로 나눠, '티어 3'으로 구분된 지역엔 고급 컴퓨터 칩 수출을 전면 통제하기로 했다. 티어3에는 중국, 마카오, 이란, 러시아, 벨라루스, 쿠바 등 20개국이 속해 있다.
다만 미국의 고강도 압박이 중국의 반도체·AI 산업 경쟁력만 키울 것이란 우려도 있다. 엔비디아 정부 업무 담당 부사장인 네드 핑클은
"극단적인 제한 정책은 전 세계 국가의 주요 컴퓨터 성능에 영향을 미칠 것"이라고 비판했다. 젠슨 황 최고경영자(CEO) 역시 "미국의 대중 규제가 오히려 중국의 독자적인 GPU 반도체 개발을 자극할 것"이라고 경고했다.
아시아경제 임 주형 기자