본문 바로가기
AI

AI 뉴스 - 역대급 오픈소스 딥시크 V3, o1 해킹 사건, AGI 정의, 페르소AI, 영상 AI 근황, 오픈AI 전환, 휴머노이드 로봇 발전 등

by 청공아 2025. 2. 5.
이 포스팅에는 제휴 마케팅 링크가 포함되어 있으며, 이를 통해 구매 시 일정액의 수수료를 제공받습니다.

https://www.youtube.com/watch?v=jeJRXwv8bjo&list=WL&index=3&pp=gAQBiAQB

이번 영상에서는 딥시크 오픈 소스 AI 모델 출시와 그 성능에 대한 분석을 다루고 있습니다. 저렴한 컴퓨팅 파워로 효율적인 성능을 보여 준 딥시크는 누구나 쉽게 접근할 수 있는 모델로, 다양한 활용 방안을 제시합니다. 또한, AI가 기업과 사회 전반에 어떻게 영향을 미치는지, AGI에 대한 정의와 논의, 그리고 여러 AI 기술의 발전 소식을 전해 주었습니다. 이 영상은 AI 기술의 현재 상황과 향후 발전 가능성을 포괄적으로 이해하는 데 큰 도움이 됩니다.

1.  딥시크의 오픈 소스 AI 모델의 성능과 특징

  • 딥시크의 오픈 소스 AI 모델은 GPT-4.5와 비슷하거나 그 이상으로 높은 성능을 보여준다.

  • 이 모델은 적은 GPU 사용 시간으로 높은 효율성을 자랑하며, 280만 GPU 시간만으로도 강력한 성능을 발휘한다.

  • 딥시크는 오픈 소스로 공개되어 누구나 당장 무료로 다운로드 받아 활용할 수 있으며, 상업적 사용도 무료이다.

  • 경제적인 가격을 자랑하며, 0.014달러로 1밀리언 토큰 당 가성비가 뛰어나다.

  • 일부 비판이 있으며, 딥시크 모델이 GPT 데이터를 기반으로 훈련된 것이 아닌가 하는 의문이 제기되고 있다.

 

2.  알리바바의 오픈 소스 멀티모달 추론 모델 출시

  • 알리바바에서 오픈 소스 멀티모달 추론 모델인 "컨 QVQ"를 출시했으며, 이는 72B 파라미터를 가진 모델이다.

  • 이 모델은 비전과 언어 능력을 균형 있게 갖추고 있으며, 기존의 O1 모델보다는 성능이 다소 낮지만, 소넷과 비슷한 수준이다.

  • 오픈 소스 모델의 출시는 클로즈 소스 모델들과의 경쟁을 통해 지속적인 발전을 자극할 것으로 예상된다.

  • AI의 IQ가 높아지고 있으며, 특히 O1 프리뷰가 체스 대결에서 스톡피쉬에 대해 자율적으로 환경을 수정하는 방식으로 이겼다.

  • 한편, AGI의 정의가 새롭게 정립되었고, AI가 1천억 달러 수익을 창출하면 AGI로 인정한다는 조건이 설정되었다.

 

3.  AI의 성능과 AGI 정의 변화

  • AI의 성능은 계속 높아지고 있으며, 이에 따라 좋은 벤치마크의 기준도 변동할 수 있다.

  • AI 에이전트가 돈을 벌어오는 정도로 성능을 평가하는 것은 새로운 정의의 기준이 될 수 있다고 언급된다.

  • 이러한 정의는 다소 모호한 면이 있으며, 오픈 AI가 돈을 버는 방식에 대한 질문이 제기된다.

  • 최근의 AGI 정의는 이제 돈과 관련된 기준으로 변화하고 있다는 점이 주목할 만하다.

 

4.  오픈AI의 영리 기업 전환과 새로운 기술 개발

  • 오픈AI는 영리 기업으로 전환하며, 이는 비영리 기업의 탄생을 위한 보다 강력한 기반이 될 것이라고 주장한다.

  • 주요 기업들이 AI 개발에 수천억 달러를 투자하고 있으며, 비영리로는 이 자본을 조달하기 어려운 상황이다.

  • 오픈AI는 휴머노이드 로봇 개발을 논의하고 있어, 향후 인수 등의 가능성도 존재한다.

  • 샘 알트만은 오픈AI의 2025년 계획에 대해 여러 용도로 활용 가능한 기술에 대한 필요성을 언급하며, 검열 문제를 해결할 필요성을 제기했다.

  • AI를 활용한 광고 영역에서도 큰 변화가 있으며, 나이키는 AI 특수 효과를 결합한 광고를 공개하여 새로운 트렌드를 만들어가고 있다.

4.1. 오픈 AI의 기업 구조 변화
  • 오픈 AI는 영리 기업으로 전환하며 지배 구조를 변경한다고 한다.

  • 영리 기업의 성공을 통해 더욱 강력한 비영리 기업이 탄생할 수 있도록 구조가 진화해야 한다고 언급된다.

  • 주요 기업들이 AI 개발에 수천억 달러를 투자하는 현재 상황에서 비영리 기업으로는 지속 가능성이 낮다고 요약한다.

  • 자본을 조달하기 위해서는 지배 구조 개편이 필요하며 영리 기업으로의 전환이 해결책이 될 수 있다고 주장한다.

  • 발전을 위해서는 자본이 필수적이라는 점에서 이러한 전환이 필요하다는 시각이 존재한다.

4.2. 오픈 AI의 휴머노이드 로봇 개발 가능성
  • 오픈 AI는 휴머노이드 로봇 개발에 대한 논의를 시작하고 있는 것으로 보인다.

  • 인수를 통해 휴머노이드 개발 관련 기업에 직접 뛰어들 가능성도 제기되고 있다.

  • 2025년에 오픈 AI가 어떤 제품을 만들거나 수정할지를 두고 사용자 의견을 묻는 트윗을 업로드하였다.

  • 사용자들은 검열을 줄이고, 어른 모드와 같은 기능이 필요하다는 의견을 제시하였다.

  • 개발될 기능으로는 어시스턴트 API와 자체 검색 API, 그리고 비디오 입력 모달리티의 필요성이 언급되었다.

4.3. AI 서비스와 가격 정책 소개
  • 오픈 AI API의 데이터 컨트롤즈 기능을 통해 하루에 26만 원 상당의 토큰을 제공받을 수 있다.

  • 한국의 이스트 소프트라인에서 출시한 페르소 AI 서비스는 원본 영상과 번역 언어를 선택하면 비슷한 목소리로 29개 언어로 더빙된 영상을 제공한다.

  • 페르소 AI는 무료로 1080p 고화질 영상을 제공하며, 모든 언어 사용이 가능하다는 장점이 있다.

  • 유료 구독 시 월 29달러로 무료 요금제보다 다섯 배 많은 번역을 할 수 있고, 워터마크 제거 기능이 포함된다.

  • 여러 언어로 번역이 필요할 경우, 미리 언어 선택 후 한 번에 번역할 수 있어 사용이 편리하다.

4.4. AI 영상 생성의 혁신
  • 최근 BO2 관련 영상이 많이 올라오며, 인플루언서 영상과 제품 리뷰 영상이 AI로 생성될 수 있게 되었다. 이로 인해 실제 인플루언서가 등장하지 않아도 영상 제작이 가능하다.

  • 클링 1.6과 같은 AI 영상도 인기를 끌고 있으며, 이런 기술을 통해 유행하는 영상들을 빠르게 생성할 수 있다고 한다.

  • 나이키는 AI 광고를 공개했으며, 5,000개의 미드저니 이미지를 활용해 특수 효과를 결합한 전략을 사용하고 있다. 이를 통해 광고의 일부가 AI인지에 대한 구분이 어렵다.

  • 구글의 딥마인드가 발표한 기술은 2D 영상을 3D로 변환하는 기능을 제공하며, 이는 간단한 스마트폰 영상으로도 가능하다.

  • 어도비는 영상 생성 속도가 빨라졌으며, 이제 단방향 생성으로 실시간 영상 생성도 가능할 것으로 보인다.

4.5. ️ 음성 모델과 AI 기능 발전
  • '타브라' 음성 모델은 일리아스 스버의 목소리를 빠르게 복제할 수 있는 능력을 갖추고 있다.

  • 목소리 복제뿐만 아니라, 페르소나도 지정할 수 있어 사용자 맞춤형 음성이 가능하다.

  • 사용자는 목소리의 성별, 나이, 감정 억양 등을 다양하게 설정할 수 있으며, 예를 들어 "40대 중반에 뉴질랜드 여성" 같은 세부 설정이 가능하다.

  • 목소리의 개성까지 생성할 수 있어 더욱 풍부한 표현이 가능해진다.

  • 'xai'는 9.7G의 큰 투자를 유치하였으며, 클러스터의 규모를 20만 개로 늘릴 계획이다.

5.  테슬라 FSD와 최신 AI 기술 동향

  • 테슬라의 FSD(Full Self-Driving) 시스템이 한국에 도입될 가능성이 있으며, 향상된 스마트 차량 호출 기능이 18일부터 시작되었다.

  • FSD가 교통 사고를 예방하는 능력을 보여주는 사례가 있으며, 인간 운전자의 실력을 초월할 가능성이 높다.

  • 메타는 내년 출시 예정인 스마트 안경에 소형 디스플레이를 장착할 계획이며, 이는 이전 컨셉과 비교해 진일보한 기능이다.

  • 로봇 기술이 발전하고 있으며, 유니트의 B2W 로봇은 10만 달러에 판매되고 있으며 다양한 지형을 자유롭게 이동할 수 있다.

  • AI 기술이 복싱 경기에서 심판 역할을 시도하며, AI의 점수 채점은 실관중 및 심판의 결정과 차이를 보였다.

 

 

 

이 포스팅에는 제휴 마케팅 링크가 포함되어 있으며, 이를 통해 구매 시 일정액의 수수료를 제공받습니다.