본문 바로가기
AI

AI 업계 최강이 된 구글, Google I/O 주요 업데이트 15분 총 정리

by 청공아 2025. 5. 23.
반응형

https://youtu.be/rPWzbT_pG_s

📌 이번 Google I/O에서 발표된 주요 AI 업데이트 내용은?

이번 Google I/O에서는 소리까지 생성하는 영상 생성 모델인 BO3, AI 편집 툴인 Flow, 더욱 자연스러워진 네이티브 보이스, 진화된 Gemini Live 프로젝트 Astra, 에이전트 모드, Gemini 2.5 Pro의 딥싱크 모드, 가성비 모델인 Gemini 2.5 Flash, 이미지 생성 모델인 Gemini Diffusion, 디자인 및 UI 제작 툴인 Stitch, AI 코딩 에이전트인 Jules, AI 검색 모드, Google Meet 실시간 번역 기능, 개인용 스마트 답장 기능, 안드로이드 XR 글라스, 그리고 온디바이스 AI 모델인 Gemma 3N 등이 발표되었습니다

이번 google i/o에서 공개된 다양한 ai 업데이트를 15분 안에 요약한 영상입니다. 핵심은 ai 기반의 영상 생성, 편집, 코딩, 디자인 기능이 대폭 강화되었다는 점입니다. 특히, 텍스트-이미지-비디오 생성 모델인 v3, ai 편집 툴 flow, gemini에이전트 모드, 그리고 안드로이드 XR 글래스와 같은 새로운 기술들이 소개되었습니다. 이러한 업데이트는 콘텐츠 제작, 개발, 디자인 분야에 혁신을 가져올 것으로 예상됩니다. 구글은 ai 기술을 통해 사용자 경험을 향상시키고, ai 업계 최강자로서의 입지를 더욱 공고히 하려는 목표를 보여주고 있습니다.

Google I/O : 구글이 매년 여는 큰 기술 행사입니다. 마치 운동회처럼, 구글이 1년 동안 준비한 새로운 기술과 제품들을 세상에 처음으로 보여주는 자리입니다.

1. 🎥 Google I/O 2024의 인상적인 AI 업데이트

  • 이번 Google I/O 발표는 방대한 정보를 포함하고 있다 .
  • 임팩트가 큰 기술들을 중심으로 소개될 예정이다 .
  • V3는 소리까지 생성하는 영상 생성 모델이다 .
  • 누구나 결제를 통해 쉽게 사용할 수 있는 상황이다 .
  • 영상 속 입모양에 맞추어 자연스럽게 영상 생성이 이루어진다 .
  • 이제는 억지로 립싱크 모델을 맞출 필요가 없다 .

2. 손쉬운 영상 제작과 자연스러운 애니메이션

  • 클릭 한번으로 소리와 영상이 포함된 완전한 영상이 즉시 제작된다 .
  • 이러한 영상 제작은 자연스러운 물리적 모션과 소리를 갖추고 있어, 매우 현실적으로 표현된다 .
  • 애니메이션 제작이 복잡한 작업임에도 불구하고, BO3를 통해 클릭만으로 입 모양과 상황을 동시에 반영할 수 있다 .
  • 기계식 키보드 소리와 젤리 누르는 느낌을 매우 잘 전달하며, 사용자 경험을 극대화할 수 있다 .

3. AI를 활용한 자연스러운 콘텐츠 생성

  • 음악과 함께 요리 영상이 매우 자연스럽게 생성되는 기술이 도입되었다.
  • 음식의 상태 변화가 잘 표현되어, 양파의 색깔 변화가 눈에 띄게 나타난다.
  • 유저들이 만든 콘텐츠가 기대 이상으로 흥미롭고, 이는 다양한 창작 가능성을 보여준다.
  • 유튜브 영상을 학습한 AI는, 이러한 영상을 그대로 재현할 수 있는 능력을 가지고 있다.

4. 🎮 게임 제작과 ASMR의 결합

  • 게임에서 다양한 기능이 가능하며, 하나의 클릭으로 영상과 소리를 동시에 생산할 수 있다.
  • 이러한 기능을 활용하여 언박싱 영상을 손쉽게 제작할 수 있으며, 음성과 효과음이 자연스럽게 결합된다.
  • 활용 예시로 랩 하는 기능도 있으며, 이를 통해 콘텐츠 제작에 대한 제약이 줄어든다.
  • 클릭 한 번으로 소리와 영상, 인물이 모두 등장하는 재미있는 경험이 가능해진다.

5. AI의 가능성: 표현의 자유로움

 
  • AI현실에서 표현하기 어려운 것들을 자연스럽게 생성할 수 있는 능력을 가지고 있다 .
  • 다양한 형식의 콘텐츠 예시로, 스탠드업 코미디 또한 생생하게 표현될 수 있다는 점이 강조되었다 .
  • 소리와 이미지를 결합하여 대화 가능한 AI의 가능성에 대해 언급되고 있다 .
  • "No more silence"라는 표현을 통해, AI와의 상호작용이 자유롭고 원활할 수 있음을 강조하고 있다 .
  • AI억양을 포함한 대화도 가능하게 하여, 다양한 소통의 방식이 구현될 수 있다 .

6. 구글의 새로운 사운드 기능

  • 사운드 에디팅 기능은 성우 녹음과 배경 음악 추가 없이 한 번에 제작될 수 있는 가능성이 있다.
  • 사용자와 대화할 수 있는 기능이 강조되며, 다양한 대화 가능성을 언급하고 있다.
  • 내용 중에는 ‘재미있음’이라는 표현이 여러 차례 반복되어, 기능이 흥미롭고 유용할 것으로 추정된다.

7. AI 편집 툴과 자연스러운 음성의 발전

  • AI 편집 툴이 구글 제품 내에서 제공되어, 사용자가 손쉽게 원하는 장면을 편집할 수 있다 .
  • 사용자는 드래그 및 플러스 익스텐드 기능을 통해 장면을 자유롭게 편집할 수 있는 기능이 추가되었다 .
  • 네이티브 보이스 음성의 자연스러움이 향상되어, 사람의 말처럼 더욱 자연스럽게 들린다 .
  • 구글의 프로젝트 아스트라가 발전하여, 사용자가 제품 설명서를 다운로드하는 것뿐만 아니라, 스크롤을 통해 직접 탐색할 수 있게 되었다 .

8. AI의 맥락 이해와 기능 확장

  • AI는 중간에 말이 끊기거나 다른 내용이 등장하더라도 맥락을 이해하고 필요한 부분만 무시할 수 있는 능력을 가진다 .
  • 제품 추천 및 쇼핑 리스트 생성과 같은 다양한 기능을 제공하여 사용자 경험을 향상시킨다 .
  • AI콘텐츠 검색 기능을 통해 적절한 정보를 찾아오는 능력을 갖추고 있다 .
  • 인터페이스와 제어 방식이 진화하여 전화 통화, 쇼핑 등을 AI가 대신 수행할 수 있게 된다 .
  • 이러한 기능들은 곧 일상 생활에 적용될 가능성이 높다 .

9. 재미나 에이전트 모드 및 업데이트

 
  • 재미나이의 에이전트 모드는 아파트 검색 등 다양한 기능을 통해 사용자가 요구하는 정보를 정리해 제공할 수 있다 .
  • 새로운 모드로 딥싱크가 공개되었으며, 이는 심층적인 분석을 가능하게 하는 기능으로 추정된다 .
  • 재미나 2.5프로의 업데이트는 코딩과 수학 등의 성능에서 이전 모델들을 능가하는 결과를 보여주었으며, 특히 O3와 비교했을 때 탁월한 점수를 기록하였다 .
  • 멀티모달 기능에서도 성능 향상이 이루어져, 다양한 입력 방식에서 개선된 결과를 보여준다 .

10. 구글의 최신 AI 모델 업데이트

  • 구글은 가성비가 좋은 모델을 새롭게 공개하였으며, 성능도 괜찮은 것으로 평가된다 .
  • 구글은 제미나의 2.5 플래시 모델을 선보였으며, 이 모델이 GPQ보다 높은 성능을 보인다 .
  • 재미나의 디퓨전이라는 새로운 기술이 도입되었으며, 이는 이미지 생성 방식으로 다음 토큰을 예측하는 것이 아니라 한 번에 이미지를 생성하고 빠르게 수정하는 방식을 사용한다 .
  • 해당 기술은 성능이 괜찮고, 속도 또한 어마어마하게 빠르다 .
  • 구글은 이러한 다양한 업데이트로 AI 업계에서의 위상을 더욱 강화하고 있다 .

11. 구글의 새로운 디퓨전 기반 코드 생성 기술과 디자인 도구

  • 구글의 디퓨전 기반 기술은 코드가 실시간으로 생성되는 방식을 사용하여 짧은 시간 안에 결과물을 만들어낸다 .
  • 디모 속도를 조절해야 했던 이유는 관객들이 작동하는 모습을 제대로 볼 수 없었기 때문이다 .
  • 구글은 오늘 재미나의 디퓨전을 공개했으며, 이는 다양한 실험적인 코드 생성을 지원한다 .
  • 새로운 제품인 스티치는 디자인과 UI를 제작할 수 있는 도구로, 사용자가 특정 요구사항을 입력하면 즉시 디자인을 생성한다 .
  • 사용자는 "해변 바이브의 뮤직앱"과 같은 구체적인 요청을 통해 UI 디자인직관적으로 생성할 수 있다 .

12. 구글의 AI 디자인 및 코딩 도구 소개

  • 피그마로의 매끄러운 이동이 가능하여 사용자 인터페이스의 접근성이 향상되었다 .
  • 주울스는 2.5% 기반의 AI 코딩 에이전트로, 오픈 AI코덱스와 유사한 기능을 제공한다 .
  • 이 도구는 지터브와 연동되어 다양한 작업을 동시에 병렬로 처리할 수 있는 능력을 지닌다 .
  • SEO 검색 최적화를 위한 테스트 도구 생성이 가능하여, 단순한 요청으로 복잡한 테스팅이 이루어질 수 있다 .
  • 구글의 쇼핑 기능은 사용자가 사진을 올리면 맞춤형 의류를 미리 볼 수 있도록 지원한다 .

13. 🤖 구글의 AI 기능 업데이트

  • 구글에서는 사용자가 옷을 입혀보는 기능을 통해 다양한 스타일을 미리 볼 수 있도록 지원한다 .
  • AI의 부작용으로 인해 유명한 테크 유튜버가 자신의 사진인지 여부를 확인하지 않고 콘텐츠를 올리며 악용 가능성이 지적되고 있다 .
  • 구글 검색의 AI 검색 기능이 도입되어, 더 나은 결과를 제공하기 위해 종합 정보를 제시하는 도구인 퍼플렉시티가 적용되었다 .
  • 검색 시 질문을 던지면 AI가 인터넷의 정보를 종합하여 상세한 답변을 제공하는 방식으로 여행 정보 등을 찾을 수 있다 .
  • 이러한 변화는 퍼플렉시티 같은 다른 서비스와의 경쟁을 염두에 둔 것으로 추정된다 .

14. 구글의 실시간 번역 및 스마트 답장 기능

  • 구글 화상회의 도구에 실시간 번역 기능이 추가되어, 사용자가 말을 하면 즉시 다른 언어로 통역된다 .
  • 이 기능은 통역사 없이도 사용 가능하다는 점에서 혁신적이다 .
  • 구글의 다양한 서비스(드라이브, 메일, 스프레드시트 등)를 통합하여 개인용 스마트 답장 기능이 도입되었다 .
  • 이 기능은 사용자가 작성한 문서와 말투를 분석하여 자연스러운 답변 생성을 가능하게 한다 .
  • 구글이 여러 스타트업의 기술을 수용하고 발전시키고 있다는 인상을 주고 있다 .

15. 구글 안드로이드 XR 글라시스의 특징

  • 구글의 안드로이드 XR 글라시스는 투명한 안경 형태로 출시되었으며 실체험이 가능하다.
  • 이 안경은 카메라와 스피커를 갖추고 있어 시간, 날씨 등 정보를 디스플레이에 띄울 수 있다.
  • 실시간 트랜슬레이션 기능이 있으며, 사진 인식과 관련된 설명을 텍스트와 자막으로 제공할 수 있다.
  • 사용자는 음성으로 정보 검색, 내비게이션 안내 등을 요청할 수 있으며, 커피샵에 대한 정보를 음성으로 확인할 수 있다.
  • 구글은 젠틀 몬스터와 협력하여 미래 지향적인 디자인을 갖춘 안경을 제공할 예정이다.

반응형