본문 바로가기
AI, IT & 디지털정보

챗GPT 무색하게 만드는 막강한 AI 출현(구글의 젬니)

by Mirae66 2023. 12. 8.

 

https://www.youtube.com/watch?v=q5qAVmXSecQ&t=57s

구글 Gemni

 

 

 

구글의 Gemini는 GPT-4를 무색하게 만들었다.

이 모델은 거의 모든 벤치마크에서 GPT-4를 이깁니다.

Gemini은 다중 모달 대형 언어 모델로, Lambada와 Palm 2를 대체할 것입니다.

놀랄 만큼 강력한 기능을 보여주었는데, 실시간으로 비디오에서 무슨 일이 일어나는지 인식하고, 여러 언어로 대화할 수 있으며, 그림과 음악을 생성할 수도 있습니다.

 

게다가 Gemini은 논리와 공간적 추론 능력이 뛰어나며, 공학자가 사진 찍기만 하면 즉시 도면을 생성할 수도 있습니다.

대부분의 벤치마크에서 GPT-4를 앞지르는 성능을 보인다.

단, '의미 없는 문장 완성'과 같은 일상적인 상황에서 GPT-4에 비해 성능이 떨어지는 것으로 나타났습니다.

Gemini은 미국에서 이미 사용 가능하지만, Ultra 모델은 추후에 출시될 것으로 예상됩니다.

Gemini은 multimodal 기능을 바탕으로 이미지, 텍스트, 오디오, 비디오 등 다양한 종류의 입력과 출력을 처리할 수 있다.

Gemini은 GPT-4보다 좋은 결과를 보여주며, 다양한 벤치마크에서 우수한 성과를 보여줍니다.

또한, Gemini은 과학 논문에서 데이터를 추출하고, 첨부된 이미지를 이해하며, 다양한 질문에 답변하는 등 다양한 기능을 수행할 수 있습니다.

미래에는 로봇과 결합하여 물리적으로 상호작용하는 능력을 갖출 것으로 기대됩니다.

Google DeepMind은 Gemini의 혁신을 지속적으로 추진하여 미래 버전에서 더 빠른 진전을 기대할 수 있습니다.

2024년은 AI 분야에서 혁신적인 발전을 기대할 수 있는 흥미로운 해가 될 것입니다.

2023년, 새로 출시되는 Gemini 모델이란 무엇인가?

2023년 12월 7일, Google은 GPT-4를 거의 모든 벤치마크에서 압도하는 기대감에 찬 Gemini 모델을 공개했습니다.

 

Gemini은 다중 모달 대형 언어 모델로, 텍스트뿐만 아니라 음성, 이미지, 비디오를 훈련시켜 다양한 기능을 수행하죠.

그림 그리기나 볼 찾기와 같은 게임에서도 공간 추론을 수행하며, 이미지 생성과 음악 제작이 가능합니다.

어느 자동차가 더 빠를지 예측하는 등, 자동차 공기역학 분야에도 사용될 수 있어요.

 

이 모델의 등장으로 소프트웨어 엔지니어뿐만 아니라 시공 엔지니어도 사라질 수 있다는 예측이 나오고 있습니다.

생성 AI '젬니' 특징은?

구글은 알파 코드 2를 공개하여, 코드포스 대회와 같은 복잡한 문제를 해결하는 경쟁 프로그래머에게 뛰어난 성능을 보입니다.

알파 코드2는 좋은 프로그래머처럼 복잡한 문제를 나누고, 동적 프로그래밍 기술 등을 활용하여 해결합니다.

현재 구글의 Gemini 모델은 세 가지 크기가 있는데, 그중Ultra 사이즈의 성능이 가장 높게 평가됩니다.

미국 내의 사용자들은 이제 바드 챗봇에서 Gemini Pro 버전을 사용할 수 있으며, 젬이 울트라는 GPT-4 Pro에 비해 약간 떨어진 성능을 보입니다.

그러나, 젬니 울트라는 여전히 수줍게 대답하는 등 자신감을 잃지 않고 우수한 성능을 보입니다.

 

GPT-4와 Gemini Ultra의 비교 결과

GPT-4에 비해 Gemini Pro는 대부분의 상황에서 성능이 낮지만, Gemini Ultra는 거의 모든 카테고리에서 우수한 성능을 보여요.

특히, Gemini Ultra는 대중적인 다중 선택 형식의 언어 이해 테스트에서, 인간 전문가를 능가하는 최초의 모델로 주목받아요.

그러나 Gemini Ultra는 HellaSwag 기준에서 GPT-4보다 성능이 낮아지며, 흔히 모호하고 애매한 문장을 완성하는 공감각적인 자연어 평가에서는 약한 모습을 보여요.

GPT-4는 HellaSwag에서 좋은 성능을 보이지만 이는 걱정거리가 될 수 있어요.

또한, Gemini Ultra의 규모가 크기 때문에 여러 데이터 센터 간에 통신해야 한다는 것이 언급되었어요.

GPT-4의 학습 방식은 인터넷과 학술 논문, 책 등을 포함하여 다양한 데이터를 필터링하고, 인간 피드백을 통해 강화학습으로 데이터 세트의 품질을 개선하고 환각을 피하는 것이죠.

 

Gemini 모델 중 Nano와 Pro는 12월 13일에 Google Cloud에서 사용 가능하지만, Gemini Ultra Pro Max는 별도의 안전 테스트를 마친 후인 내년에 출시될 예정입니다.