본문 바로가기
AI

구글 제미나이(Google Gemini)를 이용한 고난도 합성 실습 및 타 서비스와의 비교 분석

by hfgraphic 2025. 12. 28.
반응형

 

이 글은 **'구글 제미나이(Google Gemini)를 이용한 고난도 합성 실습 및 타 서비스와의 비교 분석'**을 다루고 있습니다.

 

1. 두 인물 합성 실습 결과

  • 작업 내용: 앞서 업로드한 '남성 사진'과 '여성 헤드샷'을 합성하여 "두 사람이 함께 앉아 휴대폰을 보며 웃고 있는 장면"을 생성했습니다.
  • 결과 평가: 강사는 결과물이 실제 사진과 구분이 불가능할 정도로 완벽하다고 평가합니다. 나노 바나나는 원본 인물의 특징을 그대로 유지하면서 새로운 상황(휴대폰을 보며 웃는 모습)을 자연스럽게 만들어냈습니다.

 

2. 제미나이의 유용한 기능: 마이크(음성 입력)

  • 기능: 프롬프트를 직접 타이핑하는 대신 마이크 아이콘을 눌러 음성으로 명령할 수 있습니다.
  • 장점: 특히 스마트폰 앱을 사용할 때 작은 키보드로 긴 문장을 치는 번거로움을 덜어줍니다. 구글의 음성 인식 기술 덕분에 억양이 있더라도 매우 정확하게 텍스트로 변환됩니다.

 

3. 경쟁 도구와의 비교: Gemini vs ChatGPT

나노 바나나의 우수성을 증명하기 위해 라이벌인 **ChatGPT(DALL-E 모델)**와 동일한 조건으로 비교 테스트를 진행했습니다.

  • ChatGPT 결과: * 일관성 부족: 원본 사진의 남성과 여성이 아닌, 전혀 다른 인물들이 생성되었습니다.
  • AI 특유의 이질감: 실사 사진 느낌보다는 전형적인 'AI가 만든 이미지' 느낌이 강해 현실성이 떨어집니다.
  • 결론: 나노 바나나가 '콘텍스트(원본 유지)'와 '실사 품질' 면에서 압도적으로 앞서 있음을 보여줍니다.

 

4. 구글 제미나이 플랫폼의 두 가지 단점

제미나이를 통해 나노 바나나를 사용할 때 주의해야 할 점도 솔직하게 언급합니다.

  1. 워터마크(Watermark): 생성된 이미지의 모서리에 작은 구글 워터마크가 생성됩니다. 이는 AI 생성물임을 나타내는 표시이며, 다른 편집 도구를 통해 제거해야 하는 번거로움이 있습니다.
  2. 해상도 제한: 결과물의 긴 쪽 길이가 약 1,000픽셀(1K 수준) 정도로 제한됩니다.
  • 장점: 파일 용량이 작아 생성 속도가 매우 빠릅니다(10초 내외). 소셜 미디어용으로는 충분합니다.
  • 단점: 고해상도 출력이 필요한 전문가용으로는 부족할 수 있습니다.

 

5. 요약 및 향후 계획

  • 제미나이는 빠르고 간편하게 나노 바나나의 성능을 경험할 수 있는 최고의 무료 플랫폼입니다.
  • 하지만 해상도나 워터마크 문제를 해결하고 싶다면 다른 플랫폼을 활용해야 합니다.
  • 다음 글에서는 더 높은 해상도와 정교한 조절이 가능한 또 다른 나노 바나나 플랫폼을 소개할 예정입니다.

요약하자면: 나노 바나나는 경쟁사 대비 압도적인 인물 유지력과 실사 품질을 보여주지만, 제미나이 플랫폼 자체의 한계(워터마크, 1K 해상도)가 있습니다. 이를 보완할 다음 플랫폼 학습으로 넘어가는 단계입니다.

 

반응형