본문 바로가기
AI

ChatGPT 이미지 분석 능력

by hfgraphic 2025. 5. 31.
반응형

이 영상에서는 ChatGPT의 또 다른 흥미로운 기능인 이미지 분석 능력을 소개하고자 합니다. 우리는 스마트폰으로 크루아상이나 제비가 찍힌 사진을 촬영한 뒤, ChatGPT에 전달하고 해당 제품의 영양 성분을 알려달라고 요청할 수 있습니다. 그러면 ChatGPT는 칼로리, 지방, 당분 등의 정보를 상세히 분석해줄 수 있습니다.

 

이 기능은 음식 사진에 국한되지 않습니다. 엑셀 파일, 구글 시트, CSV 파일 등도 ChatGPT에 전송할 수 있고, 파일이 너무 길거나 복잡하지 않다면 ChatGPT가 데이터를 분석하고 차트를 생성하거나 출력 결과를 생성할 수 있습니다.

 

이제 이미지 분석 기능의 두 가지 흥미로운 예시를 소개하겠습니다.

 

첫 번째는 유명한 사진 하나를 ChatGPT에 제공하고 사진 속 인물 수, 모자를 쓴 사람 수 등을 묻는 것입니다. 이 사진은 1932년 록펠러 센터 공사 중 촬영된 **“마천루 위의 점심(Lunch atop a Skyscraper)”**이라는 흑백 사진으로, ChatGPT는 정확히 11명의 인부가 있고 8명이 모자를 쓰고 있다고 알려줍니다. 또한 이 사진의 역사적 맥락도 설명하며, 뉴욕의 고층 빌딩 건설 시기 노동자들의 용기와 끈기를 상징하는 이미지라고 설명합니다.

 

두 번째 예시는 식물 사진을 ChatGPT에 전송한 후, 식물의 상태문제점 그리고 개선 방법을 묻는 것입니다. 예를 들어 잎 가장자리에 갈색 반점이 있는 식물을 보내면, ChatGPT는 물 과다 또는 부족, 습도 문제, 직사광선 노출, 또는 병충해 가능성 등을 지적하며 이에 대한 해결 방법도 안내해 줍니다. 예를 들어 물 주기 조절, 습도 조절, 균형 잡힌 비료 사용, 병충해 점검햇빛 노출 조정 등의 조언을 제시합니다.

 

또한 누수 사진, 고장 난 자동차 엔진 사진, 고장난 자전거, 혹은 음식 사진을 보내어 문제의 원인과 해결 방법을 요청할 수 있습니다. 실제로 티라미수 사진을 보내고 “이 요리를 어떻게 만들 수 있나요?”라고 물었더니, ChatGPT는 이탈리아 디저트 티라미수임을 인식하고 재료와 조리법을 안내했습니다.

 

웹사이트 디자인 시안이나 손으로 그린 로고 그림을 보내고 그것을 바탕으로 코드를 생성하거나 DALL·E로 이미지 생성도 할 수 있습니다. 예를 들어 햄버거 로고를 손으로 그려서 텍스트 없이 로고로 만들어 달라고 요청하면, 상당히 유사한 형태의 로고를 생성해줍니다.

 

또 다른 활용 방법으로는 사진 코칭입니다. 예를 들어 이집트 피라미드 앞에서 아이폰으로 찍은 사진을 보내고, “10년 이상의 경력을 가진 사진 전문가 역할을 해주세요. 이 사진을 더 잘 찍기 위해 어떤 조언을 해줄 수 있나요?“라고 묻는다면, ChatGPT는 구도(삼등분의 법칙), 자연스러운 선 활용, 광원과 시간대, 아이폰에 적합한 HDR 모드나 초점 조절 방법, 그리고 후보정 앱 활용 등을 추천합니다. 또한, 촬영 전 렌즈를 닦는 것, 손떨림 방지 등의 기본적인 팁도 함께 제시합니다.

 

마지막으로, 여러 장의 사진을 찍고 그 중 가장 나은 것을 고르라는 조언도 덧붙이며, 경험을 쌓을수록 더 나은 사진을 찍을 수 있다고 격려합니다.

 

이처럼 사진 한 장 또는 간단한 입력만으로도 매우 정밀하고 상황에 맞는 분석과 조언을 받을 수 있다는 것이 ChatGPT의 이미지 분석 기능의 강점입니다.

반응형