Gemini와 ChatGPT의 얼굴사진 이목구비 판단, 어느 쪽이 더 정확한가요?

현재 기준으로 Gemini와 ChatGPT 모두 사진을 볼 수 있는 것으로 알고 있습니다.

두 모델의 답변 방향은 비슷하지만 세부 판단이 조금 다를 때가 있는데, 실제로 얼굴사진을 바탕으로 눈 크기, 눈 모양, 콧대, 얼굴형, 입술, 얼굴 비율, 전체 조화 등을 판단할 때 어느 쪽이 더 정확하다고 볼 수 있을까요?

또 모델 자체의 차이보다도 사진 각도, 조명, 표정, 렌즈 왜곡 같은 요소가 판단 정확도에 더 큰 영향을 주는지도 궁금합니다.

더 깔끔하게 하려면 마지막에 한 줄 추가해도 좋습니다.

얼굴의 기본 이목구비 구조를 보려는 목적이라면, AI 사진 분석 결과를 어느 정도까지 참고할 수 있는지도 궁금합니다.

2개의 답변이 있어요!

  • 안녕하세요. 이승호 전문가입니다.

    제미나이와 챗지피티 모두 시각 인식 능력이 뛰어나지만 이목구비 판단에 있어서는 각 모델의 학습 데이터와 이미지 처리 알고리즘에 따라 강점이 조금씩 다릅니다.

    일반적으로 제미나이는 구글 렌즈를 통해 축적된 방대한 시각 정보와 물체 인식 기술을 바탕으로 얼굴의 각 부위별 특징과 위치를 매우 세밀하게 포착하는 편입니다. 특히 얼굴의 비율이나 이목구비의 배치를 수치적으로 분석하는 데 있어서 상당히 높은 정확도를 보여줍니다. 반면 챗지피티는 사진의 분위기나 전체적인 조화를 언어적으로 묘사하고 심미적인 관점에서 해석하는 능력이 돋보이는 경우가 많습니다.

    하지만 질문하신 것처럼 모델 자체의 성능 차이보다 사진의 촬영 조건이 정확도에 훨씬 더 결정적인 영향을 미칩니다. 렌즈 왜곡은 얼굴형을 길게 혹은 둥글게 변형시키고 조명은 콧대나 턱선의 그림자를 지워버려 AI가 입체감을 오판하게 만듭니다. 또한 위나 아래에서 찍은 각도는 눈의 크기나 턱의 비율을 실제와 다르게 보이게 하므로 AI가 아무리 뛰어나도 왜곡된 데이터를 바탕으로 내린 결론은 정확할 수 없습니다.

    얼굴의 기본 구조를 파악하려는 목적이라면 AI의 분석 결과를 대략적인 가이드라인 정도로만 참고하는 것이 좋습니다. AI는 성형외과 전문의처럼 해부학적 구조를 직접 만져보고 판단하는 것이 아니라 평면적인 이미지의 픽셀 정보를 분석하는 것이기 때문입니다. 특히 인종별, 연령별 데이터 편향이 있을 수 있어 특정 이목구비를 절대적인 기준으로 평가하기에는 한계가 있습니다.

    정확한 분석을 원하신다면 정면에서 왜곡이 적은 망원 렌즈 느낌의 렌즈로 조명이 고른 곳에서 촬영한 사진을 사용하는 것이 중요합니다.

    AI의 분석은 객관적인 수치가 아닌 확률 기반의 묘사임을 인지하고 보조적인 도구로만 활용하시길 권장합니다.

  • 안녕하세요. 김재훈 전문가입니다.

    현재 기준으로 제미나이와 GPT 모두 얼굴 특징을 꽤 잘 잡아내기 때문에 누가 더 정확하기 보다는 학습 데이터와 판단 기준 차이로 결과가 조금씩 다르게 나오는 수준이라 우열을 단정하기는 어렵습니다 오히려 정확도에 더 크게 영향을 주는 건 카메라 각도 조명 표정 렌즈 왜곡 같은 촬영 조건이라 같은 사람도 사진에 따라 분석 결과가 꽤 달라질 수 있습니다 그래서 AI 분석은 참고용으로는 충분하지만 얼굴의 실제 구조를 판다하려면 여러 각도의 사진이나 직접 관찰을 함께 해보는 것이 가장 좋습니다