오픈타임의 GSEO 실험: AI 개요 상품 추천 영역에 노출된 3일간의 A/B 테스트 후기

By: William Williams

오픈타임이 운영하는 B2C 이커머스 쇼핑몰 중 한 곳의 올해 1분기 데이터를 검토하던 중, 충격적인 사실 하나를 발견했습니다. 작년 동기 대비 구글 유기 검색을 통해 유입된 트래픽 중 약 37%가 흔적도 없이 사라져 있었습니다. 특별히 검색 알고리즘 패널티를 받거나, 사이트의 품질 지수가 급락한 상황은 아니었습니다. 단순히 사이트를 개선하지 않아서 발생한 트래픽 감소도 아니었습니다. 문제는 구글이 스스로 검색 결과 페이지의 구조를 완전히 뒤바꿔버린 데 있었습니다. 구글이 지난해 말부터 본격적으로 확대하기 시작한 AI 개요(Overview) 기능이 바로 그 원인이었습니다.

이 현상은 비단 저희 쇼핑몰만의 문제가 아닙니다. 다양한 국내 이커머스 사이트를 분석한 결과, AI 개요가 검색 결과 최상단에 노출된 키워드군에서 유기 검색 클릭률(CTR)이 평균 25~30%까지 급감한 정황이 포착되었습니다. 사용자가 더 이상 첫 번째 유기 검색 결과를 클릭하지 않는다는 뜻입니다. 왜냐하면 구글이 AI로 생성한 요약과 함께 바로 그 아래에 상품 추천 영역(Carousel)을 배치해, 사용자가 사이트로 방문하지 않아도 충분한 정보를 얻고 구매 결정을 내릴 수 있도록 만들어버렸기 때문입니다. 저희 오픈타임이 운영하는 특정 쇼핑몰도 예외는 아니었습니다. AI 개요 상품 추천 영역에 노출되기 전, 해당 키워드의 오가닉 트래픽은 월평균 1,200명 수준을 유지하고 있었습니다. 그러나 노출 이후 단 3일 만에 그 수치는 740명 수준으로 곤두박질쳤습니다. 클릭이 사라지자 매출 전환율에도 즉각적인 타격이 발생했습니다.

이 상황에서 흥미로운 반전도 있었습니다. 똑같은 AI 개요 환경에서도 오히려 트래픽이 증가한 소수의 페이지들이 존재했습니다. 어떤 차이가 있었을까요? 정답은 페이지가 어떻게 정보를 구조화했는지, 즉 AI가 사용자의 질문에 ‘답변’할 수 있도록 문서를 설계했는지 여부에 달려 있었습니다. 기존의 SEO가 키워드 밀도와 백링크에 집중했다면, 이제는 AI가 콘텐츠를 이해하고 바로 사용자에게 제시할 수 있는 형태로 최적화하는 접근법이 필요해진 것입니다. 이것이 바로 **답변 엔진 최적화(AEO)**이며, 나아가 AI가 추천 결과를 생성할 때 우리의 페이지를 최우선으로 포함하도록 유도하는 **생성 엔진 최적화(GEO)**의 개념이 현실이 된 순간이었습니다.

오픈타임은 이 지점에 주목했습니다. 단순히 트래픽이 사라지는 것을 지켜볼 수는 없었기에, 우리는 AI 개요 상품 추천 영역을 정면으로 타겟팅한 실험을 기획했습니다. 이 글은 그 실험의 전말을 생생하게 공개합니다. AI 검색 시대에 이커머스 업주라면 ‘왜 내 상품이 사라졌는가’라는 막연한 좌절감에 빠지기보다, AI가 평가하는 방식 자체를 이해하고 적극적으로 활용해야 합니다. 이 글을 끝까지 읽는다면 기존 SEO만으로는 더 이상 버틸 수 없는 이유를 넘어, GEO와 AEO의 프레임워크로 어떻게 AI 검색의 상품 추천 영역에 여러분의 브랜드를 등장시킬 수 있는지 명확한 전략을 확인하실 수 있을 것입니다. 무엇보다 우리에게는 이 고민을 실전에서 직접 검증할 수 있는 사이트([https://ai.idearabbit.co.kr/](https://ai.idearabbit.co.kr/))가 있습니다. 여기서의 실제 운영 인사이트가 이 글이 지닌 가장 강력한 차별점입니다.

GEO란? AI가 상품을 추천하는 방식을 뒤집는 ‘답변 엔진 최적화’의 핵심

AI 검색 환경이 본격화되면서 기존 SEO의 패러다임이 근본적으로 흔들리고 있습니다. 과거 사용자가 ‘검색어’를 입력하면 검색 엔진은 그 단어가 포함된 웹페이지 목록을 반환했습니다. 그러나 구글의 AI Overview(구 SGE), Bard와 같은 생성형 AI 모델은 더 이상 단순한 검색 결과 리스트를 제공하지 않습니다. 사용자의 질문을 이해하고, 여러 출처의 정보를 종합해 하나의 완성된 ‘답변’을 직접 생성하여 보여줍니다. 이러한 변화 속에서 등장한 개념이 바로 GEO(Generative Engine Optimization, 생성 엔진 최적화)와 AEO(Answer Engine Optimization, 답변 엔진 최적화)입니다. 이 두 용어는 비슷해 보이지만, 오픈타임이 AI 기반 전략을 수립하면서 명확히 구분하여 접근하고 있습니다.

GEO와 AEO의 차이: 생성 엔진이 답변을 만드는 방식

AEO는 전통적인 SEO의 확장선상에서 이해할 수 있습니다. 특정 질문(예: “가장 가벼운 무선 이어폰은?”)이 입력되었을 때, 구글의 음성 검색이나 일반 검색 결과에서 별도로 강조되는 답변 스니펫(Action Card, Featured Snippet 등)에 콘텐츠가 채택되도록 최적화하는 작업입니다. 즉, AEO는 ‘질문에 대한 가장 정확하고 간결한 답변’을 제공하는 데 초점을 맞춥니다. 반면 GEO는 한 차원 더 진화한 개념입니다. GEO는 사용자의 질문을 바탕으로 AI가 여러 문서를 종합하여 완전히 새로운 텍스트를 ‘생성’해낼 때, 그 생성 과정에서 특정 브랜드나 상품 정보가 인용되고 추천되도록 유도하는 전략입니다. 구글 AI 개요가 상품 추천 영역을 별도로 렌더링하여 ‘이런 상품들이 적합합니다’라고 제시할 수 있는 것은, 단순히 답변 스니펫을 노리는 AEO를 넘어 AI의 생성 로직 자체를 이해하고 설계해야 가능한 일입니다.

실제로 오픈타임이 idearabbit(https://ai.idearabbit.co.kr/) 사이트를 통해 실험한 GEO 접근 방식의 가장 큰 특징은, 대상이 ‘생성 과정’이라는 점입니다. 기존 AEO에서는 콘텐츠 내에 ‘질문-답변(Q&A)’ 구조를 명시적으로 만들고, 구글의 Featured Snippet 선정 기준에 맞춰 질문어를 본문에 정확히 일치시키는 전략이 주를 이뤘습니다. 하지만 GEO에서는 특정 키워드의 매칭도보다, AI 모델이 질문의 의도(Intent)를 어떻게 해석하는지가 더 중요해집니다. 구글 Bard나 SGE가 학습한 거대 언어 모델(LLM)은 사람처럼 문맥을 이해하고, 마크업된 데이터 계층을 통해 사실 관계를 검증합니다. 따라서 오픈타임은 GEO 전략에서 ‘스키마 마크업(Schema Markup)’을 최우선 요소로 두고 있습니다.

오픈타임이 정의한 GEO 전략: 질문 구조와 스키마 마크업의 조합

오픈타임의 GEO 전략은 크게 두 가지 축으로 구성됩니다. 첫 번째 축은 ‘질문 구조(Question Architecture)’입니다. 이는 단순히 고객이 검색창에 입력할 만한 키워드를 나열하는 것이 아니라, AI가 자연어로 답변을 생성할 때 반드시 거쳐야 할 추론 경로를 미리 설계하는 작업을 의미합니다. 예를 들어, ‘가정용 에스프레소 머신 추천’이라는 주제를 다룰 때, 우리는 ‘초보자에게 적합한 기종인가?’, ‘내구성은 어떤가?’, ‘가성비 측면에서 어떤지?’라는 하위 질문들이 AI의 추론 단계마다 총체적으로 제시되었습니다. 이렇게 구조화된 질문 프레임워크는 AI가 무작위로 문서를 끌어오는 것이 아니라, 우리가 의도한 논리적 흐름대로 정보를 취합하도록 유도합니다.

두 번째 축은 ‘스키마 마크업’입니다. 많은 마케터들은 여전히 스키마 마크업을 단순히 검색 결과의 ‘리치 스니펫'(별점, 가격, 재고 상태 등)을 얻기 위한 기술적 요소로만 인식합니다. 그러나 GEO 환경에서 스키마 마크업의 역할은 근본적으로 달라집니다. AI 개요가 상품을 추천하기 위해 참조할 때, 일반적인 문장 속에서 ‘product name’, ‘description’, ‘price’, ‘review rating’이라는 데이터를 추출하는 과정은 비효율적입니다. 대신, 구글의 머신러닝 파이프라인은 ‘Product’ 마크업이 적용된 페이지와, ‘FAQ’, ‘HowTo’, ‘Article’ 마크업이 조합된 페이지를 신뢰도 높은 데이터 소스로 판단합니다. 실제로 오픈타임은 AI가 상품 비교 추천을 할 때, FAQ 스키마를 통해 ‘이 제품은 누구에게 적합한가?’에 대한 정답을 명시적으로 제공했고, HowTo 스키마를 통해 3-5단계의 사용 설명을 마크업으로 직접 전달했습니다. 이 구조가 있어야 AI가 ‘답변 생성’ 과정에서 정보를 왜곡하지 않고 인용하는 안정성을 확보할 수 있습니다.

AI 모드가 상품을 읽는 방식: 일반 텍스트에서 마크업 데이터로의 이동

오픈타임이 이 실험에서 가장 주목한 부분은 AI 검색 모드(예: Google SGE 또는 Bard 관련 Feed)가 웹페이지를 바라보는 데이터 구조의 변화였습니다. 과거 구글 크롤러는 HTML 내에 존재하는 모든 텍스트를 동등한 비중으로 스캔하고 인덱싱했습니다. 그러나 생성형 AI가 동작하는 ‘품질 평가(Quality Raters)’와 ‘학습 파이프라인’의 과정을 분석해보면, 텍스트 덩어리보다는 구조화된