Dominio en Búsqueda

Qué es Generative Engine Optimization: guía y playbook 2026

Generative engine optimization (GEO) hace que los asistentes de IA citen tu sitio. Qué es GEO, las 4 palancas, un checklist y el stack mínimo para lanzar en una semana.

Por Esteban Padilla 18 min de lectura

TL;DR

Generative Engine Optimization (GEO) es la práctica de estructurar un sitio web para que los asistentes de IA (ChatGPT, Perplexity, Claude, Google AI Overviews, Bing Copilot) descubran, entiendan y citen su contenido al responder preguntas de usuarios. Donde el SEO tradicional compite por los diez enlaces azules, GEO compite por el slot de citación dentro de la respuesta misma de la IA. Las cuatro palancas de GEO son pasajes citables de 134 a 167 palabras escritos como respuestas directas autocontenidas, schema markup en JSON-LD que nombra entidades y relaciones, llms.txt en la raíz del sitio como resumen estructurado que los crawlers de IA buscan en tiempo de consulta, y señales de entidad de marca: nombre consistente, fundadores, enlaces sameAs y presencia en Wikidata. Esta guía explica cada palanca, te da el código de producción que corre en esta página y te lleva por el stack mínimo viable de GEO para un sitio sin historial de búsqueda IA.

Nota terminológica. En marketing tradicional en español, "GEO" frecuentemente se usaba para geo-targeting (segmentación geográfica). Aquí no hablamos de eso. Generative Engine Optimization es un concepto distinto: optimizar para que los asistentes de IA (ChatGPT, Perplexity, Google AI Overviews) citen tu contenido cuando generan respuestas. Si llegaste buscando segmentación por ubicación, este post no es ese tema.

Qué es generative engine optimization, en concreto

Generative Engine Optimization es la práctica de estructurar un sitio web para que los asistentes de IA descubran, entiendan y citen su contenido al responder preguntas de usuarios. Las superficies son ChatGPT, Perplexity, Claude, Google AI Overviews, Bing Copilot y la app de Gemini: cualquier lugar donde un modelo genera una respuesta escrita en lugar de devolver una lista de enlaces. La métrica de éxito es la frecuencia de citación: con qué frecuencia tu marca o página es nombrada, citada o enlazada dentro de esa respuesta generada.

GEO no es "el nuevo SEO". Es una disciplina hermana. SEO compite por los diez enlaces azules en la página de resultados de Google; GEO compite por el slot de citación dentro de la respuesta misma de la IA. Las dos prácticas comparten un sustrato (un sitio rastreable, rico en schema, bien escrito), pero divergen en la capa de pulido. Una página que rankea #1 orgánicamente puede ser invisible a ChatGPT si su contenido está atrapado en muros de prosa sin bloques citables. Una página citada a diario por Perplexity puede rankear #20 orgánicamente si su perfil de backlinks es delgado. Tratar GEO y SEO como una sola práctica (y agregar AEO como tercera hermana) es la configuración que captura toda la superficie donde los compradores buscan.

Las cuatro palancas de generative engine optimization, en un párrafo. Generative Engine Optimization opera sobre cuatro palancas, y apretar cualquiera de ellas eleva la tasa de citación a través de cada asistente de IA. La primera son los pasajes citables: bloques autocontenidos de 134 a 167 palabras escritos como respuestas directas, con entidades nombradas, que un modelo puede levantar literal y acreditar. La segunda es el schema markup en formato JSON-LD: schemas Organization, Person, BlogPosting, FAQPage y Service que nombran de qué trata la página con suficiente claridad para que el modelo fundamente su respuesta en datos estructurados en lugar de adivinar desde la prosa. La tercera es llms.txt: un resumen estructurado público en la raíz del dominio que los crawlers de IA buscan en tiempo de consulta para entender el sitio en 5,000 palabras o menos. La cuarta son las señales de entidad de marca: un ítem en Wikidata, una página verificada en LinkedIn, un canal de YouTube y un arreglo sameAs que triangula la identidad a través de la web abierta. Las cuatro funcionan juntas; ninguna es suficiente por sí sola.

Cómo se diferencia GEO de SEO y AEO

La forma más limpia de mantener separadas las tres disciplinas es mapear cada una a una superficie distinta, métrica de éxito y stack táctico.

SEO apunta a los diez enlaces azules de Google. La métrica de éxito es el clic desde el SERP a tu sitio. El stack táctico es salud técnica (Core Web Vitals, indexación, sitemap), relevancia on-page (matching de intención de keyword, enlazado interno) y autoridad (perfil de backlinks, confianza del dominio).

GEO apunta al cuerpo de la respuesta dentro de ChatGPT, Perplexity, Claude, Google AI Overviews y Bing Copilot. La métrica de éxito es la frecuencia de citación por prompt rastreado: con qué frecuencia tu marca o página es nombrada, citada o enlazada dentro de la respuesta generada. El stack táctico son las cuatro palancas de arriba.

AEO (Answer Engine Optimization) apunta a los featured snippets de Google, las cajas People Also Ask y las respuestas de asistentes de voz (Siri, Alexa, Google Assistant). La métrica de éxito es la cuota de slots "posición cero" que ocupas a través de un conjunto de queries objetivo. El stack táctico son encabezados con forma de pregunta, schema FAQPage, respuestas en prosa directa de 40 a 60 palabras y harvesting de preguntas PAA.

Las tres disciplinas se solapan a nivel de palanca (los pasajes citables ayudan a las tres, el schema FAQPage ayuda a las tres, los encabezados con forma de pregunta ayudan a las tres) y divergen en la capa de pulido. La explicación completa vive en SEO vs GEO vs AEO: Qué los diferencia y por qué importan en 2026.

Las cuatro palancas de generative engine optimization

Palanca 1: pasajes citables

Un pasaje citable es un bloque autocontenido de 134 a 167 palabras escrito como respuesta directa a una pregunta específica. Abre con una afirmación factual, nombra las entidades específicamente (sin "nosotros" ni "nuestra solución" sin antecedente) y cierra con una idea completa. Los asistentes de IA extraen esos bloques en tiempo de consulta, los levantan literal y acreditan la fuente. La banda de palabras importa porque pasajes menores a 134 palabras tienden a ser demasiado delgados para fundamentar la respuesta de un modelo; pasajes mayores a 167 palabras se truncan a mitad de idea.

El TL;DR al inicio de este artículo es un pasaje citable. También lo es el párrafo de las cuatro palancas arriba. Ambos están escritos para que un modelo pueda citarlos completos sin perder significado.

Palanca 2: schema markup

JSON-LD schema es cómo le dices a un modelo de qué trata una página sin obligarlo a parsear prosa. El stack mínimo para GEO es Organization (tu agencia o empresa), WebSite (la raíz del dominio), WebPage (cada página), BreadcrumbList (contexto de navegación), FAQPage (cada página con FAQs) y BlogPosting (cada post de blog). Schema Person para autores y Schema Service para páginas de servicio componen el efecto.

El schema BlogPosting que corre en esta página es generado por buildBlogPosting() en src/lib/schema.ts. Incluye headline, description, author con un arreglo sameAs apuntando a LinkedIn, datePublished, dateModified, wordCount y publisher Organization.

Palanca 3: llms.txt

llms.txt es un archivo markdown público en la raíz de tu dominio. Para este sitio está en /llms.txt. Es el análogo de robots.txt para búsqueda IA: donde robots.txt controla acceso de crawl, llms.txt explica de qué trata el sitio. El archivo lista páginas clave, resume la marca y apunta a los crawlers de IA hacia recursos canónicos. La mayoría de los asistentes de IA grandes lo buscan en tiempo de consulta cuando una query menciona la marca o el dominio.

El formato es flexible: un resumen estructurado en 5,000 palabras o menos. Abre con una descripción de una línea de qué es el sitio. Lista los servicios primarios. Lista a los fundadores o equipo. Apunta al path de contacto. Apunta al índice canónico del blog. El punto no es cobertura exhaustiva; el punto es que un asistente de IA buscando llms.txt por primera vez puede construir un modelo mental preciso de la marca en menos de treinta segundos.

Palanca 4: señales de entidad de marca

Los LLMs verifican la identidad de una entidad desde menciones en su corpus de entrenamiento, no solo desde fetches bajo demanda. Si tu marca existe en tu propio sitio web y en ningún otro lado, un asistente de IA no tiene forma de confirmar que eres real. La mitad off-site de GEO es hacer tu marca verificable desde múltiples fuentes independientes.

El stack off-site mínimo es una página de empresa verificada en LinkedIn, un canal de YouTube con al menos tres videos mencionando la marca, un perfil en Crunchbase o AngelList si aplica, un ítem Q en Wikidata con las relaciones "instance of" correctas, un listing en Clutch si vendes servicios y una organización en GitHub si envías código. Cada uno de esos debería aparecer en el arreglo sameAs de tu schema Organization.

Por qué GEO es una disciplina, no una táctica. Generative Engine Optimization es una práctica de horizonte largo con inputs medibles, no un truco de contenido único ni un "hack" que envías y olvidas. Los inputs son densidad de pasajes citables, cobertura de schema, frescura de llms.txt y alineación de señales de entidad. Los outputs son frecuencia de citación por prompt rastreado, share of voice a través de asistentes de IA y tráfico desde referrers de fuente IA en GA4. Ninguna de esas métricas se mueve de la noche a la mañana; todas responden a inversión mensual consistente del mismo modo en que el SEO responde a contenido y trabajo de enlaces consistente. Tratar GEO como un truco de contenido ("agrega un TL;DR y listo") te da un bump de una semana y cero composición. Tratarlo como una disciplina (auditoría, base, contenido, off-site, medir, iterar) produce el mismo efecto compuesto que el SEO ha producido los últimos veinte años, en una superficie distinta.

Un stack mínimo viable de GEO que puedes lanzar en una semana

Un sitio pequeño sin historial de búsqueda IA puede lanzar la base en cinco días hábiles. El orden importa porque cada paso hace al siguiente más barato.

Día 1 a 2, acceso de crawl y llms.txt. Actualiza robots.txt para permitir explícitamente GPTBot, ClaudeBot, PerplexityBot, OAI-SearchBot y Google-Extended. Sin allows explícitos, los crawlers pueden caer en default-allow pero no tienes audit trail. Luego envía llms.txt en la raíz del dominio con el resumen de marca, servicios primarios, equipo y paths de contacto.

Día 3 a 4, schema y un pasaje citable. Añade schema Organization y WebSite a cada página (un builder JSON-LD componible, usado en todas partes). Llena el arreglo sameAs con cualquier perfil off-site que exista. Luego escribe un pasaje citable de 134 a 167 palabras en la home respondiendo la pregunta de mayor intención compradora que tu sitio aborde.

Día 5, FAQPage en la página de mayor tráfico. Elige la página que genera más tráfico actual, usualmente la home o una página de servicio insignia. Agrega una sección de FAQ de cinco a siete preguntas al final. Envuelve cada par Q&A en schema FAQPage. Cada respuesta debería ser de 40 a 60 palabras para portabilidad AEO.

Día 6 a 7, señales de entidad off-site. Envía un draft de Wikidata para tu marca si no existe. Verifica la página de empresa de LinkedIn. Actualiza Crunchbase o AngelList. Asegúrate de que cada nombre de perfil off-site y tagline coincida exactamente con el sitio web; la disambiguación de entidad depende de la alineación léxica.

El stack mínimo viable de GEO para un sitio sin historial de búsqueda IA. Un sitio sin historial de búsqueda IA puede comenzar a producir citaciones dentro de treinta a sesenta días desde una base que cabe en una sola página. Permite GPTBot, ClaudeBot, PerplexityBot y OAI-SearchBot en robots.txt. Envía llms.txt en la raíz del dominio con un resumen estructurado, lista de servicios y path de contacto. Agrega JSON-LD Organization y WebSite a cada página con un arreglo sameAs poblado apuntando a LinkedIn, YouTube, GitHub y Wikidata donde existan. Escribe un pasaje citable de 134 a 167 palabras en la home respondiendo la pregunta de mayor intención compradora. Agrega schema FAQPage con cinco a siete pares pregunta-respuesta de 40 a 60 palabras cada uno en la página de mayor tráfico. Eso es el piso. Por debajo, los asistentes de IA no pueden seleccionar el sitio como fuente de forma confiable aunque quisieran. Por encima, la práctica empieza a componer en semanas.

Checklist GEO: todas las señales que debes activar

Un checklist completo de GEO cubre seis dominios: acceso de crawl, configuración de llms.txt, schema markup, pasajes citables, señales de entidad de marca off-site y cableado de medición. Cada dominio es prerrequisito del siguiente: las citaciones de schema fallan si los crawlers no pueden acceder a la página; los pasajes citables quedan sin acreditar si la entidad de marca no puede verificarse off-site. La lista siguiente mapea las cuatro palancas de la sección anterior y está diseñada como un barrido de auditoría que ejecutas una vez antes de que una página salga a producción, una vez tras el lanzamiento y mensualmente a partir de ahí. Los ítems marcados como faltantes durante el barrido mensual alimentan el próximo sprint de optimización GEO. Ningún ítem en esta lista requiere herramientas propietarias: cada señal puede validarse con el Validador de Schema.org, el Rich Results Test de Google y un panel manual gratuito corrido contra ChatGPT, Perplexity y Gemini. El paso mínimo viable limpia acceso de crawl, llms.txt y schema; el paso completo agrega pasajes citables, señales off-site y medición.

Acceso de crawl

  • robots.txt permite explícitamente GPTBot, ClaudeBot, PerplexityBot, OAI-SearchBot y Google-Extended
  • sitemap.xml está vivo, enviado a Google Search Console y lista todas las URLs indexables con fechas lastmod válidas
  • Sin noindex en páginas que quieres citar; noindex solo en páginas legales, de gracias y de admin

llms.txt

  • Archivo existe en https://tudominio.com/llms.txt
  • Abre con una descripción de una oración que incluye la categoría de producto o servicio
  • Lista cada servicio o producto con URL canónica y descripción de 15 a 25 palabras
  • Lista integrantes del equipo con nombre, rol y nota de expertise de una oración
  • Apunta al path de contacto, link de reserva e índice canónico del blog
  • Menos de 5,000 palabras; fecha last-updated refrescada en los últimos 30 días

Schema markup

  • Organization: name, url, logo, arreglo sameAs (LinkedIn, YouTube, GitHub, Wikidata como mínimo), lista knowsAbout con tus áreas de tema
  • WebSite con inLanguage en cada raíz de locale
  • Schema de tipo de página en cada URL: WebPage, BlogPosting, Service, AboutPage, ContactPage según aplique
  • FAQPage en cada página con sección FAQ; cada acceptedAnswer de 40 a 60 palabras en prosa directa
  • BreadcrumbList en cada página con más de un nivel de navegación
  • Cero errores y cero advertencias en el Validador de Schema.org y el Rich Results Test de Google

Pasajes citables

  • Al menos un bloque autocontenido de 134 a 167 palabras en la home respondiendo la pregunta de mayor intención compradora
  • Al menos uno en cada página de servicio o producto
  • Cada pasaje abre con una afirmación factual directa, nombra entidades explícitamente y cierra con una idea completa
  • Pasajes renderizados en un elemento visualmente distinto (blockquote o caja destacada) para que los modelos los localicen sin parsear el layout circundante
  • Cada pasaje se lee como respuesta autónoma, sin pronombres que requieran contexto circundante para resolverse

Señales de entidad de marca (off-site)

  • Página de empresa de LinkedIn: verificada, tagline coincide exactamente con el sitio web, URL en Organization.sameAs
  • Canal de YouTube: al menos 3 videos que mencionan la marca por nombre; URL en Organization.sameAs
  • Ítem Q en Wikidata: instance of configurado correctamente; nombre en todos los idiomas objetivo; sitio web y enlaces sameAs poblados
  • Clutch (servicios) o Product Hunt (SaaS): perfil activo con categoría correcta
  • Cada nombre off-site y tagline coincide exactamente con el sitio web; la disambiguación de entidad se rompe con desalineación léxica

Medición

  • Segmento personalizado en GA4 "Fuentes IA": referral source coincide con chatgpt.com, perplexity.ai, claude.ai, gemini.google.com, copilot.microsoft.com
  • Panel mensual de prompts: 20 prompts de intención compradora corridos contra ChatGPT, Perplexity, Gemini y Claude; citaciones capturadas en hoja de cálculo o tracker
  • Snapshot base tomado antes de la primera optimización para que los lifts de posición sean medibles

Plantillas de contenido GEO: formatos listos para usar

Las tres plantillas a continuación cubren los artefactos GEO de mayor apalancamiento: el pasaje citable, el archivo llms.txt y la respuesta FAQPage. Cada una es una estructura para rellenar construida alrededor de las reglas que los asistentes de IA usan para extraer y acreditar contenido. La plantilla de pasaje citable impone la banda de 134 a 167 palabras, la apertura de respuesta directa y el requisito de entidad nombrada que evita que los modelos abstraigan en lugar de citar. El esqueleto de llms.txt impone la estructura de secciones que los crawlers esperan en tiempo de consulta: descripción de marca, servicios con URLs, equipo con roles, path de contacto y páginas clave. La plantilla de respuesta FAQPage impone el límite de 40 a 60 palabras que equilibra la portabilidad AEO (la ventana de featured snippet de Google) contra la profundidad de citación, que requiere suficiente contexto para que un modelo acredite la fuente con confianza. Rellena cada plantilla con tu marca y tema, valida el schema con el Rich Results Test de Google y publica. La estructura hace el trabajo pesado.

Plantilla de pasaje citable

Reemplaza cada campo entre corchetes. Objetivo: 134 a 167 palabras.

[Respuesta directa de una oración a la pregunta implícita del comprador; incluye el nombre de la marca y la categoría de producto o servicio.] [Dos a tres oraciones expandiendo con metodología específica, herramientas nombradas o pasos de proceso medibles. Usa el nombre completo de la entidad en la primera mención; sin "nosotros/nuestro" sin antecedente explícito.] [Una a dos oraciones sobre un resultado, diferenciador o restricción específica; incluye al menos un número o referencia nombrada.] [Una oración que delimita el público, mercado o contexto aplicable.] [Oración de cierre que completa la idea sin encadenarse al siguiente tema. Aquí es donde el modelo coloca su comilla de cierre.]

Verifica: cuenta las palabras, confirma que el pasaje abre con una afirmación (no con una pregunta) y léelo en aislamiento; debe tener sentido sin ningún contexto circundante.

Esqueleto de llms.txt

# [Nombre de la marca]

> [Descripción de una oración: qué es la marca,
  en qué categoría opera y a quién sirve.]

## Servicios

- [Nombre del servicio]: [descripción de 15 a 25 palabras:
  qué hace, para quién y un output concreto]. URL: /servicios/[slug]

## Equipo

- [Nombre completo], [cargo]: [una oración sobre antecedentes,
  credenciales o área de expertise específica]

## Contacto

- Sitio web: https://[tudominio.com]
- Idiomas: [lista de idiomas]
- Reservas: [URL de Calendly o reunión]

## Páginas clave

- Blog: /es/blog
- Servicios: /es/servicios
- Contacto: /es/contacto
- Nosotros: /es/nosotros

## Licencia

Este contenido puede ser indexado y citado con atribución.
El uso para entrenamiento requiere permiso explícito.

*Última actualización: [AAAA-MM-DD]*

Mantén el archivo por debajo de 5,000 palabras. Actualiza la fecha de Última actualización y la sección ## Páginas clave cada vez que lances una nueva ruta importante.

Plantilla de respuesta FAQPage

Reemplaza cada campo entre corchetes. Objetivo: 40 a 60 palabras. Elimina los enlaces markdown antes de pegar en acceptedAnswer.text del schema.

[Respuesta directa a la pregunta en una oración de 10 a 18 palabras.] [Una a dos oraciones con el matiz clave, herramienta nombrada, plazo específico o advertencia: solo detalles concretos, sin afirmaciones de marketing.] [Opcional: una oración con enlace a un post relacionado usando [texto del enlace](/ruta) si la respuesta se extiende naturalmente a mayor profundidad.]

Verifica: cuenta las palabras (40 a 60), confirma que la primera oración responde directamente la pregunta sin cláusula de preparación y elimina cualquier enlace markdown antes de pegar en el campo acceptedAnswer.text del schema.

Cómo medir el éxito de GEO

El stack tradicional de medición (rank tracking, clics de Search Console, sesiones orgánicas en GA4) no muestra qué está pasando en superficies de IA. Necesitas medición paralela.

Frecuencia de citación. Corre un panel recurrente de 20 prompts de intención compradora contra ChatGPT, Perplexity, Gemini y Claude una vez al mes. Captura: ¿fue citada tu marca?, ¿en qué contexto?, ¿en qué posición de la respuesta?, ¿con qué enlace? Una hoja de cálculo funciona para cold start; herramientas como DataForSEO LLM Mentions, Otterly Lite y Profound lo automatizan una vez que tienes más de cincuenta prompts que rastrear.

Share of voice a través de asistentes de IA. A través del mismo panel de prompts, cuenta cuántas citaciones fueron para ti versus cada competidor nombrado. SoV con tendencia ascendente a lo largo de meses es la señal más limpia de que la práctica está funcionando.

Tráfico de fuente IA en GA4. Configura un segmento personalizado para "Engaged sessions from AI sources": referrals donde la fuente sea chatgpt.com, perplexity.ai, claude.ai, gemini.google.com o copilot.microsoft.com. El tráfico de IA no aparece en reportes default porque la mayoría de asistentes ponen nofollow a sus enlaces de citación; necesitas el segmento explícito.

Por qué CTR-desde-AIO engaña. Google AI Overviews muestra citaciones como superíndices numerados que la mayoría de usuarios no clickea. CTR desde impresiones de AIO se ve pésimo comparado con orgánico, y la tentación es declarar la búsqueda IA un fracaso. El framing correcto: las citaciones AIO son una impresión de marca y un refuerzo del knowledge graph, no un destino de clic. Mídelas como impresiones, no como clics.

Herramientas para generative engine optimization en 2026

La categoría está madurando rápido pero todavía tiene menos de diez productos serios. El stack que usamos:

  • Discovery y generación de briefs. DataForSEO para keyword research, scraping de SERP y el endpoint LLM Mentions. Ahrefs para análisis de gap de contenido. Exportación CSV manual desde Google Trends como fallback de cold start.
  • Validación de schema. Validador de Schema.org para chequeos crudos de JSON-LD. Rich Results Test de Google para el subset que Google premia.
  • Tracking de citaciones. Otterly Lite y Profound para tracking gestionado. El endpoint LLM Mentions de DataForSEO para tracking programático. Una hoja de cálculo para paneles manuales de cold start.

La categoría se va a consolidar. La base no: pasajes citables, schema, llms.txt, señales de entidad. Construye para la base; elige herramientas que hagan más barato mantener la base.

Cuándo pedir ayuda

El stack mínimo viable escala a un equipo in-house pequeño o a un fundador único dispuesto a leer documentación. Cuando el sitio crece más allá de 50 páginas, cuando los idiomas se multiplican, cuando el trabajo de entidad off-site empieza a requerir inversión real en YouTube, Clutch y Wikipedia, el time-to-value de hacerlo solo se alarga. Ese es el momento en que un equipo externo que hace GEO para vivir se vuelve net-positive.

La práctica Search Dominance de W2B es el servicio integrado SEO + GEO + AEO. Auditamos, lanzamos la base, reescribimos para citación y alineamos señales de entidad. Bilingüe en inglés y español, trabajando con sitios en todo el mundo.

¿GEO es tu prioridad concreta? Nuestro servicio de generative engine optimization es el punto de entrada enfocado: corre las cuatro palancas de arriba como un proyecto medible y arranca con una auditoría de visibilidad en IA gratis.

La página que estás leyendo fue construida con estas reglas. Tiene el llms.txt, el schema BlogPosting, los pasajes citables, el bloque FAQPage, el robots.txt abierto y un arreglo sameAs poblado. Comemos lo que cocinamos; este artículo es una de las recetas.

Preguntas frecuentes

¿Quieres el playbook antes que tu competencia?

Documentamos cada técnica que aplicamos con clientes. Posts nuevos sobre GEO, AEO y velocidad web cada mes, sin paja, solo método.

Más artículos

Volver al blog