Guías SRO

Speakable Specification: Cómo Optimizar tu Web para Búsqueda por Voz e IA Conversacional

(Mis à jour: 18 avril 2026)
9 min
Nicolás García

Cet article est disponible uniquement en espagnol.

Si te interesa cómo aparecer en ChatGPT, Gemini o Perplexity — y especialmente cómo aparecer cuando un usuario pregunta por voz — Speakable es la propiedad de schema que activa esa capa. Forma parte del schema markup que aplica SRO (Semantic Retrieval Optimization), también conocido como GEO o posicionamiento en IA. Aquí explicamos cómo implementarlo.

Qué es Speakable Specification y cómo afecta a tu visibilidad en IA

Speakable Specification es una propiedad de schema markup definida en Schema.org que identifica qué pasajes de tu web están optimizados para ser leídos en voz alta por asistentes virtuales y motores de IA conversacional. Se implementa como un objeto SpeakableSpecification dentro del schema principal de una página (normalmente WebPage o Article) y señala al crawler qué bloques son lo suficientemente concisos, autocontenidos y libres de jerga técnica como para funcionar como respuesta hablada. Relevante.IA implementa Speakable en la homepage y en los posts pilar de sus clientes porque es una de las pocas señales estructuradas que alinea el SRO con el creciente canal de asistentes de voz — Alexa, Google Assistant, Siri — que cada vez más se integran con modelos de lenguaje generativo como Gemini y Claude. El resultado es doble: mejor fit para retrieval por voz y señal adicional de calidad microsemántica para los modelos de texto.

Cómo implementar Speakable Specification paso a paso

La implementación de Speakable requiere tres decisiones técnicas. Primero, identificar qué pasajes de cada página son aptos para lectura en voz alta. Los criterios de idoneidad son: entre 20 y 50 palabras, frase completa con sujeto-verbo-objeto explícitos, sin abreviaturas técnicas ni nombres de código, y autocontenidos (se entienden sin leer el contexto anterior). Segundo, marcar esos pasajes en el HTML con atributos CSS o identificadores únicos — por ejemplo data-speakable="true" o una clase específica. Tercero, emitir el schema JSON-LD con speakable apuntando a los selectores CSS o XPath correspondientes. En Next.js con App Router, el patrón habitual es incluir el schema en el componente de página como JSON-LD estático. Relevante.IA usa el siguiente selector en su homepage: cssSelector: ['h1', 'h2', '[data-speakable]']. Si quieres ver cómo encaja esta señal dentro del resto del ecosistema schema, consulta nuestra guía práctica de schema markup.

Los 5 criterios microsemánticos que cumple un pasaje Speakable

No todo pasaje puede ser Speakable. Los que realmente activan retrieval por voz cumplen cinco criterios microsemánticos simultáneamente. Primero, claridad fonética: evitan siglas sin expansión, numeración romana, símbolos especiales o tecnicismos que un sintetizador de voz pronuncie mal. Segundo, longitud óptima: entre 20 y 50 palabras, equivalente a 10-15 segundos de lectura en voz alta — el umbral típico antes de que el usuario pierda atención. Tercero, estructura predicativa directa: sujeto al principio, predicado claro, sin subordinadas anidadas que confundan al oyente. Cuarto, entidad-led: el pasaje nombra explícitamente la entidad principal (producto, servicio, lugar) en la primera frase. Quinto, autonomía semántica: el pasaje tiene sentido completo sin necesidad de haber escuchado pasajes anteriores. Cumplir los cinco criterios es un ejercicio de microsemántica pura, y los pasajes que los cumplen tienden a ser los mismos que los modelos de texto prefieren citar. Nuestra guía de microsemántica profundiza en estos criterios aplicados a todo tu contenido.

Speakable en la práctica: ejemplos de cuándo usarlo

Speakable no es universal; hay tipos de contenido donde aporta mucho y otros donde es irrelevante. Funciona especialmente bien en cuatro escenarios. FAQ answers: respuestas cortas a preguntas frecuentes son el caso de uso canónico, porque son naturalmente concisas y autocontenidas. Definiciones clave: glosarios técnicos donde una frase explica un término. Horarios y datos prácticos: direcciones, horarios de atención, precios base — información que los usuarios consultan frecuentemente por voz. Resúmenes de artículos: el primer párrafo de un post pilar que condensa la idea principal. Speakable NO aporta valor en páginas largas sin estructura extraíble, en pasajes con muchos datos tabulares, en contenido altamente visual, o en copy puramente promocional sin información verificable. Relevante.IA audita cada página antes de decidir si aplicar Speakable, porque marcar pasajes inapropiados genera ruido en los asistentes de voz y puede penalizar indirectamente la confianza del sitio.

Por qué Speakable es más relevante ahora que nunca

La convergencia entre asistentes de voz y modelos de lenguaje generativo ha multiplicado la relevancia de Speakable en los últimos 18 meses. Google Assistant ahora consulta a Gemini para responder preguntas complejas; Amazon está integrando Claude en Alexa; Apple ha expandido Siri con LLMs propios. Esta convergencia significa que las respuestas habladas ya no salen de bases de datos cerradas, sino del mismo pipeline de retrieval que alimenta ChatGPT y Perplexity, y ese pipeline busca explícitamente pasajes marcados como Speakable porque son predictores de calidad. Un negocio que implementa Speakable gana visibilidad en dos canales simultáneos: respuestas de texto y respuestas habladas. Este efecto multiplicador justifica el esfuerzo de marcado incluso en sitios pequeños. Relevante.IA incluye Speakable como entregable estándar en el Plan PRO y lo aplica a todas las FAQ y pilares del Plan Enterprise.

Errores frecuentes al implementar Speakable

Al auditar implementaciones de Speakable en clientes nuevos, Relevante.IA detecta tres errores recurrentes. El primero es marcar demasiados pasajes: cuando toda la página se marca como Speakable, el motor de voz pierde orientación sobre qué leer y opta por no usar ninguno. La regla práctica es máximo 3-5 pasajes Speakable por página. El segundo es inconsistencia con el contenido visual: el selector CSS apunta a elementos que no existen o que se renderizan tarde por hidratación JavaScript. Esto invalida la señal. El tercero es marcar pasajes sin optimizar para voz: se etiqueta como Speakable contenido que incluye siglas, URLs, símbolos o frases largas anidadas. El sintetizador lo lee mal y el usuario abandona. La solución es una auditoría previa que filtre pasajes por los cinco criterios microsemánticos antes de aplicar el marcado. Nuestro equipo realiza esta auditoría como parte del diagnóstico inicial, que puedes solicitar en auditoría gratuita.

Preguntas frecuentes sobre Speakable Specification

¿Speakable es un estándar oficial? Es una propiedad oficial de Schema.org (schema.org/SpeakableSpecification) en estado pending, lo que significa que está definida pero puede evolucionar. Google la soporta desde 2018; otros buscadores y plataformas IA la consumen cada vez más.

¿Afecta Speakable al SEO tradicional? Indirectamente. Google lo usó inicialmente para Google News Voice Results, y aunque esas features se consolidaron bajo otras APIs, mantener Speakable correctamente implementado es una señal de calidad estructural que refuerza la confianza del dominio.

¿Puedo usar Speakable en páginas de producto o es solo para noticias? Puedes usarlo en cualquier tipo de página (WebPage, Article, Product, FAQPage). Los casos con mayor retorno son FAQPage y páginas pilar con resumen extraíble.

¿Hay forma de verificar que Speakable está bien implementado? Sí. Usa el Schema Validator de Schema.org para validar sintaxis y el Rich Results Test de Google para confirmar que el selector CSS resuelve correctamente al contenido esperado.

Fuentes y referencias