Probador de XPath
Entrada XML / HTML
Resultados
Detalles técnicos
Cómo funciona el probador de XPath
Qué hace la herramienta
El probador de XPath evalúa expresiones XPath contra documentos XML o HTML y resalta los nodos coincidentes en la fuente. Pegas tu documento XML/HTML, ingresas una expresión XPath y al instante ves todos los nodos que coinciden con su contenido extraído. Esto proporciona retroalimentación visual inmediata para desarrollar consultas usadas en web scraping, transformaciones XSLT y extracción de datos XML.
Casos de uso comunes para desarrolladores
Los desarrolladores usan probadores de XPath al crear selectores para web scraping (Scrapy, lxml), escribir transformaciones XSLT, consultar respuestas de APIs SOAP/XML o extraer datos de archivos de configuración como Maven POMs y manifests de Android. Los ingenieros de QA desarrollan localizadores de Selenium usando XPath cuando los selectores CSS son insuficientes (p. ej., seleccionar por contenido de texto o recorrer hacia arriba). Los ingenieros de DevOps consultan configuraciones de compilación y despliegue basadas en XML.
Formatos, tipos o variantes de datos
XPath admite rutas de ubicación (//book/title), predicados (//item[@price > 10]), ejes (ancestor::, following-sibling::), funciones (contains(), starts-with(), normalize-space(), count()) y expresiones de unión (|). XPath 1.0 devuelve conjuntos de nodos, cadenas, números y booleanos. XPath 2.0+ agrega secuencias, expresiones regulares y funciones de fecha/hora, aunque las implementaciones en navegadores normalmente admiten 1.0. Los elementos con prefijo de namespace requieren registro del namespace para una coincidencia correcta.
Errores comunes y casos límite
El error más común en XPath es olvidarse de los espacios de nombres predeterminados: los elementos dentro de un espacio de nombres no coincidirán con rutas sin prefijo, incluso cuando no aparezca ningún prefijo en el documento fuente. El HTML analizado como XML distingue mayúsculas y minúsculas (DIV ≠ div), mientras que los analizadores de HTML5 normalizan a minúsculas. La abreviatura '//' busca en todos los descendientes y puede ser extremadamente lenta en documentos grandes; prefiere rutas absolutas cuando se conoce la estructura. Los motores XPath de los navegadores no admiten funciones de XPath 2.0 como matches() para regex.
Cuándo usar esta herramienta vs código
Usa esta herramienta del navegador para prototipar rápidamente expresiones XPath contra documentos de muestra antes de integrarlas en código de scraping o de transformación. Para el procesamiento de XML en producción, usa bibliotecas dedicadas (lxml para Python, Saxon para Java) que admitan XPath 2.0/3.0, manejen correctamente los espacios de nombres e integren con pipelines de XSLT y XQuery para transformaciones complejas de documentos.