Tester d'XPath
Entrada XML / HTML
Resultats
Detalls tècnics
Com funciona el provador d’XPath
Què fa l’eina
El XPath Tester avalua expressions XPath contra documents XML o HTML i ressalta els nodes coincidents a la font. Enganxes el teu document XML/HTML, introdueixes una expressió XPath i veus a l’instant tots els nodes coincidents amb el seu contingut extret. Això proporciona una retroalimentació visual immediata per desenvolupar consultes utilitzades en web scraping, transformacions XSLT i extracció de dades XML.
Casos d’ús habituals per a desenvolupadors
Els desenvolupadors utilitzen provadors d’XPath quan construeixen selectors de web scraping (Scrapy, lxml), escriuen transformacions XSLT, consulten respostes d’API SOAP/XML o extreuen dades de fitxers de configuració com els POM de Maven i els manifests d’Android. Els enginyers de QA desenvolupen localitzadors de Selenium amb XPath quan els selectors CSS són insuficients (p. ex., seleccionar per contingut de text o recórrer cap amunt). Els enginyers de DevOps consulten configuracions de compilació i desplegament basades en XML.
Formats, tipus o variants de dades
XPath admet camins de localització (//book/title), predicats (//item[@price > 10]), eixos (ancestor::, following-sibling::), funcions (contains(), starts-with(), normalize-space(), count()) i expressions d’unió (|). XPath 1.0 retorna conjunts de nodes, cadenes, nombres i booleans. XPath 2.0+ afegeix seqüències, expressions regulars i funcions de data/hora, tot i que les implementacions dels navegadors normalment admeten 1.0. Els elements amb prefix d’espai de noms requereixen el registre de l’espai de noms per a una coincidència correcta.
Errors habituals i casos límit
L’error d’XPath més habitual és oblidar-se dels espais de noms per defecte: els elements dins d’un espai de noms no coincidiran amb rutes sense prefix, fins i tot quan no aparegui cap prefix al document d’origen. L’HTML analitzat com a XML distingeix entre majúscules i minúscules (DIV ≠ div), mentre que els analitzadors HTML5 normalitzen a minúscules. L’abreviatura '//' cerca tots els descendents i pot ser extremadament lenta en documents grans; és preferible fer servir rutes absolutes quan se’n coneix l’estructura. Els motors XPath dels navegadors no admeten funcions d’XPath 2.0 com matches() per a expressions regulars.
Quan utilitzar aquesta eina vs codi
Fes servir aquesta eina del navegador per prototipar ràpidament expressions XPath contra documents de mostra abans d’incrustar-les en codi de scraping o de transformació. Per al processament d’XML en producció, utilitza biblioteques dedicades (lxml per a Python, Saxon per a Java) que admetin XPath 2.0/3.0, gestionin correctament els espais de noms i s’integrin amb canals de treball d’XSLT i XQuery per a transformacions complexes de documents.