DevToys Web Pro iconDevToys Web ProBlog
Đánh giá chúng tôi:
Dùng thử tiện ích mở rộng trình duyệt:

Trình kiểm thử XPath

Không có kết quả
Chế độ
Biểu thức XPath

Đầu vào XML / HTML

  • Kết quả

    Không có nút nào khớp với biểu thức XPath.
    Chi tiết kỹ thuật

    Cách Trình kiểm thử XPath Hoạt động

    Công cụ làm gì

    Trình kiểm thử XPath đánh giá biểu thức XPath trên tài liệu XML hoặc HTML và tô sáng các node khớp trong nguồn. Bạn dán tài liệu XML/HTML, nhập biểu thức XPath, và ngay lập tức thấy tất cả node khớp cùng nội dung được trích xuất. Điều này cung cấp phản hồi trực quan tức thì để phát triển các truy vấn dùng trong web scraping, biến đổi XSLT và trích xuất dữ liệu XML.

    Các trường hợp sử dụng phổ biến cho lập trình viên

    Lập trình viên dùng trình kiểm thử XPath khi xây dựng selector cho web scraping (Scrapy, lxml), viết biến đổi XSLT, truy vấn phản hồi API SOAP/XML, hoặc trích xuất dữ liệu từ các tệp cấu hình như Maven POM và Android manifest. Kỹ sư QA phát triển locator Selenium bằng XPath khi CSS selector không đủ (ví dụ: chọn theo nội dung văn bản hoặc duyệt ngược lên). Kỹ sư DevOps truy vấn các cấu hình build và triển khai dựa trên XML.

    Định dạng dữ liệu, kiểu hoặc biến thể

    XPath hỗ trợ location path (//book/title), predicate (//item[@price > 10]), axis (ancestor::, following-sibling::), hàm (contains(), starts-with(), normalize-space(), count()), và biểu thức hợp (|). XPath 1.0 trả về node-set, chuỗi, số và boolean. XPath 2.0+ bổ sung sequence, biểu thức chính quy và các hàm ngày/giờ, dù triển khai trên trình duyệt thường chỉ hỗ trợ 1.0. Các phần tử có tiền tố namespace yêu cầu đăng ký namespace để khớp chính xác.

    Các lỗi thường gặp và trường hợp biên

    Sai lầm XPath phổ biến nhất là quên về namespace mặc định — các phần tử nằm trong một namespace sẽ không khớp với các đường dẫn không có tiền tố, ngay cả khi không có tiền tố nào xuất hiện trong tài liệu nguồn. HTML được phân tích như XML có phân biệt chữ hoa/chữ thường (DIV ≠ div), trong khi các trình phân tích HTML5 chuẩn hóa về chữ thường. Viết tắt '//' tìm kiếm tất cả các phần tử con cháu và có thể cực kỳ chậm trên các tài liệu lớn; hãy ưu tiên đường dẫn tuyệt đối khi cấu trúc đã biết. Các engine XPath trên trình duyệt không hỗ trợ các hàm XPath 2.0 như matches() cho regex.

    Khi nào nên dùng công cụ này thay vì viết mã

    Hãy dùng công cụ trên trình duyệt này để tạo mẫu nhanh các biểu thức XPath trên các tài liệu mẫu trước khi nhúng chúng vào mã thu thập dữ liệu hoặc mã chuyển đổi. Đối với xử lý XML trong môi trường production, hãy dùng các thư viện chuyên dụng (lxml cho Python, Saxon cho Java) hỗ trợ XPath 2.0/3.0, xử lý namespace đúng cách và tích hợp với các pipeline XSLT và XQuery cho các phép biến đổi tài liệu phức tạp.