Chương trình theo websphinx.sf.net
-
WebSPHINX Miễn phí
WebSPHINX là một thư viện lớp Java thu thập dữ liệu web (robot, nhện), ban đầu được phát triển bởi Robert Miller của Đại học Carnegie Mellon. Đa đọc, tollerant HTML phân tích cú pháp, URL lọc và phân loại trang, mẫu phù hợp,