Web Data Extractor Pro là một công cụ cạo web được thiết kế đặc biệt để thu thập hàng loạt các loại dữ liệu khác nhau. Nó có thể thu hoạch URL, số điện thoại và fax, địa chỉ email, cũng như thông tin thẻ meta và văn bản nội dung. Tính năng đặc biệt của WDE Pro là khai thác tùy chỉnh dữ liệu có cấu trúc. Chương trình tốc độ cao và đa đọc này hoạt động bằng cách sử dụng từ khóa vào công cụ tìm kiếm, bằng cách nhện trang web hoặc danh sách URL từ tệp. Bạn cũng có thể cho phép nó theo dõi các liên kết bên ngoài từ các trang gốc, với khả năng đi sâu vào đường dẫn URL khi bạn cần và thực sự tìm kiếm toàn bộ Internet. Web Data Extractor là cấp trên để thu thập thông tin có cấu trúc và các loại dữ liệu cụ thể liên quan đến các từ khóa bạn cung cấp bằng cách tìm kiếm thông qua nhiều lớp trang web.
lịch sử phiên bản
- Phiên bản 3.10 đăng trên 2020-01-06
Phân tích cú pháp địa chỉ email được cải thiện đáng kể; Danh sách tác nhân người dùng đã được cập nhật; Đã thêm &Thử lại các URL không được trích xuất&và & & Tăng cường yếu tố con người" các tùy chọn trong Kết nối để làm việc hiệu quả hơn với các trang web mục tiêu; Thêm tùy chọn "Kiểm tra mỗi X phút" và & Gia hạn sau khi nó đã đọc Y số liên kết & trong máy chủ Proxy cho công việc hiệu quả hơn với proxy; Nhiều cải tiến đã được thực hiện theo đánh giá của khách hàng của chúng tôi! - Phiên bản 3.9 đăng trên 2018-12-30
Danh sách các công cụ tìm kiếm được xóa các liên kết lỗi thời / bị hỏng. Điều này cho phép chúng tôi tăng tốc độ của phần mềm trong chế độ công cụ tìm kiếm; Cải thiện đáng kể địa chỉ email phân tích cú pháp, đặc biệt là cho JS (JavaScript) ẩn email;Cải thiện tùy chọn để nhập khẩu máy chủ proxy riêng từ các tập tin CSV;Cải thiện công việc với các trang web HTTPS;Cải thiện hiệu suất khi làm việc với danh sách URL lớn;Cải thiện & Quot;Cookie Capture" tùy chọn; Các bản sửa lỗi/cải tiến nhỏ khác nhau theo phản hồi của khách hàng - Phiên bản 3.8 đăng trên 2017-12-29
Thêm khả năng tải và trích xuất thông tin từ các tệp PDF; Thêm khả năng tải các tập tin giấy phép trực tiếp từ các hình thức giao diện người dùng, khi thời gian dùng thử của việc sử dụng chương trình hết hạn. Ngoài ra, tệp giấy phép có thể được tải lên từ Biểu mẫu Tùy chọn -> Giới thiệu nếu thời gian dùng thử chưa hết hạn; Cải thiện đáng kể công việc thông qua các máy chủ proxy; Phân tích cú pháp của mã hóa JS-email đã được cải thiện; Mục menu ngữ cảnh & Bắt đầu lại URL" đã được thêm vào & URL không hợp lệ&Cải thiện công việc với kho dữ liệu nội bộ phần mềm; Thêm khả năng xóa phiên cùng với tất cả dữ liệu của nó và các tập tin dịch vụ, cũng là phần mềm tự động nén kho lưu trữ nội bộ của chương trình để giảm không gian đĩa cần thiết; Đã thêm &Giới thiệu Ban đầu" trường văn bản trong giao diện người dùng. Một số trang web có thể hiển thị thông tin khác nhau tùy thuộc vào trang web bên ngoài mà họ đến từ. Trường &Giới thiệu ban đầu" cho phép bạn chỉ định địa chỉ web của một trang web đó; Chúng tôi cũng thực hiện nhiều thay đổi và cải tiến nhỏ khác nhau dựa trên phản hồi từ khách hàng - Phiên bản 3.7 đăng trên 2017-02-28
Cải thiện công việc của & Công cụ Tìm kiếm" chế độ;Cải thiện & Loại bỏ Thẻ HTML" và & Trang phải chứa văn bản sau để trích xuất dữ liệu&bộ lọc; Đã thêm &Sử dụng bộ lọc IP quốc gia" bộ lọc cho phép loại trừ kết quả của các máy chủ không liên quan (theo vị trí địa lý) đến quốc gia được chọn trong &tùy chọn Công cụ Tìm kiếm; Phân tích cú pháp email được cải thiện đáng kể và phân tích cú pháp Trình xây dựng tùy chỉnh; Những cải tiến chung trong phát hiện và khai thác dữ liệu; Chúng tôi cũng thực hiện nhiều thay đổi và cải tiến nhỏ khác nhau dựa trên phản hồi từ khách hàng - Phiên bản 3.6 đăng trên 2016-08-22
Đã thêm hộp kiểm & Nhận URL được chuyển hướng&trên & Trình chỉnh sửa dữ liệu tùy chỉnh&biểu mẫu để trích xuất url (ví dụ: địa chỉ trang web) được trình bày thông qua chuyển hướng; Đã thêm hộp kiểm & đánh dấu proxy không phản hồi giống như tự động" không hoạt động;. Nếu trong máy chủ proxy phiên được xác định là xấu (không hoạt động), nó sẽ tự động được đánh dấu là không hoạt động và nó không được sử dụng trong phiên; Đã thêm tùy chọn " mới;Dùng phối đơn dòng" để hợp nhất dữ liệu vào một chuỗi duy nhất. Ví dụ: bạn có thể xuất các màu áo thun như: & T-Shirt", & Đen, Vàng, Đỏ, Xanh lá cây; Cải thiện đáng kể tải các máy chủ proxy công cộng từ Internet; &Yếu tố con người" tùy chọn đã được cải thiện; Cải thiện một phân tích cú pháp đóng cửa bởi JS địa chỉ email; Cải thiện tùy chọn chuyển Google-captcha khi tìm kiếm dữ liệu qua Google; Chúng tôi cũng thực hiện nhiều thay đổi và cải tiến nhỏ khác nhau dựa trên phản hồi từ khách hàng - Phiên bản 2.0 đăng trên 2012-08-29
Làm lại các thuật toán để xác định độ sâu của quét, Chương trình bền vững với thiệt hại vật chất của cơ sở dữ liệu được thêm vào, Cải thiện dòng kiểm soát, trong đó có một tác động tích cực đến hiệu suất tổng thể, Cải thiện công việc với một danh sách lớn các từ khóa trong & Công cụ tìm kiếm" chế độ
Chi tiết chương trình
- Mục: Mạng & Internet > Công cụ Tìm kiếm/Tra cứu
- Publisher: WebExtractor System
- Giấy phép: Dùng thử miễn phí
- Giá: $199.00
- Phiên bản: 3.10
- Nền tảng: windows