Octoparse 6.4.1

Giấy phép: Miễn phí ‎Kích cỡ tệp: 56.62 MB
‎Xếp hạng người dùng: 2.5/5 - ‎1 ‎Phiếu

Octoparse là một phần mềm cạo web Windows phía máy khách miễn phí biến dữ liệu phi cấu trúc hoặc bán cấu trúc từ các trang web thành các tập dữ liệu có cấu trúc, không cần mã hóa. Đó là một công cụ cạo web dễ sử dụng thu thập dữ liệu từ web. Trình thu thập dữ liệu chạy trong Octoparse được xác định bởi các quy tắc khai thác được cấu hình. Quy tắc khai thác sẽ cho Octoparse biết: trang web nào sẽ được mở; dữ liệu bạn định thu thập dữ liệu ở đâu, v.v. cung cấp thu thập dữ liệu tốc độ cao, thực hiện tối đa 10 luồng đồng thời. Là một ứng dụng Windows, Octoparse hoạt động tốt cho các trang web tĩnh và năng động, bao gồm cả những trang web đang sử dụng Ajax. Có nhiều định dạng xuất khác nhau mà bạn chọn như CSV, EXCEL, HTML, TXT và cơ sở dữ liệu (MySQL, SQL Server và Oracle). Octoparse mô phỏng hoạt động của con người để tương tác với các trang web. Các tính năng đáng chú ý của nó như điền vào biểu mẫu, nhập cụm từ tìm kiếm vào hộp văn bản, v.v., sẽ giúp trích xuất dữ liệu web dễ dàng hơn nhiều. Bạn có thể chạy dự án khai thác của bạn hoặc trên máy của riêng bạn (Khai thác cục bộ) hoặc trong đám mây (Khai thác đám mây). Octoparse cung cấp một ngăn hoạt động trực quan, rất thân thiện với người dùng và đơn giản. Octoparse mô phỏng hành vi duyệt web của con người như mở trang web, đăng nhập vào tài khoản, nhập văn bản, trỏ và nhấp vào phần tử web, v.v. Chỉ cần nhấp vào thông tin trên trang web trong trình duyệt tích hợp và thực hiện việc trích xuất, bạn sẽ nhận được dữ liệu có cấu trúc bạn cần. Cạo web trên quy mô lớn cùng một lúc, dựa trên máy tính phân tán, là tính năng mạnh mẽ nhất của Octoparse. Sau khi bạn tải lên dự án cấu hình của bạn lên đám mây, bạn có thể chọn để thực hiện việc khai thác đồng thời bằng cách sử dụng nhiều máy chủ đám mây. Nếu bạn cần cạo 10.000 trang web trong một thời gian ngắn, thì dịch vụ đám mây Octoparse phù hợp nhất.

lịch sử phiên bản

  • Phiên bản 6.4.1 đăng trên 2017-03-07

Chi tiết chương trình