C# Web Scraping Library 4.0.4.2

Giấy phép: Dùng thử miễn phí ‎Kích cỡ tệp: 1.03 MB
‎Xếp hạng người dùng: 0.0/5 - ‎0 ‎Phiếu

Web-scraper cho C # cho phép các nhà phát triển .Net để tạo ra hợp lý mà trích xuất nội dung từ các ứng dụng web và biến nó thành JSON, bảng tính, C # đối tượng hoặc thậm chí SQL bằng cách sử dụng đơn giản C # và Linq mã. Iron WebScraper là một thư viện web cào cho nền tảng .Net 4.5 và Core cho phép các nhà phát triển sử dụng logic sạch sẽ, đơn giản để đảo ngược bất kỳ tài nguyên web nào trở lại vào các đối tượng C # hoặc SQL. Nó có thể trích xuất các trang bằng cách sử dụng quy trình công việc từng bước (nếu-điều-thì-đó), dễ dàng cạo và phân tích html, javascript, xml, RSS, pdf và tài liệu văn phòng trên internet hoặc mạng nội bộ địa phương trở lại vào dữ liệu có cấu trúc hữu ích. Điều này khiến nhà phát triển có các ứng dụng cạo web sạch sẽ, hiệu quả, dễ hiểu và gỡ lỗi. C # Web Scraping Thư viện là cực kỳ lịch sự, đảm bảo rằng không có tên miền hoặc địa chỉ IP có quá nhiều yêu cầu đồng thời. Nó thông minh throttles cả hai phía khách hàng và máy chủ tìm kiếm việc sử dụng CPU quá mức và làm chậm đến một tốc độ thích hợp. Ngoài ra, nó có thể tuân thủ các chỉ thị .txt bao gồm tốc độ thu thập dữ liệu cụ thể của BOT và giới hạn. Có thể đặt url và kiểu nội dung chính xác bằng quy trình làm việc lô-gic và quy tắc regex/ký tự đại diện. Cạo màn hình được thực hiện dễ dàng hơn với kiểm soát danh tính, tự động quản lý chủ đề, giới hạn tỷ lệ, url, bản sao, retries, proxy, tiêu đề và cookie vào một đội quân của trình duyệt ảo có thể bắt chước hành vi của con người và thậm chí cả các nút khách hàng, điền vào các hình thức hoặc đăng nhập vào phía sau bức tường an ninh. Điều này rất hữu ích cho việc di chuyển các hệ thống cũ, các cơ sở tìm kiếm doanh nghiệp và để phân tích cạnh tranh thống kê Tài liệu đầy đủ, hỗ trợ và tải về DLLS cho C # Web Scraper có sẵn từ http://ironsoftware.com/csharp/webscraper/, ngoài các liên kết đến một gói .Net 4.5 + Nuget với đầy đủ Azure và Mono tương thích.

Chi tiết chương trình