Arch là một phần mở rộng mã nguồn mở của Apache Nutch (một công cụ tìm kiếm mục đích chung phổ biến, có khả năng mở rộng cao) để tìm kiếm mạng nội bộ. Không hài lòng với công cụ tìm kiếm công ty của bạn? Không có gì đáng ngạc nhiên, rất ít người. Để tốt nhất của kiến thức của chúng tôi, không có công cụ mạng nội bộ mà làm việc cũng như tìm kiếm web toàn cầu của Google nào. Có một lý do cơ bản cho điều này: các thuật toán được sử dụng bởi Google trên Web toàn cầu (hoặc tương tự) không hoạt động gần như tốt trên mạng nội bộ vì thiếu dữ liệu thống kê. Arch (cuối cùng!) giải quyết vấn đề này. Nó sử dụng một phương pháp mới lạ để cung cấp kết quả tìm kiếm có độ chính xác cao hoạt động tuyệt vời. Không tin điều đó sao? Các công cụ đánh giá kiểm tra mù được bao gồm. Bạn có thể triển khai Arch và so sánh hiệu suất của arch với công cụ tìm kiếm hiện tại và/hoặc Google (trên phần công khai của trang web) bằng phương pháp kiểm tra mù. Ngoài chất lượng tìm kiếm tuyệt vời, Arch còn có nhiều tính năng quan trọng đối với môi trường công ty: - Bảo mật cấp tài liệu. Người dùng chỉ có thể tìm thấy các tài liệu mà họ được ủy quyền để xem. - Cập nhật chỉ số không tốn kém. Arch có thể cập nhật các chỉ mục và tránh việc thu hồi dữ liệu trang web hoàn chỉnh thường xuyên. - 24/7 availabilty. Luôn luôn có một chỉ số làm việc có sẵn, ngay cả khi thu thập dữ liệu không thành công. - Hỗ trợ lập chỉ mục đồng thời và tìm kiếm nhiều trang web, với khả năng tìm kiếm và quản lý bất kỳ trang web nào một cách riêng biệt, nếu cần. Năng động thêm và loại bỏ các trang web rất dễ dàng. - Một thư mục trang web được tạo tự động. - Hỗ trợ chi phí thấp sau khi triển khai. - Giao diện kép (PHP và Java) để dễ dàng triển khai và tùy chỉnh. - Tìm kiếm khía cạnh & ra khỏi hộp & quot;. - Một bộ phân tích cú pháp mở rộng và có thể mở rộng để phân tích nhiều định dạng tệp khác nhau: HTML, PHP, PDF, MS Office, Open Office, v.v. - Một mô-đun, plugin dựa trên kiến trúc có thể dễ dàng tùy chỉnh và mở rộng. - Mã nguồn được bao gồm. - Hiệu suất cao và khả năng mở rộng. Arch có thể chạy trên các cụm máy tính để lập chỉ mục các tập dữ liệu rất lớn.
lịch sử phiên bản
- Phiên bản 1.15 đăng trên 2019-05-17
Đã chuyển đổi trên Nutch 1.15 - Phiên bản 1.9.2 đăng trên 2016-08-18
Cải thiện tài liệu phân tích cú pháp, chuyển trên Nutch 1.9. - Phiên bản 1.2 đăng trên 2010-09-17
Được chuyển sang Apache Nutch 1.2, nâng cấp trình phân tích cú pháp PDF, thêm các công cụ kiểm tra và điều chỉnh, giải quyết các vấn đề được tìm thấy trong phiên bản beta, cho phép sử dụng các cụm máy tính.
Chi tiết chương trình
- Mục: Mạng & Internet > Công cụ Tìm kiếm/Tra cứu
- Publisher: CSIRO Astronomy and Space Science
- Giấy phép: Miễn phí
- Giá: N/A
- Phiên bản: 1.15
- Nền tảng: windows