![](/statics/img/blank.png)
wikipedia2XML 0.1
Giấy phép: Miễn phí Kích cỡ tệp: N/A
Xếp hạng người dùng: 3.0/5 - 1 Phiếu
Hãy chờ... Liên kết tải xuống của bạn đang được xác minh cho nội dung độc hại.
Bạn sẽ có thể tải xuống trong 5 giây.
Bạn sẽ có thể tải xuống trong 5 giây.
Về wikipedia2XML
Một tập hợp các kịch bản python để tạo và xử lý một corpus XML (một bộ sưu tập lớn các văn bản cho mục đích ngôn ngữ) từ một bãi chứa sao lưu cơ sở dữ liệu Wikipedia gốc. Nó bao gồm một phân tích cú pháp dựa trên biểu thức chính quy cho ngôn ngữ đánh dấu MediaWiki.