2018-11-19

[SHARE CODE] TOOL TỰ ĐỘNG LẤY VÀ ĐÓNG GÓI HTML VÀ CSS CỦA MỘT WEBSITE BẤT KỲ

[SHARE CODE] TOOL TỰ ĐỘNG LẤY VÀ ĐÓNG GÓI HTML VÀ CSS CỦA MỘT WEBSITE BẤT KỲ

Các bạn có thể download code tại đây
Một số thư viện dùng trong tool này:
  • [PHP] simple_html_dom linkhttp://sourceforge.net/projects/simplehtmldom/ dùng để bóc tách các phần tử html elements
  • [PHP] hzip.class.php zip cả folder thành một file với tên tương ứng
  • [JS] enscroll – v0.6.1. tạo thanh scollbar giống như facebook sidebar (bên tay phải)
Các file chính trong tool này:
  • index.php tạo form cho người dùng nhập địa chỉ website
  • functions.php  chứa các function viết sẵn dùng trong tool
  • result.php hiển thị các bước đang xử lý
Các bước xử lý:
  1. lấy cấu trúc HTML của website
  2. lấy các tìm các link tới file css và js, tải về và lưu vào thư mục tương ứng là asset/css và asset/js
  3. Tìm các ảnh background trong các file css đã tải về, lưu vào một mảng, sau đó đọc thông tin từ mảng này rồi tải về máy
  4. cập nhật lại đường dẫn của các file css và js tương ứng với thư mục tải về
  5. kết thúc
File sử dụng ajax để lấy các thông tin trả về từ file process.php. Mỗi khi trả về status là 200 thì lặp lại request cho tới khi trả về trạng thái status 500
Lưu ý: Tool không sử dụng database, chỉ sử dụng SESSION của php