tin tức

Loại bỏ tag thừa khi crawler.

22/02/2012 - Xem: 1252

Khi tiến hành crawler tin chúng ta thường gặp một số vấn đề về thiếu thẻ đóng và mở do  các trang web viết code không chuẩn. Với những bài viết này có thể làm vỡ giao diện của bạn,nhất là việc thiếu thẻ đóng

hoặc .Hàm check_tag giúp loại bỏ những thẻ thiếu thẻ đóng hoặc mở,đảm bảo lượng thẻ đóng và mở bằng nhau.Tuy nhiên với các thẻ lồng thì không hiệu quả cho lắm :D (vd:,