Günümüzde aggregator (toplayıcı) sitelerin büyük ilgi görmeye başladığı bu günler internet ortamından programatik bir şekilde ver çekmek son derece önem kazanmaya başladı.
Aslında geliştirilen araçlar sayesinde internetten veri çekmek son derece kolay olmakla birlikte nasıl yapılması gerektiği konusundaki eksiklikler nedeniyle sorunlar meydana gelmektedir.
Veri çekmek istediğiniz hedef sitelerini belirledikten sonra işlerini uygun bir şekilde yapabilecek bir Crawler ve HTML (XML) parser seçmeniz gerekmektedir. Bu araçları seçtikten sonra veri çekmeye hazır konuma geliyorsunuz demektir. Ancak üçüncü parti sitelerden veri çektiğiniz için mümkün olduğu kadar onları yormadan (Yorarsanız sizi engellerler) bu işlemleri yapamalısınız.
Karşı tarafı yormamak için Crawler konfigürasyonu yaparken dikkat etmeniz gereken bir kaç parametre var. Bunlarla ilgili detaylıca yazıp kodcu.com’da paylaştığım yazıyı inceleyebilirsiniz.