Anybody knows a good extendable open source web-crawler? -


क्रॉलर को नई प्रक्रिया (पूर्व पार्सर, पार्सर, आदि ...)

मुझे हेरिट्रिक्स प्रोजेक्ट मिला ()।

लेकिन ऐसी अन्य अच्छी परियोजनाएं हैं?

सबसे अच्छा आप कर सकते हैं जब एक स्वतंत्र क्रॉलर की बात आती है तो क्या करें यह अवधारणा (एक एंटरप्राइज़ स्केल तरीके से) से बना है और बड़े पैमाने पर डेटा की जांच करने के लिए (पिछला Google के समान) का उपयोग करके समर्थित है बढ़िया उत्पाद! मैं वर्तमान में मैनिंग के नए (अभी तक जारी नहीं) में हडोप के बारे में सब कुछ पढ़ रहा हूं। यदि आप इस मार्ग पर जाते हैं तो मैं इस शीर्षक की प्रारंभिक प्रति प्राप्त करने के लिए अपनी तकनीकी समीक्षा टीम में शामिल होने का सुझाव देता हूं!

ये सभी जावा आधारित हैं यदि आप एक असली आदमी हैं (जैसे मेरी !!) तो आप में और अधिक दिलचस्पी हो सकती है, और जो क्लास और एपीआई द्वारा एपीआई पोर्ट्स द्वारा सी # के लिए सभी वर्ग हैं।


Comments

Popular posts from this blog

delphi - Mouseover hint for TChart series value -

How to Create Master-Details view using Asp.Net MVC framework -

c++ - Linux and clipboard -