Anybody knows a good extendable open source web-crawler? -


क्रॉलर को नई प्रक्रिया (पूर्व पार्सर, पार्सर, आदि ...)

मुझे हेरिट्रिक्स प्रोजेक्ट मिला ()।

लेकिन ऐसी अन्य अच्छी परियोजनाएं हैं?

सबसे अच्छा आप कर सकते हैं जब एक स्वतंत्र क्रॉलर की बात आती है तो क्या करें यह अवधारणा (एक एंटरप्राइज़ स्केल तरीके से) से बना है और बड़े पैमाने पर डेटा की जांच करने के लिए (पिछला Google के समान) का उपयोग करके समर्थित है बढ़िया उत्पाद! मैं वर्तमान में मैनिंग के नए (अभी तक जारी नहीं) में हडोप के बारे में सब कुछ पढ़ रहा हूं। यदि आप इस मार्ग पर जाते हैं तो मैं इस शीर्षक की प्रारंभिक प्रति प्राप्त करने के लिए अपनी तकनीकी समीक्षा टीम में शामिल होने का सुझाव देता हूं!

ये सभी जावा आधारित हैं यदि आप एक असली आदमी हैं (जैसे मेरी !!) तो आप में और अधिक दिलचस्पी हो सकती है, और जो क्लास और एपीआई द्वारा एपीआई पोर्ट्स द्वारा सी # के लिए सभी वर्ग हैं।


Comments

Popular posts from this blog

delphi - Mouseover hint for TChart series value -

c++ - Linux and clipboard -

How to Create Master-Details view using Asp.Net MVC framework -