Anybody knows a good extendable open source web-crawler? -


क्रॉलर को नई प्रक्रिया (पूर्व पार्सर, पार्सर, आदि ...)

मुझे हेरिट्रिक्स प्रोजेक्ट मिला ()।

लेकिन ऐसी अन्य अच्छी परियोजनाएं हैं?

सबसे अच्छा आप कर सकते हैं जब एक स्वतंत्र क्रॉलर की बात आती है तो क्या करें यह अवधारणा (एक एंटरप्राइज़ स्केल तरीके से) से बना है और बड़े पैमाने पर डेटा की जांच करने के लिए (पिछला Google के समान) का उपयोग करके समर्थित है बढ़िया उत्पाद! मैं वर्तमान में मैनिंग के नए (अभी तक जारी नहीं) में हडोप के बारे में सब कुछ पढ़ रहा हूं। यदि आप इस मार्ग पर जाते हैं तो मैं इस शीर्षक की प्रारंभिक प्रति प्राप्त करने के लिए अपनी तकनीकी समीक्षा टीम में शामिल होने का सुझाव देता हूं!

ये सभी जावा आधारित हैं यदि आप एक असली आदमी हैं (जैसे मेरी !!) तो आप में और अधिक दिलचस्पी हो सकती है, और जो क्लास और एपीआई द्वारा एपीआई पोर्ट्स द्वारा सी # के लिए सभी वर्ग हैं।


Comments

Popular posts from this blog

c++ - Linux and clipboard -

delphi - Mouseover hint for TChart series value -

How to Create Master-Details view using Asp.Net MVC framework -