Anybody knows a good extendable open source web-crawler? -


क्रॉलर को नई प्रक्रिया (पूर्व पार्सर, पार्सर, आदि ...)

मुझे हेरिट्रिक्स प्रोजेक्ट मिला ()।

लेकिन ऐसी अन्य अच्छी परियोजनाएं हैं?

सबसे अच्छा आप कर सकते हैं जब एक स्वतंत्र क्रॉलर की बात आती है तो क्या करें यह अवधारणा (एक एंटरप्राइज़ स्केल तरीके से) से बना है और बड़े पैमाने पर डेटा की जांच करने के लिए (पिछला Google के समान) का उपयोग करके समर्थित है बढ़िया उत्पाद! मैं वर्तमान में मैनिंग के नए (अभी तक जारी नहीं) में हडोप के बारे में सब कुछ पढ़ रहा हूं। यदि आप इस मार्ग पर जाते हैं तो मैं इस शीर्षक की प्रारंभिक प्रति प्राप्त करने के लिए अपनी तकनीकी समीक्षा टीम में शामिल होने का सुझाव देता हूं!

ये सभी जावा आधारित हैं यदि आप एक असली आदमी हैं (जैसे मेरी !!) तो आप में और अधिक दिलचस्पी हो सकती है, और जो क्लास और एपीआई द्वारा एपीआई पोर्ट्स द्वारा सी # के लिए सभी वर्ग हैं।


Comments

Popular posts from this blog

c++ - Linux and clipboard -

Visual Studio 2005: How to speed up builds when a VSMDI is open? -

booting ubuntu from usb using virtualbox -