Anybody knows a good extendable open source web-crawler? -
क्रॉलर को नई प्रक्रिया (पूर्व पार्सर, पार्सर, आदि ...)
मुझे हेरिट्रिक्स प्रोजेक्ट मिला ()।
लेकिन ऐसी अन्य अच्छी परियोजनाएं हैं?
सबसे अच्छा आप कर सकते हैं जब एक स्वतंत्र क्रॉलर की बात आती है तो क्या करें यह अवधारणा (एक एंटरप्राइज़ स्केल तरीके से) से बना है और बड़े पैमाने पर डेटा की जांच करने के लिए (पिछला Google के समान) का उपयोग करके समर्थित है बढ़िया उत्पाद! मैं वर्तमान में मैनिंग के नए (अभी तक जारी नहीं) में हडोप के बारे में सब कुछ पढ़ रहा हूं। यदि आप इस मार्ग पर जाते हैं तो मैं इस शीर्षक की प्रारंभिक प्रति प्राप्त करने के लिए अपनी तकनीकी समीक्षा टीम में शामिल होने का सुझाव देता हूं!
ये सभी जावा आधारित हैं यदि आप एक असली आदमी हैं (जैसे मेरी !!) तो आप में और अधिक दिलचस्पी हो सकती है, और जो क्लास और एपीआई द्वारा एपीआई पोर्ट्स द्वारा सी # के लिए सभी वर्ग हैं।
Comments
Post a Comment