encoding - What causes my XML to break? -
मेरे पास निम्न XML कोड है।
& lt; firstname & gt; & Lt; डिफ़ॉल्ट लंबाई = "6" & gt; ओर्विन & lt; / default & gt; & LT; लघु & gt; Örwin & lt; / लघु & gt; & LT; कम & gt; Örwin & lt; / कम & gt; & LT; कम से कम & gt;। & Lt; / कम से कम & gt; & Lt; / firstname & gt;
क्यों "कम से कम" नोड ब्रेक की सामग्री है? यह थकाऊ के बजाय एक सरल "ओ" होना चाहिए। एक्सएमएल यूटीएफ -8 एन्कोडेड है और उस नोड के आउटपुट को प्रोसेस करने वाला फ़ंक्शन "लघु" और "कम" की सामग्री लिखता है जहां "ओ" स्पष्ट रूप से दिखाई दे रहा है।
मेरा अनुमान है कि XML नहीं है ठीक से यूटीएफ -8 एन्कोडेड कृपया कच्चे फ़ाइल में & lt; shortest & gt;
तत्व के भीतर बाइट को दिखाएं ... मुझे संदेह है कि आप पाएंगे कि वे वैध रूप से एन्कोडेड वर्ण नहीं हैं। यदि आप एक छोटा लेकिन पूर्ण प्रोग्राम दिखा सकते हैं जो इस XML को वैध इनपुट से उत्पन्न करता है, तो यह बहुत उपयोगी होगा। (अधिमानतः यह कह रहा है कि यह कौन से प्लेटफ़ॉर्म है, भी है:)
संपादित करें: इस फ़ाइल में कुछ बहुत अजीब चल रहा है यहां "कम" और "कम से कम" मानों के लिए हेक्स मूल्य दिए गए हैं:
छोटा: सी 3 96 72 77 69 63
सबसे छोटा: ईएफ बीएफ बीडी 2 ई
अब "सी 3 9 6" यूटीएफ -8 एन्कोडिंग यू + 00 डी 6 के लिए है, जो कि "डायअरेसिस के साथ लैटिन कैपिटल ऑर ओ हे" है।
हालांकि, ईएफ बीएफ बीडी यूटीएफ -8 एन्कोडिंग है यू + एफएफएफडी जो "प्रतिस्थापन चरित्र" है - निश्चित रूप से नहीं जो आप चाहते हैं (2 ई केवल एएससीसीआई डॉट है।)
अतः, यह वास्तव में वैध यूटीएफ -8 है - लेकिन इसमें उन पात्रों को शामिल नहीं किया गया है जिन्हें आप चाहते हैं। फिर, आपको जांचना चाहिए कि फाइल किसने बनाई ...
Comments
Post a Comment