encoding - What causes my XML to break? -


मेरे पास निम्न XML कोड है।

  & lt; firstname & gt; & Lt; डिफ़ॉल्ट लंबाई = "6" & gt; ओर्विन & lt; / default & gt; & LT; लघु & gt; Örwin & lt; / लघु & gt; & LT; कम & gt; Örwin & lt; / कम & gt; & LT; कम से कम & gt;। & Lt; / कम से कम & gt; & Lt; / firstname & gt;  

क्यों "कम से कम" नोड ब्रेक की सामग्री है? यह थकाऊ के बजाय एक सरल "ओ" होना चाहिए। एक्सएमएल यूटीएफ -8 एन्कोडेड है और उस नोड के आउटपुट को प्रोसेस करने वाला फ़ंक्शन "लघु" और "कम" की सामग्री लिखता है जहां "ओ" स्पष्ट रूप से दिखाई दे रहा है।

मेरा अनुमान है कि XML नहीं है ठीक से यूटीएफ -8 एन्कोडेड कृपया कच्चे फ़ाइल में & lt; shortest & gt; तत्व के भीतर बाइट को दिखाएं ... मुझे संदेह है कि आप पाएंगे कि वे वैध रूप से एन्कोडेड वर्ण नहीं हैं। यदि आप एक छोटा लेकिन पूर्ण प्रोग्राम दिखा सकते हैं जो इस XML को वैध इनपुट से उत्पन्न करता है, तो यह बहुत उपयोगी होगा। (अधिमानतः यह कह रहा है कि यह कौन से प्लेटफ़ॉर्म है, भी है:)

संपादित करें: इस फ़ाइल में कुछ बहुत अजीब चल रहा है यहां "कम" और "कम से कम" मानों के लिए हेक्स मूल्य दिए गए हैं:

छोटा: सी 3 96 72 77 69 63

सबसे छोटा: ईएफ बीएफ बीडी 2 ई

अब "सी 3 9 6" यूटीएफ -8 एन्कोडिंग यू + 00 डी 6 के लिए है, जो कि "डायअरेसिस के साथ लैटिन कैपिटल ऑर ओ हे" है।

हालांकि, ईएफ बीएफ बीडी यूटीएफ -8 एन्कोडिंग है यू + एफएफएफडी जो "प्रतिस्थापन चरित्र" है - निश्चित रूप से नहीं जो आप चाहते हैं (2 ई केवल एएससीसीआई डॉट है।)

अतः, यह वास्तव में वैध यूटीएफ -8 है - लेकिन इसमें उन पात्रों को शामिल नहीं किया गया है जिन्हें आप चाहते हैं। फिर, आपको जांचना चाहिए कि फाइल किसने बनाई ...


Comments

Popular posts from this blog

c++ - Linux and clipboard -

What is expire header and how to achive them in ASP.NET and PHP? -

sql server - How can I determine which of my SQL 2005 statistics are unused? -