encoding - What causes my XML to break? -


मेरे पास निम्न XML कोड है।

  & lt; firstname & gt; & Lt; डिफ़ॉल्ट लंबाई = "6" & gt; ओर्विन & lt; / default & gt; & LT; लघु & gt; Örwin & lt; / लघु & gt; & LT; कम & gt; Örwin & lt; / कम & gt; & LT; कम से कम & gt;। & Lt; / कम से कम & gt; & Lt; / firstname & gt;  

क्यों "कम से कम" नोड ब्रेक की सामग्री है? यह थकाऊ के बजाय एक सरल "ओ" होना चाहिए। एक्सएमएल यूटीएफ -8 एन्कोडेड है और उस नोड के आउटपुट को प्रोसेस करने वाला फ़ंक्शन "लघु" और "कम" की सामग्री लिखता है जहां "ओ" स्पष्ट रूप से दिखाई दे रहा है।

मेरा अनुमान है कि XML नहीं है ठीक से यूटीएफ -8 एन्कोडेड कृपया कच्चे फ़ाइल में & lt; shortest & gt; तत्व के भीतर बाइट को दिखाएं ... मुझे संदेह है कि आप पाएंगे कि वे वैध रूप से एन्कोडेड वर्ण नहीं हैं। यदि आप एक छोटा लेकिन पूर्ण प्रोग्राम दिखा सकते हैं जो इस XML को वैध इनपुट से उत्पन्न करता है, तो यह बहुत उपयोगी होगा। (अधिमानतः यह कह रहा है कि यह कौन से प्लेटफ़ॉर्म है, भी है:)

संपादित करें: इस फ़ाइल में कुछ बहुत अजीब चल रहा है यहां "कम" और "कम से कम" मानों के लिए हेक्स मूल्य दिए गए हैं:

छोटा: सी 3 96 72 77 69 63

सबसे छोटा: ईएफ बीएफ बीडी 2 ई

अब "सी 3 9 6" यूटीएफ -8 एन्कोडिंग यू + 00 डी 6 के लिए है, जो कि "डायअरेसिस के साथ लैटिन कैपिटल ऑर ओ हे" है।

हालांकि, ईएफ बीएफ बीडी यूटीएफ -8 एन्कोडिंग है यू + एफएफएफडी जो "प्रतिस्थापन चरित्र" है - निश्चित रूप से नहीं जो आप चाहते हैं (2 ई केवल एएससीसीआई डॉट है।)

अतः, यह वास्तव में वैध यूटीएफ -8 है - लेकिन इसमें उन पात्रों को शामिल नहीं किया गया है जिन्हें आप चाहते हैं। फिर, आपको जांचना चाहिए कि फाइल किसने बनाई ...


Comments

Popular posts from this blog

delphi - Mouseover hint for TChart series value -

c++ - Linux and clipboard -

How to Create Master-Details view using Asp.Net MVC framework -