Unicode
http://demo.icu-project.org/icu-bin/locexp?_=de_DE&d_=en&x=col&collation...
an online demo from the ICU project (International Components for Unicode).
Nicht alle Unicode-Zeichen dürfen in XML-Dateien vorkommen:
- Blog-Artikel zum Thema, mit Java-Code zum Entfernen der nicht erlaubten Zeichen
- Erlaubte Zeichen in XML
Und hier noch eine hilfreiche UTF-8-Zeichentabelle