Seitenhistorie
Die Eingabe kann Unicode-basiert oder nicht Unicode-basiert sein. Eingaben, die Unicode-basiert sind, erfolgen zumeist in den UCS-Transfer-Formaten (UTF). Wobei der Unterschied zwischen UTF16 und UCS2 im Allgemeinen vernachlässigbar ist. Der ReportWriter unterstützt folgende UCS-Transfer-Formate:
UTF8 | 8-Bit Transfer |
---|---|
UTF8+BOM | 8-Bit Transfer + vorangestellte Byte-Order-Mark automatische Erkennung durch den ReportWriter |
UTF16 Little Endian | 16-Bit Transfer, niederwertiges Byte zuerst |
UTF16 Big Endian | 16-Bit Transfer, höherwertiges Byte zuerst |
UTF16+BOM | 16-Bit Transfer + vorangestellte Byte-Order-Mark |
Eingaben, die nicht Unicode-basiert sind, kommen immer aus einer spezifischen 8-Bit oder 16-Bit CodePage und müssen über einen CodePage-Konverter nach UCS-2 gewandelt werden.
Hierfür besitzt der ReportWriter zwei Mechanismen:
Konvertieren über Betriebssystem-Funktionen (Zeichensätze local und oem)
Konvertieren über eigene Konvertierungstabellen
Bei der Konvertierung über Betriebssystem-Funktionen wird typischerweise die CodePage local verwendet. Einzig Microsoft-Windows-basierte Betriebssysteme haben für manche Länder zwei CodePages: eine für den grafischen Teil und eine für den Teil der Eingabeaufforderung. In diesem Fall ist local die CodePage des grafischen Teils und oem die CodePage der Eingabeaufforderung. Auf allen anderen Plattformen sind die CodePages local und oem gleich.
Im ReportWriter ist ein CodePage-Konverter enthalten, der in der Lage ist, aus unterschiedlichen nicht Unicode-basierten 8-Bit und 16-Bit CodePages (Multibyte-CodePages) in die UCS-2 CodePage zu konvertieren. Es gibt sehr viele unterschiedliche nicht Unicode-basierte CodePages, so dass es nicht möglich ist, alle bekannten CodePages im CodePage-Konverter abzubilden. Viel schlimmer noch ist die Tatsache, dass ein und dieselbe CodePage bei unterschiedlichen Standardisierungs-Gremien und Herstellern auch unterschiedliche Namen trägt. Die Suche nach der richtigen CodePage kann kompliziert sein. Beim Setzen einer CodePage werden alle Underline- und Minus-Zeichen aus dem CodePage-Namen entfernt und dann eine zugehörige CodePage gesucht. Die folgende Tabelle stellt die realisierten CodePages des ReportWriters dar:
CodePage | Name und alternative Namen | Beschreibung |
---|---|---|
CP259 | CP259 IBM259 | MS DOS 259 Symbols WP |
CP273 | CP273 IBM273 | MS DOS 273 Germany |
CP277 | CP277 IBM277 | MS DOS 277 Denmark Norway |
CP278 | CP278 IBM278 | MS DOS 278 Finland Sweden |
CP280 | CP280 IBM280 | MS DOS 280 Italy |
CP282 | CP282 IBM282 | MS DOS 282 Portugal |
CP284 | CP284 IBM284 | MS DOS 284 Spain Latin America |
CP285 | CP285 IBM285 | MS DOS 285 United Kingdom |
CP295 | CP295 IBM295 | MS DOS 282 APL |
CP297 | CP297 IBM297 | MS DOS 297 France |
CP361 | CP361 IBM361 | MS DOS 361 International Publishing |
CP363 | CP363 IBM363 | MS DOS 363 Symbols Publishing |
CP382 | CP382 IBM382 | MS DOS 382 Austria Germany Publishing |
CP383 | CP383 IBM383 | MS DOS 383 Belgium Publishing |
CP385 | CP385 IBM385 | MS DOS 385 Canada (French) Publishing |
CP386 | CP386 IBM386 | MS DOS 386 Denmark Norway Publishing |
CP387 | CP387 IBM387 | MS DOS 387 Finland Sweden Publishing |
CP388 | CP388 IBM388 | MS DOS 388 France Publishing |
CP389 | CP389 IBM389 | MS DOS 389 Italy Publishing |
CP391 | CP391 IBM391 | MS DOS 391 Portugal Publishing |
CP392 | CP392 IBM392 | MS DOS 392 Spain Publishing |
CP393 | CP393 IBM393 | MS DOS 393 Latin America Publishing |
CP394 | CP394 IBM394 | MS DOS 394 United Kingdom Publishing |
CP395 | CP395 IBM395 | MS DOS 395 United States Publishing |
CP420 | CP420 IBM420 | MS DOS 420 Arabic Bilingual |
CP424 | CP424 IBM424 | MS DOS 424 Israel |
CP437 | CP500 IBM437 | MS DOS 437 Latin US |
CP500 | CP500 IBM500 | MS DOS 500 Internationl |
CP775 | CP775 IBM775 | MS DOS 775 Baltisch |
CP829 | CP829 IBM829 | MS DOS 829 Math Symbols Publishing |
CP838 | CP838 IBM838 | MS DOS 838 Thai |
CP850 | CP850 IBM850 PC850 | MS DOS 850 Latin 1 |
CP852 | CP852 IBM852 | MS DOS 852 Latin 2 |
CP855 | CP855 IBM855 | MS DOS 855 Kyrillisch |
CP857 | CP857 IBM857 | MS DOS 857 Türkisch |
CP860 | CP860 IBM860 | MS DOS 860 Portugiesisch |
CP861 | CP861 IBM861 | MS DOS 861 Isländisch |
CP862 | CP862 IBM862 PC862 | MS DOS 862 Hebräisch |
CP863 | CP863 IBM863 | MS DOS 863 Kanadisches Französisch |
CP864 | CP864 IBM864 | MS DOS 864 Arabisch |
CP865 | CP865 IBM865 | MS DOS 865 Skandinavisch |
CP866 | CP865 IBM866 | MS DOS 866 Kyrillisch |
CP869 | CP869 IBM869 | MS DOS 869 Griechisch Modern |
CP871 | CP871 IBM871 | MS DOS 871 Iceland |
CP875 | CP875 IBM875 | MS DOS 875 Greece |
CP918 | CP918 IBM918 | MS DOS 918 Urdu |
CP1025 | CP1025 IBM1025 | MS DOS 1025 Cyrillic |
CP1027 | CP1027 IBM1027 | MS DOS 1027 Japan (Latin) |
CP1028 | CP1028 IBM1028 | MS DOS 1028 Hebrew Publishing |
CP1047 | CP1047 IBM1047 | MS DOS 1047 Open Systems |
CP1097 | CP1097 IBM1097 | MS DOS 1097 Farsi |
CP1112 | CP1112 IBM1112 | MS DOS 1112 Balti |
CP1122 | CP1122 IBM1122 | MS DOS 1122 Estonia |
CP1123 | CP1123 IBM1123 | MS DOS 1123 Cyrillic Ukraine |
CP1140 | CP1140 IBM1140 | MS DOS 1140 wie 1123 aber mit mit Euro-Zeichen |
CP1141 | CP1141 IBM1141 | MS DOS 1141 wie 273 aber mit mit Euro-Zeichen |
CP1142 | CP1142 IBM1142 | MS DOS 1142 wie 277 aber mit mit Euro-Zeichen |
CP1143 | CP1143 IBM1143 | MS DOS 1143 wie 278 aber mit mit Euro-Zeichen |
CP1144 | CP1144 IBM1144 | MS DOS 1144 wie 280 aber mit mit Euro-Zeichen |
CP1145 | CP1145 IBM1145 | MS DOS 1145 wie 284 aber mit mit Euro-Zeichen |
CP1146 | CP1146 IBM1146 | MS DOS 1146 wie 285 aber mit mit Euro-Zeichen |
CP1147 | CP1147 IBM1147 | MS DOS 1147 wie 297 aber mit mit Euro-Zeichen |
CP1148 | CP1148 IBM1148 | MS DOS 1148 wie 500 aber mit mit Euro-Zeichen |
CP1149 | CP1149 IBM1149 | MS DOS 1149 wie 871 aber mit mit Euro-Zeichen |
CP1156 | CP1156 IBM1156 | MS DOS 1156 wie 1112 aber mit mit Euro-Zeichen |
CP1157 | CP1157 IBM1157 | MS DOS 1157 wie 1122 aber mit mit Euro-Zeichen |
CP1158 | CP1158 IBM1158 | MS DOS 1158 wie 1123 aber mit mit Euro-Zeichen |
CP28709 | CP28709 IBM28709 | MS DOS 28709 United States Canada 37 bzw. 28709 |
CP874 | CP874 WINDOWS874 | MS Windows/OEM 874 Thailändisch |
CP950 | CP950 BIG5 BIGFIVE TRADITIONALCHINESE | Microsoft CodePage 950 |
CP936 | CP936 GBK SIMPLIFIEDCHINESEGBK SIMPLIFIEDCHINESE | Microsoft CodePage 936 Simplified Chinese + Euro-Zeichen |
CP949 | CP949 KOREAN | Microsoft CodePage 949 |
CP932 | CP932 SHIFTJIS JAPANESE | Microsoft CodePage 932 |
CP1051 | CP1051 IBM1051 ROMAN8 | HP Roman-8 |
CP1250 | CP1250 WINDOWS1250 | MS Windows 1250 Osteuropa |
CP1251 | CP1251 WINDOWS1251 | MS Windows 1251 Kyrillisch |
CP1252 | CP1252 WINDOWS1252 | MS Windows 1252 Westeuropa |
CP1253 | CP1253 WINDOWS1253 | MS Windows 1253 Griechisch |
CP1254 | CP1254 WINDOWS1254 | MS Windows 1254 Türkisch |
CP1255 | CP1255 WINDOWS1255 | MS Windows 1255 Hebräisch |
CP1256 | CP1256 WINDOWS1256 | MS Windows 1256 Arabisch |
CP1257 | CP1257 WINDOWS1257 | MS Windows 1257 Baltisch |
CP1258 | CP1258 WINDOWS1258 | MS Windows/DOS 1258 Vietnamesisch |
ISO-646 | ISO646 CEISO646 USASCII ASCII IBM367 CP367 ISOIR6 ISO646US | 7-Bit ASCII |
ISO-8859-1 | ISO88591 CEISO88591 ISOLATIN1 LATIN1 | Latin 1 Westeuropa |
ISO-8859-2 | ISO88592 CEISO88592 ISOLATIN2 LATIN2 | Latin 2 Osteuropa |
ISO-8859-3 | ISO88593 CEISO88593 ISOLATIN3 LATIN3 | Latin 3 Südeuropa |
ISO-8859-4 | ISO88594 CEISO88594 ISOLATIN4 LATIN4 | Latin 4 Nordeuropa |
ISO-8859-5 | ISO88595 CEISO88595 ISOLATIN5 LATIN5 | Latin 5 Kyrillisch |
ISO-8859-6 | ISO88596 CEISO88596 ISOLATIN6 LATIN6 | Latin 6 Arabisch |
ISO-8859-7 | ISO88597 CEISO88597 ISOLATIN7 LATIN7 | Latin 7 Griechisch |
ISO-8859-8 | ISO88598 CEISO88598 ISOLATIN8 LATIN8 | Latin 8 Hebräisch |
ISO-8859-9 | ISO88599 CEISO88599 ISOLATIN9 LATIN9 | Latin 9 Türkisch |
ISO-8859-10 | ISO885910 CEISO885910 ISOLATIN10 LATIN10 | Latin 10 Skandinavisch |
ISO-8859-11 | ISO885911 CEISO885911 ISOLATIN11 LATIN11 | Latin 11 Thailändisch |
DECSUPPL | DECSUPPL DECSUPPLIMENTAL | Ähnlich Latin1 |
KOI8R | KOI8R | Unix/Relcom Kyrillisch |
LOCAL | LOCAL HOST L | Lokale CodePage |
OEM | OEM | Nur auf Windows-Systemen |
UTF8 | UTF8 | Universal Codeset Transfer Format |
UTF16 | ISO10646UCS2 CEISO10646UCS2 UCS2 UTF16 UTF16 | Universal Codeset Transfer Format |
UTF16B | ISO10646UCS2B CEISO10646UCS2B UCS2B UTF16B UTF16B | Universal Codeset Transfer Format |
UTF16L | ISO10646UCS2L CEISO10646UCS2L UCS2L UTF16L UTF16L | Universal Codeset Transfer Format |
Was ist, wenn eine CodePage im ReportWriter nicht vorhanden ist?
versuchen Sie bei der Ausgabe eine andere unterstützte CodePage auszuwählen
benutzen Sie einen Konverter, der Ihre CodePage in ein Unicode-basiertes Format umwandelt
fordern Sie von uns eine Erweiterung des CodePage-Konverters an
Für nicht Unicode-basierte CodePages muss dem ReportWriter die CodePage mitgeteilt werden. Er kann sie nicht automatisch erkennen.