Sie zeigen eine alte Version dieser Seite an. Zeigen Sie die aktuelle Version an.

Unterschiede anzeigen Seitenhistorie anzeigen

« Vorherige Version anzeigen Version 6 Nächste Version anzeigen »

Die Eingabe kann Unicode-basiert oder nicht Unicode-basiert sein. Eingaben, die Unicode-basiert sind, erfolgen zumeist in den UCS-Transfer-Formaten (UTF). Wobei der Unterschied zwischen UTF16 und UCS2 im Allgemeinen vernachlässigbar ist. Der ReportWriter unterstützt folgende UCS-Transfer-Formate:

UTF8

8-Bit Transfer
dem ReportWriter muss der CodePage mitgeteilt werden

UTF8+BOM8-Bit Transfer + vorangestellte Byte-Order-Mark
automatische Erkennung durch den ReportWriter
UTF16 Little Endian

16-Bit Transfer, niederwertiges Byte zuerst
dem ReportWriter muss der CodePage mitgeteilt werden

UTF16 Big Endian

16-Bit Transfer, höherwertiges Byte zuerst
dem ReportWriter muss der CodePage mitgeteilt werden

UTF16+BOM

16-Bit Transfer + vorangestellte Byte-Order-Mark
der ReportWriter erkennt automatisch an der Byte-Order-Mark, ob es sich um UTF16 Little Endian oder UTF16 Big Endian handelt


Eingaben, die nicht Unicode-basiert sind, kommen immer aus einer spezifischen 8-Bit oder 16-Bit CodePage und müssen über einen CodePage-Konverter nach UCS-2 gewandelt werden.

Hierfür besitzt der ReportWriter zwei Mechanismen:

  • Konvertieren über Betriebssystem-Funktionen (Zeichensätze local und oem)

  • Konvertieren über eigene Konvertierungstabellen


Bei der Konvertierung über Betriebssystem-Funktionen wird typischerweise die CodePage local verwendet. Einzig Microsoft-Windows-basierte Betriebssysteme haben für manche Länder zwei CodePages: eine für den grafischen Teil und eine für den Teil der Eingabeaufforderung. In diesem Fall ist local die CodePage des grafischen Teils und oem die CodePage der Eingabeaufforderung. Auf allen anderen Plattformen sind die CodePages local und oem gleich.

Im ReportWriter ist ein CodePage-Konverter enthalten, der in der Lage ist, aus unterschiedlichen nicht Unicode-basierten 8-Bit und 16-Bit CodePages (Multibyte-CodePages) in die UCS-2 CodePage zu konvertieren. Es gibt sehr viele unterschiedliche nicht Unicode-basierte CodePages, so dass es nicht möglich ist, alle bekannten CodePages im CodePage-Konverter abzubilden. Viel schlimmer noch ist die Tatsache, dass ein und dieselbe CodePage bei unterschiedlichen Standardisierungs-Gremien und Herstellern auch unterschiedliche Namen trägt. Die Suche nach der richtigen CodePage kann kompliziert sein. Beim Setzen einer CodePage werden alle Underline- und Minus-Zeichen aus dem CodePage-Namen entfernt und dann eine zugehörige CodePage gesucht. Die folgende Tabelle stellt die realisierten CodePages des ReportWriters dar:

CodePageName und alternative NamenBeschreibung
CP259CP259 IBM259MS DOS 259 Symbols WP
CP273CP273 IBM273MS DOS 273 Germany
CP277CP277 IBM277MS DOS 277 Denmark Norway
CP278CP278 IBM278MS DOS 278  Finland Sweden
CP280CP280 IBM280MS DOS 280  Italy
CP282CP282 IBM282MS DOS 282  Portugal
CP284CP284 IBM284MS DOS 284  Spain Latin America
CP285CP285 IBM285MS DOS 285  United Kingdom
CP295CP295 IBM295MS DOS 282  APL
CP297CP297 IBM297MS DOS 297  France
CP361CP361 IBM361MS DOS 361  International Publishing
CP363CP363 IBM363MS DOS 363  Symbols Publishing
CP382CP382 IBM382MS DOS 382  Austria Germany Publishing
CP383CP383 IBM383MS DOS 383  Belgium Publishing
CP385CP385 IBM385MS DOS 385 Canada (French) Publishing
CP386CP386 IBM386MS DOS 386 Denmark Norway Publishing 
CP387CP387 IBM387MS DOS 387 Finland Sweden Publishing
CP388CP388 IBM388MS DOS 388 France Publishing
CP389CP389 IBM389MS DOS 389 Italy Publishing
CP391CP391 IBM391MS DOS 391 Portugal Publishing
CP392CP392 IBM392MS DOS 392 Spain Publishing
CP393CP393 IBM393MS DOS 393 Latin America Publishing
CP394CP394 IBM394MS DOS 394 United Kingdom Publishing
CP395CP395 IBM395MS DOS 395 United States Publishing
CP420CP420 IBM420MS DOS 420 Arabic Bilingual
CP424CP424 IBM424MS DOS 424 Israel
CP437CP500 IBM437MS DOS 437 Latin US
CP500CP500 IBM500MS DOS 500 Internationl
CP775CP775 IBM775MS DOS 775 Baltisch
CP829CP829 IBM829MS DOS 829 Math Symbols Publishing
CP838CP838 IBM838MS DOS 838 Thai
CP850CP850 IBM850 PC850MS DOS 850 Latin 1
CP852CP852 IBM852MS DOS 852 Latin 2
CP855CP855 IBM855MS DOS 855 Kyrillisch
CP857CP857 IBM857MS DOS 857 Türkisch
CP860CP860 IBM860MS DOS 860 Portugiesisch
CP861CP861 IBM861MS DOS 861 Isländisch
CP862CP862 IBM862 PC862MS DOS 862 Hebräisch
CP863CP863 IBM863MS DOS 863 Kanadisches Französisch
CP864CP864 IBM864MS DOS 864 Arabisch
CP865CP865 IBM865MS DOS 865 Skandinavisch
CP866CP865 IBM866MS DOS 866 Kyrillisch
CP869CP869 IBM869MS DOS 869 Griechisch Modern
CP871CP871 IBM871MS DOS 871 Iceland
CP875CP875 IBM875MS DOS 875 Greece
CP918CP918 IBM918MS DOS 918 Urdu
CP1025CP1025 IBM1025MS DOS 1025 Cyrillic
CP1027CP1027 IBM1027MS DOS 1027 Japan (Latin)
CP1028CP1028 IBM1028MS DOS 1028 Hebrew Publishing
CP1047CP1047 IBM1047MS DOS 1047 Open Systems
CP1097CP1097 IBM1097MS DOS 1097 Farsi
CP1112CP1112 IBM1112MS DOS 1112 Balti
CP1122CP1122 IBM1122MS DOS 1122 Estonia
CP1123CP1123 IBM1123MS DOS 1123 Cyrillic Ukraine
CP1140CP1140 IBM1140MS DOS 1140 wie 1123 aber mit mit Euro-Zeichen
CP1141CP1141 IBM1141MS DOS 1141 wie 273 aber mit mit Euro-Zeichen
CP1142CP1142 IBM1142MS DOS 1142 wie 277 aber mit mit Euro-Zeichen
CP1143CP1143 IBM1143MS DOS 1143 wie 278 aber mit mit Euro-Zeichen
CP1144CP1144 IBM1144MS DOS 1144 wie 280 aber mit mit Euro-Zeichen
CP1145CP1145 IBM1145MS DOS 1145 wie 284 aber mit mit Euro-Zeichen
CP1146CP1146 IBM1146MS DOS 1146 wie 285 aber mit mit Euro-Zeichen
CP1147CP1147 IBM1147MS DOS 1147 wie 297 aber mit mit Euro-Zeichen
CP1148CP1148 IBM1148MS DOS 1148 wie 500 aber mit mit Euro-Zeichen
CP1149CP1149 IBM1149MS DOS 1149 wie 871 aber mit mit Euro-Zeichen
CP1156CP1156 IBM1156MS DOS 1156 wie 1112 aber mit mit Euro-Zeichen
CP1157CP1157 IBM1157MS DOS 1157 wie 1122 aber mit mit Euro-Zeichen
CP1158CP1158 IBM1158MS DOS 1158 wie 1123 aber mit mit Euro-Zeichen
CP28709CP28709 IBM28709MS DOS 28709 United States Canada 37 bzw. 28709
CP874CP874 WINDOWS874MS Windows/OEM 874 Thailändisch
CP950CP950 BIG5 BIGFIVE TRADITIONALCHINESE

Microsoft CodePage 950
Traditional Chinese oder Big 5 für Taiwan, Hong Kong und Malaysia

CP936CP936 GBK SIMPLIFIEDCHINESEGBK
SIMPLIFIEDCHINESE
Microsoft CodePage 936
Simplified Chinese + Euro-Zeichen 
CP949CP949 KOREAN

Microsoft CodePage 949
Koreanisch

CP932CP932 SHIFTJIS JAPANESE

Microsoft CodePage 932
Japanisch

CP1051CP1051 IBM1051 ROMAN8HP Roman-8
CP1250CP1250 WINDOWS1250MS Windows 1250 Osteuropa
CP1251CP1251 WINDOWS1251MS Windows 1251 Kyrillisch
CP1252CP1252 WINDOWS1252MS Windows 1252 Westeuropa
CP1253CP1253 WINDOWS1253MS Windows 1253 Griechisch
CP1254CP1254 WINDOWS1254MS Windows 1254 Türkisch
CP1255CP1255 WINDOWS1255MS Windows 1255 Hebräisch
CP1256CP1256 WINDOWS1256MS Windows 1256 Arabisch
CP1257CP1257 WINDOWS1257MS Windows 1257 Baltisch
CP1258CP1258 WINDOWS1258MS Windows/DOS 1258 Vietnamesisch
ISO-646ISO646 CEISO646 USASCII ASCII IBM367 CP367 ISOIR6 ISO646US7-Bit ASCII
ISO-8859-1ISO88591 CEISO88591 ISOLATIN1 LATIN1Latin 1 Westeuropa
ISO-8859-2ISO88592 CEISO88592 ISOLATIN2 LATIN2Latin 2 Osteuropa
ISO-8859-3ISO88593 CEISO88593 ISOLATIN3 LATIN3Latin 3 Südeuropa

ISO-8859-4

ISO88594 CEISO88594 ISOLATIN4 LATIN4Latin 4 Nordeuropa
ISO-8859-5ISO88595 CEISO88595 ISOLATIN5 LATIN5Latin 5 Kyrillisch
ISO-8859-6ISO88596 CEISO88596 ISOLATIN6 LATIN6Latin 6 Arabisch
ISO-8859-7ISO88597 CEISO88597 ISOLATIN7 LATIN7Latin 7 Griechisch
ISO-8859-8ISO88598 CEISO88598 ISOLATIN8 LATIN8Latin 8 Hebräisch
ISO-8859-9ISO88599 CEISO88599 ISOLATIN9 LATIN9Latin 9 Türkisch
ISO-8859-10ISO885910 CEISO885910 ISOLATIN10 LATIN10Latin 10 Skandinavisch
ISO-8859-11ISO885911 CEISO885911 ISOLATIN11 LATIN11Latin 11 Thailändisch
DECSUPPLDECSUPPL DECSUPPLIMENTALÄhnlich Latin1
KOI8RKOI8RUnix/Relcom Kyrillisch
LOCALLOCAL HOST L

Lokale CodePage
(auf Windows-Systemen CodePage der grafischen Oberfläche)

OEMOEM

Nur auf Windows-Systemen
DOS-CodePage

UTF8UTF8

Universal Codeset Transfer Format
8 Bit

UTF16ISO10646UCS2 CEISO10646UCS2 UCS2 UTF16 UTF16

Universal Codeset Transfer Format
16 Bit mit automatischer Erkennung der Byte Order Mark
Bei Nichterkennung wird Little Endian angenommen

UTF16BISO10646UCS2B CEISO10646UCS2B UCS2B UTF16B UTF16B

Universal Codeset Transfer Format
16 Bit Big Endian (UCS2 und UTF16 wird gleichgesetzt)

UTF16LISO10646UCS2L CEISO10646UCS2L UCS2L UTF16L UTF16L

Universal Codeset Transfer Format
16 Bit Little Endian
(UCS2 und UTF16 wird gleichgesetzt)


Was ist, wenn eine CodePage im ReportWriter nicht vorhanden ist?

  • versuchen Sie bei der Ausgabe eine andere unterstützte CodePage auszuwählen

  • benutzen Sie einen Konverter, der Ihre CodePage in ein Unicode-basiertes Format umwandelt

  • fordern Sie von uns eine Erweiterung des CodePage-Konverters an


Für nicht Unicode-basierte CodePages muss dem ReportWriter die CodePage mitgeteilt werden. Er kann sie nicht automatisch erkennen.

  • Keine Stichwörter