Sie zeigen eine alte Version dieser Seite an. Zeigen Sie die aktuelle Version an.

Unterschiede anzeigen Seitenhistorie anzeigen

« Vorherige Version anzeigen Version 4 Nächste Version anzeigen »

Die Eingabe kann Unicode-basiert oder nicht Unicode-basiert sein. Eingaben, die Unicode-basiert sind, erfolgen zumeist in den UCS-Transfer-Formaten (UTF). Wobei der Unterschied zwischen UTF16 und UCS2 im Allgemeinen vernachlässigbar ist. Der ReportWriter unterstützt folgende UCS-Transfer-Formate:

UTF8

8-Bit Transfer
dem ReportWriter muss der CodePage mitgeteilt werden

UTF8+BOM8-Bit Transfer + vorangestellte Byte-Order-Mark
automatische Erkennung durch den ReportWriter
UTF16 Little Endian

16-Bit Transfer, niederwertiges Byte zuerst
dem ReportWriter muss der CodePage mitgeteilt werden

UTF16 Big Endian

16-Bit Transfer, höherwertiges Byte zuerst
dem ReportWriter muss der CodePage mitgeteilt werden

UTF16+BOM

16-Bit Transfer + vorangestellte Byte-Order-Mark
der ReportWriter erkennt automatisch an der Byte-Order-Mark, ob es sich um UTF16 Little Endian oder UTF16 Big Endian handelt


Eingaben, die nicht Unicode-basiert sind, kommen immer aus einer spezifischen 8-Bit oder 16-Bit CodePage und müssen über einen CodePage-Konverter nach UCS-2 gewandelt werden.

Hierfür besitzt der ReportWriter zwei Mechanismen:

  • Konvertieren über Betriebssystem-Funktionen (Zeichensätze local und oem)

  • Konvertieren über eigene Konvertierungstabellen


Bei der Konvertierung über Betriebssystem-Funktionen wird typischerweise die CodePage local verwendet. Einzig Microsoft-Windows-basierte Betriebssysteme haben für manche Länder zwei CodePages: eine für den grafischen Teil und eine für den Teil der Eingabeaufforderung. In diesem Fall ist local die CodePage des grafischen Teils und oem die CodePage der Eingabeaufforderung. Auf allen anderen Plattformen sind die CodePages local und oem gleich.

Im ReportWriter ist ein CodePage-Konverter enthalten, der in der Lage ist, aus unterschiedlichen nicht Unicode-basierten 8-Bit und 16-Bit CodePages (Multibyte-CodePages) in die UCS-2 CodePage zu konvertieren. Es gibt sehr viele unterschiedliche nicht Unicode-basierte CodePages, so dass es nicht möglich ist, alle bekannten CodePages im CodePage-Konverter abzubilden. Viel schlimmer noch ist die Tatsache, dass ein und dieselbe CodePage bei unterschiedlichen Standardisierungs-Gremien und Herstellern auch unterschiedliche Namen trägt. Die Suche nach der richtigen CodePage kann kompliziert sein. Beim Setzen einer CodePage werden alle Underline- und Minus-Zeichen aus dem CodePage-Namen entfernt und dann eine zugehörige CodePage gesucht. Die folgende Tabelle stellt die realisierten CodePages des ReportWriters dar:

CodePageName und alternative NamenBeschreibung
CP437CP437 IBM437MS DOS 437 Latin US
CP737CP737 IBM737MS DOS 737 Griechisch (437G)
CP775CP775 IBM775MS DOS 775 Baltisch
CP850CP850 IBM850 PC850MS DOS 850 Latin 1
CP852CP852 IBM852MS DOS 852 Latin 2
CP855CP855 IBM855MS DOS 855 Kyrillisch
CP857CP857 IBM857MS DOS 857 Türkisch
CP860CP860 IBM860MS DOS 860 Portugiesisch
CP861CP861 IBM861MS DOS 861 Isländisch
CP862CP862 IBM862 PC862MS DOS 862 Hebräisch
CP863CP863 IBM863MS DOS 863 Kanadisches Französisch
CP864CP864 IBM864MS DOS 864 Arabisch
CP865CP865 IBM865MS DOS 865 Skandinavisch
CP866CP865 IBM866MS DOS 866 Kyrillisch
CP869CP869 IBM869MS DOS 869 Griechisch Modern
CP874CP874 WINDOWS874MS Windows/OEM 874 Thailändisch
CP950CP950 BIG5 BIGFIVE TRADITIONALCHINESE

Microsoft CodePage 950
Traditional Chinese oder Big 5 für Taiwan, Hong Kong und Malaysia

CP936CP936 GBK SIMPLIFIEDCHINESEGBK
SIMPLIFIEDCHINESE
Microsoft CodePage 936
Simplified Chinese + Euro-Zeichen 
CP949CP949 KOREAN

Microsoft CodePage 949
Koreanisch

CP932CP932 SHIFTJIS JAPANESE

Microsoft CodePage 932
Japanisch

CP1051CP1051 IBM1051 ROMAN8HP Roman-8
CP1250CP1250 WINDOWS1250MS Windows 1250 Osteuropa
CP1251CP1251 WINDOWS1251MS Windows 1251 Kyrillisch
CP1252CP1252 WINDOWS1252MS Windows 1252 Westeuropa
CP1253CP1253 WINDOWS1253MS Windows 1253 Griechisch
CP1254CP1254 WINDOWS1254MS Windows 1254 Türkisch
CP1255CP1255 WINDOWS1255MS Windows 1255 Hebräisch
CP1256CP1256 WINDOWS1256MS Windows 1256 Arabisch
CP1257CP1257 WINDOWS1257MS Windows 1257 Baltisch
CP1258CP1258 WINDOWS1258MS Windows/DOS 1258 Vietnamesisch
ISO-646ISO646 CEISO646 USASCII ASCII IBM367 CP367 ISOIR6 ISO646US7-Bit ASCII
ISO-8859-1ISO88591 CEISO88591 ISOLATIN1 LATIN1Latin 1 Westeuropa
ISO-8859-2ISO88592 CEISO88592 ISOLATIN2 LATIN2Latin 2 Osteuropa
ISO-8859-3ISO88593 CEISO88593 ISOLATIN3 LATIN3Latin 3 Südeuropa

ISO-8859-4

ISO88594 CEISO88594 ISOLATIN4 LATIN4Latin 4 Nordeuropa
ISO-8859-5ISO88595 CEISO88595 ISOLATIN5 LATIN5Latin 5 Kyrillisch
ISO-8859-6ISO88596 CEISO88596 ISOLATIN6 LATIN6Latin 6 Arabisch
ISO-8859-7ISO88597 CEISO88597 ISOLATIN7 LATIN7Latin 7 Griechisch
ISO-8859-8ISO88598 CEISO88598 ISOLATIN8 LATIN8Latin 8 Hebräisch
ISO-8859-9ISO88599 CEISO88599 ISOLATIN9 LATIN9Latin 9 Türkisch
ISO-8859-10ISO885910 CEISO885910 ISOLATIN10 LATIN10Latin 10 Skandinavisch
ISO-8859-11ISO885911 CEISO885911 ISOLATIN11 LATIN11Latin 11 Thailändisch
DECSUPPLDECSUPPL DECSUPPLIMENTALÄhnlich Latin1
KOI8RKOI8RUnix/Relcom Kyrillisch
LOCALLOCAL HOST L

Lokale CodePage
(auf Windows-Systemen CodePage der grafischen Oberfläche)

OEMOEM

Nur auf Windows-Systemen
DOS-CodePage

UTF8UTF8

Universal Codeset Transfer Format
8 Bit

UTF16ISO10646UCS2 CEISO10646UCS2 UCS2 UTF16 UTF16

Universal Codeset Transfer Format
16 Bit mit automatischer Erkennung der Byte Order Mark
Bei Nichterkennung wird Little Endian angenommen

UTF16BISO10646UCS2B CEISO10646UCS2B UCS2B UTF16B UTF16B

Universal Codeset Transfer Format
16 Bit Big Endian (UCS2 und UTF16 wird gleichgesetzt)

UTF16LISO10646UCS2L CEISO10646UCS2L UCS2L UTF16L UTF16L

Universal Codeset Transfer Format
16 Bit Little Endian
(UCS2 und UTF16 wird gleichgesetzt)


Was ist, wenn eine CodePage im ReportWriter nicht vorhanden ist?

  • versuchen Sie bei der Ausgabe eine andere unterstützte CodePage auszuwählen

  • benutzen Sie einen Konverter, der Ihre CodePage in ein Unicode-basiertes Format umwandelt

  • fordern Sie von uns eine Erweiterung des CodePage-Konverters an


Für nicht Unicode-basierte CodePages muss dem ReportWriter die CodePage mitgeteilt werden. Er kann sie nicht automatisch erkennen.

  • Keine Stichwörter