Windows-1252

Windows-1252
Suuntaa-antava kuva artikkelista Windows-1252
Perhe Microsoft Windows
Kieli (kielet Saksa , Englanti , baskin , katalaanin , tanska , espanja , suomi , ranska , italia , hollanti , Norja , Portugali ja Ruotsin muun eurooppalaisten kielten
Merkkien lukumäärä ~ 223
Projektin tila Microsoftin standardoima
Alustat Windows
Organisaatio /
sponsorointi
Microsoft
Rekisterinumero 1252
Pakosarjat Ei tueta
Koodausyksikkö (koodipiste) 8 bittiä

Windows-1252 tai CP1252 (lyhenne sanoista "  sivun koodi - 1252", joka tarkoittaa Sivu Code - 1252) on hahmo , perinteisesti käytetty oletuksena on käyttöjärjestelmä on Microsoft Windows in Englanti ja suurille kielille Euroopassa lännestä , kuten Ranskan .

Asiayhteys

1990-luvun alussa, käyttää Windows-1252 koodaus kehittyy lännessä , julkaisun kanssa Windows 3.x . Koodattuja merkkejä kutsutaan hämmennyksellä "  ANSI  " eikä "Western" ( (sisään) "Western"). Virhe on korjattu, mutta sen seuraajat jatkavat käyttöä (erityisesti Windows 95, 98, NT, 2000, XP, Vista, 2003, 7). Tuolloin Windows-1252-merkistö korvasi DOS-merkistön, ts. Koodisivun 437 englanninkielisissä maissa ja koodisivun 850 useimmissa maailman maissa. '' Länsi-Eurooppa . Kaikki Windowsille kehitetyt ohjelmistot toimivat sitten tämän merkkisarjan kanssa.

Yhteentoimivuuskysymysten, monikielisten ranskankielisten alueiden ( Euroopan unioni , Maghreb ) sekä etenkin kaupan globalisaation ja Internetin kehityksen vaikutuksesta , ja vaikka Windows-1252-koodausta käytetään edelleen, tämä koodaus on kilpailun ja Unicode- standardin kehittämisen kohteena .

Nykyään modernit sovellukset eivät enää käytä tämän tyyppistä koodausta paitsi silloin, kun on tarpeen:

Tekniset näkökohdat

Windows-1252 on ISO / IEC 8859-1  : n laajennus : se eroaa ISO-8859-1- koodauksesta  käyttämällä tulostettavia merkkejä , ei ohjausmerkkejä koodeissa 128-159. Windows-käyttäjille Microsoft kutsuu tätä yleisesti ANSI , mutta sen mukaan, missä käyttöjärjestelmä myytiin, merkistöillä voi olla toinen nimi, kuten CP1252 Yhdysvalloissa tai Yhdysvalloissa. Länsi-Euroopan maat, IANA: n vahvistama nimi , Windows-1252.

Merkkitaulukko

Seuraava taulukko esittää Windows-1252: n. Numeroita 81, 8D, 8F, 90 ja 9D ei käytetä, ja ne on merkitty vaaleanvihreällä värillä. Muutokset standardista ISO-8859-1 on merkitty keltaisella värillä.

Windows-1252 (CP1252)
x0 x1 x2 x3 x4 x5 x6 x7 x8 x9 xA xB xC xD xE xF
0x EI SOH STX ETX EOT ENQ ACK BEL BS HT LF VT FF CR NIIN JOS
1x DLE DC1 DC2 DC3 DC4 NAK SYN JA B VOI EM SUB POISTU FS GS RS Meille
2x SP ! " # $ % & ' ( ) * + , - . /
3x 0 1 2 3 4 5 6 7 8 9 : ; < = > ?
4x @ AT B VS D. E F G H Minä J K L M EI O
5x P Q R S T U V W X Y Z [ \ ] ^ _
6x `` klo b vs. d e f g h i j k l m ei o
7x s q r s t u v w x y z { | } ~ N
8x ƒ ... ˆ Š Œ Ž
9x ' ' " - - ˜ š œ ž Ÿ
Kirves NBSP ¡ ¢ £ ¤ ¥ ¦ § ¨ © ª " ¬ ® ¯
Bx ° ± ² ³ " u · ¸ 1 º " ¼ ½ ¾ ¿
Cx AT AT AT AT AT AT Æ VS È E Ê Ë Ì Í Î Ï
Dx Ð EI Ò Ó Ô Õ Ö × Ø Ù Ú Û Ü Ý Þ ß
Esim klo klo klo klo klo klo æ vs. è é ê ë ì í î ï
Fx ð ei ò o vai niin õ ö ÷ ø ù ú û ü ý þ ÿ

Yhteentoimivuus

Windows-ympäristö tunnistaa ja käyttää Windows-1252: ta, eikä sitä tunnista muissa käyttöjärjestelmissä: DOS käyttää vain IBM-koodisivuja ja Linux / Unix käyttää koodisivuja. ISO- koodit (esimerkki ISO-8859-15 ) tai UTF-8 .

Erityisesti näistä syistä Unicode (ja yleisemmin ISO / IEC 10646 ) on yleensä edullinen.

Yhteentoimivuus HTML-muodossa

W3C HTML -standardien mukaan UTF-8 on sopiva koodaus useimmille HTML- asiakirjoille . Windows-1252: n käyttö on kuitenkin ollut niin laajaa, että useat selaimet tukevat merkkien numeerisia viitteitä koodeille 128-159, kun taas ne vastaavat vain Windows-1252: n merkkejä, mutta vastaavat C1-ohjaimia Unicodessa, jos ne on koodattu UTF-8: een eikä numeerisessa viitteessä.

Täten symboli "€" on Unicode-merkkinumero 8364 - 20AC (16) -, joten & # 8364; - & # x20AC; - on vakio numeerinen viite symbolille ”€”; mutta koska "€" on Windows-1252-merkkinumero 128-80 (16) -, jotkut selaimet tukevat myös & # 128; - & # x80; - tämän merkin numeerisena viitteenä, vaikka tämä onkin laitonta HTML-koodissa, jossa sen pitäisi osoittaa C1-ohjausobjekti (muuten, useimmat C1-ohjausobjektit ovat laittomia myös HTML: ssä, lukuun ottamatta rivien erotusohjaimia, joille HTML: ssä on edustavat niitä numeeristen viitteiden muodossa sekä desimaaleina että heksadesimaaleina, mikä selittää numeroiden 128-159 numeeristen viitteiden laittomuuden osoittamaan Windows-1252-koodin merkin; kuitenkin monet selaimet ovat poikkeuksia tähän sääntö koodeille, joita ei ole yhdistetty muutamiin valtuutettuihin C1-ohjaimiin, ja näytä ne sitten Windows-1252-koodin eikä standardin Unicode-koodipisteen mukaan).

Katso myös

Aiheeseen liittyvät artikkelit

Ulkoiset linkit

Huomautuksia ja viitteitä

  1. Käytettyjen termien sanasto , Globalisaation kehityskeskus, Microsoft Developer Network (MSDN), sivu A
  2. https://docs.microsoft.com/en-us/windows/desktop/intl/code-pages
  3. "  Merkkikoodaukset  " osoitteessa www.w3.org (käytetty 10. marraskuuta 2015 )
  4. Virheellisten Windows-merkkien koodaus HTML- ja XHTML-muodossa