Saltar al contento

ASCII

Non revidite
De Wikipedia, le encyclopedia libere
ASCII
instantia de: Codification de characteres, coded character set[*], Unicode range[*], technical standard[*]


, succedite per: ISO/IEC 8859[*], ISO/IEC 646[*]
Commons: ASCII

ASCII (American Standard Code for Information Interchange) es un collection de characteres e un codification de characteres basate super le alphabeto roman secundo le uso del anglese moderne. Illo es usate per computatores e altere equipamentos de communication pro representar texto e per apparatos de controlo que opera con texto.

Como altere codices, ASCII specifica un correspondentia inter numeros integre que pote esser representate digitalmente e le symbolos de un lingua scripte, permittente que apparatos digital communica inter se e processa e immagazina information de natura textual. Le codification de characteres ASCII (o un extension compatibile; vide infra) es usate in quasi tote computatores commun, specialmente in computatores personal e stationes de travalio. Le denomination MIME preferite pro iste codification es "US-ASCII".

ASCII es un codice de septe bits, lo que significa que illo usa numeros integre representabile con septe digitos binari (un gamma de 0 a 127 in decimal) pro representar information. Mesmo in le epocha del introduction del ASCII, le majoritate del computatores operava con bytes de octo bits como le minor unitate de information; le octave bit communmente era usate pro controlo de errores in lineas de communication o altere functiones in apparatos specific.

ASCII non specifica ulle maniera de representar informatoin super le structura o apparentia de un fragmento de texto. Isto require le uso de un linguage de marcation.

ASCII esseva publicate como un standard in 1963 per le American Standards Association (ASA), que posteriormente deveniva ANSI. Il habeva multe variationes de ASCII, mais su forma actual e plus disseminate es ANSI X3.4-1967, equalmente standardisate como ECMA-6, ISO/IEC 664:1991 International Reference Version, e ITU-T Recommendation T.50 (09/92). ASCII es considerate generalmente como le standard de software le plus successose jammais promulgate.

Characteres de controlo ASCII

[modificar | modificar fonte]

Le prime trenta-duo codices (numeros 0—31 in decimal) de ASCII es reservate pro characteres de controlo que pote non representar information in se, mais es usate pro controlar apparatos (como impressores) que utilisa ASCII. Per exemplo, le character 10 representa le function "Line Feed" ("avantiamento de linea", que face le impressor avantiar le papiro), e le character 27 representa le clave "Escape" trovate in le angulo superior sinistre de clavieros commun.

Le codice 127 (tote le septe bits accendite) es un altere character special cognite como "Delete". Ben que su function es similar a illo de altere characteres de controlo, illo esseva placiate in su position a fin que illo poterea esser usate pro cancellar un section de banda perforate, un medio de immagazinage popular in le passato, per perforar tote su foramines.

BinarioDecimalHexAbbreviationRepresentation
imprimibile
Nomine / Significato
0000 0000000NULNull character
0000 0001101SOHStart of Header
0000 0010202STXStart of Text
0000 0011303ETXEnd of Text
0000 0100404EOTEnd of Transmission
0000 0101505ENQEnquiry
0000 0110606ACKAcknowledgment
0000 0111707BELBell
0000 1000808BSBackspace
0000 1001909HTHorizontal Tab
0000 1010100ALFLine Feed
0000 1011110BVTVertical Tab
0000 1100120CFFForm Feed
0000 1101130DCRCarriage Return
0000 1110140ESOShift Out
0000 1111150FSIShift In
0001 00001610DLEData Link Escape
0001 00011711DC1XON Device Control 1
0001 00101812DC2Device Control 2
0001 00111913DC3XOFF Device Control 3
0001 01002014DC4Device Control 4
0001 01012115NAKNegative Acknowledgement
0001 01102216SYNSynchronous Idle
0001 01112317ETBEnd of Trans. Block
0001 10002418CANCancel
0001 10012519EMEnd of Medium
0001 1010261ASUBSubstitute
0001 1011271BESCEscape
0001 1100281CFSFile Separator
0001 1101291DGSGroup Separator
0001 1110301ERSRecord Separator
0001 1111311FUSUnit Separator
0111 11111277FDELDelete

In le tabella supra, le quinte columna contine characteres graphic que es reservate pro representar le position de codices de controlo in un fluxo de datos; tu agente de usator HTML pote requirer le installation de fontes additional a fin de exhibir los.

Softwares utilitari e systemas de operation ha varie conventiones pro representar le fin de un linea de texto. Le majoritate usa o LF o CR individualmente, o CR sequite per LF. Quando un SO immagazina texto in un file usante ASCII o un codification compatibile de 8 bits, iste characteres es representate per lor bytes 0A, 0D, o 0D sequite per 0A, respectivemente. In EBCDIC, le codice "Next Line" (NEL) al byte 15 (hex) es le typic character de fin de linea. ASCII non del toto codifica NEL, le byte 15 in illo es NAK. Le tabella sequente demonstra le variationes in le conventiones de fin de linea inter differente SOs:

Systema de OperationCharacter(es)
AIXNEL
CP/M and MP/MCR LF
CygwinLF o CR LF*
Mac OS usque a 9.xCR
Mac OS XLF
WindowsCR LF
MS-DOSCR LF
OS/390NEL
Unix, XenixLF
VMS
Ha multe formatos de file de texto.
Le formato predefinite es "Variable
Length Record".
Le formato es specificate per
le campo "Record format"
del registro del file in le directorio.
Variable Length Record,
CR LF,
CR,
LF,
Fixed Length Record,
etc.
X Window System**LF

* Depende de como illo era installate. ** Mesmo in execution super Microsoft Windows.

Characteres imprimibile ASCII

[modificar | modificar fonte]

Le codice 32 es le character de spatio, denotante le spatio inter parolas, que es producite per le grande barra de spatio de un claviero. Le codices de 33 a 126 es appellate characteres imprimite, que representa litteras, digitos, signos de punctuation e alcun symbolos miscellanee.

BinarioDecimalHexGraphico
0010 00003220(spatio in blanco)
0010 00013321!
0010 00103422"
0010 00113523#
0010 01003624$
0010 01013725%
0010 01103826&
0010 01113927'
0010 10004028(
0010 10014129)
0010 1010422A*
0010 1011432B+
0010 1100442C,
0010 1101452D-
0010 1110462E.
0010 1111472F/
0011 000048300
0011 000149311
0011 001050322
0011 001151333
0011 010052344
0011 010153355
0011 011054366
0011 011155377
0011 100056388
0011 100157399
0011 1010583A:
0011 1011593B;
0011 1100603C<
0011 1101613D=
0011 1110623E>
0011 1111633F?
BinarioDecimalHexGraphico
0100 00006440@
0100 00016541A
0100 00106642B
0100 00116743C
0100 01006844D
0100 01016945E
0100 01107046F
0100 01117147G
0100 10007248H
0100 10017349I
0100 1010744AJ
0100 1011754BK
0100 1100764CL
0100 1101774DM
0100 1110784EN
0100 1111794FO
0101 00008050P
0101 00018151Q
0101 00108252R
0101 00118353S
0101 01008454T
0101 01018555U
0101 01108656V
0101 01118757W
0101 10008858X
0101 10018959Y
0101 1010905AZ
0101 1011915B[
0101 1100925C\
0101 1101935D]
0101 1110945E^
0101 1111955F_
BinarioDecimalHexGraphico
0110 00009660`
0110 00019761a
0110 00109862b
0110 00119963c
0110 010010064d
0110 010110165e
0110 011010266f
0110 011110367g
0110 100010468h
0110 100110569i
0110 10101066Aj
0110 10111076Bk
0110 11001086Cl
0110 11011096Dm
0110 11101106En
0110 11111116Fo
0111 000011270p
0111 000111371q
0111 001011472r
0111 001111573s
0111 010011674t
0111 010111775u
0111 011011876v
0111 011111977w
0111 100012078x
0111 100112179y
0111 10101227Az
0111 10111237B{
0111 11001247C|
0111 11011257D}
0111 11101267E~

Nota que le characteres majuscule pote esser convertite in minuscule per le addition de 32 a lor valores ASCII; in binario, isto pote esser obtenite simplemente per definir le sexte bit minus significante como 1.

Variantes de ASCII

[modificar | modificar fonte]

Le dissemination international del informatica ha provocate le apparition de multe variationes e extensiones del collection de characteres ASCII, viste que ASCII non include litteras accentuate e altere symbolos necessari pro scriber le majoritate del linguas que usa alphabetos de base roman. Le standard international ISO 646 (1972) esseva le prime tentativa de remediar iste problema, ben que illo infortunatemente creava simultaneemente problemas de compatibilitate. ISO 646 esseva ancora un collection de characteres de septe bits, e viste que il non habeva codices additional disponibile, alcunes esseva reassignate in variantes pro linguas specific. Per exemplo, le codice ASCII 93 (le parenthese quadrate dextere "]") es usate in le variante german ISO 646-DE pro le littera majuscule U con dierese (Ü), e in le variante danese ISO 646-DK pro le littera majuscule A con anello (Å).

Meliorationes technologic apportava manieras de representar exteriormente le information previemente codificate in le octave bit de cata byte, liberante iste bit pro componer 128 codices de character additional pro nove assignationes. Standards de octo bits tal como ISO 8859 possibilitava le representation de un gamma plus large de linguas, mais le incompatibilitates e limitationes persisteva. ISO 8859-1 e le original ASCII de 7 bits es le plus commun codificationes de characteres in uso hodie, ben que Unicode (con un collection de characteres multo plus grande) rapidemente deveni standard in multe locos. Iste codices plus recente es retrocompatibilitate, isto es, le prime 127 positiones de cata codice es identic al ASCII, e le prime 256 positiones de Unicode es identic al ISO 8859-1.

Le parola anglese "ASCIIbetical" describe le ordination de datos in le ordine de ASCII in vice del ordine alphabetic genuine (que require un computation ingeniose, e varia secundo le lingua in question).

Ligamines externe

[modificar | modificar fonte]