ASCII
Kode Standar Amerika untuk Pertukaran Informasi atau ASCII (American Standard Code for Information Interchange) merupakan suatu standar internasional dalam kode huruf dan simbol seperti Hex dan Unicode tetapi ASCII lebih bersifat universal, contohnya 124 adalah untuk karakter "|". Ia selalu digunakan oleh komputer dan alat komunikasi lain untuk menunjukkan teks. Kode ASCII sebenarnya memiliki komposisi bilangan biner sebanyak 8 bit. Dimulai dari 00000000 hingga 11111111. Total kombinasi yang dihasilkan sebanyak 256, dimulai dari kode 0 hingga 255 dalam sistem bilangan Desimal.
Tabel Karakter ASCII
Tabel berikut berisi karakter-karakter ASCII . Dalam sistem operasi Windows dan MS-DOS, pengguna dapat menggunakan karakter ASCII dengan menekan tombol Alt+[nomor nilai ANSI (desimal)]. Sebagai contoh, tekan kombinasi tombol
Alt+87 untuk karakter huruf latin "W" kapital.
Karakter | Nilai Unicode (heksadesimal) | Nilai ANSI ASCII (desimal) | Keterangan |
NUL | 0000 | 0 | Null (tidak tampak) |
SOH | 0001 | 1 | Start of heading (tidak tampak) |
STX | 0002 | 2 | Start of text (tidak tampak) |
ETX | 0003 | 3 | End of text (tidak tampak) |
EOT | 0004 | 4 | End of transmission (tidak tampak) |
ENQ | 0005 | 5 | Enquiry (tidak tampak) |
ACK | 0006 | 6 | Acknowledge (tidak tampak) |
BEL | 0007 | 7 | Bell (tidak tampak) |
BS | 0008 | 8 | Menghapus satu karakter di belakang kursor (Backspace) |
HT | 0009 | 9 | Horizontal tabulation |
LF | 000A | 10 | Pergantian baris (Line feed) |
VT | 000B | 11 | Tabulasi vertikal |
FF | 000C | 12 | Pergantian baris (Form feed) |
CR | 000D | 13 | Pergantian baris (carriage return) |
SO | 000E | 14 | Shift out (tidak tampak) |
SI | 000F | 15 | Shift in (tidak tampak) |
DLE | 0010 | 16 | Data link escape (tidak tampak) |
DC1 | 0011 | 17 | Device control 1 (tidak tampak) |
DC2 | 0012 | 18 | Device control 2 (tidak tampak) |
DC3 | 0013 | 19 | Device control 3 (tidak tampak) |
DC4 | 0014 | 20 | Device control 4 (tidak tampak) |
NAK | 0015 | 21 | Negative acknowledge (tidak tampak) |
SYN | 0016 | 22 | Synchronous idle (tidak tampak) |
ETB | 0017 | 23 | End of transmission block (tidak tampak) |
CAN | 0018 | 24 | Cancel (tidak tampak) |
EM | 0019 | 25 | End of medium (tidak tampak) |
SUB | 001A | 26 | Substitute (tidak tampak) |
ESC | 001B | 27 | Escape (tidak tampak) |
FS | 001C | 28 | File separator |
GS | 001D | 29 | Group separator |
RS | 001E | 30 | Record separator |
US | 001F | 31 | Unit separator |
SP | 0020 | 32 | Spasi |
! | 0021 | 33 | Tanda seru (exclamation) |
" | 0022 | 34 | Tanda kutip dua |
# | 0023 | 35 | Tanda pagar (kres) |
$ | 0024 | 36 | Tanda mata uang dolar |
% | 0025 | 37 | Tanda persen |
& | 0026 | 38 | Karakter ampersand (&) |
‘ | 0027 | 39 | Karakter Apostrof |
( | 0028 | 40 | Tanda kurung buka |
) | 0029 | 41 | Tanda kurung tutup |
* | 002A | 42 | Karakter asterisk (bintang) |
+ | 002B | 43 | Tanda tambah (plus) |
, | 002C | 44 | Karakter koma |
- | 002D | 45 | Karakter hyphen (strip) |
. | 002E | 46 | Tanda titik |
/ | 002F | 47 | Garis miring (slash) |
0 | 0030 | 48 | Angka nol |
1 | 0031 | 49 | Angka satu |
2 | 0032 | 50 | Angka dua |
3 | 0033 | 51 | Angka tiga |
4 | 0034 | 52 | Angka empat |
5 | 0035 | 53 | Angka lima |
6 | 0036 | 54 | Angka enam |
7 | 0037 | 55 | Angka tujuh |
8 | 0038 | 56 | Angka delapan |
9 | 0039 | 57 | Angka sembilan |
: | 003A | 58 | Tanda titik dua |
; | 003B | 59 | Tanda titik koma |
< | 003C | 60 | Tanda lebih kecil |
= | 003D | 61 | Tanda sama dengan |
> | 003E | 62 | Tanda lebih besar |
? | 003F | 63 | Tanda tanya |
@ | 0040 | 64 | A keong (@) |
A | 0041 | 65 | Huruf latin A kapital |
B | 0042 | 66 | Huruf latin B kapital |
C | 0043 | 67 | Huruf latin C kapital |
D | 0044 | 68 | Huruf latin D kapital |
E | 0045 | 69 | Huruf latin E kapital |
F | 0046 | 70 | Huruf latin F kapital |
G | 0047 | 71 | Huruf latin G kapital |
H | 0048 | 72 | Huruf latin H kapital |
I | 0049 | 73 | Huruf latin I kapital |
J | 004A | 74 | Huruf latin J kapital |
K | 004B | 75 | Huruf latin K kapital |
L | 004C | 76 | Huruf latin L kapital |
M | 004D | 77 | Huruf latin M kapital |
N | 004E | 78 | Huruf latin N kapital |
O | 004F | 79 | Huruf latin O kapital |
P | 0050 | 80 | Huruf latin P kapital |
Q | 0051 | 81 | Huruf latin Q kapital |
R | 0052 | 82 | Huruf latin R kapital |
S | 0053 | 83 | Huruf latin S kapital |
T | 0054 | 84 | Huruf latin T kapital |
U | 0055 | 85 | Huruf latin U kapital |
V | 0056 | 86 | Huruf latin V kapital |
W | 0057 | 87 | Huruf latin W kapital |
X | 0058 | 88 | Huruf latin X kapital |
Y | 0059 | 89 | Huruf latin Y kapital |
Z | 005A | 90 | Huruf latin Z kapital |
[ | 005B | 91 | Kurung siku kiri |
\ | 005C | 92 | Garis miring terbalik (backslash) |
] | 005D | 93 | Kurung sikur kanan |
^ | 005E | 94 | Tanda pangkat |
_ | 005F | 95 | Garis bawah (underscore) |
` | 0060 | 96 | Tanda petik satu |
a | 0061 | 97 | Huruf latin a kecil |
b | 0062 | 98 | Huruf latin b kecil |
c | 0063 | 99 | Huruf latin c kecil |
d | 0064 | 100 | Huruf latin d kecil |
e | 0065 | 101 | Huruf latin e kecil |
f | 0066 | 102 | Huruf latin f kecil f |
g | 0067 | 103 | Huruf latin g kecil |
h | 0068 | 104 | Huruf latin h kecil |
i | 0069 | 105 | Huruf latin i kecil |
j | 006A | 106 | Huruf latin j kecil |
k | 006B | 107 | Huruf latin k kecil |
l | 006C | 108 | Huruf latin l kecil |
m | 006D | 109 | Huruf latin m kecil |
n | 006E | 110 | Huruf latin n kecil |
o | 006F | 111 | Huruf latin o kecil |
p | 0070 | 112 | Huruf latin p kecil |
q | 0071 | 113 | Huruf latin q kecil |
r | 0072 | 114 | Huruf latin r kecil |
s | 0073 | 115 | Huruf latin s kecil |
t | 0074 | 116 | Huruf latin t kecil |
u | 0075 | 117 | Huruf latin u kecil |
v | 0076 | 118 | Huruf latin v kecil |
w | 0077 | 119 | Huruf latin w kecil |
x | 0078 | 120 | Huruf latin x kecil |
y | 0079 | 121 | Huruf latin y kecil |
z | 007A | 122 | Huruf latin z kecil |
{ | 007B | 123 | Kurung kurawal buka |
¦ | 007C | 124 | Garis vertikal (pipa) |
} | 007D | 125 | Kurung kurawal tutup |
~ | 007E | 126 | Karakter gelombang (tilde) |
DEL | 007F | 127 | Delete |
| 0080 | 128 | Dicadangkan |
| 0081 | 129 | Dicadangkan |
| 0082 | 130 | Dicadangkan |
| 0083 | 131 | Dicadangkan |
IND | 0084 | 132 | Index |
NEL | 0085 | 133 | Next line |
SSA | 0086 | 134 | Start of selected area |
ESA | 0087 | 135 | End of selected area |
| 0088 | 136 | Character tabulation set |
| 0089 | 137 | Character tabulation with justification |
| 008A | 138 | Line tabulation set |
PLD | 008B | 139 | Partial line down |
PLU | 008C | 140 | Partial line up |
| 008D | 141 | Reverse line feed |
SS2 | 008E | 142 | Single shift two |
SS3 | 008F | 143 | Single shift three |
DCS | 0090 | 144 | Device control string |
PU1 | 0091 | 145 | Private use one |
PU2 | 0092 | 146 | Private use two |
STS | 0093 | 147 | Set transmit state |
CCH | 0094 | 148 | Cancel character |
MW | 0095 | 149 | Message waiting |
| 0096 | 150 | Start of guarded area |
| 0097 | 151 | End of guarded area |
| 0098 | 152 | Start of string |
| 0099 | 153 | Dicadangkan |
| 009A | 154 | Single character introducer |
CSI | 009B | 155 | Control sequence introducer |
ST | 009C | 156 | String terminator |
OSC | 009D | 157 | Operating system command |
PM | 009E | 158 | Privacy message |
APC | 009F | 158 | Application program command |
| 00A0 | 160 | Spasi yang bukan pemisah kata |
¡ | 00A1 | 161 | Tanda seru terbalik |
¢ | 00A2 | 162 | Tanda sen (Cent) |
£ | 00A3 | 163 | Tanda Poundsterling |
¤ | 00A4 | 164 | Tanda mata uang (Currency) |
¥ | 00A5 | 165 | Tanda Yen |
¦ | 00A6 | 166 | Garis tegak putus-putus (broken bar) |
§ | 00A7 | 167 | Section sign |
¨ | 00A8 | 168 | Diaeresis |
© | 00A9 | 169 | Tanda hak cipta (Copyright) |
ª | 00AA | 170 | Feminine ordinal indicator |
« | 00AB | 171 | Left-pointing double angle quotation mark |
¬ | 00AC | 172 | Not sign |
| 00AD | 173 | Tanda strip (hyphen) |
® | 00AE | 174 | Tanda merk terdaftar |
¯ | 00AF | 175 | Macron |
° | 00B0 | 176 | Tanda derajat |
± | 00B1 | 177 | Tanda kurang lebih (plus-minus) |
² | 00B2 | 178 | Tanda kuadrat (pangkat dua) |
³ | 00B3 | 179 | Tanda kubik (pangkat tiga) |
´ | 00B4 | 180 | Acute accent |
µ | 00B5 | 181 | Micro sign |
¶ | 00B6 | 182 | Pilcrow sign |
· | 00B7 | 183 | Middle dot |
Seni ASCII
Seni ASCII (Bahasa Inggris: ASCII art) adalah suatu bentuk karya seni yang dibuat dari karakter-karakter ASCII. Karakter ASCII tersebut dirangkai sedemikian rupa sehingga menyerupai bentuk tertentu atau tulisan tertentu.
Seni ASCII ini merupakan salah satu cara untuk menggambarkan sesuatu pada komputer-komputer awal karena itu pada saat itu printer tidak bisa untuk grafis.
Contoh seni ASCII
|''||''| ||` '||'''|,
|| || '' || ||
|| `||''|, .|''|| .|''|, `||''|, .|''|, ('''' || '''|. ||...|' '''|. '|| ||` '''|.
|| || || || || || || || || ||..|| `'') || .|''|| || \\ .|''|| `|..|| .|''||
|..||..| .|| ||. `|..||. `|..|' .|| ||. `|... `...' .||. `|..||. .|| \\. `|..||. || `|..||.
, |'
''
_ _ _ _ _ _
/\/\ ___ _ __ __| | ___| | ____ _ __ _| |_ ___ ___ _ __ ___ __ _| |_(_) / \
/ \ / _ \ '__/ _` |/ _ \ |/ / _` | / _` | __/ _ \ / _ \ | '_ ` _ \ / _` | __| |/ /
/ /\/\ \ __/ | | (_| | __/ < (_| | | (_| | |_ (_) | __/ | | | | | | (_| | |_| /\_/ \/ \/\___|_| \__,_|\___|_|\_\__,_| \__,_|\__\___/ \___| |_| |_| |_|\__,_|\__|_\/
ASCII File
Biasanya disebut juga dengan file teks, Text-Only file, atau file teks ASCII. Sebuah ASCII File ini berisi karakter, spasi, lambang khusus, simbol untuk menuju barus berikutnya, tanda tabulasi, dan tanda akhir dari file. File ini tidak berisi informasi tentang susunan dari tampilan isi file.
ASCII Character Set
Sebuah standard kode 7 bit yang menggambarkan karakter dari ASCII dengan menggunakan nilai biner. Jangkauan nilai kode ini adalah dari 0-127. Kebanyakan dari Komputer Pribadi (PC) menggunakan perluasan dari kode ASCII berbasis 8 bit, sehingga didapatkan 128 karakter ekstra, yang digunakan sebagai simbol khusus, karakter khusus, dan simbol grafis.
Sebuah standard kode 7 bit yang menggambarkan karakter dari ASCII dengan menggunakan nilai biner. Jangkauan nilai kode ini adalah dari 0-127. Kebanyakan dari Komputer Pribadi (PC) menggunakan perluasan dari kode ASCII berbasis 8 bit, sehingga didapatkan 128 karakter ekstra, yang digunakan sebagai simbol khusus, karakter khusus, dan simbol grafis.
File ASCII
Merupakan file data yang disusun dalam format pengkodean ASCII. Dengan berbagai kaidah khusus, maka masing-masing file tersebut bisa dibedakan berdasarkan kategori sistem yang menggunakannya. Diantaranya dengan memanfaatkan extension dari nama file, selain dari data yang disimpan melalui file tersebut. Misalnya file teks, HTML, dsb.
flat-ASCII
Istilah untuk
file teks yang terdiri dari 7-
bit karakter ASCII dan hanya menggunakan
kontrol karakter ASCII-
Standard. Juga dikenal sebagai
plain-
ASCII.
Sejarah ASCIIAmerican Standard Kode untuk Informasi Interchange (ASCII), adalah kode standar yang dapat digunakan untuk interchanging informasi, jika informasi dinyatakan terutama yang ditulis oleh bentuk kata Inggris. Hal ini dilaksanakan sebagai karakter-Encoding skema berdasarkan susunan abjad dari bahasa Inggris. ASCII merupakan kode teks di komputer, peralatan komunikasi, dan perangkat lain yang bekerja dengan teks. Paling modern-Encoding karakter-program yang mendukung banyak karakter selain itu yang asli-memiliki dasar dalam sejarah ASCII.
Secara historis, ASCII dikembangkan dari kode singkat. Komersial pertama yang menggunakan adalah sebagai tujuh-bit kode teleprinter dipromosikan oleh Bell layanan data. Work ASCII resmi dimulai pada 6 Oktober 1960, dengan pertemuan pertama di Amerika Standarisasi dari Asosiasi (ASA) X3.2 subpanitia. Pertama edisi standar telah diterbitkan pada tahun 1963, besar revisi pada tahun 1967, dan yang terbaru diperbaharui pada tahun 1986. Dibandingkan dengan kode telegrap sebelumnya, yang diusulkan Bell dan kode ASCII adalah memerintahkan keduanya untuk lebih nyaman sorting (misalnya, alphabetization) dari daftar, dan ditambahkan fitur untuk perangkat selain teleprinters.
ASCII berisi definisi untuk 128 karakter: 33 tidak dapat dicetak, kebanyakan usang kontrol-karakter yang akan mempengaruhi teks diproses; 94 karakter yang dicetak, dan ruang yang dianggap tidak kelihatan grafis. The ASCII karakter-Encoding skema-adalah yang paling sering digunakan-karakter yang Anda gunakan di Internet.
American Standard Kode untuk Informasi Interchange (ASCII) telah berkembang di bawah naungan sebuah komite dari American Standards Association, yang disebut X3 panitia, oleh X3.2 (nanti X3L2) panitia kecil, dan kemudian oleh panitia kecil yang X3.2.4 dari kelompok kerja . ASA yang menjadi Amerika Serikat atau Lembaga Standarisasi USASI dan akhirnya American National Standards Institute.
X3.2 subpanitia yang dirancang berdasarkan ASCII sebelumnya teleprinter Encoding sistem. Seperti karakter lain encodings, ASCII menetapkan korespondensi antara digital sedikit pola dan karakter simbol (yakni graphemes dan kontrol karakter). Hal ini memungkinkan perangkat digital untuk berkomunikasi satu sama lain dan untuk memproses, menyimpan, dan berkomunikasi karakter berorientasi informasi seperti ditulis bahasa. Sebelum ASCII dikembangkan, yang digunakan encodings termasuk 26 karakter abjad, 10 angka numerik, dan 11-25 khusus grafis simbol. Untuk memasukkan semua ini, dan kompatibel dengan karakter Comité Consultatif International Téléphonique et Télégraphique standar, Fieldata, dan EBCDIC awal, lebih dari 64 yang diperlukan dalam kode ASCII.
Komite diperdebatkan kemungkinan yang beralih fungsi tombol (seperti Baudot kode), yang akan membuat lebih dari 64 kode yang akan diwakili oleh enam bit. Bergeser dalam kode, beberapa karakter kode menentukan pilihan di antara pilihan berikut karakter kode. Memungkinkan encoding kompak, namun kurang dapat diandalkan untuk pengiriman data, kesalahan dalam transmisi yang beralih kode biasanya membuat panjang bagian dari transmisi tdk. Standar panitia memutuskan terhadap pergeseran, sehingga diperlukan ASCII setidaknya tujuh-bit kode.
Panitia dianggap sebagai delapan-bit kode, sejak delapan bit akan membuat dua empat-bit pola efisien untuk encode dengan dua angka desimal kode biner. (Namun ia meminta semua data untuk mengirim delapan bit ketika tujuh dapat mencukupi.) Panitia pemilu menggunakan tujuh-bit kode untuk meminimalkan biaya yang berkaitan dengan data. Sejak berlubang tape pada saat dapat merekam delapan bit dalam satu posisi, tapi juga diperbolehkan untuk paritas bit untuk memeriksa kesalahan jika dikehendaki. Mesin dengan octets sebagai asli jenis data yang tidak menggunakan paritas memeriksa biasanya mengatur kedelapan bit ke 0.
Kode itu sendiri telah disusun sehingga hampir semua kode kontrol yang sama, grafis dan seluruh kode yang sama. Dua kolom pertama (posisi 32) adalah untuk kontrol karakter. "ruang" karakter harus datang sebelum grafis untuk membuat algoritma sorting mudah, sehingga menjadi posisi 32. Panitia memutuskan itu penting untuk mendukung huruf besar 64-karakter alphabets, dan memilih untuk struktur ASCII sehingga dapat dengan mudah dapat digunakan untuk mengurangi 64-karakter set grafis kode. Turunkan kasus huruf karena itu tidak interleaved dengan huruf besar. Pilihan untuk tetap terbuka untuk huruf kecil lainnya huruf dan grafis, yang khusus dan kode numerik yang ditempatkan sebelum huruf, dan huruf 'A' ditempatkan di posisi ke 65 yang cocok dengan konsep yang sesuai standar Inggris. The angka 0 -9 sehingga mereka yang ditempatkan sesuai dengan nilai-nilai dalam biner diawali dengan 011, sehingga konversi dengan kode biner-desimal mudah.
Banyak dari mereka yang bukan karakter ke posisi yang sesuai dengan posisi mereka bergeser pada typewriters. Dengan demikian #, $% dan telah ditempatkan sesuai dengan ke 3, 4, dan 5 dalam kolom disamping. Tanda kurung yang tidak sesuai dengan 0 dan 9, namun karena tempat yang sesuai untuk 0 diambil oleh karakter spasi. Karena banyak Eropa typewriters meletakkan tanda kurung dengan 8 dan 9, orang-orang sesuai posisi yang dipilih untuk tanda kurung. @ Simbol yang tidak digunakan di benua Eropa dan komite diharapkan akan diganti oleh accented À variasi di Perancis, sehingga @ ditempatkan di posisi 64 di samping huruf A.
Kontrol kode merasa penting untuk data yang memulai pesan (Som), akhir alamat (EOA), akhir pesan (EOM), akhir transmisi (EOT) ", yang kamu?" (WRU), "are you?" (RU), sebuah perangkat reserved kontrol (DC0), sinkronis menganggur (SINK), dan mengakui (ACK). Posisi ini adalah untuk memaksimalkan Hamming jarak antara mereka sedikit pola. [18]
Dengan karakter khusus lainnya dan kontrol kode diisi, ASCII telah diterbitkan sebagai ASA X3.4-1963, 28 meninggalkan kode posisi yang ditugaskan tanpa makna, untuk masa depan standardisasi, dan satu kode unassigned kontrol. Penyalahgunaan sekarang nampaknya jelas bahwa posisi tersebut harus telah ditetapkan pada abjad huruf kecil, tetapi ada beberapa perdebatan pada saat apakah ada harus lebih kontrol karakter instead. The ketidaktegasan tidak tahan lama: pada bulan Mei 1963 yang CCITT Bekerja pada Partai Baru Telegraph Alphabet diusulkan untuk menetapkan karakter huruf kecil ke kolom 6 dan 7, dan Organisasi Internasional untuk Standardisasi TC 97 SC 2 pemilu pada Oktober untuk memasukkan perubahan ke dalam draf standar. The X3.2.4 tugas kelompok voted nya untuk persetujuan perubahan ASCII pada pertemuan Mei 1963. [23] Locating dengan huruf dalam kolom 6 dan 7 disebabkan karakter ke dalam sedikit berbeda dari pola huruf besar oleh satu bit, yang disederhanakan kasus kebal karakter pencocokan dan pembangunan keyboard dan printer.
X3 komite yang dibuat perubahan lainnya, termasuk karakter baru lainnya (yang menyokong dan vertikal baris karakter), [24] nama beberapa karakter kontrol (Som menjadi mulai dari kepala (SOH)) dan memindahkan atau menghapus lain (RU telah dihapus). [25 ] ASCII kemudian Diperbaharui sebagai USASI X3.4-1967, maka USASI X3.4-1968, ANSI X3.4-1977, dan akhirnya, ANSI X3.4-1986 (dua yang kadang-kadang retronamed ANSI X3.4-1967 , dan ANSI X3.4-1968).
X3 juga panitia yang dialamatkan bagaimana ASCII harus dikirim (paling signifikan bit pertama), dan bagaimana ia harus direkam pada tape berlubang. Mereka yang diusulkan 9-lagu standar untuk pita perekam suara, dan berusaha untuk menangani beberapa bentuk format kartu punched.
ASCII sendiri pertama masuk komersial pada tahun 1963 sebagai tujuh-bit untuk kode teleprinter American Telepon & Telegraph dari TWX (teletip Wide-daerah eXchange) jaringan. TWX awalnya menggunakan lima sebelumnya Baudot kode-bit, yang juga digunakan oleh sistem teleprinter Telex bersaing. Bob Bemer memperkenalkan fitur seperti urutan escape. British kolega Hugh McGregor Ross membantunya mempopulerkan-karya ini menurut Bemer, "begitu banyak sehingga kode yang menjadi ASCII pertama kali disebut-Bemer Ross Kode Eropa ".
Pada tanggal 11 Maret 1968, Presiden AS Lyndon B. Johnson diamanatkan bahwa semua komputer yang dibeli oleh pemerintah federal Amerika mendukung ASCII, menyatakan:
Saya juga disetujui rekomendasi dari menteri perdagangan tentang standar untuk merekam Standar Kode untuk Informasi Interchange pada pita magnetis dan kertas kaset ketika mereka digunakan dalam operasi komputer. Semua komputer dan peralatan yang berhubungan dengan konfigurasi dibawa ke Pemerintah Federal inventarisasi dan setelah 1 Juli 1969, harus memiliki kemampuan untuk menggunakan Standar Kode untuk Informasi Interchange dan format yang ditentukan oleh pita perekam suara dan kertas tape standar saat ini adalah media yang digunakan.
Standar internasional lainnya badan telah meratifikasi encodings karakter seperti ISO / IEC 646 yang identik atau hampir identik dengan ASCII, dengan ekstensi untuk karakter di luar Inggris alfabet dan simbol yang digunakan di luar Amerika Serikat, seperti untuk simbol dari Inggris pound sterling ( £). Hampir setiap negara yang diperlukan disesuaikan versi ASCII sejak ASCII hanya sesuai kebutuhan bagian Amerika Serikat dan beberapa negara lainnya. Misalnya, Kanada memiliki versi yang didukung Perancis karakter. Diadaptasi encodings lainnya termasuk ISCII (India), VISCII (Vietnam), dan YUSCII (Yugoslavia). Encodings ini meskipun kadang-kadang disebut sebagai ASCII, ASCII sebenarnya sangat ditentukan oleh hanya ANSI standar.
ASCII telah dimasukkan ke dalam Unicode karakter pertama ditetapkan sebagai simbol 128, sehingga memiliki karakter ASCII angka kode yang sama di kedua set. Hal ini memungkinkan UTF-8 yang akan kompatibel dengan ASCII ke belakang, keuntungan yang signifikan.
Asteroid 3568 ASCII bernama setelah karakter.
Kontrol karakter ASCII ASCII cadangan pertama 32 kode (0-31 angka desimal) untuk kontrol karakter: kode awalnya tidak dimaksudkan untuk melakukan cetak informasi, namun bukan untuk mengontrol perangkat (seperti printer) yang menggunakan ASCII, atau untuk memberikan informasi tentang meta data Aliran seperti yang disimpan pada pita perekam suara. Misalnya, 10 mewakili karakter "baris feed" fungsi (yang menyebabkan printer ke muka dengan kertas), dan mewakili karakter 8 "mundur". RFC 2822 merujuk ke kontrol karakter yang tidak termasuk carriage return, line feed atau spasi sebagai kontrol non-spasi karakter. [28] Kecuali untuk kontrol resep dasar karakter yang berorientasi baris pemformatan, ASCII tidak menetapkan mekanisme apapun untuk menjelaskan struktur atau tampilan teks dalam dokumen. Skema lainnya, seperti bahasa markup, dan alamat halaman dokumen tata letak dan format.
Asli ASCII standar digunakan hanya singkat frasa deskriptif untuk masing-masing karakter kontrol. Kemenduaan yang kiri ini pun terkadang disengaja (di mana karakter akan digunakan sedikit berbeda pada terminal di link dari data stream) dan kadang-kadang lebih banyak kebetulan (seperti apa "hapus" berarti).
Mungkin yang paling berpengaruh satu perangkat pada interpretasi ini adalah karakter ASR teletip seri-33, yang merupakan terminal dicetak dengan kertas yang tersedia tape reader / punch pilihan. Kertas tape adalah media yang sangat populer untuk jangka panjang melalui program penyimpanan sampai 1980-an, biaya rendah dan dalam beberapa cara kurang rentan daripada pita magnetis. Secara khusus, mesin teletip 33 tugas untuk kode 17 (Control-T, DC1, juga dikenal sebagai XON), 19 (Control-S, DC3, juga dikenal sebagai XOFF), dan 127 (menghapus) menjadi standar de-facto. Karena keytop untuk O kunci juga memperlihatkan panah kiri-simbol (dari ASCII-1963, yang memiliki karakter ini, bukan garis bawah), sebuah noncompliant menggunakan kode 15 (Control-O, Shift Dalam) diinterpretasikan sebagai "menghapus karakter sebelumnya" juga diadopsi oleh banyak timesharing sistem awal tetapi akhirnya layu keluar.
Penggunaan Control-S (XOFF, sebuah singkatan untuk "mengirimkan off") sebagai sinyal handshaking pengirim sebuah peringatan untuk menghentikan transmisi mendatang karena melimpah, dan kontrol-T (XON, "mengirimkan pada") untuk melanjutkan pengiriman, berlanjut ke hari ini di banyak sistem manual sebagai output kontrol teknik. Pada beberapa sistem kontrol-S tetap maknanya tetapi Control-T diganti oleh kedua-S Kontrol untuk melanjutkan output.
127 adalah kode resmi bernama "hapus" tetapi teletip label adalah "rubout". Sejak awal standar tidak memberikan interpretasi rinci untuk kebanyakan kode kontrol, interpretasi kode ini berbeda-beda. Asli teletip arti, dan maksud dari standar, itu adalah untuk membuat sebuah karakter diabaikan, sama seperti NUL (semua zeroes). Hal ini secara khusus berguna untuk kertas tape, karena punching all-pola yang sedikit di atas yang ada tanda akan memusnahkan it. Kaset yang dirancang untuk menjadi "tangan edited" bahkan dapat dihasilkan dengan spasi ekstra dari NULs (kosong tape) sehingga blok karakter dapat "digosok keluar" replacements dan kemudian dimasukkan ke dalam ruang kosong.
Video sebagai terminal mulai menggantikan yang dicetak, nilai dari "rubout" karakter telah hilang. DEC sistem, misalnya, menafsirkan "Hapus" berarti "menghapus karakter sebelum kursor," dan interpretasi ini juga menjadi umum di sistem Unix. Kebanyakan sistem lain yang digunakan "Backspace" untuk arti yang digunakan dan "Hapus" berarti "menghapus karakter pada kursor". Interpretasi yang terakhir adalah yang paling umum hari ini.
Lebih banyak dari kontrol diambil pada kode ada arti sangat berbeda dari mereka yang asli. The "escape" karakter (kode 27), misalnya, pada awalnya ditujukan untuk memungkinkan pengiriman lainnya sebagai kontrol karakter literal, bukan berarti mereka invoking. Ini sama artinya dengan "diri" yang dihadapi dalam URL encodings, string bahasa C, dan sistem lain di mana karakter tertentu memiliki makna reserved. Beberapa waktu ini berarti telah disertakan bersama dan akhirnya drifted. Dalam penggunaan modern, sebuah ESC dikirim ke terminal biasanya menunjukkan awal perintah urutan, biasanya dalam bentuk apa yang disebut "ANSI kode escape" (atau, lebih baik, sebuah "Control Sequence Introducer") beginning with ESC diikuti dengan "[" (kiri-Braket) karakter. ESC yang dikirim dari terminal yang paling sering digunakan sebagai out-of-band karakter yang digunakan untuk menghentikan suatu operasi, seperti pada TECO dan vi editor teks.
Yang melekat kemenduaan kontrol dari berbagai karakter, yang dikombinasikan dengan sejarah penggunaan, membuat masalah ketika mentransfer "teks" file antara sistem. Contoh paling jelas ini adalah masalah newline pada berbagai sistem operasi. Pencetakan di terminal tidak ada pertanyaan yang mengakhiri baris teks dengan baik "Carriage Kembali" dan "Linefeed". Pertama gerbong pencetakan kembali ke awal baris kedua dan kemajuan ke baris berikutnya tanpa memindahkan gerbong. Namun, memerlukan dua karakter untuk menandai akhir baris tak perlu diperkenalkan kompleksitas dan pertanyaan tentang bagaimana untuk menafsirkan masing-masing karakter ketika ditemui sendiri. Untuk mempermudah urusan, file teks biasa pada sistem Unix dan Amiga menggunakan baris feed sendiri untuk memisahkan baris. Demikian pula, Macintosh sistem lama, antara lain, hanya menggunakan tombol kembali dalam file teks biasa. DEC berbagai sistem operasi yang digunakan baik karakter untuk menandai akhir baris, mungkin untuk kompatibilitas dengan teletypes, dan ini de facto standar disalin di CP / M sistem operasi dan kemudian di MS-DOS dan Microsoft Windows akhirnya. Transmisi teks melalui Internet, sebagai protokol untuk E-mail dan World Wide Web, menggunakan kedua karakter.
Dengan sistem operasi DEC, bersama dengan CP / M, dilacak file panjang hanya dalam unit blok disk dan digunakan Kontrol-Z (SUB) yang menandai akhir sebenarnya teks dalam file (juga dilakukan untuk CP / M kompatibilitas dalam beberapa kasus di MS-DOS, MS-DOS sekalipun selalu direkam tepat file panjang). Teks string yang diakhiri dengan karakter null dikenal sebagai ASCIZ atau C string.
- Representation cetak, dengan Unicode karakter dari daerah U 2400 U ke 2421 untuk mewakili karakter kontrol bila diperlukan untuk mencetak atau menampilkan mereka daripada mereka yang menjalankan fungsi yang ditujukan. Beberapa browser ini mungkin tidak ditampilkan dengan benar.
- Kontrol kunci Sequence / sisipan notasi, tradisional urutan tombol untuk memasukkan karakter kontrol. The sisipan (^) yang dimulai sequence ini tidak dimaksudkan untuk menandakan bahwa karakter literal ^;, namun merupakan "Control" atau "Ctrl" kunci yang harus dilaksanakan bawah sambil menekan tombol kedua dalam urutan. Perhatikan bahwa ^ ^ berarti Control-sisipan (menekan tombol "Ctrl" dan "^" kunci), bukan kontrol-kontrol. Sisipan-tombol yang mewakili juga digunakan oleh beberapa perangkat lunak untuk mewakili karakter kontrol.
- Character Escape Codes dalam bahasa pemrograman C dan banyak dipengaruhi oleh bahasa lain, seperti Jawa dan Perl (meskipun tidak semua implementasi mendukung semua kode escape).
- Backspace karakter yang dapat dimasukkan dengan menekan tombol "Backspace", "Bksp", atau ← tombol pada beberapa sistem.
- Ab kemenduaan yang berasal dari sekitar Backspace mismatches antara maksud dari manusia atau perangkat lunak yang Backspace transmisi dan interpretasi oleh perangkat lunak penerima. Jika transmitter mengharapkan Backspace untuk menghapus karakter sebelumnya dan penerima mengharapkan Hapus digunakan untuk menghapus karakter sebelumnya, banyak receivers echo yang akan Backspace sebagai "^ H", sama seperti mereka echo lainnya uninterpreted kontrol karakter. (Mismatch yang sama di lain arah Mei Hapus ditampilkan sebagai hasil "^?".)
- Kembali karakter Carriage yang juga dapat dimasukkan dengan menekan tombol "Kembali", "Ret", "Enter", atau ↵ kunci pada kebanyakan sistem.
- The '\ e' urutan diri bukan bagian dari ISO C dan banyak bahasa lainnya spesifikasi. Namun, hal ini difahami oleh beberapa compilers.
- The Escape karakter juga dapat dimasukkan dengan menekan tombol "Escape" atau "ESC" kunci pada beberapa sistem.
- The Hapus karakter juga dapat dimasukkan dengan menekan tombol "Delete" atau "HAPUS" tombol. Juga dapat dimasukkan dengan menekan tombol "Backspace", "Bksp", atau ← tombol pada beberapa sistem.
ASCII printable karakter
Kode 32, yang "ruang" karakter, menandakan ruang antara kata-kata, seperti yang dihasilkan oleh ruang-bar di keyboard. The "space" yang dianggap sebagai karakter kelihatan grafis daripada kontrol karakter. [7] Codes 33-126, yang dikenal sebagai karakter yang dapat dicetak, mewakili huruf, angka, tanda baca, dan beberapa simbol-macam.
Tujuh-bit ASCII diberikan tujuh "nasional" dan karakter, jika digabungkan hardware dan software izin, dapat digunakan untuk mensimulasikan overstrikes beberapa tambahan internasional karakter: dalam suatu skenario yang mundur dapat mendahului sebuah kuburan aksen (yang di Amerika dan Inggris standar, tetapi hanya mereka yang standar, juga panggilan "membuka tanda kutip tunggal"), sebuah backtick, atau nafas tandai (vel terbalik).
Alias
J Juni RFC 1992 [29] dan Internet Assigned Numbers Authority registri dari rangkaian karakter [8] mengakui hal-hal berikut kebal alias untuk ASCII sebagai cocok untuk digunakan di Internet:
* ANSI_X3.4-1968 (nama kanonik)
* Iso-ir-6
* ANSI_X3.4-1986
* ISO_646.irv: 1991
* ASCII (ASCII dengan ASCII-7 dan varian-8)
* ISO646-US
* US-ASCII (penawaran MIME nama [8])
* Kami
* IBM367
* Cp367
* CsASCII
Dari jumlah tersebut, yang IANA mendorong penggunaan nama "US-ASCII" untuk menggunakan Internet dari ASCII. Sering menemukan satu ini di opsional "charset" parameter di Content-Type header MIME dari beberapa pesan, di setara "meta" elemen HTML beberapa dokumen, dan di encoding deklarasi bagian dari prolog dari beberapa dokumen XML.
Varian Komputer sebagai teknologi yang tersebar di seluruh dunia, berbagai perusahaan dan badan-badan standar dikembangkan banyak variasi ASCII untuk memfasilitasi ekspresi non-bahasa Inggris yang digunakan berbasis Roman alphabets. Satu kelas bisa beberapa variasi sebagai "ASCII ekstensi", meskipun beberapa penyalahgunaan istilah untuk menutup semua varian, termasuk mereka yang tidak memelihara ASCII karakter-peta dalam 7-bit jangkauan.
PETSCII Kode yang digunakan oleh Commodore International untuk mereka 8-bit sistem mungkin unik antara pasca 1970 menjadi kode berdasarkan ASCII-1963, bukan yang jauh lebih umum ASCII-1967, seperti yang ditemukan di zx Spectrum komputer. Atari dan Galaksija komputer juga digunakan ASCII varian.
Ketidakcocokan vs Interoperabilitas Dari awal perkembangannya, [30] ASCII dimaksudkan untuk menjadi salah satu dari beberapa varian nasional yang karakter kode standar internasional, akhirnya diterbitkan sebagai ISO / IEC 646 (1972), yang akan berbagi dalam karakter paling umum tetapi menetapkan lokal lainnya berguna untuk beberapa karakter poin kode untuk "nasional digunakan." Namun, empat tahun yang berlalu antara penerbitan ASCII dan ISO-1963 yang pertama menerima rekomendasi internasional pada tahun 1967 [31] disebabkan ASCII dari pilihan untuk menggunakan karakter nasional untuk muncul menjadi standar de facto bagi dunia, yang menyebabkan kebingungan dan ketidakcocokan sekali negara-negara lain yang mulai membuat sendiri tugas ini ke kode poin.
ISO / IEC 646, seperti ASCII, adalah 7-bit karakter yang Anda gunakan. It dibuat tidak tersedia tambahan kode, sehingga kode yang sama poin encoded karakter yang berbeda di berbagai negara. Escape kode yang ditetapkan untuk menunjukkan varian nasional yang diterapkan ke bagian teks, tetapi mereka jarang digunakan, sehingga sering tidak mungkin untuk mengetahui apa yang berbeda-beda untuk bekerja dengan karakter dan karena itu yang diwakili kode, dan teks-sistem pengolahan umumnya dapat menanggulangi dengan hanya satu varian anyway.
Karena Braket dan mengukuhkan karakter ASCII yang ditugaskan untuk "nasional menggunakan" kode poin yang digunakan untuk accented huruf nasional varian lainnya dalam ISO / IEC 646, Jerman, Perancis, atau Swedia, dll, programmer harus digunakan untuk mendapatkan membaca dan menulis
ä aÄiÜ = 'on'; ü
daripada
(A [i] = '\ n';)
C trigraphs tersebut dibuat untuk memecahkan masalah ini dalam ANSI C, walaupun mereka terlambat pengenalan dan konsisten dalam pelaksanaan Kompiler terbatas penggunaannya.
Akhirnya, sebagai 8 -, 16 - dan 32-bit komputer mulai menggantikan 18 - dan 36-bit komputer sebagai norma, menjadi umum untuk menggunakan 8-bit byte untuk menyimpan setiap karakter dalam memori, memberikan kesempatan untuk memperluas , 8-bit, saudara dari ASCII, dengan tambahan 128 karakter menyediakan ruang untuk menghindari sebagian besar kemenduaan yang diperlukan dalam kode 7-bit.
Misalnya, IBM dikembangkan 8-bit kode halaman, seperti kode halaman 437, yang menggantikan kontrol-karakter dengan simbol grafik seperti wajah smiley, dan mapping grafis tambahan karakter ke atas posisi 128. Sistem operasi seperti DOS didukung kode-halaman ini, dan produsen PC IBM didukung mereka dalam hardware. Digital Equipment Corporation mengembangkan Multinasional Character Set (DEC-MCS) untuk penggunaan yang populer VT220 terminal.
Delapan-bit standar seperti ISO / IEC 8859 (berasal dari DEC-MCS) dan Mac OS Roma benar dikembangkan sebagai ekstensi dari ASCII, meninggalkan karakter asli pemetaan utuh, tetapi menambahkan karakter tambahan definisi pertama setelah 128 (yaitu, 7 -bit) karakter. Ini diaktifkan keterwakilan karakter yang lebih luas digunakan dalam berbagai bahasa. Karena ada beberapa bersaing 8-bit kode standar, mereka terus menderita dari yang tidak kompatibel dan keterbatasan. Meski demikian, ISO-8859-1 (Latin 1), versi Windows-nya 1252 (sering mislabeled sebagai ISO-8859-1), dan aslinya 7-bit ASCII tetap karakter yang paling umum digunakan encodings hari ini.
Unicode Unicode dan ISO / IEC 10646 Universal Character Set (UCS) ada yang lebih luas dari array karakter, dan berbagai bentuk encoding mulai menggantikan ISO / IEC 8859 dan ASCII pesat di banyak lingkungan. ASCII sementara dibatasi hingga 128 karakter, Unicode UCS dan dukungan karakter oleh memisahkan konsep identifikasi unik (menggunakan alam nomor kode yang disebut poin) dan encoding (hingga 8 -, 16 - atau 32-bit format, disebut UTF-8 , UTF-16, dan UTF-32).
Untuk izin kompatibilitas ke belakang, pada 128 dan 256 ASCII ISO-8859-1 (Latin 1) ditugaskan karakter Unicode / UCS kode poin yang sama dengan mereka dalam kode standar sebelumnya. Oleh karena itu, ASCII dapat dianggap sebagai 7-bit encoding untuk skema yang sangat kecil subset dari Unicode / UCS, dan sebaliknya, dengan UTF-8 adalah bentuk biner yang kompatibel dengan ASCII untuk kode di bawah 128 poin, yang berarti semua ASCII berlaku UTF -8. Lain Encoding ASCII dalam bentuk menyerupai bagaimana mereka mewakili 128 karakter pertama dari Unicode, namun menggunakan 16 atau 32 bit per karakter, sehingga mereka memerlukan konversi untuk kompatibilitas. (UCS sama-2 ke atas adalah kompatibel dengan UTF-16)
Urutan
Pemeriksaan data kadang-kadang dilakukan dalam kode ASCII-pesanan daripada "standar" alphabetical order. Penyimpangan yang utama adalah:
* Huruf besar sebelum datang huruf, yaitu "Z" sebelum "a"
* Karakter diperpanjang rangkaian karakter seperti "é" datang setelah "z"
Slang ASCIIbetical ekspresi yang kadang-kadang digunakan untuk pesanan ini. [32] Dalam pemrograman, alfanumerik sorting untuk mengurutkan berdasarkan nilai numerik, tanpa mempertimbangkan untuk setiap karakter yang Anda gunakan. An alphanumerically diurutkan dari array byte ASCIIbetically akan muncul bila dilihat dalam sebuah karakter ASCII kompatibel ditetapkan.
J halus versi pesanan ini mengkonversi huruf besar huruf kecil huruf sebelum membandingkan nilai ASCII.
DOWNLOAD FILE .docDOWNLOAD KODE ASCII .pdfDOWNLOAD PEMBUAT GAMBAR ASCII .exe