emacs: src/coding.c annotate

annotate src/coding.c @ 17071:70194012fb3a

Fix FSF address in comment.

author	Karl Heuer <kwzh@gnu.org>
date	Sun, 23 Feb 1997 09:20:52 +0000
parents	d0d7b244b1d0
children	2cfb31c15ced

rev	line source
17052 d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1 /* Coding system handler (conversion, detection, and etc).
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2 Ver.1.0.
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3 Copyright (C) 1995 Free Software Foundation, Inc.
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	4 Copyright (C) 1995 Electrotechnical Laboratory, JAPAN.
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	5
17071 70194012fb3a Fix FSF address in comment. Karl Heuer <kwzh@gnu.org> parents: 17052 diff changeset	6 This file is part of GNU Emacs.
70194012fb3a Fix FSF address in comment. Karl Heuer <kwzh@gnu.org> parents: 17052 diff changeset	7
70194012fb3a Fix FSF address in comment. Karl Heuer <kwzh@gnu.org> parents: 17052 diff changeset	8 GNU Emacs is free software; you can redistribute it and/or modify
70194012fb3a Fix FSF address in comment. Karl Heuer <kwzh@gnu.org> parents: 17052 diff changeset	9 it under the terms of the GNU General Public License as published by
70194012fb3a Fix FSF address in comment. Karl Heuer <kwzh@gnu.org> parents: 17052 diff changeset	10 the Free Software Foundation; either version 2, or (at your option)
70194012fb3a Fix FSF address in comment. Karl Heuer <kwzh@gnu.org> parents: 17052 diff changeset	11 any later version.
70194012fb3a Fix FSF address in comment. Karl Heuer <kwzh@gnu.org> parents: 17052 diff changeset	12
70194012fb3a Fix FSF address in comment. Karl Heuer <kwzh@gnu.org> parents: 17052 diff changeset	13 GNU Emacs is distributed in the hope that it will be useful,
70194012fb3a Fix FSF address in comment. Karl Heuer <kwzh@gnu.org> parents: 17052 diff changeset	14 but WITHOUT ANY WARRANTY; without even the implied warranty of
70194012fb3a Fix FSF address in comment. Karl Heuer <kwzh@gnu.org> parents: 17052 diff changeset	15 MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE. See the
70194012fb3a Fix FSF address in comment. Karl Heuer <kwzh@gnu.org> parents: 17052 diff changeset	16 GNU General Public License for more details.
70194012fb3a Fix FSF address in comment. Karl Heuer <kwzh@gnu.org> parents: 17052 diff changeset	17
70194012fb3a Fix FSF address in comment. Karl Heuer <kwzh@gnu.org> parents: 17052 diff changeset	18 You should have received a copy of the GNU General Public License
70194012fb3a Fix FSF address in comment. Karl Heuer <kwzh@gnu.org> parents: 17052 diff changeset	19 along with GNU Emacs; see the file COPYING. If not, write to
70194012fb3a Fix FSF address in comment. Karl Heuer <kwzh@gnu.org> parents: 17052 diff changeset	20 the Free Software Foundation, Inc., 59 Temple Place - Suite 330,
70194012fb3a Fix FSF address in comment. Karl Heuer <kwzh@gnu.org> parents: 17052 diff changeset	21 Boston, MA 02111-1307, USA. */
17052 d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	22
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	23 /* TABLE OF CONTENTS *
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	24
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	25 1. Preamble
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	26 2. Emacs' internal format handlers
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	27 3. ISO2022 handlers
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	28 4. Shift-JIS and BIG5 handlers
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	29 5. End-of-line handlers
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	30 6. C library functions
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	31 7. Emacs Lisp library functions
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	32 8. Post-amble
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	33
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	34 */
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	35
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	36 /* GENERAL NOTE on CODING SYSTEM *
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	37
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	38 Coding system is an encoding mechanism of one or more character
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	39 sets. Here's a list of coding systems which Emacs can handle. When
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	40 we say "decode", it means converting some other coding system to
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	41 Emacs' internal format, and when we say "encode", it means
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	42 converting Emacs' internal format to some other coding system.
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	43
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	44 0. Emacs' internal format
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	45
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	46 Emacs itself holds a multi-lingual character in a buffer and a string
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	47 in a special format. Details are described in the section 2.
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	48
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	49 1. ISO2022
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	50
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	51 The most famous coding system for multiple character sets. X's
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	52 Compound Text, various EUCs (Extended Unix Code), and such coding
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	53 systems used in Internet communication as ISO-2022-JP are all
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	54 variants of ISO2022. Details are described in the section 3.
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	55
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	56 2. SJIS (or Shift-JIS or MS-Kanji-Code)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	57
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	58 A coding system to encode character sets: ASCII, JISX0201, and
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	59 JISX0208. Widely used for PC's in Japan. Details are described in
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	60 the section 4.
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	61
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	62 3. BIG5
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	63
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	64 A coding system to encode character sets: ASCII and Big5. Widely
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	65 used by Chinese (mainly in Taiwan and Hong Kong). Details are
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	66 described in the section 4. In this file, when written as "BIG5"
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	67 (all uppercase), it means the coding system, and when written as
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	68 "Big5" (capitalized), it means the character set.
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	69
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	70 4. Else
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	71
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	72 If a user want to read/write a text encoded in a coding system not
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	73 listed above, he can supply a decoder and an encoder for it in CCL
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	74 (Code Conversion Language) programs. Emacs executes the CCL program
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	75 while reading/writing.
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	76
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	77 Emacs represent a coding-system by a Lisp symbol that has a property
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	78 `coding-system'. But, before actually using the coding-system, the
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	79 information about it is set in a structure of type `struct
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	80 coding_system' for rapid processing. See the section 6 for more
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	81 detail.
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	82
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	83 */
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	84
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	85 /* GENERAL NOTES on END-OF-LINE FORMAT *
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	86
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	87 How end-of-line of a text is encoded depends on a system. For
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	88 instance, Unix's format is just one byte of `line-feed' code,
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	89 whereas DOS's format is two bytes sequence of `carriage-return' and
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	90 `line-feed' codes. MacOS's format is one byte of `carriage-return'.
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	91
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	92 Since how characters in a text is encoded and how end-of-line is
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	93 encoded is independent, any coding system described above can take
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	94 any format of end-of-line. So, Emacs has information of format of
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	95 end-of-line in each coding-system. See the section 6 for more
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	96 detail.
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	97
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	98 */
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	99
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	100 /* GENERAL NOTES on `detect_coding_XXX ()' functions *
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	101
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	102 These functions check if a text between SRC and SRC_END is encoded
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	103 in the coding system category XXX. Each returns an integer value in
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	104 which appropriate flag bits for the category XXX is set. The flag
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	105 bits are defined in macros CODING_CATEGORY_MASK_XXX. Below is the
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	106 template of these functions. */
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	107 #if 0
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	108 int
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	109 detect_coding_internal (src, src_end)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	110 unsigned char src, src_end;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	111 {
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	112 ...
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	113 }
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	114 #endif
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	115
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	116 /* GENERAL NOTES on `decode_coding_XXX ()' functions *
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	117
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	118 These functions decode SRC_BYTES length text at SOURCE encoded in
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	119 CODING to Emacs' internal format. The resulting text goes to a
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	120 place pointed by DESTINATION, the length of which should not exceed
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	121 DST_BYTES. The bytes actually processed is returned as *CONSUMED.
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	122 The return value is the length of the decoded text. Below is a
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	123 template of these functions. */
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	124 #if 0
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	125 decode_coding_XXX (coding, source, destination, src_bytes, dst_bytes, consumed)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	126 struct coding_system *coding;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	127 unsigned char source, destination;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	128 int src_bytes, dst_bytes;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	129 int *consumed;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	130 {
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	131 ...
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	132 }
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	133 #endif
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	134
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	135 /* GENERAL NOTES on `encode_coding_XXX ()' functions *
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	136
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	137 These functions encode SRC_BYTES length text at SOURCE of Emacs
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	138 internal format to CODING. The resulting text goes to a place
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	139 pointed by DESTINATION, the length of which should not exceed
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	140 DST_BYTES. The bytes actually processed is returned as *CONSUMED.
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	141 The return value is the length of the encoded text. Below is a
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	142 template of these functions. */
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	143 #if 0
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	144 encode_coding_XXX (coding, source, destination, src_bytes, dst_bytes, consumed)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	145 struct coding_system *coding;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	146 unsigned char source, destination;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	147 int src_bytes, dst_bytes;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	148 int *consumed;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	149 {
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	150 ...
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	151 }
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	152 #endif
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	153
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	154 /* COMMONLY USED MACROS */
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	155
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	156 /* The following three macros ONE_MORE_BYTE, TWO_MORE_BYTES, and
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	157 THREE_MORE_BYTES safely get one, two, and three bytes from the
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	158 source text respectively. If there are not enough bytes in the
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	159 source, they jump to `label_end_of_loop'. The caller should set
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	160 variables `src' and `src_end' to appropriate areas in advance. */
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	161
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	162 #define ONE_MORE_BYTE(c1) \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	163 do { \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	164 if (src < src_end) \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	165 c1 = *src++; \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	166 else \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	167 goto label_end_of_loop; \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	168 } while (0)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	169
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	170 #define TWO_MORE_BYTES(c1, c2) \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	171 do { \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	172 if (src + 1 < src_end) \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	173 c1 = src++, c2 = src++; \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	174 else \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	175 goto label_end_of_loop; \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	176 } while (0)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	177
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	178 #define THREE_MORE_BYTES(c1, c2, c3) \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	179 do { \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	180 if (src + 2 < src_end) \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	181 c1 = src++, c2 = src++, c3 = *src++; \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	182 else \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	183 goto label_end_of_loop; \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	184 } while (0)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	185
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	186 /* The following three macros DECODE_CHARACTER_ASCII,
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	187 DECODE_CHARACTER_DIMENSION1, and DECODE_CHARACTER_DIMENSION2 put
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	188 the multi-byte form of a character of each class at the place
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	189 pointed by `dst'. The caller should set the variable `dst' to
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	190 point to an appropriate area and the variable `coding' to point to
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	191 the coding-system of the currently decoding text in advance. */
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	192
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	193 /* Decode one ASCII character C. */
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	194
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	195 #define DECODE_CHARACTER_ASCII(c) \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	196 do { \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	197 if (COMPOSING_P (coding->composing)) \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	198 dst++ = 0xA0, dst++ = (c) \| 0x80; \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	199 else \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	200 *dst++ = (c); \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	201 } while (0)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	202
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	203 /* Decode one DIMENSION1 character of which charset is CHARSET and
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	204 position-code is C. */
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	205
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	206 #define DECODE_CHARACTER_DIMENSION1(charset, c) \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	207 do { \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	208 unsigned char leading_code = CHARSET_LEADING_CODE_BASE (charset); \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	209 if (COMPOSING_P (coding->composing)) \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	210 *dst++ = leading_code + 0x20; \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	211 else \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	212 *dst++ = leading_code; \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	213 if (leading_code = CHARSET_LEADING_CODE_EXT (charset)) \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	214 *dst++ = leading_code; \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	215 *dst++ = (c) \| 0x80; \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	216 } while (0)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	217
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	218 /* Decode one DIMENSION2 character of which charset is CHARSET and
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	219 position-codes are C1 and C2. */
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	220
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	221 #define DECODE_CHARACTER_DIMENSION2(charset, c1, c2) \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	222 do { \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	223 DECODE_CHARACTER_DIMENSION1 (charset, c1); \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	224 *dst++ = (c2) \| 0x80; \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	225 } while (0)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	226
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	227
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	228 /* 1. Preamble */
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	229
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	230 #include <stdio.h>
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	231
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	232 #ifdef emacs
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	233
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	234 #include <config.h>
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	235 #include "lisp.h"
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	236 #include "buffer.h"
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	237 #include "charset.h"
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	238 #include "ccl.h"
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	239 #include "coding.h"
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	240 #include "window.h"
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	241
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	242 #else /* not emacs */
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	243
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	244 #include "mulelib.h"
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	245
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	246 #endif /* not emacs */
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	247
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	248 Lisp_Object Qcoding_system, Qeol_type;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	249 Lisp_Object Qbuffer_file_coding_system;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	250 Lisp_Object Qpost_read_conversion, Qpre_write_conversion;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	251
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	252 extern Lisp_Object Qinsert_file_contents, Qwrite_region;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	253 Lisp_Object Qcall_process, Qcall_process_region, Qprocess_argument;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	254 Lisp_Object Qstart_process, Qopen_network_stream;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	255 Lisp_Object Qtarget_idx;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	256
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	257 /* Mnemonic character of each format of end-of-line. */
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	258 int eol_mnemonic_unix, eol_mnemonic_dos, eol_mnemonic_mac;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	259 /* Mnemonic character to indicate format of end-of-line is not yet
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	260 decided. */
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	261 int eol_mnemonic_undecided;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	262
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	263 #ifdef emacs
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	264
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	265 Lisp_Object Qcoding_system_vector, Qcoding_system_p, Qcoding_system_error;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	266
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	267 /* Coding-systems are handed between Emacs Lisp programs and C internal
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	268 routines by the following three variables. */
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	269 /* Coding-system for reading files and receiving data from process. */
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	270 Lisp_Object Vcoding_system_for_read;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	271 /* Coding-system for writing files and sending data to process. */
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	272 Lisp_Object Vcoding_system_for_write;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	273 /* Coding-system actually used in the latest I/O. */
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	274 Lisp_Object Vlast_coding_system_used;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	275
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	276 /* Coding-system of what terminal accept for displaying. */
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	277 struct coding_system terminal_coding;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	278
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	279 /* Coding-system of what is sent from terminal keyboard. */
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	280 struct coding_system keyboard_coding;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	281
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	282 Lisp_Object Vcoding_system_alist;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	283
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	284 #endif /* emacs */
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	285
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	286 Lisp_Object Qcoding_category_index;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	287
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	288 /* List of symbols `coding-category-xxx' ordered by priority. */
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	289 Lisp_Object Vcoding_category_list;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	290
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	291 /* Table of coding-systems currently assigned to each coding-category. */
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	292 Lisp_Object coding_category_table[CODING_CATEGORY_IDX_MAX];
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	293
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	294 /* Table of names of symbol for each coding-category. */
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	295 char *coding_category_name[CODING_CATEGORY_IDX_MAX] = {
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	296 "coding-category-internal",
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	297 "coding-category-sjis",
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	298 "coding-category-iso-7",
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	299 "coding-category-iso-8-1",
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	300 "coding-category-iso-8-2",
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	301 "coding-category-iso-else",
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	302 "coding-category-big5",
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	303 "coding-category-binary"
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	304 };
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	305
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	306 /* Alist of charsets vs the alternate charsets. */
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	307 Lisp_Object Valternate_charset_table;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	308
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	309 /* Alist of charsets vs revision number. */
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	310 Lisp_Object Vcharset_revision_alist;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	311
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	312
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	313 /* 2. Emacs internal format handlers */
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	314
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	315 /* Emacs' internal format for encoding multiple character sets is a
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	316 kind of multi-byte encoding, i.e. encoding a character by a sequence
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	317 of one-byte codes of variable length. ASCII characters and control
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	318 characters (e.g. `tab', `newline') are represented by one-byte as
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	319 is. It takes the range 0x00 through 0x7F. The other characters
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	320 are represented by a sequence of `base leading-code', optional
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	321 `extended leading-code', and one or two `position-code's. Length
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	322 of the sequence is decided by the base leading-code. Leading-code
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	323 takes the range 0x80 through 0x9F, whereas extended leading-code
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	324 and position-code take the range 0xA0 through 0xFF. See the
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	325 document of `charset.h' for more detail about leading-code and
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	326 position-code.
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	327
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	328 There's one exception in this rule. Special leading-code
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	329 `leading-code-composition' denotes that the following several
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	330 characters should be composed into one character. Leading-codes of
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	331 components (except for ASCII) are added 0x20. An ASCII character
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	332 component is represented by a 2-byte sequence of `0xA0' and
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	333 `ASCII-code + 0x80'. See also the document in `charset.h' for the
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	334 detail of composite character. Hence, we can summarize the code
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	335 range as follows:
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	336
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	337 --- CODE RANGE of Emacs' internal format ---
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	338 (character set) (range)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	339 ASCII 0x00 .. 0x7F
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	340 ELSE (1st byte) 0x80 .. 0x9F
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	341 (rest bytes) 0xA0 .. 0xFF
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	342 ---------------------------------------------
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	343
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	344 */
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	345
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	346 enum emacs_code_class_type emacs_code_class[256];
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	347
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	348 /* Go to the next statement only if *SRC is accessible and the code is
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	349 greater than 0xA0. */
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	350 #define CHECK_CODE_RANGE_A0_FF \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	351 do { \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	352 if (src >= src_end) \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	353 goto label_end_of_switch; \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	354 else if (*src++ < 0xA0) \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	355 return 0; \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	356 } while (0)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	357
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	358 /* See the above "GENERAL NOTES on `detect_coding_XXX ()' functions".
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	359 Check if a text is encoded in Emacs' internal format. If it is,
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	360 return CODING_CATEGORY_MASK_INTERNAL, else return 0. */
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	361
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	362 int
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	363 detect_coding_internal (src, src_end)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	364 unsigned char src, src_end;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	365 {
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	366 unsigned char c;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	367 int composing = 0;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	368
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	369 while (src < src_end)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	370 {
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	371 c = *src++;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	372
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	373 if (composing)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	374 {
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	375 if (c < 0xA0)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	376 composing = 0;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	377 else
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	378 c -= 0x20;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	379 }
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	380
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	381 switch (emacs_code_class[c])
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	382 {
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	383 case EMACS_ascii_code:
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	384 case EMACS_linefeed_code:
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	385 break;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	386
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	387 case EMACS_control_code:
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	388 if (c == ISO_CODE_ESC \|\| c == ISO_CODE_SI \|\| c == ISO_CODE_SO)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	389 return 0;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	390 break;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	391
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	392 case EMACS_invalid_code:
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	393 return 0;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	394
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	395 case EMACS_leading_code_composition: /* c == 0x80 */
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	396 if (composing)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	397 CHECK_CODE_RANGE_A0_FF;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	398 else
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	399 composing = 1;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	400 break;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	401
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	402 case EMACS_leading_code_4:
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	403 CHECK_CODE_RANGE_A0_FF;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	404 /* fall down to check it two more times ... */
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	405
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	406 case EMACS_leading_code_3:
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	407 CHECK_CODE_RANGE_A0_FF;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	408 /* fall down to check it one more time ... */
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	409
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	410 case EMACS_leading_code_2:
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	411 CHECK_CODE_RANGE_A0_FF;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	412 break;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	413
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	414 default:
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	415 label_end_of_switch:
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	416 break;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	417 }
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	418 }
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	419 return CODING_CATEGORY_MASK_INTERNAL;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	420 }
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	421
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	422
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	423 /* 3. ISO2022 handlers */
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	424
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	425 /* The following note describes the coding system ISO2022 briefly.
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	426 Since the intension of this note is to help understanding of the
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	427 programs in this file, some parts are NOT ACCURATE or OVERLY
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	428 SIMPLIFIED. For the thorough understanding, please refer to the
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	429 original document of ISO2022.
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	430
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	431 ISO2022 provides many mechanisms to encode several character sets
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	432 in 7-bit and 8-bit environment. If one choose 7-bite environment,
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	433 all text is encoded by codes of less than 128. This may make the
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	434 encoded text a little bit longer, but the text get more stability
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	435 to pass through several gateways (some of them split MSB off).
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	436
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	437 There are two kind of character set: control character set and
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	438 graphic character set. The former contains control characters such
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	439 as `newline' and `escape' to provide control functions (control
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	440 functions are provided also by escape sequence). The latter
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	441 contains graphic characters such as ' A' and '-'. Emacs recognizes
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	442 two control character sets and many graphic character sets.
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	443
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	444 Graphic character sets are classified into one of the following
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	445 four classes, DIMENSION1_CHARS94, DIMENSION1_CHARS96,
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	446 DIMENSION2_CHARS94, DIMENSION2_CHARS96 according to the number of
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	447 bytes (DIMENSION) and the number of characters in one dimension
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	448 (CHARS) of the set. In addition, each character set is assigned an
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	449 identification tag (called "final character" and denoted as <F>
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	450 here after) which is unique in each class. <F> of each character
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	451 set is decided by ECMA(*) when it is registered in ISO. Code range
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	452 of <F> is 0x30..0x7F (0x30..0x3F are for private use only).
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	453
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	454 Note (*): ECMA = European Computer Manufacturers Association
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	455
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	456 Here are examples of graphic character set [NAME(<F>)]:
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	457 o DIMENSION1_CHARS94 -- ASCII('B'), right-half-of-JISX0201('I'), ...
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	458 o DIMENSION1_CHARS96 -- right-half-of-ISO8859-1('A'), ...
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	459 o DIMENSION2_CHARS94 -- GB2312('A'), JISX0208('B'), ...
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	460 o DIMENSION2_CHARS96 -- none for the moment
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	461
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	462 A code area (1byte=8bits) is divided into 4 areas, C0, GL, C1, and GR.
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	463 C0 [0x00..0x1F] -- control character plane 0
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	464 GL [0x20..0x7F] -- graphic character plane 0
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	465 C1 [0x80..0x9F] -- control character plane 1
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	466 GR [0xA0..0xFF] -- graphic character plane 1
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	467
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	468 A control character set is directly designated and invoked to C0 or
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	469 C1 by an escape sequence. The most common case is that ISO646's
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	470 control character set is designated/invoked to C0 and ISO6429's
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	471 control character set is designated/invoked to C1, and usually
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	472 these designations/invocations are omitted in a coded text. With
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	473 7-bit environment, only C0 can be used, and a control character for
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	474 C1 is encoded by an appropriate escape sequence to fit in the
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	475 environment. All control characters for C1 are defined the
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	476 corresponding escape sequences.
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	477
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	478 A graphic character set is at first designated to one of four
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	479 graphic registers (G0 through G3), then these graphic registers are
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	480 invoked to GL or GR. These designations and invocations can be
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	481 done independently. The most common case is that G0 is invoked to
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	482 GL, G1 is invoked to GR, and ASCII is designated to G0, and usually
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	483 these invocations and designations are omitted in a coded text.
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	484 With 7-bit environment, only GL can be used.
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	485
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	486 When a graphic character set of CHARS94 is invoked to GL, code 0x20
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	487 and 0x7F of GL area work as control characters SPACE and DEL
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	488 respectively, and code 0xA0 and 0xFF of GR area should not be used.
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	489
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	490 There are two ways of invocation: locking-shift and single-shift.
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	491 With locking-shift, the invocation lasts until the next different
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	492 invocation, whereas with single-shift, the invocation works only
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	493 for the following character and doesn't affect locking-shift.
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	494 Invocations are done by the following control characters or escape
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	495 sequences.
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	496
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	497 ----------------------------------------------------------------------
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	498 function control char escape sequence description
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	499 ----------------------------------------------------------------------
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	500 SI (shift-in) 0x0F none invoke G0 to GL
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	501 SI (shift-out) 0x0E none invoke G1 to GL
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	502 LS2 (locking-shift-2) none ESC 'n' invoke G2 into GL
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	503 LS3 (locking-shift-3) none ESC 'o' invoke G3 into GL
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	504 SS2 (single-shift-2) 0x8E ESC 'N' invoke G2 into GL
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	505 SS3 (single-shift-3) 0x8F ESC 'O' invoke G3 into GL
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	506 ----------------------------------------------------------------------
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	507 The first four are for locking-shift. Control characters for these
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	508 functions are defined by macros ISO_CODE_XXX in `coding.h'.
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	509
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	510 Designations are done by the following escape sequences.
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	511 ----------------------------------------------------------------------
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	512 escape sequence description
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	513 ----------------------------------------------------------------------
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	514 ESC '(' <F> designate DIMENSION1_CHARS94<F> to G0
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	515 ESC ')' <F> designate DIMENSION1_CHARS94<F> to G1
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	516 ESC '*' <F> designate DIMENSION1_CHARS94<F> to G2
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	517 ESC '+' <F> designate DIMENSION1_CHARS94<F> to G3
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	518 ESC ',' <F> designate DIMENSION1_CHARS96<F> to G0 (*)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	519 ESC '-' <F> designate DIMENSION1_CHARS96<F> to G1
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	520 ESC '.' <F> designate DIMENSION1_CHARS96<F> to G2
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	521 ESC '/' <F> designate DIMENSION1_CHARS96<F> to G3
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	522 ESC '$' '(' <F> designate DIMENSION2_CHARS94<F> to G0 (**)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	523 ESC '$' ')' <F> designate DIMENSION2_CHARS94<F> to G1
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	524 ESC '$' '*' <F> designate DIMENSION2_CHARS94<F> to G2
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	525 ESC '$' '+' <F> designate DIMENSION2_CHARS94<F> to G3
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	526 ESC '$' ',' <F> designate DIMENSION2_CHARS96<F> to G0 (*)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	527 ESC '$' '-' <F> designate DIMENSION2_CHARS96<F> to G1
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	528 ESC '$' '.' <F> designate DIMENSION2_CHARS96<F> to G2
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	529 ESC '$' '/' <F> designate DIMENSION2_CHARS96<F> to G3
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	530 ----------------------------------------------------------------------
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	531
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	532 In this list, "DIMENSION1_CHARS94<F>" means a graphic character set
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	533 of dimension 1, chars 94, and final character <F>, and etc.
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	534
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	535 Note (*): Although these designations are not allowed in ISO2022,
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	536 Emacs accepts them on decoding, and produces them on encoding
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	537 CHARS96 character set in a coding system which is characterized as
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	538 7-bit environment, non-locking-shift, and non-single-shift.
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	539
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	540 Note (**): If <F> is '@', 'A', or 'B', the intermediate character
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	541 '(' can be omitted. We call this as "short-form" here after.
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	542
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	543 Now you may notice that there are a lot of ways for encoding the
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	544 same multilingual text in ISO2022. Actually, there exist many
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	545 coding systems such as Compound Text (used in X's inter client
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	546 communication, ISO-2022-JP (used in Japanese Internet), ISO-2022-KR
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	547 (used in Korean Internet), EUC (Extended UNIX Code, used in Asian
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	548 localized platforms), and all of these are variants of ISO2022.
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	549
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	550 In addition to the above, Emacs handles two more kinds of escape
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	551 sequences: ISO6429's direction specification and Emacs' private
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	552 sequence for specifying character composition.
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	553
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	554 ISO6429's direction specification takes the following format:
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	555 o CSI ']' -- end of the current direction
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	556 o CSI '0' ']' -- end of the current direction
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	557 o CSI '1' ']' -- start of left-to-right text
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	558 o CSI '2' ']' -- start of right-to-left text
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	559 The control character CSI (0x9B: control sequence introducer) is
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	560 abbreviated to the escape sequence ESC '[' in 7-bit environment.
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	561
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	562 Character composition specification takes the following format:
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	563 o ESC '0' -- start character composition
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	564 o ESC '1' -- end character composition
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	565 Since these are not standard escape sequences of any ISO, the use
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	566 of them for these meaning is restricted to Emacs only. */
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	567
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	568 enum iso_code_class_type iso_code_class[256];
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	569
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	570 /* See the above "GENERAL NOTES on `detect_coding_XXX ()' functions".
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	571 Check if a text is encoded in ISO2022. If it is, returns an
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	572 integer in which appropriate flag bits any of:
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	573 CODING_CATEGORY_MASK_ISO_7
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	574 CODING_CATEGORY_MASK_ISO_8_1
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	575 CODING_CATEGORY_MASK_ISO_8_2
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	576 CODING_CATEGORY_MASK_ISO_ELSE
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	577 are set. If a code which should never appear in ISO2022 is found,
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	578 returns 0. */
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	579
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	580 int
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	581 detect_coding_iso2022 (src, src_end)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	582 unsigned char src, src_end;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	583 {
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	584 unsigned char graphic_register[4];
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	585 unsigned char c, esc_cntl;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	586 int mask = (CODING_CATEGORY_MASK_ISO_7
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	587 \| CODING_CATEGORY_MASK_ISO_8_1
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	588 \| CODING_CATEGORY_MASK_ISO_8_2);
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	589 /* We may look ahead maximum 3 bytes. */
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	590 unsigned char *adjusted_src_end = src_end - 3;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	591 int i;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	592
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	593 for (i = 0; i < 4; i++)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	594 graphic_register[i] = CHARSET_ASCII;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	595
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	596 while (src < adjusted_src_end)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	597 {
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	598 c = *src++;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	599 switch (c)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	600 {
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	601 case ISO_CODE_ESC:
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	602 if (src >= adjusted_src_end)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	603 break;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	604 c = *src++;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	605 if (c == '$')
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	606 {
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	607 /* Designation of 2-byte character set. */
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	608 if (src >= adjusted_src_end)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	609 break;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	610 c = *src++;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	611 }
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	612 if ((c >= ')' && c <= '+') \|\| (c >= '-' && c <= '/'))
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	613 /* Designation to graphic register 1, 2, or 3. */
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	614 mask &= ~CODING_CATEGORY_MASK_ISO_7;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	615 else if (c == 'N' \|\| c == 'O' \|\| c == 'n' \|\| c == 'o')
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	616 return CODING_CATEGORY_MASK_ISO_ELSE;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	617 break;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	618
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	619 case ISO_CODE_SI:
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	620 case ISO_CODE_SO:
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	621 return CODING_CATEGORY_MASK_ISO_ELSE;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	622
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	623 case ISO_CODE_CSI:
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	624 case ISO_CODE_SS2:
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	625 case ISO_CODE_SS3:
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	626 mask &= ~CODING_CATEGORY_MASK_ISO_7;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	627 break;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	628
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	629 default:
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	630 if (c < 0x80)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	631 break;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	632 else if (c < 0xA0)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	633 return 0;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	634 else
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	635 {
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	636 int count = 1;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	637
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	638 mask &= ~CODING_CATEGORY_MASK_ISO_7;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	639 while (src < adjusted_src_end && *src >= 0xA0)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	640 count++, src++;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	641 if (count & 1 && src < adjusted_src_end)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	642 mask &= ~CODING_CATEGORY_MASK_ISO_8_2;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	643 }
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	644 break;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	645 }
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	646 }
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	647
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	648 return mask;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	649 }
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	650
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	651 /* Decode a character of which charset is CHARSET and the 1st position
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	652 code is C1. If dimension of CHARSET 2, the 2nd position code is
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	653 fetched from SRC and set to C2. If CHARSET is negative, it means
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	654 that we are decoding ill formed text, and what we can do is just to
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	655 read C1 as is. */
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	656
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	657 #define DECODE_ISO_CHARACTER(charset, c1) \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	658 do { \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	659 if ((charset) >= 0 && CHARSET_DIMENSION (charset) == 2) \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	660 ONE_MORE_BYTE (c2); \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	661 if (COMPOSING_HEAD_P (coding->composing)) \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	662 { \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	663 *dst++ = LEADING_CODE_COMPOSITION; \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	664 if (COMPOSING_WITH_RULE_P (coding->composing)) \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	665 /* To tell composition rules are embeded. */ \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	666 *dst++ = 0xFF; \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	667 coding->composing += 2; \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	668 } \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	669 if ((charset) < 0) \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	670 *dst++ = c1; \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	671 else if ((charset) == CHARSET_ASCII) \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	672 DECODE_CHARACTER_ASCII (c1); \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	673 else if (CHARSET_DIMENSION (charset) == 1) \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	674 DECODE_CHARACTER_DIMENSION1 (charset, c1); \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	675 else \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	676 DECODE_CHARACTER_DIMENSION2 (charset, c1, c2); \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	677 if (COMPOSING_WITH_RULE_P (coding->composing)) \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	678 /* To tell a composition rule follows. */ \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	679 coding->composing = COMPOSING_WITH_RULE_RULE; \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	680 } while (0)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	681
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	682 /* Set designation state into CODING. */
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	683 #define DECODE_DESIGNATION(reg, dimension, chars, final_char) \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	684 do { \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	685 int charset = ISO_CHARSET_TABLE (dimension, chars, final_char); \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	686 Lisp_Object temp \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	687 = Fassq (CHARSET_SYMBOL (charset), Valternate_charset_table); \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	688 if (! NILP (temp)) \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	689 charset = get_charset_id (XCONS (temp)->cdr); \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	690 if (charset >= 0) \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	691 { \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	692 if (coding->direction == 1 \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	693 && CHARSET_REVERSE_CHARSET (charset) >= 0) \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	694 charset = CHARSET_REVERSE_CHARSET (charset); \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	695 CODING_SPEC_ISO_DESIGNATION (coding, reg) = charset; \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	696 } \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	697 } while (0)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	698
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	699 /* See the above "GENERAL NOTES on `decode_coding_XXX ()' functions". */
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	700
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	701 int
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	702 decode_coding_iso2022 (coding, source, destination,
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	703 src_bytes, dst_bytes, consumed)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	704 struct coding_system *coding;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	705 unsigned char source, destination;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	706 int src_bytes, dst_bytes;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	707 int *consumed;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	708 {
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	709 unsigned char *src = source;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	710 unsigned char *src_end = source + src_bytes;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	711 unsigned char *dst = destination;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	712 unsigned char *dst_end = destination + dst_bytes;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	713 /* Since the maximum bytes produced by each loop is 7, we subtract 6
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	714 from DST_END to assure that overflow checking is necessary only
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	715 at the head of loop. */
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	716 unsigned char *adjusted_dst_end = dst_end - 6;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	717 int charset;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	718 /* Charsets invoked to graphic plane 0 and 1 respectively. */
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	719 int charset0 = CODING_SPEC_ISO_PLANE_CHARSET (coding, 0);
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	720 int charset1 = CODING_SPEC_ISO_PLANE_CHARSET (coding, 1);
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	721
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	722 while (src < src_end && dst < adjusted_dst_end)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	723 {
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	724 /* SRC_BASE remembers the start position in source in each loop.
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	725 The loop will be exited when there's not enough source text
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	726 to analyze long escape sequence or 2-byte code (within macros
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	727 ONE_MORE_BYTE or TWO_MORE_BYTES). In that case, SRC is reset
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	728 to SRC_BASE before exiting. */
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	729 unsigned char *src_base = src;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	730 unsigned char c1 = *src++, c2, cmprule;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	731
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	732 switch (iso_code_class [c1])
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	733 {
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	734 case ISO_0x20_or_0x7F:
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	735 if (!coding->composing
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	736 && (charset0 < 0 \|\| CHARSET_CHARS (charset0) == 94))
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	737 {
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	738 /* This is SPACE or DEL. */
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	739 *dst++ = c1;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	740 break;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	741 }
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	742 /* This is a graphic character, we fall down ... */
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	743
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	744 case ISO_graphic_plane_0:
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	745 if (coding->composing == COMPOSING_WITH_RULE_RULE)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	746 {
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	747 /* This is a composition rule. */
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	748 *dst++ = c1 \| 0x80;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	749 coding->composing = COMPOSING_WITH_RULE_TAIL;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	750 }
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	751 else
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	752 DECODE_ISO_CHARACTER (charset0, c1);
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	753 break;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	754
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	755 case ISO_0xA0_or_0xFF:
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	756 if (charset1 < 0 \|\| CHARSET_CHARS (charset1) == 94)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	757 {
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	758 /* Invalid code. */
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	759 *dst++ = c1;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	760 break;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	761 }
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	762 /* This is a graphic character, we fall down ... */
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	763
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	764 case ISO_graphic_plane_1:
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	765 DECODE_ISO_CHARACTER (charset1, c1);
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	766 break;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	767
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	768 case ISO_control_code:
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	769 /* All ISO2022 control characters in this class have the
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	770 same representation in Emacs internal format. */
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	771 *dst++ = c1;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	772 break;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	773
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	774 case ISO_carriage_return:
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	775 if (coding->eol_type == CODING_EOL_CR)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	776 {
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	777 *dst++ = '\n';
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	778 }
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	779 else if (coding->eol_type == CODING_EOL_CRLF)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	780 {
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	781 ONE_MORE_BYTE (c1);
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	782 if (c1 == ISO_CODE_LF)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	783 *dst++ = '\n';
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	784 else
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	785 {
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	786 src--;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	787 *dst++ = c1;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	788 }
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	789 }
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	790 else
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	791 {
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	792 *dst++ = c1;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	793 }
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	794 break;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	795
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	796 case ISO_shift_out:
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	797 CODING_SPEC_ISO_INVOCATION (coding, 0) = 1;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	798 charset0 = CODING_SPEC_ISO_PLANE_CHARSET (coding, 0);
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	799 break;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	800
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	801 case ISO_shift_in:
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	802 CODING_SPEC_ISO_INVOCATION (coding, 0) = 0;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	803 charset0 = CODING_SPEC_ISO_PLANE_CHARSET (coding, 0);
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	804 break;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	805
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	806 case ISO_single_shift_2_7:
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	807 case ISO_single_shift_2:
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	808 /* SS2 is handled as an escape sequence of ESC 'N' */
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	809 c1 = 'N';
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	810 goto label_escape_sequence;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	811
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	812 case ISO_single_shift_3:
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	813 /* SS2 is handled as an escape sequence of ESC 'O' */
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	814 c1 = 'O';
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	815 goto label_escape_sequence;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	816
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	817 case ISO_control_sequence_introducer:
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	818 /* CSI is handled as an escape sequence of ESC '[' ... */
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	819 c1 = '[';
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	820 goto label_escape_sequence;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	821
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	822 case ISO_escape:
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	823 ONE_MORE_BYTE (c1);
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	824 label_escape_sequence:
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	825 /* Escape sequences handled by Emacs are invocation,
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	826 designation, direction specification, and character
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	827 composition specification. */
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	828 switch (c1)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	829 {
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	830 case '&': /* revision of following character set */
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	831 ONE_MORE_BYTE (c1);
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	832 if (!(c1 >= '@' && c1 <= '~'))
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	833 {
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	834 goto label_invalid_escape_sequence;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	835 }
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	836 ONE_MORE_BYTE (c1);
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	837 if (c1 != ISO_CODE_ESC)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	838 {
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	839 goto label_invalid_escape_sequence;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	840 }
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	841 ONE_MORE_BYTE (c1);
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	842 goto label_escape_sequence;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	843
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	844 case '$': /* designation of 2-byte character set */
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	845 ONE_MORE_BYTE (c1);
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	846 if (c1 >= '@' && c1 <= 'B')
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	847 { /* designation of JISX0208.1978, GB2312.1980,
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	848 or JISX0208.1980 */
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	849 DECODE_DESIGNATION (0, 2, 94, c1);
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	850 }
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	851 else if (c1 >= 0x28 && c1 <= 0x2B)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	852 { /* designation of DIMENSION2_CHARS94 character set */
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	853 ONE_MORE_BYTE (c2);
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	854 DECODE_DESIGNATION (c1 - 0x28, 2, 94, c2);
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	855 }
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	856 else if (c1 >= 0x2C && c1 <= 0x2F)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	857 { /* designation of DIMENSION2_CHARS96 character set */
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	858 ONE_MORE_BYTE (c2);
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	859 DECODE_DESIGNATION (c1 - 0x2C, 2, 96, c2);
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	860 }
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	861 else
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	862 {
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	863 goto label_invalid_escape_sequence;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	864 }
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	865 break;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	866
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	867 case 'n': /* invocation of locking-shift-2 */
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	868 CODING_SPEC_ISO_INVOCATION (coding, 0) = 2;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	869 break;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	870
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	871 case 'o': /* invocation of locking-shift-3 */
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	872 CODING_SPEC_ISO_INVOCATION (coding, 0) = 3;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	873 break;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	874
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	875 case 'N': /* invocation of single-shift-2 */
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	876 ONE_MORE_BYTE (c1);
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	877 charset = CODING_SPEC_ISO_DESIGNATION (coding, 2);
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	878 DECODE_ISO_CHARACTER (charset, c1);
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	879 break;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	880
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	881 case 'O': /* invocation of single-shift-3 */
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	882 ONE_MORE_BYTE (c1);
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	883 charset = CODING_SPEC_ISO_DESIGNATION (coding, 3);
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	884 DECODE_ISO_CHARACTER (charset, c1);
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	885 break;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	886
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	887 case '0': /* start composing without embeded rules */
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	888 coding->composing = COMPOSING_NO_RULE_HEAD;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	889 break;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	890
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	891 case '1': /* end composing */
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	892 coding->composing = COMPOSING_NO;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	893 break;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	894
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	895 case '2': /* start composing with embeded rules */
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	896 coding->composing = COMPOSING_WITH_RULE_HEAD;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	897 break;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	898
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	899 case '[': /* specification of direction */
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	900 /* For the moment, nested direction is not supported.
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	901 So, the value of `coding->direction' is 0 or 1: 0
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	902 means left-to-right, 1 means right-to-left. */
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	903 ONE_MORE_BYTE (c1);
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	904 switch (c1)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	905 {
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	906 case ']': /* end of the current direction */
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	907 coding->direction = 0;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	908
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	909 case '0': /* end of the current direction */
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	910 case '1': /* start of left-to-right direction */
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	911 ONE_MORE_BYTE (c1);
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	912 if (c1 == ']')
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	913 coding->direction = 0;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	914 else
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	915 goto label_invalid_escape_sequence;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	916 break;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	917
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	918 case '2': /* start of right-to-left direction */
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	919 ONE_MORE_BYTE (c1);
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	920 if (c1 == ']')
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	921 coding->direction= 1;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	922 else
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	923 goto label_invalid_escape_sequence;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	924 break;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	925
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	926 default:
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	927 goto label_invalid_escape_sequence;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	928 }
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	929 break;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	930
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	931 default:
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	932 if (c1 >= 0x28 && c1 <= 0x2B)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	933 { /* designation of DIMENSION1_CHARS94 character set */
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	934 ONE_MORE_BYTE (c2);
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	935 DECODE_DESIGNATION (c1 - 0x28, 1, 94, c2);
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	936 }
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	937 else if (c1 >= 0x2C && c1 <= 0x2F)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	938 { /* designation of DIMENSION1_CHARS96 character set */
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	939 ONE_MORE_BYTE (c2);
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	940 DECODE_DESIGNATION (c1 - 0x2C, 1, 96, c2);
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	941 }
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	942 else
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	943 {
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	944 goto label_invalid_escape_sequence;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	945 }
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	946 }
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	947 /* We must update these variables now. */
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	948 charset0 = CODING_SPEC_ISO_PLANE_CHARSET (coding, 0);
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	949 charset1 = CODING_SPEC_ISO_PLANE_CHARSET (coding, 1);
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	950 break;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	951
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	952 label_invalid_escape_sequence:
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	953 {
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	954 int length = src - src_base;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	955
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	956 bcopy (src_base, dst, length);
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	957 dst += length;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	958 }
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	959 }
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	960 continue;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	961
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	962 label_end_of_loop:
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	963 coding->carryover_size = src - src_base;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	964 bcopy (src_base, coding->carryover, coding->carryover_size);
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	965 src = src_base;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	966 break;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	967 }
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	968
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	969 /* If this is the last block of the text to be decoded, we had
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	970 better just flush out all remaining codes in the text although
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	971 they are not valid characters. */
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	972 if (coding->last_block)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	973 {
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	974 bcopy (src, dst, src_end - src);
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	975 dst += (src_end - src);
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	976 src = src_end;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	977 }
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	978 *consumed = src - source;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	979 return dst - destination;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	980 }
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	981
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	982 /* ISO2022 encoding staffs. */
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	983
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	984 /*
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	985 It is not enough to say just "ISO2022" on encoding, but we have to
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	986 specify more details. In Emacs, each coding-system of ISO2022
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	987 variant has the following specifications:
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	988 1. Initial designation to G0 thru G3.
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	989 2. Allows short-form designation?
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	990 3. ASCII should be designated to G0 before control characters?
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	991 4. ASCII should be designated to G0 at end of line?
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	992 5. 7-bit environment or 8-bit environment?
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	993 6. Use locking-shift?
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	994 7. Use Single-shift?
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	995 And the following two are only for Japanese:
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	996 8. Use ASCII in place of JIS0201-1976-Roman?
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	997 9. Use JISX0208-1983 in place of JISX0208-1978?
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	998 These specifications are encoded in `coding->flags' as flag bits
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	999 defined by macros CODING_FLAG_ISO_XXX. See `coding.h' for more
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1000 detail.
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1001 */
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1002
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1003 /* Produce codes (escape sequence) for designating CHARSET to graphic
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1004 register REG. If <final-char> of CHARSET is '@', 'A', or 'B' and
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1005 the coding system CODING allows, produce designation sequence of
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1006 short-form. */
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1007
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1008 #define ENCODE_DESIGNATION(charset, reg, coding) \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1009 do { \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1010 unsigned char final_char = CHARSET_ISO_FINAL_CHAR (charset); \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1011 char intermediate_char_94 = "()+"; \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1012 char *intermediate_char_96 = ",-./"; \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1013 Lisp_Object temp \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1014 = Fassq (make_number (charset), Vcharset_revision_alist); \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1015 if (! NILP (temp)) \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1016 { \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1017 *dst++ = ISO_CODE_ESC; \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1018 *dst++ = '&'; \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1019 *dst++ = XINT (XCONS (temp)->cdr) + '@'; \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1020 } \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1021 *dst++ = ISO_CODE_ESC; \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1022 if (CHARSET_DIMENSION (charset) == 1) \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1023 { \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1024 if (CHARSET_CHARS (charset) == 94) \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1025 *dst++ = (unsigned char) (intermediate_char_94[reg]); \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1026 else \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1027 *dst++ = (unsigned char) (intermediate_char_96[reg]); \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1028 } \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1029 else \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1030 { \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1031 *dst++ = '$'; \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1032 if (CHARSET_CHARS (charset) == 94) \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1033 { \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1034 if (! (coding->flags & CODING_FLAG_ISO_SHORT_FORM) \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1035 \|\| reg != 0 \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1036 \|\| final_char < '@' \|\| final_char > 'B') \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1037 *dst++ = (unsigned char) (intermediate_char_94[reg]); \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1038 } \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1039 else \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1040 *dst++ = (unsigned char) (intermediate_char_96[reg]); \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1041 } \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1042 *dst++ = final_char; \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1043 CODING_SPEC_ISO_DESIGNATION (coding, reg) = charset; \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1044 } while (0)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1045
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1046 /* The following two macros produce codes (control character or escape
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1047 sequence) for ISO2022 single-shift functions (single-shift-2 and
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1048 single-shift-3). */
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1049
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1050 #define ENCODE_SINGLE_SHIFT_2 \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1051 do { \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1052 if (coding->flags & CODING_FLAG_ISO_SEVEN_BITS) \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1053 dst++ = ISO_CODE_ESC, dst++ = 'N'; \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1054 else \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1055 *dst++ = ISO_CODE_SS2; \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1056 CODING_SPEC_ISO_SINGLE_SHIFTING (coding) = 1; \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1057 } while (0)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1058
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1059 #define ENCODE_SINGLE_SHIFT_3 \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1060 do { \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1061 if (coding->flags & CODING_FLAG_ISO_SEVEN_BITS) \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1062 dst++ = ISO_CODE_ESC, dst++ = 'O'; \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1063 else \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1064 *dst++ = ISO_CODE_SS3; \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1065 CODING_SPEC_ISO_SINGLE_SHIFTING (coding) = 1; \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1066 } while (0)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1067
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1068 /* The following four macros produce codes (control character or
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1069 escape sequence) for ISO2022 locking-shift functions (shift-in,
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1070 shift-out, locking-shift-2, and locking-shift-3). */
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1071
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1072 #define ENCODE_SHIFT_IN \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1073 do { \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1074 *dst++ = ISO_CODE_SI; \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1075 CODING_SPEC_ISO_INVOCATION (coding, 0) = 0; \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1076 } while (0)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1077
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1078 #define ENCODE_SHIFT_OUT \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1079 do { \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1080 *dst++ = ISO_CODE_SO; \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1081 CODING_SPEC_ISO_INVOCATION (coding, 0) = 1; \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1082 } while (0)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1083
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1084 #define ENCODE_LOCKING_SHIFT_2 \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1085 do { \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1086 dst++ = ISO_CODE_ESC, dst++ = 'n'; \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1087 CODING_SPEC_ISO_INVOCATION (coding, 0) = 2; \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1088 } while (0)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1089
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1090 #define ENCODE_LOCKING_SHIFT_3 \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1091 do { \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1092 dst++ = ISO_CODE_ESC, dst++ = 'o'; \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1093 CODING_SPEC_ISO_INVOCATION (coding, 0) = 3; \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1094 } while (0)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1095
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1096 /* Produce codes for a DIMENSION1 character of which character set is
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1097 CHARSET and position-code is C1. Designation and invocation
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1098 sequences are also produced in advance if necessary. */
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1099
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1100
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1101 #define ENCODE_ISO_CHARACTER_DIMENSION1(charset, c1) \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1102 do { \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1103 if (CODING_SPEC_ISO_SINGLE_SHIFTING (coding)) \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1104 { \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1105 if (coding->flags & CODING_FLAG_ISO_SEVEN_BITS) \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1106 *dst++ = c1 & 0x7F; \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1107 else \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1108 *dst++ = c1 \| 0x80; \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1109 CODING_SPEC_ISO_SINGLE_SHIFTING (coding) = 0; \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1110 break; \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1111 } \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1112 else if (charset == CODING_SPEC_ISO_PLANE_CHARSET (coding, 0)) \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1113 { \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1114 *dst++ = c1 & 0x7F; \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1115 break; \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1116 } \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1117 else if (charset == CODING_SPEC_ISO_PLANE_CHARSET (coding, 1)) \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1118 { \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1119 *dst++ = c1 \| 0x80; \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1120 break; \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1121 } \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1122 else \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1123 /* Since CHARSET is not yet invoked to any graphic planes, we \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1124 must invoke it, or, at first, designate it to some graphic \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1125 register. Then repeat the loop to actually produce the \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1126 character. */ \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1127 dst = encode_invocation_designation (charset, coding, dst); \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1128 } while (1)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1129
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1130 /* Produce codes for a DIMENSION2 character of which character set is
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1131 CHARSET and position-codes are C1 and C2. Designation and
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1132 invocation codes are also produced in advance if necessary. */
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1133
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1134 #define ENCODE_ISO_CHARACTER_DIMENSION2(charset, c1, c2) \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1135 do { \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1136 if (CODING_SPEC_ISO_SINGLE_SHIFTING (coding)) \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1137 { \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1138 if (coding->flags & CODING_FLAG_ISO_SEVEN_BITS) \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1139 dst++ = c1 & 0x7F, dst++ = c2 & 0x7F; \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1140 else \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1141 dst++ = c1 \| 0x80, dst++ = c2 \| 0x80; \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1142 CODING_SPEC_ISO_SINGLE_SHIFTING (coding) = 0; \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1143 break; \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1144 } \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1145 else if (charset == CODING_SPEC_ISO_PLANE_CHARSET (coding, 0)) \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1146 { \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1147 dst++ = c1 & 0x7F, dst++= c2 & 0x7F; \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1148 break; \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1149 } \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1150 else if (charset == CODING_SPEC_ISO_PLANE_CHARSET (coding, 1)) \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1151 { \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1152 dst++ = c1 \| 0x80, dst++= c2 \| 0x80; \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1153 break; \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1154 } \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1155 else \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1156 /* Since CHARSET is not yet invoked to any graphic planes, we \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1157 must invoke it, or, at first, designate it to some graphic \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1158 register. Then repeat the loop to actually produce the \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1159 character. */ \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1160 dst = encode_invocation_designation (charset, coding, dst); \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1161 } while (1)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1162
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1163 /* Produce designation and invocation codes at a place pointed by DST
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1164 to use CHARSET. The element `spec.iso2022' of *CODING is updated.
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1165 Return new DST. */
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1166
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1167 unsigned char *
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1168 encode_invocation_designation (charset, coding, dst)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1169 int charset;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1170 struct coding_system *coding;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1171 unsigned char *dst;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1172 {
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1173 int reg; /* graphic register number */
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1174
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1175 /* At first, check designations. */
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1176 for (reg = 0; reg < 4; reg++)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1177 if (charset == CODING_SPEC_ISO_DESIGNATION (coding, reg))
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1178 break;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1179
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1180 if (reg >= 4)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1181 {
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1182 /* CHARSET is not yet designated to any graphic registers. */
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1183 /* At first check the requested designation. */
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1184 reg = CODING_SPEC_ISO_REQUESTED_DESIGNATION (coding, charset);
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1185 if (reg < 0)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1186 /* Since CHARSET requests no special designation, designate to
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1187 graphic register 0. */
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1188 reg = 0;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1189
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1190 ENCODE_DESIGNATION (charset, reg, coding);
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1191 }
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1192
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1193 if (CODING_SPEC_ISO_INVOCATION (coding, 0) != reg
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1194 && CODING_SPEC_ISO_INVOCATION (coding, 1) != reg)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1195 {
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1196 /* Since the graphic register REG is not invoked to any graphic
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1197 planes, invoke it to graphic plane 0. */
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1198 switch (reg)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1199 {
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1200 case 0: /* graphic register 0 */
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1201 ENCODE_SHIFT_IN;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1202 break;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1203
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1204 case 1: /* graphic register 1 */
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1205 ENCODE_SHIFT_OUT;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1206 break;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1207
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1208 case 2: /* graphic register 2 */
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1209 if (coding->flags & CODING_FLAG_ISO_SINGLE_SHIFT)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1210 ENCODE_SINGLE_SHIFT_2;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1211 else
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1212 ENCODE_LOCKING_SHIFT_2;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1213 break;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1214
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1215 case 3: /* graphic register 3 */
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1216 if (coding->flags & CODING_FLAG_ISO_SINGLE_SHIFT)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1217 ENCODE_SINGLE_SHIFT_3;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1218 else
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1219 ENCODE_LOCKING_SHIFT_3;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1220 break;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1221 }
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1222 }
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1223 return dst;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1224 }
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1225
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1226 /* The following two macros produce codes for indicating composition. */
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1227 #define ENCODE_COMPOSITION_NO_RULE_START dst++ = ISO_CODE_ESC, dst++ = '0'
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1228 #define ENCODE_COMPOSITION_WITH_RULE_START dst++ = ISO_CODE_ESC, dst++ = '2'
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1229 #define ENCODE_COMPOSITION_END dst++ = ISO_CODE_ESC, dst++ = '1'
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1230
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1231 /* The following three macros produce codes for indicating direction
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1232 of text. */
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1233 #define ENCODE_CONTROL_SEQUENCE_INTRODUCER \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1234 do { \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1235 if (coding->flags == CODING_FLAG_ISO_SEVEN_BITS) \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1236 dst++ = ISO_CODE_ESC, dst++ = '['; \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1237 else \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1238 *dst++ = ISO_CODE_CSI; \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1239 } while (0)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1240
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1241 #define ENCODE_DIRECTION_R2L \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1242 ENCODE_CONTROL_SEQUENCE_INTRODUCER, dst++ = '2', dst++ = ']'
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1243
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1244 #define ENCODE_DIRECTION_L2R \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1245 ENCODE_CONTROL_SEQUENCE_INTRODUCER, dst++ = '0', dst++ = ']'
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1246
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1247 /* Produce codes for designation and invocation to reset the graphic
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1248 planes and registers to initial state. */
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1249 #define ENCODE_RESET_PLANE_AND_REGISTER(eol) \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1250 do { \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1251 int reg; \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1252 if (CODING_SPEC_ISO_INVOCATION (coding, 0) != 0) \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1253 ENCODE_SHIFT_IN; \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1254 for (reg = 0; reg < 4; reg++) \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1255 { \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1256 if (CODING_SPEC_ISO_INITIAL_DESIGNATION (coding, reg) < 0) \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1257 { \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1258 if (eol) CODING_SPEC_ISO_DESIGNATION (coding, reg) = -1; \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1259 } \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1260 else if (CODING_SPEC_ISO_DESIGNATION (coding, reg) \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1261 != CODING_SPEC_ISO_INITIAL_DESIGNATION (coding, reg)) \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1262 ENCODE_DESIGNATION \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1263 (CODING_SPEC_ISO_INITIAL_DESIGNATION (coding, reg), reg, coding); \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1264 } \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1265 } while (0)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1266
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1267 /* See the above "GENERAL NOTES on `encode_coding_XXX ()' functions". */
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1268
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1269 int
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1270 encode_coding_iso2022 (coding, source, destination,
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1271 src_bytes, dst_bytes, consumed)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1272 struct coding_system *coding;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1273 unsigned char source, destination;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1274 int src_bytes, dst_bytes;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1275 int *consumed;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1276 {
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1277 unsigned char *src = source;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1278 unsigned char *src_end = source + src_bytes;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1279 unsigned char *dst = destination;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1280 unsigned char *dst_end = destination + dst_bytes;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1281 /* Since the maximum bytes produced by each loop is 6, we subtract 5
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1282 from DST_END to assure overflow checking is necessary only at the
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1283 head of loop. */
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1284 unsigned char *adjusted_dst_end = dst_end - 5;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1285
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1286 while (src < src_end && dst < adjusted_dst_end)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1287 {
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1288 /* SRC_BASE remembers the start position in source in each loop.
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1289 The loop will be exited when there's not enough source text
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1290 to analyze multi-byte codes (within macros ONE_MORE_BYTE,
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1291 TWO_MORE_BYTES, and THREE_MORE_BYTES). In that case, SRC is
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1292 reset to SRC_BASE before exiting. */
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1293 unsigned char *src_base = src;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1294 unsigned char c1 = *src++, c2, c3, c4;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1295 int charset;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1296
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1297 /* If we are seeing a component of a composite character, we are
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1298 seeing a leading-code specially encoded for composition, or a
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1299 composition rule if composing with rule. We must set C1
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1300 to a normal leading-code or an ASCII code. If we are not at
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1301 a composed character, we must reset the composition state. */
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1302 if (COMPOSING_P (coding->composing))
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1303 {
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1304 if (c1 < 0xA0)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1305 {
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1306 /* We are not in a composite character any longer. */
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1307 coding->composing = COMPOSING_NO;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1308 ENCODE_COMPOSITION_END;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1309 }
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1310 else
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1311 {
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1312 if (coding->composing == COMPOSING_WITH_RULE_RULE)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1313 {
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1314 *dst++ = c1 & 0x7F;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1315 coding->composing = COMPOSING_WITH_RULE_HEAD;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1316 continue;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1317 }
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1318 else if (coding->composing == COMPOSING_WITH_RULE_HEAD)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1319 coding->composing = COMPOSING_WITH_RULE_RULE;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1320 if (c1 == 0xA0)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1321 {
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1322 /* This is an ASCII component. */
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1323 ONE_MORE_BYTE (c1);
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1324 c1 &= 0x7F;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1325 }
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1326 else
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1327 /* This is a leading-code of non ASCII component. */
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1328 c1 -= 0x20;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1329 }
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1330 }
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1331
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1332 /* Now encode one character. C1 is a control character, an
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1333 ASCII character, or a leading-code of multi-byte character. */
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1334 switch (emacs_code_class[c1])
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1335 {
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1336 case EMACS_ascii_code:
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1337 ENCODE_ISO_CHARACTER_DIMENSION1 (CHARSET_ASCII, c1);
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1338 break;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1339
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1340 case EMACS_control_code:
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1341 if (coding->flags & CODING_FLAG_ISO_RESET_AT_CNTL)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1342 ENCODE_RESET_PLANE_AND_REGISTER (0);
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1343 *dst++ = c1;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1344 break;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1345
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1346 case EMACS_carriage_return_code:
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1347 if (!coding->selective)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1348 {
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1349 if (coding->flags & CODING_FLAG_ISO_RESET_AT_CNTL)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1350 ENCODE_RESET_PLANE_AND_REGISTER (0);
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1351 *dst++ = c1;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1352 break;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1353 }
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1354 /* fall down to treat '\r' as '\n' ... */
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1355
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1356 case EMACS_linefeed_code:
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1357 if (coding->flags & CODING_FLAG_ISO_RESET_AT_EOL)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1358 ENCODE_RESET_PLANE_AND_REGISTER (1);
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1359 if (coding->eol_type == CODING_EOL_LF
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1360 \|\| coding->eol_type == CODING_EOL_AUTOMATIC)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1361 *dst++ = ISO_CODE_LF;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1362 else if (coding->eol_type == CODING_EOL_CRLF)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1363 dst++ = ISO_CODE_CR, dst++ = ISO_CODE_LF;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1364 else
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1365 *dst++ = ISO_CODE_CR;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1366 break;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1367
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1368 case EMACS_leading_code_2:
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1369 ONE_MORE_BYTE (c2);
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1370 ENCODE_ISO_CHARACTER_DIMENSION1 (c1, c2);
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1371 break;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1372
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1373 case EMACS_leading_code_3:
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1374 TWO_MORE_BYTES (c2, c3);
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1375 if (c1 < LEADING_CODE_PRIVATE_11)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1376 ENCODE_ISO_CHARACTER_DIMENSION2 (c1, c2, c3);
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1377 else
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1378 ENCODE_ISO_CHARACTER_DIMENSION1 (c2, c3);
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1379 break;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1380
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1381 case EMACS_leading_code_4:
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1382 THREE_MORE_BYTES (c2, c3, c4);
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1383 ENCODE_ISO_CHARACTER_DIMENSION2 (c2, c3, c4);
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1384 break;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1385
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1386 case EMACS_leading_code_composition:
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1387 ONE_MORE_BYTE (c1);
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1388 if (c1 == 0xFF)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1389 {
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1390 coding->composing = COMPOSING_WITH_RULE_HEAD;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1391 ENCODE_COMPOSITION_WITH_RULE_START;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1392 }
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1393 else
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1394 {
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1395 /* Rewind one byte because it is a character code of
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1396 composition elements. */
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1397 src--;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1398 coding->composing = COMPOSING_NO_RULE_HEAD;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1399 ENCODE_COMPOSITION_NO_RULE_START;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1400 }
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1401 break;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1402
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1403 case EMACS_invalid_code:
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1404 *dst++ = c1;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1405 break;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1406 }
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1407 continue;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1408 label_end_of_loop:
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1409 coding->carryover_size = src - src_base;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1410 bcopy (src_base, coding->carryover, coding->carryover_size);
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1411 src = src_base;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1412 break;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1413 }
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1414
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1415 /* If this is the last block of the text to be encoded, we must
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1416 reset the state of graphic planes and registers to initial one.
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1417 In addition, we had better just flush out all remaining codes in
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1418 the text although they are not valid characters. */
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1419 if (coding->last_block)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1420 {
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1421 ENCODE_RESET_PLANE_AND_REGISTER (1);
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1422 bcopy(src, dst, src_end - src);
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1423 dst += (src_end - src);
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1424 src = src_end;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1425 }
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1426 *consumed = src - source;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1427 return dst - destination;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1428 }
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1429
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1430
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1431 /* 4. SJIS and BIG5 handlers */
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1432
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1433 /* Although SJIS and BIG5 are not ISO's coding system, They are used
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1434 quite widely. So, for the moment, Emacs supports them in the bare
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1435 C code. But, in the future, they may be supported only by CCL. */
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1436
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1437 /* SJIS is a coding system encoding three character sets: ASCII, right
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1438 half of JISX0201-Kana, and JISX0208. An ASCII character is encoded
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1439 as is. A character of charset katakana-jisx0201 is encoded by
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1440 "position-code + 0x80". A character of charset japanese-jisx0208
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1441 is encoded in 2-byte but two position-codes are divided and shifted
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1442 so that it fit in the range below.
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1443
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1444 --- CODE RANGE of SJIS ---
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1445 (character set) (range)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1446 ASCII 0x00 .. 0x7F
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1447 KATAKANA-JISX0201 0xA0 .. 0xDF
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1448 JISX0208 (1st byte) 0x80 .. 0x9F and 0xE0 .. 0xFF
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1449 (2nd byte) 0x40 .. 0xFF
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1450 -------------------------------
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1451
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1452 */
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1453
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1454 /* BIG5 is a coding system encoding two character sets: ASCII and
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1455 Big5. An ASCII character is encoded as is. Big5 is a two-byte
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1456 character set and is encoded in two-byte.
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1457
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1458 --- CODE RANGE of BIG5 ---
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1459 (character set) (range)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1460 ASCII 0x00 .. 0x7F
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1461 Big5 (1st byte) 0xA1 .. 0xFE
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1462 (2nd byte) 0x40 .. 0x7E and 0xA1 .. 0xFE
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1463 --------------------------
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1464
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1465 Since the number of characters in Big5 is larger than maximum
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1466 characters in Emacs' charset (96x96), it can't be handled as one
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1467 charset. So, in Emacs, Big5 is divided into two: `charset-big5-1'
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1468 and `charset-big5-2'. Both are DIMENSION2 and CHARS94. The former
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1469 contains frequently used characters and the latter contains less
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1470 frequently used characters. */
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1471
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1472 /* Macros to decode or encode a character of Big5 in BIG5. B1 and B2
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1473 are the 1st and 2nd position-codes of Big5 in BIG5 coding system.
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1474 C1 and C2 are the 1st and 2nd position-codes of of Emacs' internal
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1475 format. CHARSET is `charset_big5_1' or `charset_big5_2'. */
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1476
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1477 /* Number of Big5 characters which have the same code in 1st byte. */
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1478 #define BIG5_SAME_ROW (0xFF - 0xA1 + 0x7F - 0x40)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1479
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1480 #define DECODE_BIG5(b1, b2, charset, c1, c2) \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1481 do { \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1482 unsigned int temp \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1483 = (b1 - 0xA1) * BIG5_SAME_ROW + b2 - (b2 < 0x7F ? 0x40 : 0x62); \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1484 if (b1 < 0xC9) \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1485 charset = charset_big5_1; \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1486 else \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1487 { \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1488 charset = charset_big5_2; \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1489 temp -= (0xC9 - 0xA1) * BIG5_SAME_ROW; \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1490 } \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1491 c1 = temp / (0xFF - 0xA1) + 0x21; \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1492 c2 = temp % (0xFF - 0xA1) + 0x21; \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1493 } while (0)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1494
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1495 #define ENCODE_BIG5(charset, c1, c2, b1, b2) \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1496 do { \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1497 unsigned int temp = (c1 - 0x21) * (0xFF - 0xA1) + (c2 - 0x21); \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1498 if (charset == charset_big5_2) \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1499 temp += BIG5_SAME_ROW * (0xC9 - 0xA1); \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1500 b1 = temp / BIG5_SAME_ROW + 0xA1; \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1501 b2 = temp % BIG5_SAME_ROW; \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1502 b2 += b2 < 0x3F ? 0x40 : 0x62; \
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1503 } while (0)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1504
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1505 /* See the above "GENERAL NOTES on `detect_coding_XXX ()' functions".
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1506 Check if a text is encoded in SJIS. If it is, return
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1507 CODING_CATEGORY_MASK_SJIS, else return 0. */
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1508
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1509 int
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1510 detect_coding_sjis (src, src_end)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1511 unsigned char src, src_end;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1512 {
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1513 unsigned char c;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1514
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1515 while (src < src_end)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1516 {
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1517 c = *src++;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1518 if (c == ISO_CODE_ESC \|\| c == ISO_CODE_SI \|\| c == ISO_CODE_SO)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1519 return 0;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1520 if ((c >= 0x80 && c < 0xA0) \|\| c >= 0xE0)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1521 {
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1522 if (src < src_end && *src++ < 0x40)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1523 return 0;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1524 }
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1525 }
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1526 return CODING_CATEGORY_MASK_SJIS;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1527 }
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1528
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1529 /* See the above "GENERAL NOTES on `detect_coding_XXX ()' functions".
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1530 Check if a text is encoded in BIG5. If it is, return
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1531 CODING_CATEGORY_MASK_BIG5, else return 0. */
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1532
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1533 int
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1534 detect_coding_big5 (src, src_end)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1535 unsigned char src, src_end;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1536 {
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1537 unsigned char c;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1538
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1539 while (src < src_end)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1540 {
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1541 c = *src++;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1542 if (c == ISO_CODE_ESC \|\| c == ISO_CODE_SI \|\| c == ISO_CODE_SO)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1543 return 0;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1544 if (c >= 0xA1)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1545 {
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1546 if (src >= src_end)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1547 break;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1548 c = *src++;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1549 if (c < 0x40 \|\| (c >= 0x7F && c <= 0xA0))
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1550 return 0;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1551 }
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1552 }
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1553 return CODING_CATEGORY_MASK_BIG5;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1554 }
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1555
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1556 /* See the above "GENERAL NOTES on `decode_coding_XXX ()' functions".
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1557 If SJIS_P is 1, decode SJIS text, else decode BIG5 test. */
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1558
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1559 int
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1560 decode_coding_sjis_big5 (coding, source, destination,
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1561 src_bytes, dst_bytes, consumed, sjis_p)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1562 struct coding_system *coding;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1563 unsigned char source, destination;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1564 int src_bytes, dst_bytes;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1565 int *consumed;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1566 int sjis_p;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1567 {
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1568 unsigned char *src = source;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1569 unsigned char *src_end = source + src_bytes;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1570 unsigned char *dst = destination;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1571 unsigned char *dst_end = destination + dst_bytes;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1572 /* Since the maximum bytes produced by each loop is 4, we subtract 3
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1573 from DST_END to assure overflow checking is necessary only at the
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1574 head of loop. */
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1575 unsigned char *adjusted_dst_end = dst_end - 3;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1576
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1577 while (src < src_end && dst < adjusted_dst_end)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1578 {
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1579 /* SRC_BASE remembers the start position in source in each loop.
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1580 The loop will be exited when there's not enough source text
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1581 to analyze two-byte character (within macro ONE_MORE_BYTE).
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1582 In that case, SRC is reset to SRC_BASE before exiting. */
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1583 unsigned char *src_base = src;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1584 unsigned char c1 = *src++, c2, c3, c4;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1585
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1586 if (c1 == '\r')
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1587 {
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1588 if (coding->eol_type == CODING_EOL_CRLF)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1589 {
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1590 ONE_MORE_BYTE (c2);
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1591 if (c2 == '\n')
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1592 *dst++ = c2;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1593 else
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1594 /* To process C2 again, SRC is subtracted by 1. */
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1595 *dst++ = c1, src--;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1596 }
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1597 else
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1598 *dst++ = c1;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1599 }
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1600 else if (c1 < 0x80)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1601 *dst++ = c1;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1602 else if (c1 < 0xA0 \|\| c1 >= 0xE0)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1603 {
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1604 /* SJIS -> JISX0208, BIG5 -> Big5 (only if 0xE0 <= c1 < 0xFF) */
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1605 if (sjis_p)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1606 {
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1607 ONE_MORE_BYTE (c2);
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1608 DECODE_SJIS (c1, c2, c3, c4);
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1609 DECODE_CHARACTER_DIMENSION2 (charset_jisx0208, c3, c4);
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1610 }
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1611 else if (c1 >= 0xE0 && c1 < 0xFF)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1612 {
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1613 int charset;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1614
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1615 ONE_MORE_BYTE (c2);
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1616 DECODE_BIG5 (c1, c2, charset, c3, c4);
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1617 DECODE_CHARACTER_DIMENSION2 (charset, c3, c4);
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1618 }
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1619 else /* Invalid code */
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1620 *dst++ = c1;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1621 }
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1622 else
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1623 {
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1624 /* SJIS -> JISX0201-Kana, BIG5 -> Big5 */
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1625 if (sjis_p)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1626 DECODE_CHARACTER_DIMENSION1 (charset_katakana_jisx0201, c1);
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1627 else
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1628 {
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1629 int charset;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1630
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1631 ONE_MORE_BYTE (c2);
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1632 DECODE_BIG5 (c1, c2, charset, c3, c4);
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1633 DECODE_CHARACTER_DIMENSION2 (charset, c3, c4);
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1634 }
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1635 }
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1636 continue;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1637
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1638 label_end_of_loop:
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1639 coding->carryover_size = src - src_base;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1640 bcopy (src_base, coding->carryover, coding->carryover_size);
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1641 src = src_base;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1642 break;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1643 }
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1644
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1645 *consumed = src - source;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1646 return dst - destination;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1647 }
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1648
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1649 /* See the above "GENERAL NOTES on `encode_coding_XXX ()' functions".
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1650 This function can encode `charset_ascii', `charset_katakana_jisx0201',
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1651 `charset_jisx0208', `charset_big5_1', and `charset_big5-2'. We are
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1652 sure that all these charsets are registered as official charset
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1653 (i.e. do not have extended leading-codes). Characters of other
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1654 charsets are produced without any encoding. If SJIS_P is 1, encode
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1655 SJIS text, else encode BIG5 text. */
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1656
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1657 int
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1658 encode_coding_sjis_big5 (coding, source, destination,
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1659 src_bytes, dst_bytes, consumed, sjis_p)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1660 struct coding_system *coding;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1661 unsigned char source, destination;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1662 int src_bytes, dst_bytes;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1663 int *consumed;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1664 int sjis_p;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1665 {
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1666 unsigned char *src = source;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1667 unsigned char *src_end = source + src_bytes;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1668 unsigned char *dst = destination;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1669 unsigned char *dst_end = destination + dst_bytes;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1670 /* Since the maximum bytes produced by each loop is 2, we subtract 1
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1671 from DST_END to assure overflow checking is necessary only at the
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1672 head of loop. */
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1673 unsigned char *adjusted_dst_end = dst_end - 1;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1674
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1675 while (src < src_end && dst < adjusted_dst_end)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1676 {
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1677 /* SRC_BASE remembers the start position in source in each loop.
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1678 The loop will be exited when there's not enough source text
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1679 to analyze multi-byte codes (within macros ONE_MORE_BYTE and
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1680 TWO_MORE_BYTES). In that case, SRC is reset to SRC_BASE
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1681 before exiting. */
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1682 unsigned char *src_base = src;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1683 unsigned char c1 = *src++, c2, c3, c4;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1684
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1685 if (coding->composing)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1686 {
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1687 if (c1 == 0xA0)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1688 {
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1689 ONE_MORE_BYTE (c1);
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1690 c1 &= 0x7F;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1691 }
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1692 else if (c1 >= 0xA0)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1693 c1 -= 0x20;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1694 else
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1695 coding->composing = 0;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1696 }
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1697
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1698 switch (emacs_code_class[c1])
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1699 {
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1700 case EMACS_ascii_code:
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1701 case EMACS_control_code:
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1702 *dst++ = c1;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1703 break;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1704
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1705 case EMACS_carriage_return_code:
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1706 if (!coding->selective)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1707 {
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1708 *dst++ = c1;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1709 break;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1710 }
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1711 /* fall down to treat '\r' as '\n' ... */
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1712
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1713 case EMACS_linefeed_code:
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1714 if (coding->eol_type == CODING_EOL_LF
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1715 \|\| coding->eol_type == CODING_EOL_AUTOMATIC)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1716 *dst++ = '\n';
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1717 else if (coding->eol_type == CODING_EOL_CRLF)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1718 dst++ = '\r', dst++ = '\n';
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1719 else
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1720 *dst++ = '\r';
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1721 break;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1722
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1723 case EMACS_leading_code_2:
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1724 ONE_MORE_BYTE (c2);
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1725 if (sjis_p && c1 == charset_katakana_jisx0201)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1726 *dst++ = c2;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1727 else
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1728 dst++ = c1, dst++ = c2;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1729 break;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1730
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1731 case EMACS_leading_code_3:
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1732 TWO_MORE_BYTES (c2, c3);
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1733 c2 &= 0x7F, c3 &= 0x7F;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1734 if (sjis_p && c1 == charset_jisx0208)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1735 {
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1736 unsigned char s1, s2;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1737
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1738 ENCODE_SJIS (c2, c3, s1, s2);
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1739 dst++ = s1, dst++ = s2;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1740 }
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1741 else if (!sjis_p && (c1 == charset_big5_1 \|\| c1 == charset_big5_2))
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1742 {
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1743 unsigned char b1, b2;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1744
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1745 ENCODE_BIG5 (c1, c2, c3, b1, b2);
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1746 dst++ = b1, dst++ = b2;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1747 }
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1748 else
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1749 dst++ = c1, dst++ = c2, *dst++ = c3;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1750 break;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1751
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1752 case EMACS_leading_code_4:
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1753 THREE_MORE_BYTES (c2, c3, c4);
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1754 dst++ = c1, dst++ = c2, dst++ = c3, dst++ = c4;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1755 break;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1756
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1757 case EMACS_leading_code_composition:
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1758 coding->composing = 1;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1759 break;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1760
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1761 default: /* i.e. case EMACS_invalid_code: */
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1762 *dst++ = c1;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1763 }
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1764 continue;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1765
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1766 label_end_of_loop:
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1767 coding->carryover_size = src - src_base;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1768 bcopy (src_base, coding->carryover, coding->carryover_size);
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1769 src = src_base;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1770 break;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1771 }
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1772
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1773 *consumed = src - source;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1774 return dst - destination;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1775 }
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1776
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1777
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1778 /* 5. End-of-line handlers */
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1779
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1780 /* See the above "GENERAL NOTES on `decode_coding_XXX ()' functions".
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1781 This function is called only when `coding->eol_type' is
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1782 CODING_EOL_CRLF or CODING_EOL_CR. */
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1783
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1784 decode_eol (coding, source, destination, src_bytes, dst_bytes, consumed)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1785 struct coding_system *coding;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1786 unsigned char source, destination;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1787 int src_bytes, dst_bytes;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1788 int *consumed;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1789 {
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1790 unsigned char *src = source;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1791 unsigned char *src_end = source + src_bytes;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1792 unsigned char *dst = destination;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1793 unsigned char *dst_end = destination + dst_bytes;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1794 int produced;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1795
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1796 switch (coding->eol_type)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1797 {
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1798 case CODING_EOL_CRLF:
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1799 {
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1800 /* Since the maximum bytes produced by each loop is 2, we
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1801 subtract 1 from DST_END to assure overflow checking is
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1802 necessary only at the head of loop. */
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1803 unsigned char *adjusted_dst_end = dst_end - 1;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1804
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1805 while (src < src_end && dst < adjusted_dst_end)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1806 {
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1807 unsigned char *src_base = src;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1808 unsigned char c = *src++;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1809 if (c == '\r')
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1810 {
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1811 ONE_MORE_BYTE (c);
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1812 if (c != '\n')
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1813 *dst++ = '\r';
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1814
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1815 }
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1816 else
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1817 *dst++ = c;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1818 continue;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1819
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1820 label_end_of_loop:
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1821 coding->carryover_size = src - src_base;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1822 bcopy (src_base, coding->carryover, coding->carryover_size);
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1823 src = src_base;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1824 break;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1825 }
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1826 *consumed = src - source;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1827 produced = dst - destination;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1828 break;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1829 }
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1830
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1831 case CODING_EOL_CR:
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1832 produced = (src_bytes > dst_bytes) ? dst_bytes : src_bytes;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1833 bcopy (source, destination, produced);
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1834 dst_end = destination + produced;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1835 while (dst < dst_end)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1836 if (*dst++ == '\r') dst[-1] = '\n';
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1837 *consumed = produced;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1838 break;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1839
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1840 default: /* i.e. case: CODING_EOL_LF */
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1841 produced = (src_bytes > dst_bytes) ? dst_bytes : src_bytes;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1842 bcopy (source, destination, produced);
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1843 *consumed = produced;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1844 break;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1845 }
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1846
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1847 return produced;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1848 }
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1849
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1850 /* See "GENERAL NOTES about `encode_coding_XXX ()' functions". Encode
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1851 format of end-of-line according to `coding->eol_type'. If
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1852 `coding->selective' is 1, code '\r' in source text also means
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1853 end-of-line. */
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1854
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1855 encode_eol (coding, source, destination, src_bytes, dst_bytes, consumed)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1856 struct coding_system *coding;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1857 unsigned char source, destination;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1858 int src_bytes, dst_bytes;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1859 int *consumed;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1860 {
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1861 unsigned char *src = source;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1862 unsigned char *dst = destination;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1863 int produced;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1864
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1865 if (src_bytes <= 0)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1866 return 0;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1867
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1868 switch (coding->eol_type)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1869 {
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1870 case CODING_EOL_LF:
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1871 case CODING_EOL_AUTOMATIC:
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1872 produced = (src_bytes > dst_bytes) ? dst_bytes : src_bytes;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1873 bcopy (source, destination, produced);
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1874 if (coding->selective)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1875 {
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1876 int i = produced;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1877 while (i--)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1878 if (*dst++ == '\r') dst[-1] = '\n';
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1879 }
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1880 *consumed = produced;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1881
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1882 case CODING_EOL_CRLF:
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1883 {
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1884 unsigned char c;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1885 unsigned char *src_end = source + src_bytes;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1886 unsigned char *dst_end = destination + dst_bytes;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1887 /* Since the maximum bytes produced by each loop is 2, we
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1888 subtract 1 from DST_END to assure overflow checking is
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1889 necessary only at the head of loop. */
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1890 unsigned char *adjusted_dst_end = dst_end - 1;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1891
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1892 while (src < src_end && dst < adjusted_dst_end)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1893 {
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1894 c = *src++;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1895 if (c == '\n' \|\| (c == '\r' && coding->selective))
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1896 dst++ = '\r', dst++ = '\n';
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1897 else
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1898 *dst++ = c;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1899 }
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1900 produced = dst - destination;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1901 *consumed = src - source;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1902 break;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1903 }
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1904
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1905 default: /* i.e. case CODING_EOL_CR: */
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1906 produced = (src_bytes > dst_bytes) ? dst_bytes : src_bytes;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1907 bcopy (source, destination, produced);
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1908 {
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1909 int i = produced;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1910 while (i--)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1911 if (*dst++ == '\n') dst[-1] = '\r';
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1912 }
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1913 *consumed = produced;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1914 }
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1915
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1916 return produced;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1917 }
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1918
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1919
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1920 /* 6. C library functions */
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1921
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1922 /* In Emacs Lisp, coding system is represented by a Lisp symbol which
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1923 has a property `coding-system'. The value of this property is a
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1924 vector of length 5 (called as coding-vector). Among elements of
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1925 this vector, the first (element[0]) and the fifth (element[4])
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1926 carry important information for decoding/encoding. Before
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1927 decoding/encoding, this information should be set in fields of a
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1928 structure of type `coding_system'.
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1929
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1930 A value of property `coding-system' can be a symbol of another
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1931 subsidiary coding-system. In that case, Emacs gets coding-vector
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1932 from that symbol.
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1933
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1934 `element[0]' contains information to be set in `coding->type'. The
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1935 value and its meaning is as follows:
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1936
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1937 0 -- coding_system_internal
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1938 1 -- coding_system_sjis
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1939 2 -- coding_system_iso2022
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1940 3 -- coding_system_big5
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1941 4 -- coding_system_ccl
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1942 nil -- coding_system_no_conversion
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1943 t -- coding_system_automatic
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1944
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1945 `element[4]' contains information to be set in `coding->flags' and
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1946 `coding->spec'. The meaning varies by `coding->type'.
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1947
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1948 If `coding->type' is `coding_type_iso2022', element[4] is a vector
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1949 of length 32 (of which the first 13 sub-elements are used now).
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1950 Meanings of these sub-elements are:
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1951
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1952 sub-element[N] where N is 0 through 3: to be set in `coding->spec.iso2022'
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1953 If the value is an integer of valid charset, the charset is
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1954 assumed to be designated to graphic register N initially.
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1955
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1956 If the value is minus, it is a minus value of charset which
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1957 reserves graphic register N, which means that the charset is
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1958 not designated initially but should be designated to graphic
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1959 register N just before encoding a character in that charset.
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1960
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1961 If the value is nil, graphic register N is never used on
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1962 encoding.
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1963
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1964 sub-element[N] where N is 4 through 11: to be set in `coding->flags'
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1965 Each value takes t or nil. See the section ISO2022 of
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1966 `coding.h' for more information.
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1967
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1968 If `coding->type' is `coding_type_big5', element[4] is t to denote
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1969 BIG5-ETen or nil to denote BIG5-HKU.
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1970
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1971 If `coding->type' takes the other value, element[4] is ignored.
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1972
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1973 Emacs Lisp's coding system also carries information about format of
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1974 end-of-line in a value of property `eol-type'. If the value is
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1975 integer, 0 means CODING_EOL_LF, 1 means CODING_EOL_CRLF, and 2
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1976 means CODING_EOL_CR. If it is not integer, it should be a vector
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1977 of subsidiary coding systems of which property `eol-type' has one
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1978 of above values.
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1979
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1980 */
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1981
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1982 /* Extract information for decoding/encoding from CODING_SYSTEM_SYMBOL
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1983 and set it in CODING. If CODING_SYSTEM_SYMBOL is invalid, CODING
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1984 is setup so that no conversion is necessary and return -1, else
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1985 return 0. */
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1986
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1987 int
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1988 setup_coding_system (coding_system_symbol, coding)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1989 Lisp_Object coding_system_symbol;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1990 struct coding_system *coding;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1991 {
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1992 Lisp_Object coding_system_vector = Qnil;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1993 Lisp_Object type, eol_type;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1994
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1995 /* At first, set several fields default values. */
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1996 coding->require_flushing = 0;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1997 coding->last_block = 0;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1998 coding->selective = 0;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	1999 coding->composing = 0;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2000 coding->direction = 0;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2001 coding->carryover_size = 0;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2002 coding->symbol = Qnil;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2003 coding->post_read_conversion = coding->pre_write_conversion = Qnil;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2004
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2005 /* Get value of property `coding-system'. If it is a Lisp symbol
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2006 pointing another coding system, fetch its property until we get a
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2007 vector. */
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2008 while (!NILP (coding_system_symbol))
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2009 {
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2010 coding->symbol = coding_system_symbol;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2011 if (NILP (coding->post_read_conversion))
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2012 coding->post_read_conversion = Fget (coding_system_symbol,
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2013 Qpost_read_conversion);
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2014 if (NILP (coding->pre_write_conversion))
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2015 coding->pre_write_conversion = Fget (coding_system_symbol,
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2016 Qpre_write_conversion);
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2017
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2018 coding_system_vector = Fget (coding_system_symbol, Qcoding_system);
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2019 if (VECTORP (coding_system_vector))
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2020 break;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2021 coding_system_symbol = coding_system_vector;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2022 }
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2023 Vlast_coding_system_used = coding->symbol;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2024
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2025 if (!VECTORP (coding_system_vector)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2026 \|\| XVECTOR (coding_system_vector)->size != 5)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2027 goto label_invalid_coding_system;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2028
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2029 /* Get value of property `eol-type' by searching from the root
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2030 coding-system. */
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2031 coding_system_symbol = coding->symbol;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2032 eol_type = Qnil;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2033 while (SYMBOLP (coding_system_symbol) && !NILP (coding_system_symbol))
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2034 {
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2035 eol_type = Fget (coding_system_symbol, Qeol_type);
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2036 if (!NILP (eol_type))
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2037 break;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2038 coding_system_symbol = Fget (coding_system_symbol, Qcoding_system);
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2039 }
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2040
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2041 if (VECTORP (eol_type))
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2042 coding->eol_type = CODING_EOL_AUTOMATIC;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2043 else if (XFASTINT (eol_type) == 1)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2044 coding->eol_type = CODING_EOL_CRLF;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2045 else if (XFASTINT (eol_type) == 2)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2046 coding->eol_type = CODING_EOL_CR;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2047 else
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2048 coding->eol_type = CODING_EOL_LF;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2049
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2050 type = XVECTOR (coding_system_vector)->contents[0];
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2051 switch (XFASTINT (type))
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2052 {
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2053 case 0:
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2054 coding->type = coding_type_internal;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2055 break;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2056
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2057 case 1:
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2058 coding->type = coding_type_sjis;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2059 break;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2060
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2061 case 2:
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2062 coding->type = coding_type_iso2022;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2063 {
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2064 Lisp_Object val = XVECTOR (coding_system_vector)->contents[4];
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2065 Lisp_Object *flags;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2066 int i, charset, default_reg_bits = 0;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2067
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2068 if (!VECTORP (val) \|\| XVECTOR (val)->size != 32)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2069 goto label_invalid_coding_system;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2070
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2071 flags = XVECTOR (val)->contents;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2072 coding->flags
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2073 = ((NILP (flags[4]) ? 0 : CODING_FLAG_ISO_SHORT_FORM)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2074 \| (NILP (flags[5]) ? 0 : CODING_FLAG_ISO_RESET_AT_EOL)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2075 \| (NILP (flags[6]) ? 0 : CODING_FLAG_ISO_RESET_AT_CNTL)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2076 \| (NILP (flags[7]) ? 0 : CODING_FLAG_ISO_SEVEN_BITS)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2077 \| (NILP (flags[8]) ? 0 : CODING_FLAG_ISO_LOCKING_SHIFT)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2078 \| (NILP (flags[9]) ? 0 : CODING_FLAG_ISO_SINGLE_SHIFT)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2079 \| (NILP (flags[10]) ? 0 : CODING_FLAG_ISO_USE_ROMAN)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2080 \| (NILP (flags[11]) ? 0 : CODING_FLAG_ISO_USE_OLDJIS)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2081 \| (NILP (flags[12]) ? 0 : CODING_FLAG_ISO_NO_DIRECTION));
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2082
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2083 /* Invoke graphic register 0 to plane 0. */
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2084 CODING_SPEC_ISO_INVOCATION (coding, 0) = 0;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2085 /* Invoke graphic register 1 to plane 1 if we can use full 8-bit. */
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2086 CODING_SPEC_ISO_INVOCATION (coding, 1)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2087 = (coding->flags & CODING_FLAG_ISO_SEVEN_BITS ? -1 : 1);
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2088 /* Not single shifting at first. */
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2089 CODING_SPEC_ISO_SINGLE_SHIFTING(coding) = 0;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2090
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2091 /* Checks FLAGS[REG] (REG = 0, 1, 2 3) and decide designations.
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2092 FLAGS[REG] can be one of below:
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2093 integer CHARSET: CHARSET occupies register I,
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2094 t: designate nothing to REG initially, but can be used
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2095 by any charsets,
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2096 list of integer, nil, or t: designate the first
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2097 element (if integer) to REG initially, the remaining
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2098 elements (if integer) is designated to REG on request,
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2099 if an element is t, REG can be used by any charset,
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2100 nil: REG is never used. */
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2101 for (charset = 0; charset < MAX_CHARSET; charset++)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2102 CODING_SPEC_ISO_REQUESTED_DESIGNATION (coding, charset) = -1;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2103 for (i = 0; i < 4; i++)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2104 {
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2105 if (INTEGERP (flags[i])
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2106 && (charset = XINT (flags[i]), CHARSET_VALID_P (charset)))
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2107 {
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2108 CODING_SPEC_ISO_INITIAL_DESIGNATION (coding, i) = charset;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2109 CODING_SPEC_ISO_REQUESTED_DESIGNATION (coding, charset) = i;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2110 }
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2111 else if (EQ (flags[i], Qt))
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2112 {
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2113 CODING_SPEC_ISO_INITIAL_DESIGNATION (coding, i) = -1;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2114 default_reg_bits \|= 1 << i;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2115 }
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2116 else if (CONSP (flags[i]))
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2117 {
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2118 Lisp_Object tail = flags[i];
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2119
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2120 if (INTEGERP (XCONS (tail)->car)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2121 && (charset = XINT (XCONS (tail)->car),
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2122 CHARSET_VALID_P (charset)))
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2123 {
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2124 CODING_SPEC_ISO_INITIAL_DESIGNATION (coding, i) = charset;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2125 CODING_SPEC_ISO_REQUESTED_DESIGNATION (coding, charset) =i;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2126 }
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2127 else
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2128 CODING_SPEC_ISO_INITIAL_DESIGNATION (coding, i) = -1;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2129 tail = XCONS (tail)->cdr;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2130 while (CONSP (tail))
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2131 {
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2132 if (INTEGERP (XCONS (tail)->car)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2133 && (charset = XINT (XCONS (tail)->car),
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2134 CHARSET_VALID_P (charset)))
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2135 CODING_SPEC_ISO_REQUESTED_DESIGNATION (coding, charset)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2136 = i;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2137 else if (EQ (XCONS (tail)->car, Qt))
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2138 default_reg_bits \|= 1 << i;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2139 tail = XCONS (tail)->cdr;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2140 }
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2141 }
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2142 else
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2143 CODING_SPEC_ISO_INITIAL_DESIGNATION (coding, i) = -1;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2144
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2145 CODING_SPEC_ISO_DESIGNATION (coding, i)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2146 = CODING_SPEC_ISO_INITIAL_DESIGNATION (coding, i);
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2147 }
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2148
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2149 if (! (coding->flags & CODING_FLAG_ISO_LOCKING_SHIFT))
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2150 {
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2151 /* REG 1 can be used only by locking shift in 7-bit env. */
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2152 if (coding->flags & CODING_FLAG_ISO_SEVEN_BITS)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2153 default_reg_bits &= ~2;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2154 if (! (coding->flags & CODING_FLAG_ISO_SINGLE_SHIFT))
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2155 /* Without any shifting, only REG 0 and 1 can be used. */
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2156 default_reg_bits &= 3;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2157 }
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2158
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2159 for (charset = 0; charset < MAX_CHARSET; charset++)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2160 if (CHARSET_VALID_P (charset)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2161 && CODING_SPEC_ISO_REQUESTED_DESIGNATION (coding, charset) < 0)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2162 {
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2163 /* We have not yet decided where to designate CHARSET. */
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2164 int reg_bits = default_reg_bits;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2165
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2166 if (CHARSET_CHARS (charset) == 96)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2167 /* A charset of CHARS96 can't be designated to REG 0. */
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2168 reg_bits &= ~1;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2169
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2170 if (reg_bits)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2171 /* There exist some default graphic register. */
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2172 CODING_SPEC_ISO_REQUESTED_DESIGNATION (coding, charset)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2173 = (reg_bits & 1
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2174 ? 0 : (reg_bits & 2 ? 1 : (reg_bits & 4 ? 2 : 3)));
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2175 else
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2176 /* We anyway have to designate CHARSET to somewhere. */
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2177 CODING_SPEC_ISO_REQUESTED_DESIGNATION (coding, charset)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2178 = (CHARSET_CHARS (charset) == 94
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2179 ? 0
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2180 : ((coding->flags & CODING_FLAG_ISO_LOCKING_SHIFT
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2181 \|\| ! coding->flags & CODING_FLAG_ISO_SEVEN_BITS)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2182 ? 1
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2183 : (coding->flags & CODING_FLAG_ISO_SINGLE_SHIFT
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2184 ? 2 : 0)));
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2185 }
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2186 }
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2187 coding->require_flushing = 1;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2188 break;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2189
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2190 case 3:
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2191 coding->type = coding_type_big5;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2192 coding->flags
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2193 = (NILP (XVECTOR (coding_system_vector)->contents[4])
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2194 ? CODING_FLAG_BIG5_HKU
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2195 : CODING_FLAG_BIG5_ETEN);
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2196 break;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2197
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2198 case 4:
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2199 coding->type = coding_type_ccl;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2200 {
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2201 Lisp_Object val = XVECTOR (coding_system_vector)->contents[4];
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2202 if (CONSP (val)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2203 && VECTORP (XCONS (val)->car)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2204 && VECTORP (XCONS (val)->cdr))
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2205 {
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2206 setup_ccl_program (&(coding->spec.ccl.decoder), XCONS (val)->car);
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2207 setup_ccl_program (&(coding->spec.ccl.encoder), XCONS (val)->cdr);
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2208 }
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2209 else
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2210 goto label_invalid_coding_system;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2211 }
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2212 coding->require_flushing = 1;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2213 break;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2214
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2215 default:
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2216 if (EQ (type, Qt))
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2217 coding->type = coding_type_automatic;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2218 else
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2219 coding->type = coding_type_no_conversion;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2220 break;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2221 }
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2222 return 0;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2223
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2224 label_invalid_coding_system:
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2225 coding->type = coding_type_no_conversion;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2226 return -1;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2227 }
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2228
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2229 /* Emacs has a mechanism to automatically detect a coding system if it
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2230 is one of Emacs' internal format, ISO2022, SJIS, and BIG5. But,
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2231 it's impossible to distinguish some coding systems accurately
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2232 because they use the same range of codes. So, at first, coding
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2233 systems are categorized into 7, those are:
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2234
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2235 o coding-category-internal
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2236
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2237 The category for a coding system which has the same code range
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2238 as Emacs' internal format. Assigned the coding-system (Lisp
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2239 symbol) `coding-system-internal' by default.
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2240
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2241 o coding-category-sjis
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2242
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2243 The category for a coding system which has the same code range
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2244 as SJIS. Assigned the coding-system (Lisp
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2245 symbol) `coding-system-sjis' by default.
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2246
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2247 o coding-category-iso-7
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2248
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2249 The category for a coding system which has the same code range
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2250 as ISO2022 of 7-bit environment. Assigned the coding-system
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2251 (Lisp symbol) `coding-system-junet' by default.
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2252
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2253 o coding-category-iso-8-1
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2254
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2255 The category for a coding system which has the same code range
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2256 as ISO2022 of 8-bit environment and graphic plane 1 used only
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2257 for DIMENSION1 charset. Assigned the coding-system (Lisp
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2258 symbol) `coding-system-ctext' by default.
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2259
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2260 o coding-category-iso-8-2
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2261
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2262 The category for a coding system which has the same code range
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2263 as ISO2022 of 8-bit environment and graphic plane 1 used only
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2264 for DIMENSION2 charset. Assigned the coding-system (Lisp
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2265 symbol) `coding-system-euc-japan' by default.
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2266
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2267 o coding-category-iso-else
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2268
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2269 The category for a coding system which has the same code range
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2270 as ISO2022 but not belongs to any of the above three
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2271 categories. Assigned the coding-system (Lisp symbol)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2272 `coding-system-iso-2022-ss2-7' by default.
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2273
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2274 o coding-category-big5
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2275
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2276 The category for a coding system which has the same code range
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2277 as BIG5. Assigned the coding-system (Lisp symbol)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2278 `coding-system-big5' by default.
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2279
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2280 o coding-category-binary
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2281
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2282 The category for a coding system not categorized in any of the
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2283 above. Assigned the coding-system (Lisp symbol)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2284 `coding-system-noconv' by default.
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2285
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2286 Each of them is a Lisp symbol and the value is an actual
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2287 `coding-system's (this is also a Lisp symbol) assigned by a user.
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2288 What Emacs does actually is to detect a category of coding system.
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2289 Then, it uses a `coding-system' assigned to it. If Emacs can't
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2290 decide only one possible category, it selects a category of the
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2291 highest priority. Priorities of categories are also specified by a
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2292 user in a Lisp variable `coding-category-list'.
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2293
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2294 */
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2295
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2296 /* Detect how a text of length SRC_BYTES pointed by SRC is encoded.
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2297 If it detects possible coding systems, return an integer in which
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2298 appropriate flag bits are set. Flag bits are defined by macros
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2299 CODING_CATEGORY_MASK_XXX in `coding.h'. */
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2300
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2301 int
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2302 detect_coding_mask (src, src_bytes)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2303 unsigned char *src;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2304 int src_bytes;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2305 {
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2306 register unsigned char c;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2307 unsigned char *src_end = src + src_bytes;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2308 int mask;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2309
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2310 /* At first, skip all ASCII characters and control characters except
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2311 for three ISO2022 specific control characters. */
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2312 while (src < src_end)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2313 {
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2314 c = *src;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2315 if (c >= 0x80
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2316 \|\| (c == ISO_CODE_ESC \|\| c == ISO_CODE_SI \|\| c == ISO_CODE_SO))
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2317 break;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2318 src++;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2319 }
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2320
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2321 if (src >= src_end)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2322 /* We found nothing other than ASCII. There's nothing to do. */
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2323 return CODING_CATEGORY_MASK_ANY;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2324
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2325 /* The text seems to be encoded in some multilingual coding system.
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2326 Now, try to find in which coding system the text is encoded. */
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2327 if (c < 0x80)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2328 /* i.e. (c == ISO_CODE_ESC \|\| c == ISO_CODE_SI \|\| c == ISO_CODE_SO) */
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2329 /* C is an ISO2022 specific control code of C0. */
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2330 mask = detect_coding_iso2022 (src, src_end);
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2331
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2332 else if (c == ISO_CODE_SS2 \|\| c == ISO_CODE_SS3 \|\| c == ISO_CODE_CSI)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2333 /* C is an ISO2022 specific control code of C1,
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2334 or the first byte of SJIS's 2-byte character code,
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2335 or a leading code of Emacs. */
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2336 mask = (detect_coding_iso2022 (src, src_end)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2337 \| detect_coding_sjis (src, src_end)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2338 \| detect_coding_internal (src, src_end));
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2339
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2340 else if (c < 0xA0)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2341 /* C is the first byte of SJIS character code,
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2342 or a leading-code of Emacs. */
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2343 mask = (detect_coding_sjis (src, src_end)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2344 \| detect_coding_internal (src, src_end));
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2345
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2346 else
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2347 /* C is a character of ISO2022 in graphic plane right,
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2348 or a SJIS's 1-byte character code (i.e. JISX0201),
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2349 or the first byte of BIG5's 2-byte code. */
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2350 mask = (detect_coding_iso2022 (src, src_end)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2351 \| detect_coding_sjis (src, src_end)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2352 \| detect_coding_big5 (src, src_end));
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2353
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2354 return mask;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2355 }
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2356
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2357 /* Detect how a text of length SRC_BYTES pointed by SRC is encoded.
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2358 The information of the detected coding system is set in CODING. */
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2359
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2360 void
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2361 detect_coding (coding, src, src_bytes)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2362 struct coding_system *coding;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2363 unsigned char *src;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2364 int src_bytes;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2365 {
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2366 int mask = detect_coding_mask (src, src_bytes);
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2367 int idx;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2368
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2369 if (mask == CODING_CATEGORY_MASK_ANY)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2370 /* We found nothing other than ASCII. There's nothing to do. */
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2371 return;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2372
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2373 if (!mask)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2374 /* The source text seems to be encoded in unknown coding system.
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2375 Emacs regards the category of such a kind of coding system as
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2376 `coding-category-binary'. We assume that a user has assigned
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2377 an appropriate coding system for a `coding-category-binary'. */
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2378 idx = CODING_CATEGORY_IDX_BINARY;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2379 else
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2380 {
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2381 /* We found some plausible coding systems. Let's use a coding
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2382 system of the highest priority. */
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2383 Lisp_Object val = Vcoding_category_list;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2384
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2385 if (CONSP (val))
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2386 while (!NILP (val))
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2387 {
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2388 idx = XFASTINT (Fget (XCONS (val)->car, Qcoding_category_index));
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2389 if ((idx < CODING_CATEGORY_IDX_MAX) && (mask & (1 << idx)))
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2390 break;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2391 val = XCONS (val)->cdr;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2392 }
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2393 else
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2394 val = Qnil;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2395
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2396 if (NILP (val))
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2397 {
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2398 /* For unknown reason, `Vcoding_category_list' contains none
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2399 of found categories. Let's use any of them. */
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2400 for (idx = 0; idx < CODING_CATEGORY_IDX_MAX; idx++)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2401 if (mask & (1 << idx))
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2402 break;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2403 }
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2404 }
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2405 setup_coding_system (XSYMBOL (coding_category_table[idx])->value, coding);
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2406 }
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2407
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2408 /* Detect how end-of-line of a text of length SRC_BYTES pointed by SRC
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2409 is encoded. Return one of CODING_EOL_LF, CODING_EOL_CRLF,
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2410 CODING_EOL_CR, and CODING_EOL_AUTOMATIC. */
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2411
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2412 int
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2413 detect_eol_type (src, src_bytes)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2414 unsigned char *src;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2415 int src_bytes;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2416 {
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2417 unsigned char *src_end = src + src_bytes;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2418 unsigned char c;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2419
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2420 while (src < src_end)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2421 {
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2422 c = *src++;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2423 if (c == '\n')
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2424 return CODING_EOL_LF;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2425 else if (c == '\r')
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2426 {
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2427 if (src < src_end && *src == '\n')
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2428 return CODING_EOL_CRLF;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2429 else
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2430 return CODING_EOL_CR;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2431 }
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2432 }
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2433 return CODING_EOL_AUTOMATIC;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2434 }
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2435
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2436 /* Detect how end-of-line of a text of length SRC_BYTES pointed by SRC
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2437 is encoded. If it detects an appropriate format of end-of-line, it
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2438 sets the information in CODING. /
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2439
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2440 void
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2441 detect_eol (coding, src, src_bytes)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2442 struct coding_system *coding;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2443 unsigned char *src;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2444 int src_bytes;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2445 {
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2446 Lisp_Object val;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2447 int eol_type = detect_eol_type (src, src_bytes);
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2448
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2449 if (eol_type == CODING_EOL_AUTOMATIC)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2450 /* We found no end-of-line in the source text. */
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2451 return;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2452
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2453 val = Fget (coding->symbol, Qeol_type);
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2454 if (VECTORP (val) && XVECTOR (val)->size == 3)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2455 setup_coding_system (XVECTOR (val)->contents[eol_type], coding);
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2456 }
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2457
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2458 /* See "GENERAL NOTES about `decode_coding_XXX ()' functions". Before
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2459 decoding, it may detect coding system and format of end-of-line if
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2460 those are not yet decided. */
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2461
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2462 int
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2463 decode_coding (coding, source, destination, src_bytes, dst_bytes, consumed)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2464 struct coding_system *coding;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2465 unsigned char source, destination;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2466 int src_bytes, dst_bytes;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2467 int *consumed;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2468 {
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2469 int produced;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2470
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2471 if (src_bytes <= 0)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2472 {
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2473 *consumed = 0;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2474 return 0;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2475 }
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2476
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2477 if (coding->type == coding_type_automatic)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2478 detect_coding (coding, source, src_bytes);
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2479
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2480 if (coding->eol_type == CODING_EOL_AUTOMATIC)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2481 detect_eol (coding, source, src_bytes);
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2482
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2483 coding->carryover_size = 0;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2484 switch (coding->type)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2485 {
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2486 case coding_type_no_conversion:
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2487 label_no_conversion:
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2488 produced = (src_bytes > dst_bytes) ? dst_bytes : src_bytes;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2489 bcopy (source, destination, produced);
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2490 *consumed = produced;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2491 break;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2492
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2493 case coding_type_internal:
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2494 case coding_type_automatic:
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2495 if (coding->eol_type == CODING_EOL_LF
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2496 \|\| coding->eol_type == CODING_EOL_AUTOMATIC)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2497 goto label_no_conversion;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2498 produced = decode_eol (coding, source, destination,
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2499 src_bytes, dst_bytes, consumed);
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2500 break;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2501
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2502 case coding_type_sjis:
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2503 produced = decode_coding_sjis_big5 (coding, source, destination,
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2504 src_bytes, dst_bytes, consumed,
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2505 1);
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2506 break;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2507
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2508 case coding_type_iso2022:
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2509 produced = decode_coding_iso2022 (coding, source, destination,
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2510 src_bytes, dst_bytes, consumed);
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2511 break;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2512
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2513 case coding_type_big5:
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2514 produced = decode_coding_sjis_big5 (coding, source, destination,
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2515 src_bytes, dst_bytes, consumed,
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2516 0);
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2517 break;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2518
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2519 case coding_type_ccl:
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2520 produced = ccl_driver (&coding->spec.ccl.decoder, source, destination,
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2521 src_bytes, dst_bytes, consumed);
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2522 break;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2523 }
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2524
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2525 return produced;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2526 }
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2527
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2528 /* See "GENERAL NOTES about `encode_coding_XXX ()' functions". */
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2529
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2530 int
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2531 encode_coding (coding, source, destination, src_bytes, dst_bytes, consumed)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2532 struct coding_system *coding;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2533 unsigned char source, destination;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2534 int src_bytes, dst_bytes;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2535 int *consumed;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2536 {
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2537 int produced;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2538
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2539 coding->carryover_size = 0;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2540 switch (coding->type)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2541 {
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2542 case coding_type_no_conversion:
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2543 label_no_conversion:
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2544 produced = (src_bytes > dst_bytes) ? dst_bytes : src_bytes;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2545 if (produced > 0)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2546 {
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2547 bcopy (source, destination, produced);
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2548 if (coding->selective)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2549 {
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2550 unsigned char p = destination, pend = destination + produced;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2551 while (p < pend)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2552 if (*p++ = '\015') p[-1] = '\n';
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2553 }
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2554 }
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2555 *consumed = produced;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2556 break;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2557
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2558 case coding_type_internal:
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2559 case coding_type_automatic:
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2560 if (coding->eol_type == CODING_EOL_LF
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2561 \|\| coding->eol_type == CODING_EOL_AUTOMATIC)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2562 goto label_no_conversion;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2563 produced = encode_eol (coding, source, destination,
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2564 src_bytes, dst_bytes, consumed);
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2565 break;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2566
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2567 case coding_type_sjis:
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2568 produced = encode_coding_sjis_big5 (coding, source, destination,
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2569 src_bytes, dst_bytes, consumed,
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2570 1);
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2571 break;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2572
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2573 case coding_type_iso2022:
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2574 produced = encode_coding_iso2022 (coding, source, destination,
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2575 src_bytes, dst_bytes, consumed);
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2576 break;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2577
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2578 case coding_type_big5:
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2579 produced = encode_coding_sjis_big5 (coding, source, destination,
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2580 src_bytes, dst_bytes, consumed,
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2581 0);
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2582 break;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2583
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2584 case coding_type_ccl:
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2585 produced = ccl_driver (&coding->spec.ccl.encoder, source, destination,
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2586 src_bytes, dst_bytes, consumed);
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2587 break;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2588 }
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2589
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2590 return produced;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2591 }
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2592
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2593 #define CONVERSION_BUFFER_EXTRA_ROOM 256
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2594
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2595 /* Return maximum size (bytes) of a buffer enough for decoding
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2596 SRC_BYTES of text encoded in CODING. */
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2597
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2598 int
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2599 decoding_buffer_size (coding, src_bytes)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2600 struct coding_system *coding;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2601 int src_bytes;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2602 {
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2603 int magnification;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2604
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2605 if (coding->type == coding_type_iso2022)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2606 magnification = 3;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2607 else if (coding->type == coding_type_ccl)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2608 magnification = coding->spec.ccl.decoder.buf_magnification;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2609 else
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2610 magnification = 2;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2611
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2612 return (src_bytes * magnification + CONVERSION_BUFFER_EXTRA_ROOM);
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2613 }
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2614
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2615 /* Return maximum size (bytes) of a buffer enough for encoding
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2616 SRC_BYTES of text to CODING. */
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2617
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2618 int
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2619 encoding_buffer_size (coding, src_bytes)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2620 struct coding_system *coding;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2621 int src_bytes;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2622 {
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2623 int magnification;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2624
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2625 if (coding->type == coding_type_ccl)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2626 magnification = coding->spec.ccl.encoder.buf_magnification;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2627 else
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2628 magnification = 3;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2629
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2630 return (src_bytes * magnification + CONVERSION_BUFFER_EXTRA_ROOM);
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2631 }
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2632
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2633 #ifndef MINIMUM_CONVERSION_BUFFER_SIZE
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2634 #define MINIMUM_CONVERSION_BUFFER_SIZE 1024
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2635 #endif
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2636
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2637 char *conversion_buffer;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2638 int conversion_buffer_size;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2639
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2640 /* Return a pointer to a SIZE bytes of buffer to be used for encoding
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2641 or decoding. Sufficient memory is allocated automatically. If we
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2642 run out of memory, return NULL. */
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2643
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2644 char *
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2645 get_conversion_buffer (size)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2646 int size;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2647 {
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2648 if (size > conversion_buffer_size)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2649 {
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2650 char *buf;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2651 int real_size = conversion_buffer_size * 2;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2652
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2653 while (real_size < size) real_size *= 2;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2654 buf = (char *) xmalloc (real_size);
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2655 xfree (conversion_buffer);
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2656 conversion_buffer = buf;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2657 conversion_buffer_size = real_size;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2658 }
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2659 return conversion_buffer;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2660 }
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2661
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2662
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2663 #ifdef emacs
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2664 /* 7. Emacs Lisp library functions */
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2665
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2666 DEFUN ("coding-system-vector", Fcoding_system_vector, Scoding_system_vector,
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2667 1, 1, 0,
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2668 "Return coding-vector of CODING-SYSTEM.\n\
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2669 If CODING-SYSTEM is not a valid coding-system, return nil.")
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2670 (obj)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2671 Lisp_Object obj;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2672 {
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2673 while (SYMBOLP (obj) && !NILP (obj))
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2674 obj = Fget (obj, Qcoding_system);
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2675 return ((NILP (obj) \|\| !VECTORP (obj) \|\| XVECTOR (obj)->size != 5)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2676 ? Qnil : obj);
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2677 }
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2678
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2679 DEFUN ("coding-system-p", Fcoding_system_p, Scoding_system_p, 1, 1, 0,
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2680 "Return t if OBJECT is nil or a coding-system.\n\
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2681 See document of make-coding-system for coding-system object.")
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2682 (obj)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2683 Lisp_Object obj;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2684 {
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2685 return ((NILP (obj) \|\| !NILP (Fcoding_system_vector (obj))) ? Qt : Qnil);
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2686 }
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2687
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2688 DEFUN ("read-non-nil-coding-system",
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2689 Fread_non_nil_coding_system, Sread_non_nil_coding_system, 1, 1, 0,
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2690 "Read a coding-system from the minibuffer, prompting with string PROMPT.")
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2691 (prompt)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2692 Lisp_Object prompt;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2693 {
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2694 return Fintern (Fcompleting_read (prompt, Vobarray, Qcoding_system_vector,
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2695 Qt, Qnil, Qnil),
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2696 Qnil);
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2697 }
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2698
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2699 DEFUN ("read-coding-system", Fread_coding_system, Sread_coding_system, 1, 1, 0,
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2700 "Read a coding-system or nil from the minibuffer, prompting with string PROMPT.")
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2701 (prompt)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2702 Lisp_Object prompt;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2703 {
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2704 return Fintern (Fcompleting_read (prompt, Vobarray, Qcoding_system_p,
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2705 Qt, Qnil, Qnil),
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2706 Qnil);
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2707 }
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2708
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2709 DEFUN ("check-coding-system", Fcheck_coding_system, Scheck_coding_system,
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2710 1, 1, 0,
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2711 "Check validity of CODING-SYSTEM.\n\
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2712 If valid, return CODING-SYSTEM, else `coding-system-error' is signaled.\n\
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2713 CODING-SYSTEM is valid if it is a symbol and has \"coding-system\" property.\n\
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2714 The value of property should be a vector of length 5.")
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2715 (coding_system)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2716 Lisp_Object coding_system;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2717 {
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2718 CHECK_SYMBOL (coding_system, 0);
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2719 if (!NILP (Fcoding_system_p (coding_system)))
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2720 return coding_system;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2721 while (1)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2722 Fsignal (Qcoding_system_error, coding_system);
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2723 }
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2724
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2725 DEFUN ("detect-coding-region", Fdetect_coding_region, Sdetect_coding_region,
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2726 2, 2, 0,
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2727 "Detect coding-system of the text in the region between START and END.\n\
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2728 Return a list of possible coding-systems ordered by priority.\n\
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2729 If only ASCII characters are found, it returns `coding-system-automatic'\n\
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2730 or its subsidiary coding-system according to a detected end-of-line format.")
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2731 (b, e)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2732 Lisp_Object b, e;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2733 {
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2734 int coding_mask, eol_type;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2735 Lisp_Object val;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2736 int beg, end;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2737
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2738 validate_region (&b, &e);
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2739 beg = XINT (b), end = XINT (e);
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2740 if (beg < GPT && end >= GPT) move_gap (end);
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2741
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2742 coding_mask = detect_coding_mask (POS_ADDR (beg), end - beg);
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2743 eol_type = detect_eol_type (POS_ADDR (beg), end - beg);
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2744
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2745 if (coding_mask == CODING_CATEGORY_MASK_ANY)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2746 {
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2747 val = intern ("coding-system-automatic");
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2748 if (eol_type != CODING_EOL_AUTOMATIC)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2749 {
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2750 Lisp_Object val2 = Fget (val, Qeol_type);
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2751 if (VECTORP (val2))
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2752 val = XVECTOR (val2)->contents[eol_type];
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2753 }
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2754 }
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2755 else
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2756 {
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2757 Lisp_Object val2;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2758
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2759 /* At first, gather possible coding-systems in VAL in a reverse
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2760 order. */
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2761 val = Qnil;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2762 for (val2 = Vcoding_category_list;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2763 !NILP (val2);
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2764 val2 = XCONS (val2)->cdr)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2765 {
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2766 int idx
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2767 = XFASTINT (Fget (XCONS (val2)->car, Qcoding_category_index));
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2768 if (coding_mask & (1 << idx))
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2769 val = Fcons (Fsymbol_value (XCONS (val2)->car), val);
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2770 }
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2771
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2772 /* Then, change the order of the list, while getting subsidiary
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2773 coding-systems. */
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2774 val2 = val;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2775 val = Qnil;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2776 for (; !NILP (val2); val2 = XCONS (val2)->cdr)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2777 {
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2778 if (eol_type == CODING_EOL_AUTOMATIC)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2779 val = Fcons (XCONS (val2)->car, val);
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2780 else
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2781 {
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2782 Lisp_Object val3 = Fget (XCONS (val2)->car, Qeol_type);
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2783 if (VECTORP (val3))
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2784 val = Fcons (XVECTOR (val3)->contents[eol_type], val);
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2785 else
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2786 val = Fcons (XCONS (val2)->car, val);
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2787 }
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2788 }
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2789 }
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2790
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2791 return val;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2792 }
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2793
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2794 /* Scan text in the region between BEGP and ENDP, skip characters
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2795 which we never have to encode to (iff ENCODEP is 1) or decode from
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2796 coding system CODING at the head and tail, then set BEGP and ENDP
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2797 to the addresses of start and end of the text we actually convert. */
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2798
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2799 void
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2800 shrink_conversion_area (begp, endp, coding, encodep)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2801 unsigned char begp, endp;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2802 struct coding_system *coding;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2803 int encodep;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2804 {
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2805 register unsigned char beg_addr = begp, end_addr = endp;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2806
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2807 if (coding->eol_type != CODING_EOL_LF
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2808 && coding->eol_type != CODING_EOL_AUTOMATIC)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2809 /* Since we anyway have to convert end-of-line format, it is not
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2810 worth skipping at most 100 bytes or so. */
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2811 return;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2812
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2813 if (encodep) /* for encoding */
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2814 {
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2815 switch (coding->type)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2816 {
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2817 case coding_type_no_conversion:
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2818 case coding_type_internal:
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2819 case coding_type_automatic:
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2820 /* We need no conversion. */
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2821 begp = endp;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2822 return;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2823 case coding_type_ccl:
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2824 /* We can't skip any data. */
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2825 return;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2826 default:
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2827 /* We can skip all ASCII characters at the head and tail. */
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2828 while (beg_addr < end_addr && *beg_addr < 0x80) beg_addr++;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2829 while (beg_addr < end_addr && *(end_addr - 1) < 0x80) end_addr--;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2830 break;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2831 }
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2832 }
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2833 else /* for decoding */
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2834 {
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2835 switch (coding->type)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2836 {
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2837 case coding_type_no_conversion:
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2838 /* We need no conversion. */
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2839 begp = endp;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2840 return;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2841 case coding_type_internal:
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2842 if (coding->eol_type == CODING_EOL_LF)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2843 {
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2844 /* We need no conversion. */
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2845 begp = endp;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2846 return;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2847 }
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2848 /* We can skip all but carriage-return. */
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2849 while (beg_addr < end_addr && *beg_addr != '\r') beg_addr++;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2850 while (beg_addr < end_addr && *(end_addr - 1) != '\r') end_addr--;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2851 break;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2852 case coding_type_sjis:
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2853 case coding_type_big5:
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2854 /* We can skip all ASCII characters at the head. */
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2855 while (beg_addr < end_addr && *beg_addr < 0x80) beg_addr++;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2856 /* We can skip all ASCII characters at the tail except for
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2857 the second byte of SJIS or BIG5 code. */
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2858 while (beg_addr < end_addr && *(end_addr - 1) < 0x80) end_addr--;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2859 if (end_addr != *endp)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2860 end_addr++;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2861 break;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2862 case coding_type_ccl:
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2863 /* We can't skip any data. */
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2864 return;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2865 default: /* i.e. case coding_type_iso2022: */
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2866 {
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2867 unsigned char c;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2868
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2869 /* We can skip all ASCII characters except for a few
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2870 control codes at the head. */
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2871 while (beg_addr < end_addr && (c = *beg_addr) < 0x80
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2872 && c != ISO_CODE_CR && c != ISO_CODE_SO
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2873 && c != ISO_CODE_SI && c != ISO_CODE_ESC)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2874 beg_addr++;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2875 }
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2876 break;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2877 }
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2878 }
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2879 *begp = beg_addr;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2880 *endp = end_addr;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2881 return;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2882 }
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2883
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2884 /* Encode to (iff ENCODEP is 1) or decode form coding system CODING a
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2885 text between B and E. B and E are buffer position. */
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2886
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2887 Lisp_Object
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2888 code_convert_region (b, e, coding, encodep)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2889 Lisp_Object b, e;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2890 struct coding_system *coding;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2891 int encodep;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2892 {
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2893 int beg, end, len, consumed, produced;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2894 char *buf;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2895 unsigned char begp, endp;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2896 int pos = PT;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2897
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2898 validate_region (&b, &e);
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2899 beg = XINT (b), end = XINT (e);
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2900 if (beg < GPT && end >= GPT)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2901 move_gap (end);
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2902
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2903 if (encodep && !NILP (coding->pre_write_conversion))
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2904 {
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2905 /* We must call a pre-conversion function which may put a new
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2906 text to be converted in a new buffer. */
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2907 struct buffer old = current_buffer, new;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2908
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2909 TEMP_SET_PT (beg);
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2910 call2 (coding->pre_write_conversion, b, e);
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2911 if (old != current_buffer)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2912 {
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2913 /* Replace the original text by the text just generated. */
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2914 len = ZV - BEGV;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2915 new = current_buffer;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2916 set_buffer_internal (old);
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2917 del_range (beg, end);
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2918 insert_from_buffer (new, 1, len, 0);
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2919 end = beg + len;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2920 }
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2921 }
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2922
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2923 /* We may be able to shrink the conversion region. */
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2924 begp = POS_ADDR (beg); endp = begp + (end - beg);
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2925 shrink_conversion_area (&begp, &endp, coding, encodep);
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2926
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2927 if (begp == endp)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2928 /* We need no conversion. */
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2929 len = end - beg;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2930 else
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2931 {
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2932 beg += begp - POS_ADDR (beg);
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2933 end = beg + (endp - begp);
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2934
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2935 if (encodep)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2936 len = encoding_buffer_size (coding, end - beg);
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2937 else
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2938 len = decoding_buffer_size (coding, end - beg);
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2939 buf = get_conversion_buffer (len);
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2940
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2941 coding->last_block = 1;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2942 produced = (encodep
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2943 ? encode_coding (coding, POS_ADDR (beg), buf, end - beg, len,
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2944 &consumed)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2945 : decode_coding (coding, POS_ADDR (beg), buf, end - beg, len,
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2946 &consumed));
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2947
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2948 len = produced + (beg - XINT (b)) + (XINT (e) - end);
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2949
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2950 TEMP_SET_PT (beg);
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2951 insert (buf, produced);
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2952 del_range (PT, PT + end - beg);
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2953 if (pos >= end)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2954 pos = PT + (pos - end);
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2955 else if (pos > beg)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2956 pos = beg;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2957 TEMP_SET_PT (pos);
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2958 }
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2959
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2960 if (!encodep && !NILP (coding->post_read_conversion))
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2961 {
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2962 /* We must call a post-conversion function which may alter
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2963 the text just converted. */
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2964 Lisp_Object insval;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2965
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2966 beg = XINT (b);
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2967 TEMP_SET_PT (beg);
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2968 insval = call1 (coding->post_read_conversion, make_number (len));
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2969 CHECK_NUMBER (insval, 0);
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2970 len = XINT (insval);
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2971 }
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2972
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2973 return make_number (len);
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2974 }
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2975
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2976 Lisp_Object
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2977 code_convert_string (str, coding, encodep)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2978 Lisp_Object str;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2979 struct coding_system *coding;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2980 int encodep;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2981 {
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2982 int len, consumed, produced;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2983 char *buf;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2984 unsigned char begp, endp;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2985 int head_skip, tail_skip;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2986 struct gcpro gcpro1;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2987
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2988 if (encodep && !NILP (coding->pre_write_conversion)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2989 \|\| !encodep && !NILP (coding->post_read_conversion))
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2990 {
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2991 /* Since we have to call Lisp functions which assume target text
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2992 is in a buffer, after setting a temporary buffer, call
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2993 code_convert_region. */
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2994 int count = specpdl_ptr - specpdl;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2995 int len = XSTRING (str)->size;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2996 Lisp_Object result;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2997 struct buffer *old = current_buffer;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2998
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	2999 record_unwind_protect (Fset_buffer, Fcurrent_buffer ());
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3000 temp_output_buffer_setup (" code-converting-work");
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3001 set_buffer_internal (XBUFFER (Vstandard_output));
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3002 insert_from_string (str, 0, len, 0);
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3003 code_convert_region (make_number (BEGV), make_number (ZV),
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3004 coding, encodep);
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3005 result = make_buffer_string (BEGV, ZV, 0);
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3006 set_buffer_internal (old);
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3007 return unbind_to (count, result);
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3008 }
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3009
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3010 /* We may be able to shrink the conversion region. */
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3011 begp = XSTRING (str)->data;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3012 endp = begp + XSTRING (str)->size;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3013 shrink_conversion_area (&begp, &endp, coding, encodep);
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3014
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3015 if (begp == endp)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3016 /* We need no conversion. */
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3017 return str;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3018
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3019 head_skip = begp - XSTRING (str)->data;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3020 tail_skip = XSTRING (str)->size - head_skip - (endp - begp);
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3021
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3022 GCPRO1 (str);
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3023
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3024 if (encodep)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3025 len = encoding_buffer_size (coding, endp - begp);
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3026 else
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3027 len = decoding_buffer_size (coding, endp - begp);
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3028 buf = get_conversion_buffer (len + head_skip + tail_skip);
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3029
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3030 bcopy (XSTRING (str)->data, buf, head_skip);
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3031 coding->last_block = 1;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3032 produced = (encodep
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3033 ? encode_coding (coding, XSTRING (str)->data + head_skip,
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3034 buf + head_skip, endp - begp, len, &consumed)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3035 : decode_coding (coding, XSTRING (str)->data + head_skip,
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3036 buf + head_skip, endp - begp, len, &consumed));
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3037 bcopy (XSTRING (str)->data + head_skip + (endp - begp),
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3038 buf + head_skip + produced,
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3039 tail_skip);
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3040
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3041 UNGCPRO;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3042
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3043 return make_string (buf, head_skip + produced + tail_skip);
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3044 }
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3045
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3046 DEFUN ("decode-coding-region", Fdecode_coding_region, Sdecode_coding_region,
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3047 3, 3, 0,
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3048 "Decode the text between START and END which is encoded in CODING-SYSTEM.\n\
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3049 Return length of decoded text.")
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3050 (b, e, coding_system)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3051 Lisp_Object b, e, coding_system;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3052 {
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3053 struct coding_system coding;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3054
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3055 CHECK_NUMBER_COERCE_MARKER (b, 0);
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3056 CHECK_NUMBER_COERCE_MARKER (e, 1);
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3057 CHECK_SYMBOL (coding_system, 2);
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3058
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3059 if (setup_coding_system (Fcheck_coding_system (coding_system), &coding) < 0)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3060 error ("Invalid coding-system: %s", XSYMBOL (coding_system)->name->data);
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3061
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3062 return code_convert_region (b, e, &coding, 0);
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3063 }
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3064
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3065 DEFUN ("encode-coding-region", Fencode_coding_region, Sencode_coding_region,
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3066 3, 3, 0,
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3067 "Encode the text between START and END to CODING-SYSTEM.\n\
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3068 Return length of encoded text.")
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3069 (b, e, coding_system)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3070 Lisp_Object b, e, coding_system;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3071 {
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3072 struct coding_system coding;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3073
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3074 CHECK_NUMBER_COERCE_MARKER (b, 0);
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3075 CHECK_NUMBER_COERCE_MARKER (e, 1);
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3076 CHECK_SYMBOL (coding_system, 2);
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3077
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3078 if (setup_coding_system (Fcheck_coding_system (coding_system), &coding) < 0)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3079 error ("Invalid coding-system: %s", XSYMBOL (coding_system)->name->data);
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3080
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3081 return code_convert_region (b, e, &coding, 1);
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3082 }
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3083
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3084 DEFUN ("decode-coding-string", Fdecode_coding_string, Sdecode_coding_string,
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3085 2, 2, 0,
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3086 "Decode STRING which is encoded in CODING-SYSTEM, and return the result.")
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3087 (string, coding_system)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3088 Lisp_Object string, coding_system;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3089 {
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3090 struct coding_system coding;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3091
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3092 CHECK_STRING (string, 0);
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3093 CHECK_SYMBOL (coding_system, 1);
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3094
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3095 if (setup_coding_system (Fcheck_coding_system (coding_system), &coding) < 0)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3096 error ("Invalid coding-system: %s", XSYMBOL (coding_system)->name->data);
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3097
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3098 return code_convert_string (string, &coding, 0);
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3099 }
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3100
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3101 DEFUN ("encode-coding-string", Fencode_coding_string, Sencode_coding_string,
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3102 2, 2, 0,
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3103 "Encode STRING to CODING-SYSTEM, and return the result.")
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3104 (string, coding_system)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3105 Lisp_Object string, coding_system;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3106 {
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3107 struct coding_system coding;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3108
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3109 CHECK_STRING (string, 0);
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3110 CHECK_SYMBOL (coding_system, 1);
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3111
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3112 if (setup_coding_system (Fcheck_coding_system (coding_system), &coding) < 0)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3113 error ("Invalid coding-system: %s", XSYMBOL (coding_system)->name->data);
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3114
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3115 return code_convert_string (string, &coding, 1);
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3116 }
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3117
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3118 DEFUN ("decode-sjis-char", Fdecode_sjis_char, Sdecode_sjis_char, 1, 1, 0,
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3119 "Decode a JISX0208 character of SJIS coding-system-sjis.\n\
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3120 CODE is the character code in SJIS.\n\
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3121 Return the corresponding character.")
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3122 (code)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3123 Lisp_Object code;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3124 {
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3125 unsigned char c1, c2, s1, s2;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3126 Lisp_Object val;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3127
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3128 CHECK_NUMBER (code, 0);
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3129 s1 = (XFASTINT (code)) >> 8, s2 = (XFASTINT (code)) & 0xFF;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3130 DECODE_SJIS (s1, s2, c1, c2);
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3131 XSETFASTINT (val, MAKE_NON_ASCII_CHAR (charset_jisx0208, c1, c2));
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3132 return val;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3133 }
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3134
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3135 DEFUN ("encode-sjis-char", Fencode_sjis_char, Sencode_sjis_char, 1, 1, 0,
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3136 "Encode a JISX0208 character CHAR to SJIS coding-system.\n\
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3137 Return the corresponding character code in SJIS.")
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3138 (ch)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3139 Lisp_Object ch;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3140 {
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3141 int charset;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3142 unsigned char c1, c2, s1, s2;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3143 Lisp_Object val;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3144
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3145 CHECK_NUMBER (ch, 0);
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3146 SPLIT_CHAR (XFASTINT (ch), charset, c1, c2);
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3147 if (charset == charset_jisx0208)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3148 {
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3149 ENCODE_SJIS (c1, c2, s1, s2);
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3150 XSETFASTINT (val, ((int)s1 << 8) \| s2);
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3151 }
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3152 else
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3153 XSETFASTINT (val, 0);
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3154 return val;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3155 }
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3156
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3157 DEFUN ("decode-big5-char", Fdecode_big5_char, Sdecode_big5_char, 1, 1, 0,
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3158 "Decode a Big5 character CODE of BIG5 coding-system.\n\
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3159 CODE is the character code in BIG5.\n\
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3160 Return the corresponding character.")
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3161 (code)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3162 Lisp_Object code;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3163 {
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3164 int charset;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3165 unsigned char b1, b2, c1, c2;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3166 Lisp_Object val;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3167
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3168 CHECK_NUMBER (code, 0);
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3169 b1 = (XFASTINT (code)) >> 8, b2 = (XFASTINT (code)) & 0xFF;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3170 DECODE_BIG5 (b1, b2, charset, c1, c2);
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3171 XSETFASTINT (val, MAKE_NON_ASCII_CHAR (charset, c1, c2));
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3172 return val;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3173 }
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3174
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3175 DEFUN ("encode-big5-char", Fencode_big5_char, Sencode_big5_char, 1, 1, 0,
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3176 "Encode the Big5 character CHAR to BIG5 coding-system.\n\
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3177 Return the corresponding character code in Big5.")
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3178 (ch)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3179 Lisp_Object ch;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3180 {
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3181 int charset;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3182 unsigned char c1, c2, b1, b2;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3183 Lisp_Object val;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3184
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3185 CHECK_NUMBER (ch, 0);
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3186 SPLIT_CHAR (XFASTINT (ch), charset, c1, c2);
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3187 if (charset == charset_big5_1 \|\| charset == charset_big5_2)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3188 {
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3189 ENCODE_BIG5 (charset, c1, c2, b1, b2);
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3190 XSETFASTINT (val, ((int)b1 << 8) \| b2);
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3191 }
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3192 else
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3193 XSETFASTINT (val, 0);
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3194 return val;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3195 }
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3196
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3197 DEFUN ("set-terminal-coding-system",
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3198 Fset_terminal_coding_system, Sset_terminal_coding_system, 1, 1,
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3199 "zCoding-system for terminal display: ",
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3200 "Set coding-system of your terminal to CODING-SYSTEM.\n\
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3201 All outputs to terminal are encoded to this coding-system.")
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3202 (coding_system)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3203 Lisp_Object coding_system;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3204 {
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3205 CHECK_SYMBOL (coding_system, 0);
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3206 setup_coding_system (Fcheck_coding_system (coding_system), &terminal_coding);
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3207 update_mode_lines++;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3208 if (!NILP (Finteractive_p ()))
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3209 Fredraw_display ();
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3210 return Qnil;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3211 }
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3212
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3213 DEFUN ("terminal-coding-system",
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3214 Fterminal_coding_system, Sterminal_coding_system, 0, 0, 0,
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3215 "Return coding-system of your terminal.")
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3216 ()
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3217 {
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3218 return terminal_coding.symbol;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3219 }
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3220
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3221 DEFUN ("set-keyboard-coding-system",
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3222 Fset_keyboard_coding_system, Sset_keyboard_coding_system, 1, 1,
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3223 "zCoding-system for keyboard input: ",
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3224 "Set coding-system of what is sent from terminal keyboard to CODING-SYSTEM.\n\
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3225 All inputs from terminal are decoded from this coding-system.")
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3226 (coding_system)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3227 Lisp_Object coding_system;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3228 {
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3229 CHECK_SYMBOL (coding_system, 0);
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3230 setup_coding_system (Fcheck_coding_system (coding_system), &keyboard_coding);
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3231 return Qnil;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3232 }
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3233
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3234 DEFUN ("keyboard-coding-system",
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3235 Fkeyboard_coding_system, Skeyboard_coding_system, 0, 0, 0,
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3236 "Return coding-system of what is sent from terminal keyboard.")
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3237 ()
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3238 {
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3239 return keyboard_coding.symbol;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3240 }
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3241
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3242
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3243 DEFUN ("find-coding-system", Ffind_coding_system, Sfind_coding_system,
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3244 1, MANY, 0,
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3245 "Return a cons of coding systems for I/O primitive OPERATION.\n\
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3246 Remaining arguments are for OPERATION.\n\
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3247 OPERATION is one of the following Emacs I/O primitives:\n\
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3248 For file I/O, insert-file-contents or write-region.\n\
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3249 For process I/O, call-process, call-process-region, or start-process.\n\
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3250 For network I/O, open-network-stream.\n\
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3251 For each OPERATION, TARGET is selected from the arguments as below:\n\
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3252 For file I/O, TARGET is a file name.\n\
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3253 For process I/O, TARGET is a process name.\n\
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3254 For network I/O, TARGET is a service name or a port number\n\
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3255 \n\
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3256 The return value is a cons of coding systems for decoding and encoding\n\
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3257 registered in nested alist `coding-system-alist' (which see) at a slot\n\
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3258 corresponding to OPERATION and TARGET.
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3259 If a function symbol is at the slot, return a result of the function call.\n\
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3260 The function is called with one argument, a list of all the arguments.")
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3261 (nargs, args)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3262 int nargs;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3263 Lisp_Object *args;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3264 {
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3265 Lisp_Object operation, target_idx, target, val;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3266 register Lisp_Object chain;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3267
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3268 if (nargs < 2)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3269 error ("Too few arguments");
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3270 operation = args[0];
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3271 if (!SYMBOLP (operation)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3272 \|\| !INTEGERP (target_idx = Fget (operation, Qtarget_idx)))
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3273 error ("Invalid first arguement");
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3274 if (nargs < 1 + XINT (target_idx))
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3275 error ("Too few arguments for operation: %s",
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3276 XSYMBOL (operation)->name->data);
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3277 target = args[XINT (target_idx) + 1];
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3278 if (!(STRINGP (target)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3279 \|\| (EQ (operation, Qopen_network_stream) && INTEGERP (target))))
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3280 error ("Invalid %dth argument", XINT (target_idx) + 1);
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3281
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3282 chain = Fassq (operation, Vcoding_system_alist);
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3283 if (NILP (chain))
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3284 return Qnil;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3285
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3286 for (chain = XCONS (chain)->cdr; CONSP (chain); chain = XCONS (chain)->cdr)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3287 {
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3288 Lisp_Object elt = XCONS (chain)->car;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3289
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3290 if (CONSP (elt)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3291 && ((STRINGP (target)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3292 && STRINGP (XCONS (elt)->car)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3293 && fast_string_match (XCONS (elt)->car, target) >= 0)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3294 \|\| (INTEGERP (target) && EQ (target, XCONS (elt)->car))))
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3295 return (CONSP (val = XCONS (elt)->cdr)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3296 ? val
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3297 : ((SYMBOLP (val) && Fboundp (val)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3298 ? call2 (val, Flist (nargs, args))
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3299 : Qnil)));
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3300 }
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3301 return Qnil;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3302 }
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3303
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3304 #endif /* emacs */
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3305
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3306
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3307 /* 8. Post-amble */
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3308
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3309 init_coding_once ()
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3310 {
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3311 int i;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3312
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3313 /* Emacs internal format specific initialize routine. */
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3314 for (i = 0; i <= 0x20; i++)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3315 emacs_code_class[i] = EMACS_control_code;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3316 emacs_code_class[0x0A] = EMACS_linefeed_code;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3317 emacs_code_class[0x0D] = EMACS_carriage_return_code;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3318 for (i = 0x21 ; i < 0x7F; i++)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3319 emacs_code_class[i] = EMACS_ascii_code;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3320 emacs_code_class[0x7F] = EMACS_control_code;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3321 emacs_code_class[0x80] = EMACS_leading_code_composition;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3322 for (i = 0x81; i < 0xFF; i++)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3323 emacs_code_class[i] = EMACS_invalid_code;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3324 emacs_code_class[LEADING_CODE_PRIVATE_11] = EMACS_leading_code_3;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3325 emacs_code_class[LEADING_CODE_PRIVATE_12] = EMACS_leading_code_3;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3326 emacs_code_class[LEADING_CODE_PRIVATE_21] = EMACS_leading_code_4;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3327 emacs_code_class[LEADING_CODE_PRIVATE_22] = EMACS_leading_code_4;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3328
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3329 /* ISO2022 specific initialize routine. */
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3330 for (i = 0; i < 0x20; i++)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3331 iso_code_class[i] = ISO_control_code;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3332 for (i = 0x21; i < 0x7F; i++)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3333 iso_code_class[i] = ISO_graphic_plane_0;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3334 for (i = 0x80; i < 0xA0; i++)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3335 iso_code_class[i] = ISO_control_code;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3336 for (i = 0xA1; i < 0xFF; i++)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3337 iso_code_class[i] = ISO_graphic_plane_1;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3338 iso_code_class[0x20] = iso_code_class[0x7F] = ISO_0x20_or_0x7F;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3339 iso_code_class[0xA0] = iso_code_class[0xFF] = ISO_0xA0_or_0xFF;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3340 iso_code_class[ISO_CODE_CR] = ISO_carriage_return;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3341 iso_code_class[ISO_CODE_SO] = ISO_shift_out;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3342 iso_code_class[ISO_CODE_SI] = ISO_shift_in;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3343 iso_code_class[ISO_CODE_SS2_7] = ISO_single_shift_2_7;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3344 iso_code_class[ISO_CODE_ESC] = ISO_escape;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3345 iso_code_class[ISO_CODE_SS2] = ISO_single_shift_2;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3346 iso_code_class[ISO_CODE_SS3] = ISO_single_shift_3;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3347 iso_code_class[ISO_CODE_CSI] = ISO_control_sequence_introducer;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3348
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3349 Qcoding_system = intern ("coding-system");
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3350 staticpro (&Qcoding_system);
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3351
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3352 Qeol_type = intern ("eol-type");
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3353 staticpro (&Qeol_type);
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3354
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3355 Qbuffer_file_coding_system = intern ("buffer-file-coding-system");
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3356 staticpro (&Qbuffer_file_coding_system);
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3357
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3358 Qpost_read_conversion = intern ("post-read-conversion");
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3359 staticpro (&Qpost_read_conversion);
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3360
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3361 Qpre_write_conversion = intern ("pre-write-conversion");
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3362 staticpro (&Qpre_write_conversion);
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3363
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3364 Qcoding_system_vector = intern ("coding-system-vector");
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3365 staticpro (&Qcoding_system_vector);
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3366
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3367 Qcoding_system_p = intern ("coding-system-p");
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3368 staticpro (&Qcoding_system_p);
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3369
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3370 Qcoding_system_error = intern ("coding-system-error");
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3371 staticpro (&Qcoding_system_error);
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3372
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3373 Fput (Qcoding_system_error, Qerror_conditions,
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3374 Fcons (Qcoding_system_error, Fcons (Qerror, Qnil)));
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3375 Fput (Qcoding_system_error, Qerror_message,
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3376 build_string ("Coding-system error"));
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3377
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3378 Qcoding_category_index = intern ("coding-category-index");
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3379 staticpro (&Qcoding_category_index);
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3380
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3381 {
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3382 int i;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3383 for (i = 0; i < CODING_CATEGORY_IDX_MAX; i++)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3384 {
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3385 coding_category_table[i] = intern (coding_category_name[i]);
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3386 staticpro (&coding_category_table[i]);
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3387 Fput (coding_category_table[i], Qcoding_category_index,
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3388 make_number (i));
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3389 }
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3390 }
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3391
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3392 conversion_buffer_size = MINIMUM_CONVERSION_BUFFER_SIZE;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3393 conversion_buffer = (char *) xmalloc (MINIMUM_CONVERSION_BUFFER_SIZE);
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3394
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3395 setup_coding_system (Qnil, &keyboard_coding);
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3396 setup_coding_system (Qnil, &terminal_coding);
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3397 }
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3398
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3399 #ifdef emacs
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3400
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3401 syms_of_coding ()
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3402 {
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3403 Qtarget_idx = intern ("target-idx");
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3404 staticpro (&Qtarget_idx);
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3405
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3406 Fput (Qinsert_file_contents, Qtarget_idx, make_number (0));
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3407 Fput (Qwrite_region, Qtarget_idx, make_number (2));
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3408
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3409 Qcall_process = intern ("call-process");
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3410 staticpro (&Qcall_process);
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3411 Fput (Qcall_process, Qtarget_idx, make_number (0));
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3412
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3413 Qcall_process_region = intern ("call-process-region");
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3414 staticpro (&Qcall_process_region);
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3415 Fput (Qcall_process_region, Qtarget_idx, make_number (2));
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3416
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3417 Qstart_process = intern ("start-process");
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3418 staticpro (&Qstart_process);
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3419 Fput (Qstart_process, Qtarget_idx, make_number (2));
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3420
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3421 Qopen_network_stream = intern ("open-network-stream");
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3422 staticpro (&Qopen_network_stream);
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3423 Fput (Qopen_network_stream, Qtarget_idx, make_number (3));
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3424
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3425 defsubr (&Scoding_system_vector);
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3426 defsubr (&Scoding_system_p);
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3427 defsubr (&Sread_coding_system);
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3428 defsubr (&Sread_non_nil_coding_system);
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3429 defsubr (&Scheck_coding_system);
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3430 defsubr (&Sdetect_coding_region);
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3431 defsubr (&Sdecode_coding_region);
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3432 defsubr (&Sencode_coding_region);
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3433 defsubr (&Sdecode_coding_string);
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3434 defsubr (&Sencode_coding_string);
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3435 defsubr (&Sdecode_sjis_char);
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3436 defsubr (&Sencode_sjis_char);
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3437 defsubr (&Sdecode_big5_char);
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3438 defsubr (&Sencode_big5_char);
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3439 defsubr (&Sset_terminal_coding_system);
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3440 defsubr (&Sterminal_coding_system);
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3441 defsubr (&Sset_keyboard_coding_system);
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3442 defsubr (&Skeyboard_coding_system);
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3443 defsubr (&Sfind_coding_system);
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3444
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3445 DEFVAR_LISP ("coding-category-list", &Vcoding_category_list,
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3446 "List of coding-categories (symbols) ordered by priority.");
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3447 {
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3448 int i;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3449
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3450 Vcoding_category_list = Qnil;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3451 for (i = CODING_CATEGORY_IDX_MAX - 1; i >= 0; i--)
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3452 Vcoding_category_list
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3453 = Fcons (coding_category_table[i], Vcoding_category_list);
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3454 }
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3455
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3456 DEFVAR_LISP ("coding-system-for-read", &Vcoding_system_for_read,
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3457 "A variable of internal use only.\n\
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3458 If the value is a coding system, it is used for decoding on read operation.\n\
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3459 If not, an appropriate element in `coding-system-alist' (which see) is used.");
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3460 Vcoding_system_for_read = Qnil;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3461
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3462 DEFVAR_LISP ("coding-system-for-write", &Vcoding_system_for_write,
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3463 "A variable of internal use only.\n\
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3464 If the value is a coding system, it is used for encoding on write operation.\n\
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3465 If not, an appropriate element in `coding-system-alist' (which see) is used.");
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3466 Vcoding_system_for_write = Qnil;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3467
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3468 DEFVAR_LISP ("last-coding-system-used", &Vlast_coding_system_used,
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3469 "Coding-system used in the latest file or process I/O.");
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3470 Vlast_coding_system_used = Qnil;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3471
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3472 DEFVAR_LISP ("coding-system-alist", &Vcoding_system_alist,
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3473 "Nested alist to decide a coding system for a specific I/O operation.\n\
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3474 The format is ((OPERATION . ((REGEXP . CODING-SYSTEMS) ...)) ...).\n\
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3475
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3476 OPERATION is one of the following Emacs I/O primitives:\n\
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3477 For file I/O, insert-file-contents and write-region.\n\
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3478 For process I/O, call-process, call-process-region, and start-process.\n\
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3479 For network I/O, open-network-stream.\n\
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3480 In addition, for process I/O, `process-argument' can be specified for\n\
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3481 encoding arguments of the process.\n\
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3482 \n\
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3483 REGEXP is a regular expression matching a target of OPERATION, where\n\
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3484 target is a file name for file I/O operations, a process name for\n\
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3485 process I/O operations, or a service name for network I/O\n\
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3486 operations. REGEXP might be a port number for network I/O operation.\n\
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3487 \n\
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3488 CODING-SYSTEMS is a cons of coding systems to encode and decode\n\
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3489 character code on OPERATION, or a function symbol returning the cons.\n\
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3490 See the documentation of `find-coding-system' for more detail.");
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3491 Vcoding_system_alist = Qnil;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3492
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3493 DEFVAR_INT ("eol-mnemonic-unix", &eol_mnemonic_unix,
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3494 "Mnemonic character indicating UNIX-like end-of-line format (i.e. LF) .");
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3495 eol_mnemonic_unix = '.';
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3496
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3497 DEFVAR_INT ("eol-mnemonic-dos", &eol_mnemonic_dos,
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3498 "Mnemonic character indicating DOS-like end-of-line format (i.e. CRLF).");
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3499 eol_mnemonic_dos = ':';
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3500
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3501 DEFVAR_INT ("eol-mnemonic-mac", &eol_mnemonic_mac,
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3502 "Mnemonic character indicating MAC-like end-of-line format (i.e. CR).");
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3503 eol_mnemonic_mac = '\'';
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3504
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3505 DEFVAR_INT ("eol-mnemonic-undecided", &eol_mnemonic_undecided,
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3506 "Mnemonic character indicating end-of-line format is not yet decided.");
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3507 eol_mnemonic_undecided = '-';
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3508
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3509 DEFVAR_LISP ("alternate-charset-table", &Valternate_charset_table,
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3510 "Alist of charsets vs the alternate charsets.\n\
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3511 While decoding, if a charset (car part of an element) is found,\n\
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3512 decode it as the alternate charset (cdr part of the element).");
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3513 Valternate_charset_table = Qnil;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3514
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3515 DEFVAR_LISP ("charset-revision-table", &Vcharset_revision_alist,
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3516 "Alist of charsets vs revision numbers.\n\
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3517 While encoding, if a charset (car part of an element) is found,\n\
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3518 designate it with the escape sequence identifing revision (cdr part of the element).");
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3519 Vcharset_revision_alist = Qnil;
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3520 }
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3521
d0d7b244b1d0 Initial revision Karl Heuer <kwzh@gnu.org> parents: diff changeset	3522 #endif /* emacs */

Mercurial > emacs

annotate src/coding.c @ 17071:70194012fb3a