]> arthur.barton.de Git - netatalk.git/blob - etc/afpd/nls/makecode.c
patch #432137 to map unmappable characters, from Andre Schild (aschild@users.sourcefo...
[netatalk.git] / etc / afpd / nls / makecode.c
1 /*
2  * $Id: makecode.c,v 1.4 2001-06-11 17:35:55 rufustfirefly Exp $
3  *
4  * quick-and-dirty way of creating code pages
5  */
6
7 #ifdef HAVE_CONFIG_H
8 #include "config.h"
9 #endif /* HAVE_CONFIG_H */
10
11 #include <stdio.h>
12 #include <stdlib.h>
13 #include <string.h>
14
15 #include <netatalk/endian.h>
16 #include "codepage.h"
17
18 /* map of cp10000 (mac roman) to iso-latin-1 */
19 static const unsigned char mac_to_isolatin1_map[] = {
20 0xC4, 0xC5, 0xC7, 0xC9, 0xD1, 0xD6, 0xDC, 0xE1,
21 0xE0, 0xE2, 0xE4, 0xE3, 0xE5, 0xE7, 0xE9, 0xE8,
22 0xEA, 0xEB, 0xED, 0xEC, 0xEE, 0xEF, 0xF1, 0xF3,
23 0xF2, 0xF4, 0xF6, 0xF5, 0xFA, 0xF9, 0xFB, 0xFC,
24 0x00, 0xB0, 0xA2, 0xA3, 0xA7, 0xB7, 0xB6, 0xDF,
25 0xAE, 0xA9, 0x00, 0xB4, 0xA8, 0x00, 0xC6, 0xD8,
26 0x00, 0xB1, 0x00, 0x00, 0xA5, 0xB5, 0xF0, 0x00,
27 0x00, 0x00, 0x00, 0xAA, 0xBA, 0x00, 0xE6, 0xF8,
28 0xBF, 0xA1, 0xAC, 0x00, 0x00, 0x00, 0x00, 0xAB,
29 0xBB, 0x00, 0xA0, 0xC0, 0xC3, 0xD5, 0x00, 0x00,
30 0xAD, 0x00, 0x00, 0x00, 0x00, 0x00, 0xF7, 0x00,
31 0xFF, 0x00, 0x00, 0xA4, 0x00, 0x00, 0x00, 0x00,
32 0x00, 0x00, 0xB8, 0x00, 0x00, 0xC2, 0xCA, 0xC1,
33 0xCB, 0xC8, 0xCD, 0xCE, 0xCF, 0xCC, 0xD3, 0xD4,
34 0x00, 0xD2, 0xDA, 0xDB, 0xD9 
35 /*, 0x00, 0x00, 0x00, 0x00, 0x00, 0x00,
36   0x00, 0x00, 0x00, 0x00, 0x00 */
37 };
38
39 /* map of cp10000 (mac roman) to iso-latin-1 adapted */
40 static const unsigned char mac_to_isolatin1_adapted_map[] = {
41 0xC4, 0xC5, 0xC7, 0xC9, 0xD1, 0xD6, 0xDC, 0xE1,
42 0xE0, 0xE2, 0xE4, 0xE3, 0xE5, 0xE7, 0xE9, 0xE8,
43 0xEA, 0xEB, 0xED, 0xEC, 0xEE, 0xEF, 0xF1, 0xF3,
44 0xF2, 0xF4, 0xF6, 0xF5, 0xFA, 0xF9, 0xFB, 0xFC,
45 0x00, 0xB0, 0xA2, 0xA3, 0xA7, 0xB7, 0xB6, 0xDF,
46 0xAE, 0xA9, 0xFE, 0xB4, 0xA8, 0x00, 0xC6, 0xD8,
47 0x00, 0xB1, 0x00, 0x00, 0xA5, 0xB5, 0xF0, 0x00,
48 0x00, 0x00, 0x00, 0xAA, 0xBA, 0x00, 0xE6, 0xF8,
49 0xBF, 0xA1, 0xAC, 0x00, 0xFD, 0x00, 0x00, 0xAB,
50 0xBB, 0x00, 0xA0, 0xC0, 0xC3, 0xD5, 0x00, 0x00,
51 0xAD, 0xAF, 0xB2, 0xB3, 0xDD, 0xDE, 0xF7, 0xB0,
52 0xFF, 0x00, 0x00, 0xA4, 0x00, 0x00, 0x00, 0x00,
53 0x00, 0x00, 0xB8, 0x00, 0x00, 0xC2, 0xCA, 0xC1,
54 0xCB, 0xC8, 0xCD, 0xCE, 0xCF, 0xCC, 0xD3, 0xD4,
55 0x00, 0xD2, 0xDA, 0xDB, 0xD9 
56 /*, 0x00, 0x00, 0x00, 0x00, 0x00, 0x00,
57   0x00, 0x00, 0x00, 0x00, 0x00 */
58 };
59
60 /* Map of CP10000 (Mac Roman) to MSDOS CP 437 */
61 static const unsigned char mac_to_cp437_map[] = {
62 0x8e, 0x8f, 0x80, 0x90, 0xa5, 0x99, 0x9a, 0xa0, 
63 0x85, 0x83, 0x84, 0xe0, 0x86, 0x87, 0x82, 0x8a,
64 0x88, 0x89, 0xa1, 0x8d, 0x8c, 0x8b, 0xa4, 0xa2, 
65 0x95, 0x93, 0x94, 0xe5, 0xa3, 0x97, 0x96, 0x81,
66 0xc5, 0xf8, 0x9b, 0x9c, 0xb6, 0xf9, 0xb8, 0xe1, 
67 0xc9, 0xe9, 0xcb, 0xd9, 0xc0, 0xd8, 0x92, 0xe8,
68 0xec, 0xf1, 0xf3, 0xf2, 0x9d, 0xe6, 0xeb, 0xe4, 
69 0xef, 0xe3, 0xf4, 0xa6, 0xa7, 0xea, 0x91, 0xed,
70 0xa8, 0xad, 0xaa, 0xfb, 0x9f, 0xf7, 0xdd, 0xae, 
71 0xaf, 0xb0, 0xff, 0xd6, 0xd2, 0xb1, 0xb2, 0xb7,
72 0xb4, 0xc4, 0xb5, 0xb9, 0xba, 0xbb, 0xf6, 0xbc, 
73 0x98, 0xbd, 0xf5, 0xfe, 0xbe, 0xbf, 0xc1, 0xc2,
74 0xce, 0xfa, 0xc3, 0xc6, 0xc7, 0xc8, 0xee, 0xca, 
75 0xcc, 0xcd, 0xb3, 0xd7, 0xcf, 0xd0, 0xd1, 0xd3,
76 0xdb, 0xda, 0xa9, 0xab, 0xac, 0xd4, 0xd5, 0xdc, 
77 0xde, 0xdf, 0xfc, 0xfd, 0xe7, 0xe2, 0xf0, 0x9e
78 };
79
80 /* Map of CP10000 (Mac Roman) to MSDOS CP 850 */
81 static const unsigned char mac_to_cp850_map[] = {
82 0x8e, 0x8f, 0x80, 0x90, 0xa5, 0x99, 0x9a, 0xa0,
83 0x85, 0x83, 0x84, 0xc6, 0x86, 0x87, 0x82, 0x8a,
84 0x88, 0x89, 0xa1, 0x8d, 0x8c, 0x8b, 0xa4, 0xa2,
85 0x95, 0x93, 0x94, 0xe4, 0xa3, 0x97, 0x96, 0x81,
86 0xc5, 0xf8, 0xbd, 0x9c, 0xf5, 0xb0, 0xf4, 0xe1,
87 0xa9, 0xb8, 0xb1, 0xef, 0xf9, 0xca, 0x92, 0x9d,
88 0xb2, 0xf1, 0xb3, 0xb4, 0xbe, 0xe6, 0xd0, 0xba,
89 0xbb, 0xcb, 0xdd, 0xa6, 0xa7, 0xbc, 0x91, 0x9b,
90 0xa8, 0xad, 0xaa, 0xd9, 0x9f, 0xf2, 0xfe, 0xae,
91 0xaf, 0xdc, 0xff, 0xb7, 0xc7, 0xe5, 0xc0, 0xc1,
92 0xc2, 0xc4, 0xc3, 0x9e, 0xab, 0xac, 0xf6, 0xbf,
93 0x98, 0xed, 0xc8, 0xcf, 0xc9, 0xcc, 0xcd, 0xce,
94 0xd1, 0xfa, 0xd5, 0xda, 0xdb, 0xb6, 0xd2, 0xb5,
95 0xd3, 0xd4, 0xd6, 0xd7, 0xd8, 0xde, 0xe0, 0xe2,
96 0xf0, 0xe3, 0xe9, 0xea, 0xeb, 0xfb, 0xdf, 0xe7,
97 0xee, 0xe8, 0xec, 0xf3, 0xf7, 0xfc, 0xfd, 0xb9
98 };
99
100 struct mac_code {
101   char *m_name;
102   const unsigned char *m_map; 
103   u_int16_t m_len;
104   const char *m_id;
105 };
106
107 static struct mac_code names[] = {
108   {"maccode.437", mac_to_cp437_map, sizeof(mac_to_cp437_map), "cp437"},
109   {"maccode.850", mac_to_cp850_map, sizeof(mac_to_cp850_map), "cp850"},
110   {"maccode.iso8859-1", mac_to_isolatin1_map, sizeof(mac_to_isolatin1_map), "iso8859-1"},
111   {"maccode.iso8859-1.adapted", mac_to_isolatin1_adapted_map, sizeof(mac_to_isolatin1_adapted_map), "iso8859-1-adapted"},
112   {NULL, NULL, 0, NULL}
113 };
114
115 int main(int argc, char **argv)
116 {
117   unsigned char buf[CODEPAGE_FILE_HEADER_SIZE];
118   u_int16_t id;
119   int i, j;
120   FILE *fp;
121   
122   for (i = 0; names[i].m_name; i++) {
123     if ((fp = fopen(names[i].m_name, "w")) == NULL) {
124       fprintf(stderr, "can't open %s\n", names[i].m_name);
125       continue;
126     }
127
128     memset(buf, 0, CODEPAGE_FILE_HEADER_SIZE);
129
130     id = htons(CODEPAGE_FILE_ID); /* file id */
131     memcpy(buf, &id, sizeof(id));
132     *(buf + 2) = CODEPAGE_FILE_VERSION; /* version */
133     if ((j = strlen(names[i].m_id)) & 1) /* pad to even boundary */
134       j++;
135     *(buf + 3) = j; /* length of name */
136
137     *(buf + 4) = 1; /* default quantum. this should be modified to 
138                      * deal with multibyte characters */
139
140     /* rules */
141     *(buf + 5) = CODEPAGE_RULE_MTOU | CODEPAGE_RULE_UTOM;
142
143     /* offset to data */
144     id = htons(CODEPAGE_FILE_HEADER_SIZE + j); 
145     memcpy(buf + 6, &id, sizeof(id));
146
147     /* size of data */
148     id = htons(names[i].m_len); 
149     memcpy(buf + 8, &id, sizeof(id));
150
151     /* write it out */
152     fwrite(buf, CODEPAGE_FILE_HEADER_SIZE, 1, fp);
153
154     /* we either keep or drop the null byte to keep the name on an
155        even boundary */
156     fwrite(names[i].m_id, j, 1, fp); 
157     
158     /* we typically only map characters > 0x7F */
159     for (j = 0; j < names[i].m_len; j++) {
160       buf[0] = CODEPAGE_RULE_MTOU | CODEPAGE_RULE_UTOM;
161       buf[1] = j + 0x80;
162       buf[2] = names[i].m_map[j];
163       fwrite(buf, 3, 1, fp);
164     }
165     fclose(fp);
166   }
167   return 0;
168 }