]> git.pld-linux.org Git - packages/cpl.git/blob - cpl.7.pl
- release 4 (3 is for Ra)
[packages/cpl.git] / cpl.7.pl
1 .\" Copyright (c) 1997 Mariusz Krawczyk
2 .\" Uogonkowienie i korekta formatowania: Andrzej Krzysztofowicz
3 .\" 
4 .TH CPL 7 "28 sierpnia 1997" "ConvPL"
5 .SH NAZWA
6 cpl \- konwerter standardów polskich znaków v2.07
7 .SH SK£ADNIA
8 .B cpl
9 .I nn
10 .RI [ konwersja ]
11 .RB [ - ]
12 .RI [ plik1.txt ]
13 .RI [ plik2.txt " ... ]"
14
15 .SH OPIS
16 Parametr
17 .RB nn
18 to dwie cyfry/litery, okre¶laj±ce standard 
19 .I ¼ród³owy 
20 (pierwsza) i 
21 .I docelowy 
22 (druga) przeprowadzanej konwersji.
23 Parametr
24 .B konwersja
25 okre¶la rodzaj opcjonalnie stosowanej konwersji
26 zakoñczenia linii pomiedzy DOSem a Unixem i Amig±.
27
28 .SH PRZYK£ADY
29 .TP
30 .B cpl 14 tekst1.txt
31 \- plik tekst1.txt (Mazovia -> ISO-Latin-2)
32 .TP
33 .B cpl 14 *.txt
34 \- wszystkie pliki z rozszerzeniem .txt
35 .TP
36 .B cpl 14 tekst1.txt *.doc
37 \- plik tekst1.txt i wszystkie .doc
38
39 .SH "OBS£UGIWANE STANDARDY"
40 Dostêpne standardy (podajemy dwie cyfry/litery):
41 .TP
42 .B 0:
43 bez polskich liter (ASCII, CP473)
44 .TP
45 .B 1:
46 Mazovia
47 .TP
48 .B 2:
49 FidoMazovia
50 .TP
51 .B 3:
52 IBM Latin 2 (CP852)
53 .TP
54 .B 4:
55 ISO Latin 2 (ISO-8859-2)
56 .TP
57 .B 5:
58 DHN
59 .TP
60 .B 6:
61 CSK
62 .TP
63 .B 7:
64 Cyfromat (IINTE-ISIS)
65 .TP
66 .B 8:
67 IEA
68 .TP
69 .B 9:
70 LOGIC
71 .TP
72 .B a:
73 Microvex
74 .TP
75 .B b:
76 Amiga PL
77 .TP
78 .B c:
79 CP/J (Elwro 800 Junior)
80 .TP
81 .B d:
82 Amiga FAT
83 .TP
84 .B e:
85 Windows 3.x/95 (CP1250)
86 .TP
87 .B f:
88 Amiga XJP
89 .TP
90 .B g:
91 Ventura
92 .TP
93 .B h:
94 Macintosh
95 .TP
96 .B i:
97 TeX PL
98 .TP
99 .B j:
100 Corel 2.0
101 .TP
102 .B k:
103 Atari Calamus
104 .TP
105 .B l:
106 FX
107 .TP
108 .B m:
109 KWK
110 .TP
111 .B n:
112 MS Works
113 .TP
114 .B o:
115 ATM
116
117 .SH SKRÓTY
118 Zamiast najczê¶ciej stosowanych konwersji mo¿na stosowaæ skróty. Podajemy
119 wówczas tylko jedn± literê:
120 .TP
121 .B A:
122 Mazovia na IBM Latin 2
123 .TP
124 .B B:
125 IBM Latin 2 na Mazoviê
126 .TP
127 .B C:
128 Mazovia na ASCII
129 .TP
130 .B D:
131 IBM Latin 2 na ASCII
132 .TP
133 .B F:
134 FidoMazovia na Mazoviê
135 .PP
136 Dowolno¶æ konwersji jest ca³kowita, z jednym wyj±tkiem. Standard ASCII nie
137 mo¿e byæ standardem ¼ród³owym konwersji (przyczyna jest oczywista - ¿eby nie
138 pokaszaniæ ca³ego tekstu - ale jest od tej regu³y wyj±tek! patrz
139 .BR UWAGI ).
140
141 .SH "KONWERSJA ZAKOÑCZEÑ LINII"
142 .I ConvPL 
143 umo¿liwia równoleg³± konwersjê pomiêdzy tekstem spod DOSa, a tekstem
144 spod Uniksa czy Amigi. Rodzaj docelowej konwersji okre¶laj± parametry:
145 .TP
146 .B \-: 
147 konwersja do tekstu Uniksa (Amigi)  -> NL
148 .TP
149 .B \=: 
150 konwersja do tekstu DOSa            -> CR+LF
151 .PP
152 Zmieni³em wystêpuj±ce w poprzednich wersjach oznaczenia tych parametrów
153 (/, \\), poniewa¿ uko¶nik odwrotny jest znakiem specjalnym pod Uniksami. Nowe
154 ustawienia mo¿na równie ³atwo zapamiêtaæ: pod Uniksem koniec linii to jeden
155 znak (NL), wiêc jedna kreska: "-"; pod DOSem s± to dwa znaki (CR+LF), st±d
156 dwie kreski: "=". Logiczne ;)
157
158 .SH "PRACA W TRYBIE FILTRU"
159 .I ConvPL
160 mo¿e pracowaæ równie¿ w trybie filtru. Podanie znaku "-" zamiast
161 nazw plików spowoduje pobranie tekstu ze standardowego urz±dzenia wej¶cia 
162 - stdin (klawiatura) i zapisanie go do standardowego wyj¶cia - stdout 
163 (monitor, terminal, drukarka). Przyk³ady:
164 .TP
165 .B cpl A \-
166 \- ka¿da linia wpisywana z klawiatury bêdzie
167 pojawia³a siê poni¿ej po wci¶niêciu
168 .IR <Enter> ,
169 znaki z kodu Mazovia bêd±
170 zamieniane na IBM Latin 2
171 .TP
172 .B cpl 13 <joke.txt >prn
173 \- konwersja pliku joke.txt i wys³anie
174 wyników bezpo¶rednio na drukarkê (DOS); czêsto sam z tego korzystam, bo na
175 moim PC pod DOSem mam Mazoviê, a na drukarce CP852.
176 .PP
177 Je¶li nie chcemy za¶miecaæ sobie dysku, wydajemy nastepuj±ce polecenia:
178 .TP
179 .BR "cpl A - <joke.txt >nul " (MSDOS)
180 lub 
181 .B >/dev/null
182 (Unix) ;)))
183 .PP
184 Tryb filtru umo¿liwia równie¿ przetwarzanie tekstu w potoku (pipe).
185 .br 
186 .I Przyk³ad:
187 .TP
188 .BR "type joke1.txt | cpl 14- - >joke3.txt " (MSDOS)
189 Plik 
190 .I joke1.txt
191 zostanie przepuszczony przez konwersjê Mazovia -> ISO-Latin-2,
192 a koñce linii zostan± zamienione na mod³ê uniksow±. Wynik zostanie 
193 zapisany do pliku
194 .IR joke3.txt .
195 .PP
196 Zwróæ uwagê na obecno¶æ dwóch minusów w linii poleceñ - ka¿dy pe³ni inn±
197 funkcjê. Pierwszy, po³±czony z opisem konwersji ("14-"), w³±cza konwersjê
198 zakoñczeñ linii. Drugi, samodzielny, w³±cza tryb filtru.
199 .TP
200 .BR "cat joke.txt1 joke2.txt | cpl 14- - >joke3.txt " (Unix)
201 Przyjmuj±c, ¿e pliki 
202 .I joke.txt 
203 i
204 .I joke2.txt 
205 s± napisane oryginalnie w Mazovii i pod MSDOSem, takie polecenie spowoduje 
206 po³±czenie obu plików, konwersjê ca³o¶ci z Mazovii na ISO Latin 2, i przy
207 okazji z CR+LF -> NL, a nastêpnie zapis do pliku 
208 .IR joke3.txt .
209 .PP
210 Uruchamiaj±c
211 .I ConvPL
212 w tym trybie nale¿y uwa¿aæ na pomy³ki takie jak ta:
213 .TP
214 .B cpl A joke.txt >prn
215 Tekst zostanie przekonwertowany zgodnie z regu³± 13 (skrót "A"), ale na
216 drukarkê nie zostanie wys³any, gdy¿
217 .I ConvPL
218 bêdzie go zapisywa³ do pliku
219 .I joke.txt
220 a nie na standardowe wyj¶cie. W rzeczywisto¶ci powy¿sze (b³êdne)
221 polecenie oznacza:
222 .br
223 .B konwertuj plik joke.txt, zapisuj±c wynik pod t± sam± nazw±,
224 za¶ na drukarkê wysy³aj wyj¶cie przez program
225 normalnie wyswietlane na ekranie, czyli komunikaty.
226 .PP
227 Polecenie poni¿sze spowoduje najprawdopodobniej uszkodzenie oryginalnego
228 pliku, wiêc nale¿y siê go wystrzegaæ:
229 .TP
230 .BR "cpl A - <joke.txt >joke.txt " (obie nazwy takie same!)
231 Po prostu, system straci g³owê próbuj±c równocze¶nie czytaæ i pisaæ
232 do pliku, a ucierpi na tym ten¿e plik.
233 .PP
234 .I Pamiêtajmy:
235 aby uruchomiæ ConvPL w trybie filtru, potok danych musi
236 przychodziæ z stdin i wychodziæ na stdout (a nie czê¶ciowo z pliku, czê¶ciowo
237 z potoku). Je¶li nie wiesz o co chodzi, to poczytaj o potokach, filtrach oraz
238 roli symboli <, |, > itp. w poleceniach DOSa i Uniksa.
239
240 .SH UWAGI
241 Od wersji 2.01 istnieje mo¿liwo¶æ wykonywania konwersji zakoñczeñ linii
242 bez zmiany standardu polskich znaków. Wystarczy jako standard ¼ród³owy
243 podaæ ASCII - "0" (do tej pory by³o to niedopuszczalne), za¶ jako drugi
244 parametr opcjê konwersji zakoñczeñ linii "-" lub "=".  Drugi parametr,
245 podany zgodnie z konwencj± i okre¶laj±cy standard docelowy jest w tym
246 wypadku ignorowany. A zatem, ka¿dy z poni¿szych przyk³adów ma takie samo
247 dzia³anie:
248 .TP
249 .B cpl  0- joke.txt
250 .TP
251 .B cpl 00- joke.txt
252 .TP
253 .B cpl 02- joke.txt
254 .PP
255 czyli konwersjê zakoñczeñ linii do pojedynczych NL, bez naruszania
256 polskich liter.
257 .TP 
258 .B Komentarz do standardów
259 Za definicjê Amiga PL dziekujê Marcinowi K±dzio³ce <2:484/15.16@fidonet>.
260 .IP
261 Definicje dodane w wersji 1.75 udostêpni³ mi Edwin Wierszelis
262 <2:482/16@fidonet>, autor konwertera KPN.
263 .IP
264 .I Standard ASCII 
265 to oczywi¶cie zwyk³e literki ASCII, zastêpuj±ce odpowiednie
266 polskie znaki. Taki tekst zwie siê zwykle "polskawym", a standard okre¶la
267 jako CP473 (oryginalna, amerykañska strona kodowa).
268 .IP
269 .I FidoMazovia 
270 jest pó³formalnym (jak ca³a reszta ;) standardem, przyjêtym 
271 w ¶rodowisku sieci Fido. Jedyna ró¿nica w stosunku do klasycznej Mazovii
272 to zamiana znaku c' (141) na c-cedilla (135), wynikaj±ca ze wzglêdów
273 technicznych.
274 .IP
275 .I Standard IBM Latin 2 (CP852) 
276 jest lansowany przez Micro$oft wraz z systemem
277 MSDOS. Wraz z kolejnym "systemem" - Windows wyszed³ na ¶wiat standard
278 strony kodowej 1250 (CP1250). Znany te¿ jako Windows-EE, czyli strona
279 kodowa dla Europy Wschodniej.
280 .IP
281 .I ISO-8859-2 
282 znany te¿ jako 
283 .I ISO Latin 2 
284 jest standardem rozpowszechnionym
285 zw³aszcza w systemach uniksowych i pracuj±cych pod X-window. Jest równie¿
286 standardem zalecanym przez Polskie Normy oraz uznanym za obowi±zujacy
287 w polskojêzycznym WWW oraz w polskim UseNecie.
288 .IP
289 Standard 
290 .I FAT 
291 jest jednym z amigowskich dialektów, znalezionym w diskmagu
292 FAT przez Edwina Wierszelisa.
293 .IP
294 Standard
295 .I DHN
296 jest rozpowszechniony wraz z polskim ChiWriterem.
297 .IP
298 Niektóre standardy pochodza z Polskiej Strony Ogonkowej 
299 .IR http://www.uci.agh.edu.pl/ogonki/ , 
300 na której mo¿na znale¼æ wiele cennych informacji na temat polskich liter.
301 .TP 
302 .B Konwersja tekstu Unix<->DOS:
303 Pod Uniksem ka¿da linijka tekstu koñczy siê znakiem NL (new line) o kodzie
304 0xa, równoznacznym DOSowemu LF (line feed). Pod DOSem zakoñczenie linii
305 stanowi para znaków CR+LF, czyli 0xd,0xa. Parametr "-" wymusza zakoñczenie
306 linii znakiem NL, za¶ "=" - par± CR+LF. Brak okre¶lonego kierunku konwersji
307 nie spowoduje ¿adnej zmiany koñców linii w pliku wynikowym. Parametry
308 konwersji zakoñczeñ linii dodaje siê "na trzeciego" do parametrów konwersji
309 standardów.
310 .TP 
311 .B Kod ¼ród³owy
312 Program by³ z powodzeniem kompilowany Borlandem 3.1, gcc 2.7.2 pod Linuksem
313 (a.out, ELF), oraz DJGPP pod DOSem (gcc 2.6.3). Proszê o kontakt w razie 
314 wyst±pienia niekompatybilno¶ci kodu ¼ród³owego w innych systemach.
315 Wersja 2.04 i wy¿sze s± na razie kompilowalne tylko pod Linuksem (i byæ mo¿e
316 innymi Uniksami).
317 .TP 
318 .B Licznik linii:
319 Typowy "wodotrysk". Zwalnia pracê o ok. 30%. Standardowo wy³±czony, w celu
320 w³±czenia trzeba przekompilowaæ ¼ród³a bez opcji NO_LINE_COUNT. Licznik jest
321 zawsze wy³±czony podczas pracy w trybie stdin/stdout (czyli zazwyczaj jako
322 filtr itp.).
323 .TP 
324 .B Znane b³êdy:
325 Tekst nie mo¿e zawieraæ znaku ASCII 0 (^@), 
326 który jest u¿ywany jako znacznik koñca pliku.
327
328 .SH "INNE OPCJE"
329 .TP
330 .BR \-? ", " \-h ", " --help:
331 wy¶wietlaj± listê wszystkich dostêpnych parametrów, sk³adniê linii poleceñ
332 itp.
333 .TP
334 .BR \-V ", " --version:
335 wy¶wietla (na stdout) numer wersji CPL
336 .TP
337 .BR \-L ", " --licencja:
338 wy¶wietlaj± licencjê u¿ytkowania programu.
339 .TP
340 .BR \-S ", " --standard:
341 wy¶wietlaj± tabelkê wszystkich obs³ugiwanych standardów polskich znaków.
342 .\" .SH "W PLANACH"
343 .\" .sp
344 .\" .B 'spolszczanie' cyrylicy
345 .\" .sp
346 .\" .B kody wieloznakowe
347
348 .SH "ZOBACZ TAK¯E"
349 .BR qpl (7) 
350
351 .SH AUTORZY
352 .TP
353 .B Pawe³ Krawczyk 
354 \- wla¶ciciel praw autorskich programu
355 .B cpl
356 .br
357 .I <kravietz@pipeta.chemia.pk.edu.pl>
358 .TP
359 .B Mariusz Krawczyk
360 \- twórca pliku manual-a, czyli tego
361 .br
362 .I <scorpio@astra.mech.pk.edu.pl>
This page took 0.085027 seconds and 3 git commands to generate.