]> git.pld-linux.org Git - packages/cpl.git/blob - cpl.7
- added link ConvPL -> cpl
[packages/cpl.git] / cpl.7
1 .\" Copyright (c) 1997 Mariusz Krawczyk
2 .\"
3 .TH CPL 7 "28 Aug 1997" "ConvPL" "Linux Programmer's Manual"
4 .SH NAME
5 cpl \- konwerter standardow polskich znakow v2.05
6 .SH SKLADNIA
7 .BI "cpl <nn>" "[konwersja] [-] "[plik1.txt] " [plik2.txt ...]"
8 .SH OPIS
9 Parametr
10 .B <nn>
11 to dwie cyfry/litery, okreslajace standard 
12 .IR zrodlowy 
13 (pierwsza) i 
14 .IR docelowy 
15 (druga) przeprowadzanej konwersji.
16 Parametr
17 .B <konwersja>
18 okresla rodzaj opcjonalnie stosowanej konwersji
19 zakonczenia linii pomiedzy DOSem a Unixem i Amiga.
20 .SH Przyklady:
21 .B cpl 14 tex1.txt
22 \- plik tex1.txt (Mazovia -> ISO-Latin-2)
23 .br
24 .B cpl 14 *.txt
25 \- wszystkie pliki z rozszerzeniem .txt
26 .br
27 .B  cpl 14 tex1.txt *.doc
28 \- plik tekst1.txt i wszystkie .doc
29 .SH "OBSLUGIWANE STANDARDY"
30 Dostepne standardy (podajemy dwie cyfry/litery):
31 .br
32 .B 0:
33 bez polskich liter (ASCII,CP473)
34 .br
35 .B 1:
36 Mazovia
37 .br
38 .B 2:
39 FidoMazovia
40 .br
41 .B 3:
42 IBM Latin 2 (CP852)
43 .br
44 .B 4:
45 ISO Latin 2 (ISO-8859-2)
46 .br
47 .B 5:
48 DHN
49 .br
50 .B 6:
51 CSK
52 .br
53 .B 7:
54 Cyfromat (IINTE-ISIS)
55 .br
56 .B 8:
57 IEA
58 .br
59 .B 9:
60 LOGIC
61 .br
62 .B a:
63 Microvex
64 .br
65 .B b:
66 Amiga PL
67 .br
68 .B c:
69 CP/J (Elwro 800 Junior)
70 .br
71 .B d:
72 Amiga FAT
73 .br
74 .B e:
75 Windows 3.0 (CP1250)
76 .br
77 .B f:
78 Amiga XJP
79 .br
80 .B g:
81 Ventura
82 .br
83 .B h:
84 Macintosh
85 .br
86 .B i:
87 TeX PL
88 .br
89 .B j:
90 Corel 2.0
91 .br
92 .B k:
93 Atari Calamus
94 .br
95 .B l:
96 FX
97 .br
98 .B m:
99 KWK
100 .br
101 .B n:
102 MS Works
103 .br
104 .B o:
105 ATM
106 .SH Skroty:
107 Zamiast najczesciej stosowanych konwersji mozna stosowac skroty. Podajemy
108 wowczas tylko jedna litere:
109 .br
110 .B A:
111 Mazovia na IBM Latin 2
112 .br
113 .B B:
114 IBM Latin 2 na Mazovie
115 .br
116 .B C:
117 Mazovia na ASCII
118 .br
119 .B D:
120 IBM Latin 2 na ASCII
121 .br
122 .B F:
123 FidoMazovia na Mazovie
124 .br
125 Dowolnosc konwersji jest calkowita, z jednym wyjatkiem. Standard ASCII nie
126 moze byc standardem zrodlowym konwersji (przyczyna jest oczywista - zeby nie
127 pokaszanic calego tekstu - ale jest od tej reguly wyjatek! patrz
128 .B UWAGI .
129 .SH Konwersja zakonczen linii:
130 .IR ConvPL 
131 umozliwia rownolegla konwersje pomiedzy tekstem spod DOSa, a tekstem
132 spod Unixa czy Amigi. Rodzaj docelowej konwersji okreslaja parametry:
133 .br
134 .B \-: 
135 konwersja do tekstu Unixa (Amigi)  -> NL
136 .br
137 .B \=: 
138 konwersja do tekstu DOSa           -> CR+LF
139 .br
140 Zmienilem wystepujace w poprzednich wersjach oznaczenia tych parametrow
141 (/,\\), poniewaz bekslesz jest znakiem specjalnym pod U*xem. Nowe ustawienia
142 mozna rownie latwo zapamietac: pod U*xem koniec linii to jeden znak (NL),
143 wiec jedna kreska: "-"; pod DOSem sa to dwa znaki (CR+LF), stad dwie
144 kreski: "=". ;)
145 .SH "PRACA W TRYBIE FILTRU"
146 .IR ConvPL
147 moze pracowac rowniez w trybie filtru. Podanie znaku "-" zamiast
148 nazw plikow spowoduje pobranie tekstu z standardowego urzadzenia wejscia 
149 - stdin (klawiatura) i zapisanie go do standardowego wyjscia - stdout 
150 (monitor, terminal, drukarka). Przyklady:
151 .br
152 .B cpl A \-
153 kazda linia wpisywana z klawiatury bedzie
154 pojawiala sie ponizej po wcisnieciu
155 .IR <Enter>
156 , znaki z kodu Mazovia beda
157 zamieniane na IBM Latin 2
158 .br
159 .B cpl 13 <joke.txt >prn
160 \- konwersja pliku joke.txt i wyslanie
161 wynikow bezposrednio na drukarke (DOS);
162 czesto sam z tego korzystam, bo na moim PC pod DOSem mam Mazovie, a na drukarce CP852 .
163 Jesli nie chcemy zasmiecac sobie dysku, wydajemy nastepujace polecenia:
164 .br
165 .B  cpl A - <joke.txt >nul
166 (MSDOS) lub 
167 .B >/dev/null
168 (Unix) ;)))
169 Tryb filtru umozliwia rowniez przetwarzanie tekstu w potoku (pipe).
170 .br 
171 .IR Przyklad:
172 .br
173 .B type joke1.txt | cpl 14- - >joke3.txt 
174 (MSDOS). Plik 
175 .IR joke1.txt
176 zostanie przepuszczony przez konwersje Mazovia -> ISO-Latin-2,
177 a konce linii zostana zamienione na modle unixowa. Wynik zostanie 
178 zapisany do pliku
179 .IR joke3.txt
180 Zwroc uwage na obecnosc dwoch minusow w linii polecen - kazdy pelni inna
181 funkcje. Pierwszy, polaczony z opisem konwersji ("14-"), wlacza konwersje
182 zakonczen linii. Drugi, samodzielny, wlacza tryb filtru.
183 .br
184 .B cat joke.txt1 joke2.txt | cpl 14- - >joke3.txt (Unix)
185 .br
186 Przyjmujac, ze pliki 
187 .IR joke.txt 
188 i
189 .IR joke2.txt 
190 sa napisane oryginalnie w Mazovii i pod MSDOSem, takie polecenie spowoduje 
191 polaczenie obu plikow, konwersje calosci z Mazovii na ISO Latin 2, i przy okazji z CR+LF -> NL, 
192 a nastepnie zapis do pliku 
193 .IR joke3.txt.
194 Uruchamiajac 
195 .IR ConvPL 
196 w tym trybie nalezy uwazac na pomylki takie jak ta:
197 .br
198 .B cpl A joke.txt >prn
199 .br
200 Tekst zostanie przekonwertowany zgodnie z regula 13 (skrot "A"), ale na
201 drukarke nie zostanie wyslany, gdyz
202 .IR ConvPL
203 bedzie go zapisywal do pliku
204 .IR joke.txt
205 a nie na standardowe wyjscie. W rzeczywistosci powyzsze (bledne)
206 polecenie oznacza:
207 .br
208 .B konwertuj plik joke.txt, zapisujac wynik pod ta sama nazwa,
209 zas na drukarke wysylaj wyjscie przez program
210 normalnie wyswietlane na ekranie, czyli komunikaty.
211 .br
212 Polecenie ponizsze spowoduje najprawdopodobniej uszkodzenie oryginalnego pliku,
213 wiec nalezy sie go wystrzegac:
214 .br
215 .B  cpl A - <joke.txt >joke.txt (obie nazwy takie same!)
216 .br
217 Po prostu, system straci glowe probujac rownoczesnie czytac i pisac
218 do pliku, a ucierpi na tym tenze plik.
219 .br
220 .IR Pamietajmy:
221 aby uruchomic ConvPL w trybie filtru, potok danych musi
222 przychodzic ze stdin i wychodzic na stdout (a nie czesciowo z pliku, czesciowo
223 z potoku). Jesli nie wiesz o co chodzi, to poczytaj o potokach, filtrach oraz
224 roli symboli <, |, > itp. w poleceniach DOSa i Unixa.
225 .SH UWAGI:
226 Od wersji 2.01 istnieje mozliwosc wykonywania konwersji zakonczen linii
227 bez zmiany standardu polskich znakow. Wystarczy jako standard zrodlowy
228 podac ASCII - "0" (do tej pory bylo to niedopuszczalne), zas jako drugi
229 parametr opcje konwersji zakonczen linii "-" lub "=".  Drugi parametr,
230 podany zgodnie z konwencja i okreslajacy standard docelowy jest w tym
231 wypadku ignorowany. A zatem, kazdy z ponizszych przykladow ma takie samo
232 dzialanie:
233 .br
234 .B  cpl 0- joke.txt
235 .br
236 .B cpl 00- joke.txt
237 .br
238 .B cpl 02- joke.txt
239 .br
240 czyli konwersje zakonczen linii do pojedynczych NL, bez naruszania
241 polskich liter.
242 .TP 
243 .B Komentarz do standardow
244 Za definicje Amiga PL dziekuje Marcinowi Kadziolce <2:484/15.16@fidonet>.
245 .br
246 Definicje dodane w wersji 1.75 udostepnil mi Edwin Wierszelis
247 <2:482/16@fidonet>, autor konwertera KPN.
248 .br
249 .I Standard ASCII 
250 to oczywiscie zwykle literki ASCII, zastepujace odpowiednie
251 polskie znaki. Taki tekst zwie sie zwykle "polskawym", a standard okresla
252 jako CP473 (oryginalna, amerykanska strona kodowa).
253 .br
254 .IR FidoMazovia 
255 jest polformalnym (jak cala reszta ;) standardem, przyjetym 
256 w srodowisku sieci Fido. Jedyna roznica w stosunku do klasycznej Mazovii 
257 to zamiana znaku c' (141) na c-cedilla (135), wynikajaca ze wzgledow 
258 technicznych.
259 .br
260 .I Standard IBM Latin 2 (CP852) 
261 jest lansowany przez Micro$oft wraz z systemem
262 MSDOS. Wraz z kolejnym "systemem" - Windows wyszedl na swiat standard
263 strony kodowej 1250 (CP1250). Znany tez jako Windows-EE, czyli strona
264 kodowa dla Europy Wschodniej.
265 .br
266 .IR ISO-8859-2 
267 znany tez jako 
268 .IR ISO Latin 2 
269 jest standardem rozpowszechnionym
270 zwlaszcza w systemach unixowych i pracujacych pod X-windowsami. Jest rowniez
271 standardem zalecanym przez Polskie Normy oraz uznanym za obowiazujacy
272 w polskojezycznym WWW oraz, ostatnio, w polskim UseNecie.
273 .br
274 Standard 
275 .IR FAT 
276 jest jednym z amigowskich dialektow, znalezionym w diskmagu
277 FAT przez Edwina Wierszelisa.
278 .br Standard
279 .IR DHN
280 jest rozpowszechniony wraz z polskim ChiWriterem.
281 .br
282 Niektore standardy pochodza z Polskiej Strony Ogonkowej 
283 .IR http://www.uci.agh.edu.pl/ogonki/, 
284 na ktorej mozna znalezc wiele cennych informacji na temat polskich liter.
285 .TP 
286 .B Konwersja tekstu Unix<->DOS:
287 Pod Unixem kazda linijka tekstu konczy sie znakiem NL (new line) o kodzie 0xa,
288 rownoznaczny DOSowemu LF (line feed). Pod DOSem zakonczenie linii stanowi
289 para znakow CR+LF, czyli 0xd,0xa. Parametr "-" wymusza zakonczenie linii
290 znakiem NL, zas "=" - para CR+LF. Brak okreslonego kierunku konwersji
291 nie spowoduje zadnej zmiany koncow linii w pliku wynikowym. Parametry konwersji
292 zakonczen linii dodaje sie "na trzeciego" do parametrow konwersji standardow.
293 .TP 
294 .B Kod zrodlowy
295 Program byl z powodzeniem kompilowany Borlandem 3.1, gcc 2.7.2 pod Linuxem
296 (a.out, ELF), oraz DJGPP pod DOSem (gcc 2.6.3). Prosze o kontakt w razie 
297 wystapienia niekompatybilnosci kodu zrodlowego w innych systemach.
298 Wersja 2.04 i wyzsze sa na razie kompilowalne tylko pod Linuxem (i byc moze
299 innymi Unixami).
300 .TP 
301 .B Licznik linii:
302 Typowy "wodotrysk". Zwalnia prace o ok. 30%. Standardowo 
303 wylaczony, w celu wlaczenia trzeba przekompilowac zrodla bez opcji NO_LINE_COUNT. Licznik jest
304 zawsze wylaczony podczas pracy w trybie stdin/stdout (czyli zazwyczaj jako
305 filtr itp.).
306 .TP 
307 .B Znane bledy:
308 Tekst nie moze zawierac znaku ASCII 0 (^@), 
309 ktory jest uzywany jako znacznik konca pliku.
310 .SH INNE OPCJE
311 .TP
312 .B \-?, \-h, --help:
313 wyswietlaja liste wszystkich dostepnych parametrow, skladnie linii komend itp.
314 .TP
315 .B \-V,  --version:
316 wyswietla (na stdout) numer wersji CPL
317 .TP
318 .B \-L, --licencja:
319 wyswietlaja licencje uzytkowania programu.
320 .TP
321 .B \-S, --standard:
322 wyswietlaja tabelke wszystkich obslugiwanych standardow polskich znakow.
323 .SH W PLANACH
324 .sp
325 .B 'spolszczanie' cyrylicy
326 .sp
327 .B kody wieloznakowe
328 .SH "PATRZ ROWNIEZ"
329 .BR qpl (7) 
330 .SH AUTORZY:
331 .B Pawel Krawczyk 
332 \- wlasciciel praw autorskich programu
333 .B cpl
334 .IR kravietz@pipeta.chemia.pk.edu.pl
335 .br
336 .B Mariusz Krawczyk
337 \- tworca pliku manual-a czyli tego .
338 .IR scorpio@astra.mech.pk.edu.pl
This page took 0.087783 seconds and 3 git commands to generate.