1 .\" Copyright (c) 1997 Mariusz Krawczyk
2 .\" Uogonkowienie i korekta formatowania: Andrzej Krzysztofowicz
4 .TH CPL 7 "28 sierpnia 1997" "ConvPL"
6 cpl \- konwerter standardów polskich znaków v2.07
13 .RI [ plik2.txt " ... ]"
18 to dwie cyfry/litery, okre¶laj±ce standard
22 (druga) przeprowadzanej konwersji.
25 okre¶la rodzaj opcjonalnie stosowanej konwersji
26 zakoñczenia linii pomiedzy DOSem a Unixem i Amig±.
31 \- plik tekst1.txt (Mazovia -> ISO-Latin-2)
34 \- wszystkie pliki z rozszerzeniem .txt
36 .B cpl 14 tekst1.txt *.doc
37 \- plik tekst1.txt i wszystkie .doc
39 .SH "OBS£UGIWANE STANDARDY"
40 Dostêpne standardy (podajemy dwie cyfry/litery):
43 bez polskich liter (ASCII, CP473)
55 ISO Latin 2 (ISO-8859-2)
79 CP/J (Elwro 800 Junior)
85 Windows 3.x/95 (CP1250)
118 Zamiast najczê¶ciej stosowanych konwersji mo¿na stosowaæ skróty. Podajemy
119 wówczas tylko jedn± literê:
122 Mazovia na IBM Latin 2
125 IBM Latin 2 na Mazoviê
134 FidoMazovia na Mazoviê
136 Dowolno¶æ konwersji jest ca³kowita, z jednym wyj±tkiem. Standard ASCII nie
137 mo¿e byæ standardem ¼ród³owym konwersji (przyczyna jest oczywista - ¿eby nie
138 pokaszaniæ ca³ego tekstu - ale jest od tej regu³y wyj±tek! patrz
141 .SH "KONWERSJA ZAKOÑCZEÑ LINII"
143 umo¿liwia równoleg³± konwersjê pomiêdzy tekstem spod DOSa, a tekstem
144 spod Uniksa czy Amigi. Rodzaj docelowej konwersji okre¶laj± parametry:
147 konwersja do tekstu Uniksa (Amigi) -> NL
150 konwersja do tekstu DOSa -> CR+LF
152 Zmieni³em wystêpuj±ce w poprzednich wersjach oznaczenia tych parametrów
153 (/, \\), poniewa¿ uko¶nik odwrotny jest znakiem specjalnym pod Uniksami. Nowe
154 ustawienia mo¿na równie ³atwo zapamiêtaæ: pod Uniksem koniec linii to jeden
155 znak (NL), wiêc jedna kreska: "-"; pod DOSem s± to dwa znaki (CR+LF), st±d
156 dwie kreski: "=". Logiczne ;)
158 .SH "PRACA W TRYBIE FILTRU"
160 mo¿e pracowaæ równie¿ w trybie filtru. Podanie znaku "-" zamiast
161 nazw plików spowoduje pobranie tekstu ze standardowego urz±dzenia wej¶cia
162 - stdin (klawiatura) i zapisanie go do standardowego wyj¶cia - stdout
163 (monitor, terminal, drukarka). Przyk³ady:
166 \- ka¿da linia wpisywana z klawiatury bêdzie
167 pojawia³a siê poni¿ej po wci¶niêciu
169 znaki z kodu Mazovia bêd±
170 zamieniane na IBM Latin 2
172 .B cpl 13 <joke.txt >prn
173 \- konwersja pliku joke.txt i wys³anie
174 wyników bezpo¶rednio na drukarkê (DOS); czêsto sam z tego korzystam, bo na
175 moim PC pod DOSem mam Mazoviê, a na drukarce CP852.
177 Je¶li nie chcemy za¶miecaæ sobie dysku, wydajemy nastepuj±ce polecenia:
179 .BR "cpl A - <joke.txt >nul " (MSDOS)
184 Tryb filtru umo¿liwia równie¿ przetwarzanie tekstu w potoku (pipe).
188 .BR "type joke1.txt | cpl 14- - >joke3.txt " (MSDOS)
191 zostanie przepuszczony przez konwersjê Mazovia -> ISO-Latin-2,
192 a koñce linii zostan± zamienione na mod³ê uniksow±. Wynik zostanie
196 Zwróæ uwagê na obecno¶æ dwóch minusów w linii poleceñ - ka¿dy pe³ni inn±
197 funkcjê. Pierwszy, po³±czony z opisem konwersji ("14-"), w³±cza konwersjê
198 zakoñczeñ linii. Drugi, samodzielny, w³±cza tryb filtru.
200 .BR "cat joke.txt1 joke2.txt | cpl 14- - >joke3.txt " (Unix)
205 s± napisane oryginalnie w Mazovii i pod MSDOSem, takie polecenie spowoduje
206 po³±czenie obu plików, konwersjê ca³o¶ci z Mazovii na ISO Latin 2, i przy
207 okazji z CR+LF -> NL, a nastêpnie zapis do pliku
212 w tym trybie nale¿y uwa¿aæ na pomy³ki takie jak ta:
214 .B cpl A joke.txt >prn
215 Tekst zostanie przekonwertowany zgodnie z regu³± 13 (skrót "A"), ale na
216 drukarkê nie zostanie wys³any, gdy¿
218 bêdzie go zapisywa³ do pliku
220 a nie na standardowe wyj¶cie. W rzeczywisto¶ci powy¿sze (b³êdne)
223 .B konwertuj plik joke.txt, zapisuj±c wynik pod t± sam± nazw±,
224 za¶ na drukarkê wysy³aj wyj¶cie przez program
225 normalnie wyswietlane na ekranie, czyli komunikaty.
227 Polecenie poni¿sze spowoduje najprawdopodobniej uszkodzenie oryginalnego
228 pliku, wiêc nale¿y siê go wystrzegaæ:
230 .BR "cpl A - <joke.txt >joke.txt " (obie nazwy takie same!)
231 Po prostu, system straci g³owê próbuj±c równocze¶nie czytaæ i pisaæ
232 do pliku, a ucierpi na tym ten¿e plik.
235 aby uruchomiæ ConvPL w trybie filtru, potok danych musi
236 przychodziæ z stdin i wychodziæ na stdout (a nie czê¶ciowo z pliku, czê¶ciowo
237 z potoku). Je¶li nie wiesz o co chodzi, to poczytaj o potokach, filtrach oraz
238 roli symboli <, |, > itp. w poleceniach DOSa i Uniksa.
241 Od wersji 2.01 istnieje mo¿liwo¶æ wykonywania konwersji zakoñczeñ linii
242 bez zmiany standardu polskich znaków. Wystarczy jako standard ¼ród³owy
243 podaæ ASCII - "0" (do tej pory by³o to niedopuszczalne), za¶ jako drugi
244 parametr opcjê konwersji zakoñczeñ linii "-" lub "=". Drugi parametr,
245 podany zgodnie z konwencj± i okre¶laj±cy standard docelowy jest w tym
246 wypadku ignorowany. A zatem, ka¿dy z poni¿szych przyk³adów ma takie samo
255 czyli konwersjê zakoñczeñ linii do pojedynczych NL, bez naruszania
258 .B Komentarz do standardów
259 Za definicjê Amiga PL dziekujê Marcinowi K±dzio³ce <2:484/15.16@fidonet>.
261 Definicje dodane w wersji 1.75 udostêpni³ mi Edwin Wierszelis
262 <2:482/16@fidonet>, autor konwertera KPN.
265 to oczywi¶cie zwyk³e literki ASCII, zastêpuj±ce odpowiednie
266 polskie znaki. Taki tekst zwie siê zwykle "polskawym", a standard okre¶la
267 jako CP473 (oryginalna, amerykañska strona kodowa).
270 jest pó³formalnym (jak ca³a reszta ;) standardem, przyjêtym
271 w ¶rodowisku sieci Fido. Jedyna ró¿nica w stosunku do klasycznej Mazovii
272 to zamiana znaku c' (141) na c-cedilla (135), wynikaj±ca ze wzglêdów
275 .I Standard IBM Latin 2 (CP852)
276 jest lansowany przez Micro$oft wraz z systemem
277 MSDOS. Wraz z kolejnym "systemem" - Windows wyszed³ na ¶wiat standard
278 strony kodowej 1250 (CP1250). Znany te¿ jako Windows-EE, czyli strona
279 kodowa dla Europy Wschodniej.
284 jest standardem rozpowszechnionym
285 zw³aszcza w systemach uniksowych i pracuj±cych pod X-window. Jest równie¿
286 standardem zalecanym przez Polskie Normy oraz uznanym za obowi±zujacy
287 w polskojêzycznym WWW oraz w polskim UseNecie.
291 jest jednym z amigowskich dialektów, znalezionym w diskmagu
292 FAT przez Edwina Wierszelisa.
296 jest rozpowszechniony wraz z polskim ChiWriterem.
298 Niektóre standardy pochodza z Polskiej Strony Ogonkowej
299 .IR http://www.uci.agh.edu.pl/ogonki/ ,
300 na której mo¿na znale¼æ wiele cennych informacji na temat polskich liter.
302 .B Konwersja tekstu Unix<->DOS:
303 Pod Uniksem ka¿da linijka tekstu koñczy siê znakiem NL (new line) o kodzie
304 0xa, równoznacznym DOSowemu LF (line feed). Pod DOSem zakoñczenie linii
305 stanowi para znaków CR+LF, czyli 0xd,0xa. Parametr "-" wymusza zakoñczenie
306 linii znakiem NL, za¶ "=" - par± CR+LF. Brak okre¶lonego kierunku konwersji
307 nie spowoduje ¿adnej zmiany koñców linii w pliku wynikowym. Parametry
308 konwersji zakoñczeñ linii dodaje siê "na trzeciego" do parametrów konwersji
312 Program by³ z powodzeniem kompilowany Borlandem 3.1, gcc 2.7.2 pod Linuksem
313 (a.out, ELF), oraz DJGPP pod DOSem (gcc 2.6.3). Proszê o kontakt w razie
314 wyst±pienia niekompatybilno¶ci kodu ¼ród³owego w innych systemach.
315 Wersja 2.04 i wy¿sze s± na razie kompilowalne tylko pod Linuksem (i byæ mo¿e
319 Typowy "wodotrysk". Zwalnia pracê o ok. 30%. Standardowo wy³±czony, w celu
320 w³±czenia trzeba przekompilowaæ ¼ród³a bez opcji NO_LINE_COUNT. Licznik jest
321 zawsze wy³±czony podczas pracy w trybie stdin/stdout (czyli zazwyczaj jako
325 Tekst nie mo¿e zawieraæ znaku ASCII 0 (^@),
326 który jest u¿ywany jako znacznik koñca pliku.
330 .BR \-? ", " \-h ", " --help:
331 wy¶wietlaj± listê wszystkich dostêpnych parametrów, sk³adniê linii poleceñ
334 .BR \-V ", " --version:
335 wy¶wietla (na stdout) numer wersji CPL
337 .BR \-L ", " --licencja:
338 wy¶wietlaj± licencjê u¿ytkowania programu.
340 .BR \-S ", " --standard:
341 wy¶wietlaj± tabelkê wszystkich obs³ugiwanych standardów polskich znaków.
344 .\" .B 'spolszczanie' cyrylicy
346 .\" .B kody wieloznakowe
354 \- wla¶ciciel praw autorskich programu
357 .I <kravietz@pipeta.chemia.pk.edu.pl>
360 \- twórca pliku manual-a, czyli tego
362 .I <scorpio@astra.mech.pk.edu.pl>