Poprzedni artyku/l | Koniec artyku/lu | Spis artyku/l/ow | Nast/epny artyku/l
Tekstem do mnie m/ow
Bogus/law Jackowski

Zwi/azek mi/edzy literkami na klawiaturze a literkami wy/swietlanymi na ekranie komputera wydaje si/e oczywisty: klepiemy w klawisz z literk/a ,,A'' i na ekranie wy/swietla si/e literka ,,A''. Wi/ekszo/s/c u/zytkownik/ow dywagacje tego rodzaju skwitowa/laby kr/otko: a jak ma by/c? Taki jest los genialnych rozwi/aza/n -- dzia/laj/a niezauwa/zalnie. Ich istnienie odczuwa si/e dopiero w/owczas, gdy co/s si/e zepsuje. Kto na co dzie/n u/swiadamia sobie, jak bardzo si/e z/zy/l z elektryczno/sci/a, kanalizacj/a i bie/z/ac/a wod/a? Ale niech no tylko wy/l/acz/a nam pr/ad...

W przypadku numeracji znak/ow rol/e ,,braku pr/adu'' odegra/ly znaki diakrytyczne -- litery z ogonkami, akcentami, cedillami. Obecna architektura komputer/ow podkusi/la tw/orc/ow oprogramowania do przeznaczenia na znak jednego bajtu, ale okaza/lo si/e, /ze 256 numer/ow to za ma/lo. Do tego dosz/la scheda maszyn do pisania, po kt/orych komputery odziedziczy/ly klawiatury (z nielicznymi chlubnymi wyj/atkami -- takimi jak na przyk/lad mikrokomputery ZX Spectrum) oraz scheda dalekopis/ow, po kt/orych zosta/ly dwa znaki ko/nca wiersza -- CR (carriage return) i LF (line feed) -- u/zywane, o dziwo, tylko na trzy sposoby, zamiast teoretycznie mo/zliwych czterech. Wszystko razem spowodowa/lo, /ze nie tylko na pocz/atku by/l chaos. I wygl/ada na to, /ze je/sli chodzi o kodowanie znak/ow, to jeszcze troch/e pob/edzie.

Nie w konkretnym kodowaniu wszak/ze (aktualnie mi/lo/sciwie nam panuje ASCII -- American Standard Code for Information Inter-change, kt/ory /smia/lo mo/zna obarcza/c odpowiedzialno/sci/a za wspomniany chaos) tkwi genialno/s/c pomys/lu ponumerowania liter alfabetu, cyfr, znak/ow przestankowych i co wa/zniejszych symboli. To sama idea ponumerowania by/la genialna. Jej bezpo/sredni/a konsekwencj/a by/lo pojawienie si/e tekstowego formatu danych, co w istotny spos/ob przyczyni/lo si/e do szybkiego rozwoju technologii komputerowej.

Rzecz w tym, /ze cz/lowiek /latwiej czyta, rozumie i zapami/etuje litery uk/ladaj/ace si/e w s/lowa, ni/z ci/agi cyfr binarnych, na kt/ore koniec ko/nc/ow zamieniane s/a wszelkie dane wprowadzane do komputera. Gdy komputery wypr/a cz/lowieka, to rozumienie j/ezyka, kt/orym komputery porozumiewaj/a si/e ze sob/a, b/edzie zb/edne. Ale na razie cz/lowiek musi m/oc si/e wtr/aci/c do rozmowy komputer/ow.

Wad/a formatu tekstowego zdawa/la si/e ongi/s redundancja -- na przechowywanie danych w postaci binarnej mo/zna przeznaczy/c mniej bit/ow ni/z na dane tekstowe. Teoretycznie. Wsp/o/lczesne komercyjne formaty binarne (np. format *.doc pewnego popularnego edytora tekst/ow) zawiera tyle /smiecia, /ze po zamianie na format tekstowy obj/eto/s/c danych maleje wielokrotnie...

W dawnych czasach zdarzy/lo mi si/e programowa/c binarnie -- wprowadza/lem programy bezpo/srednio do pami/eci komputera za pomoc/a specjalnej klawiatury. Programy by/ly wprawdzie niedu/ze, ale za to wra/zenie, jakie to drobne z pozoru do/swiadczenie na mnie wywar/lo -- ogromne. W/owczas zacz/a/lem docenia/c format tekstowy. Dzi/s jestem jego zagorza/lym or/edownikiem.

Istnienie formatu tekstowego stanowi pod/lo/ze, na kt/orym wyros/ly j/ezyki programowania -- osi/agni/ecie nie do przecenienia w historii informatyki. Temu pomys/lowi zawdzi/eczamy mo/zliwo/s/c efektywnego przenoszenia program/ow z komputera na komputer.

W systemie Unix tekstowy format danych jest stosowany jako zasadnicza forma komunikacji mi/edzy programami (piping). Dzi/eki temu wszystkie programy porozumiewaj/a si/e w jednolity, stabilny spos/ob. To pozwala programom-noworodkom dogadywa/c si/e bez k/lopotu z programami-dziadkami, a tym samym programy nie starzej/a si/e a/z tak gwa/ltownie, jak na rynku komercyjnym, poganianym przez nowo/sci niekompatybilne z czym tylko si/e da.

ilustracja humor Nieprzypadkowo do kanonu systemu Unix wesz/ly programy takie jak grep, sed, awk, perl, diff, patch, pozwalaj/ace z plikami tekstowymi wyczynia/c r/o/zne sztuki -- modyfikowa/c, por/ownywa/c, wyszukiwa/c dane. Narz/edzia te sprawiaj/a, /ze piel/egnacja danych przechowywanych w postaci tekstowej jest wygodna i niezawodna. W wielu wypadkach program/ow tych mo/zna u/zywa/c do obs/lugi tekstowych baz danych, aczkolwiek nie nale/zy z tym przesadza/c -- przy bardziej z/lo/zonych zagadnieniach zaleca/lbym jednak pos/lugiwanie si/e specjalizowanymi narz/edziami.

Obszarem informatyki, w kt/orym format tekstowy wspaniale si/e sprawdzi/l, jest WWW (World Wide Web). Ma/lo kto upatruje /xr/ode/l sukcesu WWW w wykorzystaniu formatu tekstowego jako podstawowego no/snika informacji -- j/ezyka HTML (Hyper Text Markup Language). Ja upatruj/e. I uwa/zam, /ze Timothy Berners-Lee, tw/orca WWW, zas/lu/zy/l na wdzi/eczno/s/c informatycznej braci nie tylko z powodu sukcesu idei, nie pochodz/acej zreszt/a od niego, ale te/z -- a mo/ze przede wszystkim? -- z powodu wskazania w/la/sciwej drogi /swiatowym gigantom oprogramowania.

Pozytywne do/swiadczenia z HTML-em sk/loni/ly projektant/ow kolejnej edycji najpopularniejszego systemu operacyjnego do decyzji, by to format tekstowy stanowi/l podstawowy no/snik informacji systemowej. Ma nim by/c j/ezyk XML (Extensible Markup Language) -- spadkobierca HTML-a. Wygl/ada mi to na ponowne wynalezienie ko/la. Ale to nie zarzut -- ko/lo te/z z pewno/sci/a wymy/slano wielokrotnie. Wa/zne, /zeby dobry pomys/l w ko/ncu si/e przyj/a/l.


Poprzedni artyku/l | Pocz/atek artyku/lu | Spis artyku/l/ow | Nast/epny artyku/l