Vývoj prístupov k spracovaniu údajov na počítači
Systémov pre ovládanie súborov
Šesťdesiate roky 20. storočia – činnosť informačného systému prebieha na princípe konverzácie so systémom. Toto riešenie nazývame klasické hromadné spracovanie dát. Systémy pracujú s internými organizáciami dát, s priamym prístupom a interaktívnym stykom s užívateľom.
Charakteristickou črtou klasického hromadného spracovania dát je, že súbory sú štruktúrované podľa potrieb konkrétnych aplikácií, ktoré ich používajú. Podľa zadania problému môžeme usudzovať, aké dáta budeme potrebovať pre spracovanie, a podľa toho navrhneme súbory, ktoré sú "ušité na mieru" pre danú aplikáciu. V každom programe je potom presne uvedené, ktoré súbory potrebuje, ako sú štruktúrované a organizované, aké výsledné informácie sa majú získať a do ktorých výstupných súborov sa majú uložiť.
Obrázok: Klasické hromadné spracovanie dát
Konverzačné systémy boli pôvodne vytvorené pre aplikácie vyžadujúce rýchlu spätnú väzbu ako je napríklad rezervácia leteniek, spracovanie dát v bankovníctve a pod. Výhodou je to, že vstup dát sa realizuje priamo tam, kde dáta vznikajú, a odpadá tak priveľa administratívy a kódovania, ktoré je typické pre dávkové spracovanie.
Pri hromadnom spracovaní dát sa používajú systémy pre spracovanie/ovládanie súborov (podporované hostiteľským operačným systémom), ktoré podporujú niektoré techniky ako napr. sekvenčné, index-sekvenčné, indexové súbory a B-stromy.
Uvedené spôsoby spracovania dát však mali určité nevýhody, ktoré obmedzovali rozvoj automatizácie takýchto informačných systémov. K nevýhodám patrili predovšetkým tieto:
- silná závislosť programov a údajov – presné opisy organizácie údajov boli len v programoch, ktoré s nimi pracovali a pri potrebe zmeniť organizáciu údajov bolo potrebné zmeny premietnuť do všetkých programov, ktoré s nimi pracujú (každý program rieši nielen vlastný aplikačný problém, ale i otázky fyzického uloženia dát na médium; nadväzujúce úlohy musia rešpektovať už vytvorené fyzické štruktúry dát);
- agendy sú vnímané ako relatívne izolované časti informačného systému bez širšieho zdieľania dát – medzi rôznymi agendami preto nie sú žiadne alebo len minimálne väzby – nadbytočnosť (redundancia) údajov – rovnaké údaje bolo často potrebné zadávať do rôznych aplikácií (agend) a udržiavať ich, aj keď v iných aplikáciách sa už vyskytovali. Tak sa môže stať, že rovnaké údaje o pracovníkoch podniku sú uvedené v niekoľkých súboroch – v evidencii osobnej, účtovníckej, kvalifikačnej, zdravotnej atď.;
- nekonzistencia dát – ak je niektorý údaj redundantný, potom musí mať vo všetkých súboroch rovnakú hodnotu. Táto vlastnosť sa nazýva konzistencia. Môže sa však stať, že pri zmene hodnoty sa táto zmena nepremietne do všetkých súborov a dáta sa stanú nekonzistentné, napríklad pracovníčka sa vydá a zmenu priezviska nahlási iba na mzdovú učtáreň;
- nekompatibilita údajov – v rôznych agendách sa dáta rovnakého významu získavali/spracovávali rôznymi metódami a výstupné informácie z rôznych agend mohli byť preto odlišné, aj keď šlo o rovnaké vstupy;
- súbory navrhnuté podľa potrieb konkrétnych programov – malá flexibilita dátových súborov, nízka úroveň abstrakcie pri pohľadoch na dáta – jednoduché dátové modely;
- problémy so zabezpečením integrity dát – hodnoty dát podliehajú obmedzeniam, ktoré odrážajú vlastnosti skutočných objektov vo svete vzťahujúcich sa k istému časovému okamihu (napr. menový kurz, limity váhových kategórií pretekárov a pod.). Taktiež všetky dáta v dátových súboroch musia byť aktuálne a musia odpovedať skutočnosti reálneho sveta. Tejto vlastnosti hovoríme integrita (celistvosť). Súčasťou aplikačných programov musí byť kontrola vstupujúcich dát, čo v prípade, že sa kontroly týkajú viacerých súborov, môže aplikačný program zbytočne skomplikovať;
- obtiažna dosiahnuteľnosť dát – ak chceme získať odpoveď na dopyt ohľadne stavu dát, znamená to vytvoriť zvláštny aplikačný program, ktorý odpovedá práve na tento dopyt, prípadne sa uspokojiť s už existujúcimi výstupmi aplikačných programov, a požadovanú informáciu vyhľadať "ručne";
- izolovanosť dát – dáta môžu byť rozptýlené v rôznych agendách (súboroch). Súbory môžu byť rôzne organizované a ekvivalentné dáta môžu mať rôzne formáty. Tým sa značne komplikuje tvorba nových aplikačných programov;
- problémy so špecifikáciou a zaistením ochrany dát pred zneužitím (proti získaniu informácií z vonkajšieho systému, ale i medzi užívateľmi). Napr. pri spracovaní dát v bankovníctve nie je žiaduce, aby mohol ktokoľvek realizovať s dátami akékoľvek operácie, alebo aby mal prístup k všetkým informáciám. Pri spracovaní dát klasickým spôsobom však aplikačný program musí mať k dispozícii toľko podrobností, že to ochranu dát pred zneužitím veľmi sťažuje;
- problémy súčasného prístupu viacerých užívateľov – napríklad v systéme rezervácie miesteniek sa jedná o koordináciu paralelných procesov, kedy jeden môže modifikovať dáta a druhý dáta čítať. V podstate to nie je možné v súboroch s vysokou redundanciou, kedy je nutné aktualizovať údaj na viacerých miestach.
Príklad: Sporiteľňa
Dáta v súboroch: informácie o klientoch, informácie o ich účtoch, informácie pobočiek sporiteľne, informácie o transakciách s účtami.
Aplikácie: správa dát účtov klientov, pobočiek, realizovanie transakcií s účtami, výpis z účtu.
Operácie: pridávanie súborov a aplikačných programov podľa potreby.