Vývoj prístupov k spracovaniu údajov na počítači

Portál: E-learningový vzdelávací portál Slovenskej poľnohospodárskej univerzity v Nitre
Kurz: Databázové systémy
Kniha: Vývoj prístupov k spracovaniu údajov na počítači
Vytlačil(a): Hosťovský používateľ
Dátum: štvrtok, 21 novembra 2024, 23:11

Opis

Vývoj prístupov k spracovaniu údajov na počítači

Agendový spôsob spracovania dát

Rozsiahle systémy pre spracovanie dát sa nazývajú informačné systémy. Rozumieme nimi systémy pre zber, uchovanie, vyhľadanie a spracovanie dát za účelom poskytnutia informácií. Dáta sú údaje získané pozorovaním alebo meraním a informácie znamenajú interpretáciu týchto dát a vzťahov medzi nimi.

Základ činnosti informačných systémov predstavujú údaje, ktoré sú zviazané s objektmi reálneho sveta – opisujú ich vlastnosti, chovanie a podobne. Prvé informačné systémy (50-te roky 20. storočia) používali tzv. agendový spôsob spracovania dát, spracovávali sa jednotlivé podnikové problémové oblasti – agendy, ako napríklad skladové hospodárstvo, mzdy, účtovníctvo, a to na jednom počítači. Agendy sú chápané ako relatívne izolované časti informačného systému bez širšieho zdieľania dát. Uvedené spracovanie úloh prebiehalo v dávkach. Dáta sa najprv ručne zaznamenávali na stanovené papierové formuláre, ďalej sa z formulárov prepisovali na vhodné vstupné médium (dierne štítky, diskety) pre počítač, formou primárneho spracovania sa dáta načítali do počítača a radou sekundárnych spracovaní sa následne nad dátami realizovali výpočty, výbery, tlač výstupných zostáv.

Celková doba tohto spôsobu spracovania údajov je pomerne dlhá, preto nie je možné týmto spôsobom vyhodnocovať dynamické deje. Typickou aplikáciou bola mesačne spracovávaná mzdová agenda. Pre spracovávanie sa používali účelovo vyvinuté programy, väčšinou v jazyku Cobol. Príznačná je úzka previazanosť fyzických a logických dátových štruktúr a odtiaľ plynúca možnosť ťažko získať údaje v inej podobe, než pre akú bola aplikácia vytvorená.

Vybrané charakteristiky tohto prístupu, aplikačné programy, riešia jednotlivé úlohy – uloženie dát na médium, spracovanie dát, tlač zostáv. Súbor aplikačných programov tvorí ucelenú agendu zahŕňajúcu typickú architektúru aplikácie – všetko v programe; riešenie ucelených problémových oblastí v jednej agende (dáta sa zbierajú špeciálne pre túto agendu); nízku efektívnosť dátových štruktúr a programov.

ASSD11

Obrázok: Štruktúra dát agendového typu

Agendový spôsob spracovania dát zásadne nerieši problematiku organizácie údajov ako celku, ale len jednotlivých agend, ktoré sa spracovávajú ako nezávislé celky.

Systémov pre ovládanie súborov

Šesťdesiate roky 20. storočia – činnosť informačného systému prebieha na princípe konverzácie so systémom. Toto riešenie nazývame  klasické hromadné spracovanie dát. Systémy pracujú s internými organizáciami dát, s priamym prístupom a interaktívnym stykom s užívateľom.

Charakteristickou črtou klasického hromadného spracovania dát je, že súbory sú štruktúrované podľa potrieb konkrétnych aplikácií, ktoré ich používajú. Podľa zadania problému môžeme usudzovať, aké dáta budeme potrebovať pre spracovanie, a podľa toho navrhneme súbory, ktoré sú "ušité na mieru" pre danú aplikáciu. V každom programe je potom presne uvedené, ktoré súbory potrebuje, ako sú štruktúrované a organizované, aké výsledné informácie sa majú získať a do ktorých výstupných súborov sa majú uložiť.

ASSD2                                                           

Obrázok: Klasické hromadné spracovanie dát

 

Konverzačné systémy boli pôvodne vytvorené pre aplikácie vyžadujúce rýchlu spätnú väzbu ako je napríklad rezervácia leteniek, spracovanie dát v bankovníctve a pod. Výhodou je to, že vstup dát sa realizuje priamo tam, kde dáta vznikajú, a odpadá tak priveľa administratívy a kódovania, ktoré je typické pre dávkové spracovanie.

Pri hromadnom spracovaní dát sa používajú systémy pre spracovanie/ovládanie súborov (podporované hostiteľským operačným systémom), ktoré podporujú niektoré techniky ako napr. sekvenčné, index-sekvenčné, indexové súbory a B-stromy.

Uvedené spôsoby spracovania dát však mali určité nevýhody, ktoré obmedzovali rozvoj automatizácie takýchto informačných systémov. K nevýhodám patrili predovšetkým tieto:

  • silná závislosť programov a údajov – presné opisy organizácie údajov boli len v programoch, ktoré s nimi pracovali a pri potrebe zmeniť organizáciu údajov bolo potrebné zmeny premietnuť do všetkých programov, ktoré s nimi pracujú (každý program rieši nielen vlastný aplikačný problém, ale i otázky fyzického uloženia dát na médium; nadväzujúce úlohy musia rešpektovať už vytvorené fyzické štruktúry dát);
  • agendy sú vnímané ako relatívne izolované časti informačného systému bez širšieho zdieľania dát – medzi rôznymi agendami preto nie sú žiadne alebo len minimálne väzby – nadbytočnosť (redundancia) údajov – rovnaké údaje bolo často potrebné zadávať do rôznych aplikácií (agend) a udržiavať ich, aj keď v iných  aplikáciách sa už vyskytovali. Tak sa môže stať, že rovnaké údaje o pracovníkoch podniku sú uvedené v niekoľkých súboroch – v evidencii osobnej, účtovníckej, kvalifikačnej, zdravotnej atď.;
  • nekonzistencia dát – ak je niektorý údaj redundantný, potom musí mať vo všetkých súboroch rovnakú hodnotu. Táto vlastnosť sa nazýva konzistencia. Môže sa však stať, že pri zmene hodnoty sa táto zmena nepremietne do všetkých súborov a dáta sa stanú nekonzistentné, napríklad pracovníčka sa vydá a zmenu priezviska nahlási iba na mzdovú učtáreň;
  • nekompatibilita údajov – v rôznych agendách sa dáta rovnakého významu získavali/spracovávali rôznymi metódami a výstupné informácie z  rôznych agend mohli byť preto odlišné, aj keď šlo o rovnaké vstupy;
  • súbory navrhnuté podľa potrieb konkrétnych programov – malá flexibilita dátových súborov, nízka úroveň abstrakcie pri pohľadoch na dáta – jednoduché dátové modely;
  • problémy so zabezpečením integrity dát – hodnoty dát podliehajú obmedzeniam, ktoré odrážajú vlastnosti skutočných objektov vo svete vzťahujúcich sa k istému časovému okamihu (napr. menový kurz, limity váhových kategórií pretekárov a pod.). Taktiež všetky dáta v dátových súboroch musia byť aktuálne a musia odpovedať skutočnosti reálneho sveta. Tejto vlastnosti hovoríme integrita (celistvosť). Súčasťou aplikačných programov musí byť kontrola vstupujúcich dát, čo v prípade, že sa kontroly týkajú viacerých súborov, môže aplikačný program zbytočne skomplikovať;
  • obtiažna dosiahnuteľnosť dát – ak chceme získať odpoveď na dopyt ohľadne stavu dát, znamená to vytvoriť zvláštny aplikačný program, ktorý odpovedá práve na tento dopyt, prípadne sa uspokojiť s už existujúcimi výstupmi aplikačných programov, a požadovanú informáciu vyhľadať "ručne";
  • izolovanosť dát – dáta môžu byť rozptýlené v rôznych agendách (súboroch).  Súbory môžu byť rôzne organizované a ekvivalentné dáta môžu mať rôzne formáty. Tým sa značne komplikuje tvorba nových aplikačných programov;
  • problémy so špecifikáciou a zaistením ochrany dát pred zneužitím (proti získaniu informácií z vonkajšieho systému, ale i medzi užívateľmi). Napr. pri spracovaní dát v bankovníctve nie je  žiaduce, aby mohol ktokoľvek realizovať s dátami akékoľvek operácie, alebo aby mal prístup k všetkým informáciám. Pri spracovaní dát klasickým spôsobom však aplikačný program musí mať k dispozícii toľko podrobností, že to ochranu dát pred zneužitím veľmi sťažuje;
  • problémy súčasného prístupu viacerých užívateľov – napríklad v systéme rezervácie miesteniek sa jedná o koordináciu paralelných procesov, kedy jeden môže modifikovať dáta a druhý dáta čítať. V podstate to nie je možné v súboroch s vysokou redundanciou, kedy je nutné aktualizovať údaj na viacerých miestach.

Príklad: Sporiteľňa

Dáta v súboroch: informácie o klientoch, informácie o ich účtoch, informácie pobočiek sporiteľne, informácie o transakciách s účtami.

Aplikácie: správa dát účtov klientov, pobočiek, realizovanie transakcií s účtami, výpis z účtu.

Operácie: pridávanie súborov a aplikačných programov podľa potreby.

Databázové spracovanie dát

Aby sa odstránili tieto a ďalšie problémy a dosiahla sa čo najväčšia nezávislosť dát od užívateľských programov, moderné informačné systémy používajú tzv. databázové spracovanie dát (druhá polovica 60-tych rokov a 70-te roky). Vzniklo na určitom stupni vývoja technológie automatického spracovania dát a obsahuje kolekciu vzájomne súvisiacich údajov v údajovej základni, s cieľom poskytnúť aktuálne informácie za meniacich sa podmienok viacerým požívateľom v rovnakom čase, priestore a v požadovanej forme. Ide teda o komplexné zachytenie údajov v údajovej základni – v databáze (dáta už nie sú organizované v izolovaných súboroch ako v predchádzajúcich riešeniach), ktorá je centrálne riadená a spoločná pre viaceré aplikácie. Tieto snahy teda viedli k centralizácii dát do databázy a k vytvoreniu špeciálnych programov pre zabezpečenie práce s dátami v databáze. Tomuto programovému produktu hovoríme systém riadenia bázy dát.

 

DSD1

Obrázok: Databázová technológia – dosiahnutie istej nezávislosti dát na užívateľských programoch a nezávislosti programov na dátach.

 

Databáza má spravidla jednu internú organizáciu údajov pre všetky oblasti a spôsoby ich využitia. Údaje uložené v databáze sa môžu meniť (aj pomerne často). Údaje vyskytujúce sa v databáze v určitom časovom momente nazývame databázovou inštanciou (alebo výskytom, stavom).

K výhodám databázového spracovanie dát patrili predovšetkým tieto:

  • štruktúry dátových súborov sú oddelené od aplikačných (užívateľských) programov;
  • prístup k údajom je možný len prostredníctvom programov databázového systému a nie priamo;
  • dáta je možné vyhodnotiť akýmkoľvek spôsobom;
  • umožnený prístup viacerých užívateľov súčasne;
  • zaistená ochrana údajov proti zneužitiu.