Stručná história databáz
Portál: | E-learningový vzdelávací portál Slovenskej poľnohospodárskej univerzity v Nitre |
Kurz: | Databázové systémy |
Kniha: | Stručná história databáz |
Vytlačil(a): | Hosťovský používateľ |
Dátum: | piatok, 22 novembra 2024, 04:15 |
Opis
Stručná história databáz
Stručná história databáz
Významným krokom vo vývoji databáz a databázových systémov bolo presunutie spracovania dát na stroje. Za prvé veľké strojové spracovanie dát je možné pravdepodobne považovať sčítanie ľudu v Spojených štátoch v roku 1890. Pamäťovým médiom bol dierny štítok a spracovanie zozbieraných informácií prebiehalo na elektromechanických strojoch. Elektromechanické stroje sa využívali pre účely spracovania dát ďalšie polstoročie.
Projekty zamerané na výskum vesmíru vyvolali celý rad zaujímavých vývojových aktivít v rôznych odvetviach vedy a techniky, vrátane sveta informačných technológií . V rámci projektu Apollo americkej kozmickej agentúry NASA, ktorého cieľom bolo pristátie na Mesiaci, vytvorila North American Aviation (NAA) v roku 1964 hierarchický súborový systém pomenovaný Generalized Update Acess Method (GUAM). Neskôr sa k NAA pridala spoločnosť IBM a zo systému GUAM vznikla prvá komerčne dostupná databáza s hierarchickým modelom, ktorá bola pod názvom IMS (Information Management System) uvedená na trh v roku 1966.
V polovici 60. rokov vyvinula svoju prvú databázu taktiež spoločnosť General Electric. Tá bola postavená na sieťovom modeli, viedol ju popredný počítačový vedecký odborník Charles W. Bachman a bola pomenovaná IDS (Integrated Data Store). V roku 1967 bola na konferencii CODASYL (Conference of Data Systems Languages) založená pracovná skupina DBTG (Database Task Group), ktorá začala s návrhom množiny odborných štandardov pre sieťový model. Ako reakciu na kritiku problému “jedného rodiča” v hierarchickom modeli zaviedla spoločnosť IBM novú verziu IMS, v ktorej mohol mať každý záznam jedného fyzického “rodiča” a niekoľko rodičov logických.
Stručná história databáz
V roku 1970 zverejnil výskumný pracovník spoločnosti IBM Dr. E.F. Codd v odbornom časopise Communications of the ACM, the Journal of the Association for Computing Macbinery, Inc., článok s názvom “A Relational Model of Data for Large Shared Data Banks” (Relačný model dát pre veľké zdieľané databanky). Po troch rokoch prác zverejnila svoje štandardy taktiež pracovná skupina CODASYL DBTG. Tím začalo päť ročné obdobie vášnivých sporov o to, ktorý z modelov je najlepší.
Zástancovia sieťového modelu CODASYL DBTG uvádzali, že:
- relačný model je príliš matematický,
- nie je možné vytvoriť efektívnu implementáciu relačného modelu,
- aplikačné systémy potrebujú spracovávať dáta po jednotlivých záznamoch.
Relačný model obhajovali jeho tvorcovia týmito argumentmi:
- niečo tak komplikovaného, ako sú návrhy DBTG, nemôže byť tou správnou cestou ku správe dát,
- množinovo orientované dotazy sú v jazyku DBTG príliš náročné,
- sieťový model nemá žiadne formálne základy v matematickej teórii.
Tieto spory vyvrcholili v roku 1975 na konferencii, na ktorej obhajoval výhody relačného modelu Ted Codd s dvomi ďalšími účastníkmi a proti nim stál Charles Bachman so svojimi dvomi spolupracovníkmi. Na konci konferencie bolo celé auditórium ešte zmätenejšie ako na jeho začiatku. Dôvodom bola skutočnosť, že všetky argument obidvoch strán boli celkom správne. Koncom 70. rokov ale záujem o sieťový model databáz značne ochabol. Vďaka ďalšiemu vývoji databáz a počítačových technológií ako takých sa nakoniec relačný model ukázal ako vhodnejší, a to konkrétne vďaka týmto úspechom:
- vznikli zvláštne dotazovacie jazyky ako SQL, ktoré neboli tak prísne matematické,
- pri experimentálnych implementáciách sa ukázalo, že aj v relačnom modeli je možné dosiahnuť rozumného stupňa efektivity, aj keď nie tak vysokého, ako u ekvivalentnej databázy podľa sieťového modelu. Na viac, ceny počítačových systémov neustále klesali a flexibilita systému začala byť považovaná dôležitejšiu ako efektivita,
- pokročilé nástroje umožnili ešte ľahšiu obsluhu relačného modelu,
- výskum Dr. Codda viedol nakoniec k vývoju celkom novej matematickej disciplíny nazývanej relačný kalkul.
Stručná história databáz
V polovici 70. rokov boli práce na výskume a vývoji databáz v plnom prúde. Medzi rokmi 1974 a 1978 vyvinul tým 15 výskumníkov spoločnosti IBM v kalifornskom San Jose pod vedením Franka Kinga prototyp relačnej databázy s názvom Systém R. Tento databázový systém bol postavený komerčne a stal sa základom produktov HP ALLBASE a IDMS/SQL. Externé špecifikácie Systému R implementoval nezávisle taktiež istý Larry Ellison zo spoločností, ktoré neskôr boli známe ako Oracle. Dnes je už všeobecne známe, že prvým zákazníkom Oracle bola americká CIA. Po čiastočnom prepísaní sa Systém R vo firme IBM zmenil na SQL/DS a potom na produkt DB2, ktorý je u firmy IBM v oblasti databáz dodnes jej vlajkovou loďou.
Tým zostavený zo študentov kalifornskej univerzity Berkeley pod vedením Michaela Stonebrakera a Eugena Wonga vyvinul v priebehu rokov 1973 až 1977 databázový systém INGRES. Taktiež tento systém sa stal komerčným produktom a bol pomerne úspešný. Do dnes ho predáva spoločnosť Computer Associates, a to pod označením CA-INGRES.
V roku 1976 predstavil Peter Chen model entín a vzťahov, alebo inak povedané relácií (ER). Jeho práca, v ktorej sa opieral o slabé miesta relačného modelovania, sa stala základom veľkého počtu neskôr vyvinutých techník modelovania. V prípade, že Ted Codd je považovaný za “otca” relačného modelu, potom Petra Chena musíme prehlásiť za „otca“ diagramov ER.
Spoločnosť Sybase vytvorila úspešný relačný databázový systém pre unixové server a pri vývoji ďalšej generácie Sybase, označovanej Systém 10, uzavrela dohodu so spoločnosťou Microsoft, v rámci ktorej predpokladala vytvorenie verzie pre servery s Windows. Z dôvodov, ktoré nie sú verejne príliš dobre známe, však táto spolupráca ešte pred dokončením produktov začala škrípať, ale obidve strany si odniesli so sebou akúkoľvek svoju prácu, ktorá bola do tej doby zrealizovaná. Microsoft dokončil verziu produktu pod Windows a uviedol ju na trh pod názvom Microsoft SQL server, zatiaľ čo Sybase vypustila do sveta produkt s pôvodným označením Sybase 10. Obidva produkty boli natoľko podobné, že inštruktori systému od Microsoftu používali na školeniach namiesto nie príliš zrealizovanej prvej dokumentácie od Microsoftu radšej manuály Sybase. Počas ďalších rokov sa vývoj obidvoch produktov dosť výrazne rozišiel, ale korene Sybase sú v Microsoft SQL Serveri viditeľné doteraz.
Stručná história databáz
Osemdesiate roky znamenali na trhu databáz frontálny útok relačných technológií. Počas rovnakej dekády neboli o nič málo menej úspešné i objektovo orientované databázy, ktoré sa po prvý krát objavili v 70. rokoch. V 90. rokoch nastúpili taktiež objektovo-relačné systémy, z ktorých ako prvý vstúpil na trh Informix a pomerne rýchlo za ním nasledovali Oracle a IBM. Filozofia objektovo orientovaných modelov databáz bola preberaná z objektovo orientovaných jazykov. Objektové systémy sa presadzujú hlavne v špeciálnych aplikáciách (CAD, grafické systémy).
V pohybe boli samozrejme nie len relačné technológie, ale aj ľudia okolo nich. Michael Stonebraker opustil univerzitu v Berkeley a založil výrobu objektovo-relačných databáz Illustra a po zlúčení so spoločnosťou Informix sa v nej stal riaditeľom pre výskum. Bob Epstein, ktorý so Stonebrakerom pracoval na projekte INGRES, taktiež prešiel do komerčnej spoločnosti, a to spolu so “svojim” INGRES. Odtiaľ viedli jeho kroky do firmy Britton-Lee (dnes súčasť koncernu NCR), kde pracoval na prvých databázových počítačoch (database machines, počítačové systémy špecializované výhradne na prevádzku databáz), a potom do Sybase, kde niekoľko rokov pôsobil ako riaditeľ pre výskum. Databázové počítače so zhodou okolností vzišli z odbytu, preto že v porovnaní s bežným relačným databázovým systémom, prevádzkovaným na normálnom univerzálnom počítači, boli neúmerne drahé. Databázový technológovia tej doby pôsobili predovšetkým v oblasti sanfranciského zálivu a vznikli tu všetky významné relačné produkty, viac menej súbežne s búrlivým rastom známeho “Silicon Valley”. Iný sa presťahovali na iné miesto, ale DB2, Oracle a Sybase pôsobia dodnes z veľkej časti práve v oblasti zálivu.
Časom sa klasická relačná technológia naďalej rozvíja. Príkladom sú paralelné architektúry pre zvýšenie výkonu systémov riadenia bázy dát, deduktívne databázy a expertné systémy. S rozvojom technológie nastupujú za klasickými informačnými systémami s databázovými aplikáciami (katalógy, bankovníctvo, knižnice, sklady, doprava,…) ďalšie aplikácie so zložito štruktúrovanými dátami:
- multimediálna databáza – informácie vo forme (i kombinované) dokumentov - textov, obrázkov, zvukov, videa;
- geografické informačné systémy – dáta vo forme máp;
- podnikové systémy pre podporu analýzy, riadenie a rozhodovanie, využívajúce technológiu dátových skladov a OLAP s možnosťou dolovania dát (data minig);
- komerčné obchodovanie na internete , práca s XML dátami;
- riadenia podnikových procesov – workflow.
Distribuovaný databázový systém je množina uzlov počítačovej siete, navzájom prepojených v komunikačnej sieti pričom každý z uzlov je samostatný databázový systém, ale tieto uzly navzájom spolupracujú tak, že z každého uzla je možné sprístupniť údaje uložené na inom uzle presne tak, akoby boli umiestnené na vlastnom uzle. Samotná databáza je množina navzájom prepojených databáz, ktoré sú umiestnené na rôznych uzloch tak, že užívateľ s nimi manipuluje akoby boli umiestnené v centralizovanej databáze.
Deduktívne databázy sú založené na podpore teórie dokazovania a sú schopné dedukcie dodatočných faktov z extenzionálnej databázy. Majú zabudované špecifikované deduktívne axiómy a pravidlá dedukcie. Deduktívne axiómy spoločne s integritnými obmedzeniami sú obvykle označované ako intenzionálne databázy. Deduktívna databáza sa teda skladá z dvoch zložiek, extenzionálnej databázy (EDB) a intenzionálnej databázey (IDB).
Expertný systém je aplikačný počítačový program alebo systém kooperujúcich programov, ktorý rozhoduje alebo rieši problémy v istej špecializovanej oblasti (financie, medicína, a i.) s použitím znalostí a pravidiel definovaných expertmi z príslušnej oblasti. Expertné systémy sa vytvárajú pre kognitívne riešenie problémov na expertnej úrovni. Ide o také problémy, pre ktoré nie sú známe riešiace algoritmy. Algoritmy stelesnené v expertných systémoch zodpovedajú všeobecným metódam vyhľadávania vhodných riešiacich postupov. Tieto metódy nie sú špecifické pre jednotlivé problémy. Korešpondujú so všeobecne platnými postupmi cieleného prehľadávania tzv. problémového priestoru.