13.07.2015 Views

Wykład nr 1 - Zakład Systemów Informatycznych - Uniwersytet Śląski

Wykład nr 1 - Zakład Systemów Informatycznych - Uniwersytet Śląski

Wykład nr 1 - Zakład Systemów Informatycznych - Uniwersytet Śląski

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

Literaturahttp://zsi.tech.us.edu.pl/~nowak/swibio/index.html


Obiektami najczęściejsą dokumenty wktórych chcemywyszukiwaćinformacji5


Budowa SWICelem systemu wyszukiwania informacji jest dostarczenieużytkownikowi poszukiwanej przez niego informacji.Użytkownik, który ma szereg pytań, powinien na nieotrzymać odpowiedź w jak najkrótszym czasie.Dokumentźródłowy (Opis,plan, rysunek,informacjasłowna, słyszana)dokument wtórny,który ma tę samąwagę informacyjną,ale w znacznieskróconej,zakodowanej iskompresowanejformiejest najważniejszymmodułem. Dba o to, abywyszukać informacje w jaknajkrótszym czasie, z jaknajwiększą dokładnością ijak najmniejszą ilościąszumu informacyjnego.przekazujeużytkownikowiuzyskane informacjew dowolnym językudogodnym dlaużytkownika.


Dokumenty - rodzaje• Dokument źródłowy - opis obiektu w postaci źródłowej(język naturalny); dokument na wejściu systemu (np.ankiety)• Dokument wtórny - dokument opracowany napodstawie dokumentu źródłowego przystosowany dokonkretnego systemu informatycznego; dokumentgdzie wszystkie informacje z dokumentu źródłowego sąkodowane; są to informacje skrócone.• Dokument wyszukiwawczy - jest to dokumentopracowany na podstawie dokumentu wtórnego;przystosowany do konkretnej metody wyszukiwaniainformacji.


Definicja SI


Dziedzina atrybutu• Z każdym atrybutem „a” należącym do zbioruA zwiążemy zbiór wartości tego atrybutu (V a ).• Dziedzina atrybutu „a” jest co najmniejdwuelementowa, tzn. każdy atrybut możeprzyjmować co najmniej jedną z 2 możliwychwartości.• Dziedziną V a atrybutu „a” w systemie S będziezbiór V a określony jako:V a = {v V: dla których istnieje x X, takie, że (x,a)=v}


Funkcja informacji • Będzie to funkcja dwuargumentowa, dla opisu własności obiektów.• Każdemu obiektowi x X i atrybutowi a A przyporządkowuje wartość v należącądo dziedziny V a.


Przykłady SIX A Rok wydania Wydawnictwo DziedzinaX 1 1987 PWN InformatykaX 2 1990 WNT InformatykaX 3 1987 PWN ElektronikaX 4 1990 WNT InformatykaX = {x1,x2,x3,x4}A = {Rok wydania, Wydawnictwo, Dziedzina}V rok wydania = {1987,1990}V Wydawnictwo = {PWN, WNT}V Dziedzina = {Informatyka, Elektronika}


Deskryptor• Parę (a,v) gdzie a jest atrybutem ze zbioru A,v V a – jest wartością atrybutu a należącą dodziedziny - nazywamy deskryptorem.(Dziedzina, Elektronika)(Wydawnictwo, PWN)


Informacja o obiekcie w systemie S• To funkcja x o argumentach w A i wartościachw V taka, że x (a) = (x,a) wprowadzona dlakażdego x X.• Jest to po prostu zbiór wartości wszystkichatrybutów obiektu w danym systemie.• Np.Czyli jest to zbiór deskryptorów !!!


Opis obiektu X w systemie S• To zbiór deskryptorów wyznaczony przezinformację o obiekcie.• Różnica jest formalna: informacja o obiekcie topewna funkcja, a opis obiektu to termin (twórjęzykowy).


Definicja informacji w systemie S• Informacją w systemie S będzie każda funkcja o argumentach w zbiorze atrybutów A orazwartościach należących do V, taka, że (a) V a.• Wszystkich możliwych informacji w systemiebędzie:aAcard ( V ) a


PrzykładZakładając, że w naszym systemie S mamy następujący zbióratrybutów: A = {a,b,c} oraz zbiory wartości dlaposzczególnych atrybutów:V a = {p1,p2}, V b = {q1,q2,q3} oraz V c ={r1,r2,r3} card ( VaAcard ( Vaa2*3*3 18) )* card ( Vb)* card ( Vc)(a,p1)(b,q1)(c,r1)(a,p1)(b,q1)(c,r2)(a,p1)(b,q1)(c,r3)(a,p1)(b,q2)(c,r1)(a,p1)(b,q2)(c,r2)(a,p1)(b,q2)(c,r3)(a,p1)(b,q3)(c,r1)(a,p1)(b,q3)(c,r2)(a,p1)(b,q3)(c,r3)(a,p2)(b,q1)(c,r1)(a,p2)(b,q1)(c,r2)(a,p2)(b,q1)(c,r3)(a,p2)(b,q2)(c,r1)(a,p2)(b,q2)(c,r2)(a,p2)(b,q2)(c,r3)(a,p2)(b,q3)(c,r1)(a,p2)(b,q3)(c,r2)(a,p2)(b,q3)(c,r3)


Własności informacji w systemie• Każda informacja wyznacza pewien zbiórobiektów X takich, że X = {x X: x = }Czyli obiektów mających w systemie jednakowąinformację.• Informacja jest pusta gdy nie odpowiada jejżaden obiekt w systemie: X = {}


System jest selektywnySystem jest selektywny wtedy i tylko wtedy gdykażdej informacji odpowiada co najwyżejjeden obiekt.


System kompletnySystem jest kompletny wtedy i tylko wtedy gdykażdej informacji odpowiada co najmniejjeden obiekt.Inna definicja:System jest kompletny wtedy i tylko wtedy gdykażda informacja w systemie jest niepusta.


Przykład – czy system jest selektywny ?X A b CX1 P1 Q2 R1X2 P1 Q3 R2X3 P1 Q2 R1x4 p2 q1 r3Jeśli:A = {a,b,c}Va = {p1,p2}, Vb = {q1,q2,q3} oraz Vc={r1,r2,r3}wówczas:Funkcja taka, że(a)=p1, (b)=q2, (c) = r1lub opis:(a,p1)(b,q2)(c,r1)jest informacją w systemie S oraz X = {x1,x3}X = {x X: x = } = {x X: a A x(a) = (a)} = a A {x X: (x,a) = (a) }={x X: (x,a) = p1 } {x X: (x,b) = q2 } {x X: (x,c) = r1 } = {x1,x2,x3} {x1,x3} {x1,x3} = {x1,x3}System nie jest selektywny


Przykład – czy system jest kompletny ?X A b CX1 P1 Q2 R1X2 P1 Q3 R2X3 P1 Q2 R1x4 p2 q1 r3Jeśli:A = {a,b,c}Va = {p1,p2}, Vb = {q1,q2,q3} oraz Vc={r1,r2,r3}wówczas:Liczba możliwych informacji w systemie wynosi:2*3*318I istnieje przynajmniej jedna taka informacja, np.:(a,p1)(b,q1)(c,r1)Której nie odpowiada żaden z obiektów w systemie, inaczej powiemy, że jest onainformacją pustą.System nie jest kompletny


Równoważność obiektów w systemie• Obiekty x,y X są nierozróżnialne w systemieS ze względu na atrybut a A:• A więc:~( x y) x(a) y( a)a• Obiekty x,y X są nierozróżnialne w systemieS ze względu na KAŻDY atrybut a A:~( x y) ( x(a) y( a))S aA~( x y) x yS


Równoważność obiektów w systemie• Obiekty x1 i x4 są nierozróżnialne w systemie Sze względu na atrybut „a” gdyż:~x1 x4) x( a) ( a)1 xa(4• Obiekty x1 i x3 są nierozróżnialne w systemie Sze względu na KAŻDY atrybut a A:X A b CX1 P1 Q2 R1X2 P2 Q3 R2X3 P1 Q2 R1x4 P1 q1 r3~( x1 x3) ( x( a) ( ))1 xa 3 x1 xaAS3


Relacja równoważności• Jest określona na zbiorze obiektów X.• Każda taka relacja dzieli zbiór, na którym jest określona, awięc zbiór obiektów, na rozłączne klasy, które będziemynazywać blokami (klasami) elementarnymi.a BX1 P1 Q1X2 P1 Q1X3 P1 Q2X1X2X3aP1P1P1B1={x1,x2,x3}X4 P2 Q1X5 P2 Q1x6 p2 q2X4X5aP2P2B2={x4,x5,x6}x6p2


Klasa równoważności• Klasą równoważności nazywamy najmniejszyzbiór obiektów opisywalny w systemie, taki, któryda się opisać przez atrybuty sytemu.• Klasa równoważności - zbiór obiektównierozróżnialnych w systemie. Klasęrównoważności (dla zbioru atrybutów A) tworząobiekty nierozróżnialne względem siebie biorącpod uwagę atrybuty ze zbioru A (a więc obiektymające identyczne wartości dla atrybutów zezbioru A).


Relacja równoważnościBa BX1 P1 Q1X2 P1 Q1X3 P1 Q2X1X2X4X5Q1Q1Q1Q1B3={x1,x2,x4,x5}X4 P2 Q1X5 P2 Q1x6 p2 q2X3BQ2B4={x3,x6}x6q2


Zbiory elementarneRelacja równoważnościa BX1 P1 Q1X2 P1 Q1X3 P1 Q2X4 P2 Q1X5 P2 Q1x6 p2 q2a BX1 P1 Q1X2 P1 Q1a BX3 P1 Q2a BX4 P2 Q1X5 P2 Q1B5={x1,x2}B6={x3}B7={x4,x5}aBx6 p2 q2B8={x6}


Równoważność dwóch systemów• Jeżeli systemy S i S’ mają ten sam zbiórobiektów to są równoważne (S ~ S’) wtedy itylko wtedy gdy generują tę samą relację~ ~równoważności na zbiorze X, tj.S S'• Jeżeli systemy S i S’ mają ten sam zbiórobiektów to powiemy, że system S jestdokładniejszy niż S’ wtedy i tylko wtedy gdy~~S S'


Zależność atrybutówJeśli „a” i „b” są atrybutami w systemie informacyjnym to:a) „b” zależy od „a” (ab) gdy~ ~a bb) „a” i „b” są niezależne gdy nie zachodzi żadna z relacji:~a~banibac) Atrybuty „a” i „b” są równoważne w S (a ~ b) gdy:~~~ ~a b


Jeśli ab…• To istnieje funkcja o argumentach w zbiorze wartości atrybutu„a” oraz przyjmująca wartości ze zbioru „b”, którajednocześnie przyporządkowuje wartościom atrybutu „a”wartości „b”.• Często mówi się wtedy o zależnościach funkcjonalnych(funkcyjnych).• Jeżeli „b” zależy od „a” to istnieje funkcja:fba: VaVbbx( b) fa( x(a)) Xb, ( b) Xa, ( a)xx


Przykład~a~b~ca b CX1 P1 Q1 R1X2 P1 Q1 R2X3 P2 Q1 R3X4 P2 Q1 R4X5 P1 Q2 R1X6 P1 Q2 R2X7 P2 Q2 R3x8 p2 q2 R4 {{ x1,x2,x5,x6},{x3,x4,x7,x8}} {{ x1,x2,x3,x4},{x5,x6,x7,x8}} {{ x1,x5},{x2,x6},{x3,x7},{x4,x8}}• X= {x1,x2,..,x8}• A = {a,b,c}• Va = {p1,p2}• Vb={q1,q2}• Vc={r1,r2,r3,r4}~a~b~b~a~c~c~b~a~c~c~b~aca


Przykłada b CX1 P1 Q1 R1X2 P1 Q1 R2X3 P2 Q1 R3X4 P2 Q1 R4X5 P1 Q2 R1X6 P1 Q2 R2X7 P2 Q2 R3x8 p2 q2 R4caGdy (C=r1) wówczas (a=p1)Gdy (C=r2) wówczas (a=p1)Gdy (C=r3) wówczas (a=p2)Gdy (C=r4) wówczas (a=p2)


• Na tym koniec 1 wykładu….• Reszta w następny wtorek 33


Język deskryptorowy L s =


Syntaktyka


Semantyka


Przykłady• Niech system S będzie systemem informacyjnym:Alfabetem będą:Stałe: 0 i 1Symbole: +, *,~, , Atrybuty: {a, b, c}I ich wartości: {v1,v2,w1,w2,u1,u2,u3}To w naszym języku termami będą wyrażenia:a b CX1 V1 W1 U2X2 V2 W1 U3X3 V1 W2 U1X4 V1 W2 U1X5 V2 W2 U3X6 v1 w1 u3( a,v1~ [( a,v( b,w( b,w( a,v2) ( b,w11) ( c,u) ( c,u)22)*( a,v1)*( c,u)31 ( b,w2)]*( c,u))2)3)


Przykłady cd.• Wtedy znaczeniem tych termów będą zbiory:( a,v ) ( b,w )*( c,u1 2 2)a b CX1 V1 W1 U2X2 V2 W1 U3X3 V1 W2 U1X4 V1 W2 U1X5 V2 W2 U3X6 v1 w1 u3s{ x1,(( a,v ) ( b,w )*( c,u )) 12 2x3,x4,x6}({x3,x4,x5}{x1}){ x1,x3,x4,x6}


Przykłady cd.• Wtedy znaczeniem termu:~ [( a,v )*( a,v )]*( c,u )2 1 3a b CX1 V1 W1 U2X2 V2 W1 U3X3 V1 W2 U1X4 V1 W2 U1X5 V2 W2 U3x6 v1 w1 u3będzie zbiór:s~ {(~ [( a,v )*( a,v )] ( c,u ))2 13} {x2,x5,x6} X


Przykłady cd.• Wtedy znaczeniem termu:( b,w ) ( c,u )1 3a b CX1 V1 W1 U2X2 V2 W1 U3X3 V1 W2 U1X4 V1 W2 U1X5 V2 W2 U3X6 v1 w1 u3będzie zbiór:s(( b,w ) ( c,u ))13( X{x1,x2,x6}){x2,x5,x6}{ x2,x3,x4,x5,x6}


Rodzaje termów


Reguły przekształcania termów


Przykład przekształcenia termówt ~ [( a,v )*( b,w )] ( c,u )11 21t ~ ( a,v ) ~ ( b,w ) ( c,u )212 1t ( a,v ) ( b,w ) ( c,u )321 1


Konieczność normalizacji termu t4 sprawi, żebędzie on miał postać:),)(,)(,(),)(,)(,(),)(,)(,(),)(,)(,(),)(,)(,(),)(,)(,(),)(,)(,(),)(,)(,(),)(,)(,()],(),)]*[(,(),)*[(,()],(),)]*[(,(),)*[(,()],(),)]*[(,(),)*[(,(2221222121122211212111111112121121211212124ucwbvaucwbvaucwbvaucwbvaucwbvaucwbvaucwbvaucwbvaucwbvavavawbwbucucucvavawbucucwbwbvat


Wtedy znaczeniem termu t4 będzie: (( a,vs (( a,vs (( a,vs121)( b,w1)( b,w)( b,w12)( c,u2)( c,u)( c,u11)))))) { x1} { x5,x6} { x3,x4}Pozostałe termy są puste a więc: ( t 1) {x1}{x5,x6}{x3,x4}{x1,x3,x4,x5,x6}sa b CX1 V1 W1 U2X2 V2 W1 U3X3 V1 W2 U1X4 V1 W2 U1X5 V2 W1 U1X6 V2 w1 U1


Równość i zawieranie się termów


Termy t1 i t2 są równe:tt12 ( t ( t ( a,v ( a,v1211)( b,w1)( b,w) (( a,v1) (( a,v11)( c,u))( b,w1)( b,w12))( c,u2)) {x1})) {x1}a b CX1 V1 W1 U2X2 V2 W1 U3X3 V1 W2 U1X4 V1 W2 U1X5 V2 W1 U1X6 V2 w1 U1


Zawieranie się termów t1 i t2:tt12 ( t ( t ( a,v ( a,v1211)( b,w)) (( a,v1) (( a,v11)( c,u)( b,w12))( c,u)) {x1,x3,x4}2)) {x1}a b CX1 V1 W1 U2X2 V2 W1 U3X3 V1 W2 U1X4 V1 W2 U1X5 V2 W1 U1X6 V2 w1 U1( t t t t) ( )1 221


Parametry SWI1. Struktura bazy danych2. Redundancja i zajętość pamięci:• Obiektowa (powielenie się opisu obiektów w BD)• Atrybutowa (powielenie się adresów obiektów w BD)3. Aktualizacja bazy danych4. Czas wyszukiwania

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!