11.01.2015 Views

Cap.4 - Tehnologii informationale

Cap.4 - Tehnologii informationale

Cap.4 - Tehnologii informationale

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

<strong>Cap.4</strong>.<strong>Tehnologii</strong> informaţionale<br />

Curs:<br />

Tehnologia informaţiei<br />

în cercetare<br />

Mat. Gabriela MAILAT<br />

Prof.dr.ing. Elena HELEREA<br />

1


1. Concepte de bază privind tehnologia<br />

informaţională<br />

1.1. Informaţia<br />

2. Tehnologia informaţională<br />

2.1. Internetul<br />

2.2. OCR (Optical Character Recognition)<br />

2


Informaţia a fost identificată drept una din<br />

cerinţele fundamentale ale existenţei umane.<br />

Posedă trei caracteristici principale:<br />

informaţia este cea mai importantă resursă<br />

economică,<br />

consumul de informaţie este intens,<br />

dezvoltarea infrastructurii informaţionale globale<br />

este primordială.<br />

3


4<br />

Zona informaţională comună este constituită din mai<br />

multe niveluri indivizibile, şi anume:<br />

1. Informaţia ca atare, în format electronic (baze de date,<br />

baze de documente, baze de imagini ş.a.);<br />

2. Componentele hardware şi software disponibile<br />

utilizatorilor pentru a prelucra aceste informaţii;<br />

3. Infrastructura fizică (cablu, reţele de comunicaţii radio şi<br />

prin satelit);<br />

4. Serviciile de bază ale telecomunicaţiilor, în special e-mail,<br />

transfer electronic de date, acces interactiv la baze de date<br />

şi transmiterea interactivă a imaginii digitale;


5<br />

5. Aplicaţiile care oferă utilizatorilor serviciile<br />

specifice de care au nevoie pentru a utiliza<br />

nivelurile anterior menţionate.<br />

6. Utilizatorii care nu au fost instruiţi în vederea<br />

folosirii aplicaţiilor, dar care sunt conştienţi de<br />

potenţialul utilizării tehnologiei informaţionale<br />

şi de comunicaţii şi de condiţiile pe care<br />

trebuie să le îndeplinească pentru a beneficia<br />

de avantajele ei.


Informaţia<br />

1. informaţie ca produs (categoria de „intermediatori<br />

de informaţii" care se ocupă de ordonarea şi distribuţia<br />

informaţiilor prin cărţi, reviste, radio şi televiziune)<br />

2. informaţie ca mijloc de producţie (numărul celor<br />

care se ocupă de informaţii ca mijloc de producţie a<br />

crescut mult în ultimii ani, ei participând „la alcătuirea<br />

stocurilor interne de informaţii, necesare în activitatea<br />

continuă şi eficientă a oricărei instituţii.<br />

6


7<br />

Data = forma concretă de exprimare a<br />

informaţiei.<br />

Data = un număr, o mărime, o relaţie care<br />

serveşte la rezolvarea unei probleme sau<br />

care este obţinută în urma unei cercetări,<br />

urmând a fi supusă unor prelucrări.<br />

Data poate fi considerată materia primă<br />

pentru informaţie


Schematic relaţia dintre date şi informaţii<br />

poate fi reprezentată astfel:<br />

8 Relaţia date-informaţii


Evaluarea informaţiei<br />

Pentru evaluarea calitativă a informaţiei pot<br />

fi luate în considerare trei aspecte:<br />

1. dimensiunea temporală,<br />

2. conţinutul şi<br />

3. forma informaţiei.<br />

9


Evaluarea informaţiei<br />

1. Dimensiunea temporală<br />

Informaţia - oportună<br />

o anumită frecvenţă<br />

actuală.<br />

Perioada la care se raportează<br />

informaţia constituie un atribut temporal<br />

de mare importanţă.<br />

10


Evaluarea informaţiei<br />

2.Conţinutul - cea mai importantă<br />

dimensiune a informaţiei.<br />

Informaţia:<br />

exactă<br />

pertinentă<br />

completă<br />

exhaustivă<br />

concisă.<br />

11


Evaluarea informaţiei<br />

3. Forma<br />

Defineşte modalitatea de prezentare a informaţiei,<br />

fiind cea care face informaţia atrăgătoare, uşor de<br />

utilizat şi înţeles.<br />

Informaţiile trebuie să fie clare, precise, ordonate,<br />

prezentate într-o modalitate adecvată (text, grafice,<br />

scheme etc.) şi pe un suport accesibil (hârtie,<br />

transparente, ecranul unui calculator etc.).<br />

12


Tehnologia informaţională<br />

Pentru a deveni utilă în orice domeniu de<br />

activitate informaţia trebuie să fie colectată,<br />

stocată, prelucrată şi transmisă celor care au<br />

nevoie.<br />

Utilizarea tehnologiei informaţionale<br />

ameliorează oportunităţile în valorificarea<br />

informaţiei.<br />

13


Tehnologia informaţională<br />

<strong>Tehnologii</strong>le informaţionale permit<br />

colectarea, prelucrarea, stocarea şi<br />

transmiterea informaţiilor sub formă de voce,<br />

imagine, text şi numerică pe baza<br />

microelectronicii, prin intermediul combinării<br />

informaticii cu telecomunicaţiile.<br />

14


Tehnologia informaţională<br />

Tehnologia informaţională = o paradigmă a<br />

dezvoltării tehnico-economice ce include<br />

comunicaţiile, fotonica, sistemele de<br />

fabricaţie, reţelele, softul, echipamentele de<br />

stocare a informaţiei şi memoriile.<br />

15


Tehnologia informaţională<br />

TEHNOLOGIILE INFORMAŢIONALE<br />

PROCESE METODE TEHNICI OPERAŢII<br />

PRELUCRARE AUTOMATĂ A DATELOR<br />

16


Tehnologia informaţională<br />

Aspecte şi activităţi din cadrul tehnologiilor<br />

informaţionale pot fi grupate în categoriile<br />

prezentate în schema de mai jos:<br />

17


Tehnologia informaţională<br />

• COLECTAREA INFORMAŢIILOR<br />

• REPREZENTAREA INF.<br />

• ÎNREGISTRAREA INF. (SCRIEREA)<br />

• IDENTIFICAREA INF. (CITIREA)<br />

PRELUCRAREA INFORM.<br />

• ORGANIZAREA ÎN MEMORIE ŞI<br />

• PĂSTRAREA INFORMAŢIILOR<br />

18


Tehnologia informaţională<br />

PRELUCRAREA INFORM.<br />

• CĂUTAREA/REGĂSIREA INF.<br />

• EXTRAGEREA/SELECTAREA INF.<br />

TRANSMITEREA INFORMAŢIILOR<br />

ASIGURAREA SECURITĂŢII<br />

INFORMAŢIILOR<br />

REDAREA INFORMAŢIILOR<br />

19


Tehnologia informaţională<br />

<br />

Caracteristici globale:<br />

Asigurarea accesibilităţii oricărei informaţii sub formă<br />

verbală, simbolică, prin intermediul calculatorului;<br />

Punerea la dispoziţie de capacităţi mari de<br />

memorare pentru sistemele de prelucrare a<br />

informaţiilor;<br />

Posibilitatea utilizării limbajului uman pentru<br />

interogarea sistemelor de prelucrare a informaţiilor;<br />

20


Tehnologia informaţională<br />

<br />

<br />

Orice informaţie care se dovedeşte utilă va putea fi<br />

transmisă în alt punct din acelaşi sistem cu costuri<br />

scăzute;<br />

Sistemele de prelucrare a informaţiilor sunt din ce în<br />

ce mai capabile de a informa, de a sprijini procesul<br />

decizional şi, mai mult, de a învăţa.<br />

21


Tehnologia informaţională<br />

Două schimbări esenţiale :<br />

Descentralizarea puterii informatice şi a<br />

stocării datelor şi deplasarea către utilizator;<br />

Utilizarea pe scară largă a telecomunicaţiilor<br />

care fac legătura electronică între diferitele<br />

componente ale sistemelor informaţionale.<br />

22


Tehnologia informaţională<br />

Tehnologia informaţională cuprinde, pe lângă<br />

elementele care asigură colectarea,<br />

prelucrarea, stocarea şi transmiterea<br />

informaţiilor (sub formă de voce, imagine,<br />

text şi numerică pe baza microelectronicii,<br />

prin intermediul combinării informaticii cu<br />

telecomunicaţiile) şi elementele teoretice şi<br />

metodologice privind dezvoltarea sistemelor<br />

informatice.<br />

23


Tehnologia informaţională<br />

<br />

<br />

<br />

<br />

Principalele tehnologii informaţionale:<br />

Internetul<br />

<strong>Tehnologii</strong> de recunoaşterea optică a caracterelor<br />

OCR (Optical Character Recognition)<br />

<strong>Tehnologii</strong> tip Bancomatele (Automat Teller Machine<br />

- ATM)<br />

<strong>Tehnologii</strong> online de realizare a întâlnirilor (de<br />

conferenţiere)<br />

24


Tehnologia informaţională<br />

Tehnologia multimedia<br />

Tehnologia de gestiune electronică a<br />

documentelor<br />

Alte tehnologii informaţionale<br />

25


INTERNETUL<br />

Internet = Reţea a tuturor reţelelor<br />

Reţelele de calculatoare – Avantaje:<br />

a) Partajarea resurselor – echipamentele şi în<br />

special datele sunt disponibile pentru<br />

oricine din reţea, indiferent de localizarea<br />

fizică a utilizatorului<br />

26


INTERNETUL<br />

b) Accesul la informaţie de la distanţă – poate<br />

lua diferite forme, de la accesul la programe<br />

până la accesul la baze de date la distanţă<br />

(rezervări de locuri, de cărţi, operaţiuni<br />

bancare etc.)<br />

c) Comunicaţii interpersonale – pot lua forme<br />

de mesaje de e-mail, întâlniri virtuale,<br />

instruire la distanţă<br />

d) Realitate virtuală partajată.<br />

27


INTERNETUL<br />

Internetul are la bază reţele de calculatoare<br />

dispersate la nivel mondial în toate colţurile<br />

lumii, care comunică între ele prin<br />

intermediul unui protocol Internet – Protocol<br />

(IP).<br />

Fiecare gazdă din Internet are o adresă IP<br />

care codifică adresa sa de reţea şi de gazdă,<br />

combinaţia fiind unică.<br />

28


INTERNETUL - Poştă electronică<br />

Mesajele de poştă electronică sunt compuse<br />

din mesajul în sine şi un plic.<br />

To: xxx@yahoo.com<br />

From: zzz@gmail.com<br />

Date: sat 17 th nov<br />

Subject: Conferinta<br />

Avshvchvjhdcvjhdvjh<br />

29<br />

Attachments:


INTERNETUL - Poştă electronică<br />

MTS din Internet permite transportul<br />

mesajelor prin reţea Internet pe bază de<br />

“stochează şi înaintează” sau “stochează şi<br />

descarcă”.<br />

Informaţiile pot fi transmise la orice oră<br />

30


INTERNETUL - Poştă electronică<br />

Elementele unui sistem de e-mail şi ale<br />

sistemului de transfer<br />

31


INTERNETUL - Poştă electronică<br />

Operaţiunile sistemului de e-mail<br />

(message relay<br />

32


INTERNET – PROCESAREA UNEI<br />

INTEROGĂRI DE LA CLIENT<br />

33<br />

Paşii executaţi de serverul web pentru<br />

procesarea unei interogări recepţionate de<br />

la clientul web:<br />

1. Browserul web sau alt client web trimite către<br />

serverul web o interogare cerând anumite<br />

resurse. Interogarea este transmisă în formă<br />

HTTP, în timp ce adresa resursei cerute este<br />

specificată în format Uniform Resource Locator<br />

(URL). Interogările sunt făcute de obicei<br />

utilizând comanda HTTP Get.


INTERNET – PROCESAREA UNEI<br />

INTEROGĂRI DE LA CLIENT<br />

2. După recepţionarea interogării de la client, serverul<br />

web determină existenţa resursei în cadrul<br />

resurselor controlate de serverul respectiv;<br />

3. în cazul în care resursa este disponibilă, serverul<br />

web determină drepturile de acces, iar dacă aceste<br />

drepturi nu au fost încălcate, returnează către client<br />

conţinutul resursei dorite;<br />

4. în cazul în care drepturile de acces au fost<br />

încălcate, serverul web respinge interogarea,<br />

returnând clientului atenţionarea de rigoare;<br />

34


INTERNET – PROCESAREA UNEI<br />

INTEROGĂRI DE LA CLIENT<br />

5. în cazul în care resursa nu se găseşte pe serverul<br />

web, serverul determină informaţia despre resursă<br />

din fişierele de configuraţie, acestea cuprinzând<br />

inclusiv o posibilă relocare în reţea. Dacă resursa a<br />

fost alocată serverului, dar a fost redirectată<br />

temporar către o altă locaţie, serverul informează<br />

clientul despre acest fapt;<br />

6. dacă serverul web suportă un arbore virtual<br />

construit din alte servere web, căutarea va fi<br />

redirecţionată către resursele necesare;<br />

35


INTERNET – PROCESAREA UNEI<br />

INTEROGĂRI DE LA CLIENT<br />

7. dacă serverul web este utilizat ca şi server proxy, el<br />

acţionează pe de-o parte ca şi server web pentru clientul care<br />

a transmis interogarea, iar pe de altă parte ca şi client web<br />

pentru a interoga un alt server web. Acesta este un simplu<br />

agent de retransmisie care regăseşte şi stochează în cache<br />

pagini web pentru persoanele din interior dar care nu permite<br />

accesul vizitatorilor la resursele interne. Pentru a utiliza un<br />

server proxy, fiecare browser trebuie configurat să poată:<br />

a. trimite toate cererile GET către serverul proxy şi nu către gazda<br />

specificată în URL;<br />

b. să includă întregul URL, inclusiv numele serverului şi portul în<br />

cererea GET.<br />

8. după returnarea informaţiilor către client, serverul închide<br />

conexiune cu acesta.<br />

36


INTERNET – PROCESAREA UNEI<br />

INTEROGĂRI DE LA CLIENT<br />

Interacţiunile dintre client şi server<br />

37


INTERNET – PROCESAREA UNEI<br />

INTEROGĂRI DE LA CLIENT<br />

<br />

Server web pe post de agent de retransmisie<br />

(proxy)<br />

38


INTERNET - Motoare de căutare<br />

<br />

<br />

Motoarele de căutare pe Internet sunt site-uri web<br />

specializate, create pentru a ajuta oamenii să<br />

găsească informaţii stocate în alte site-uri.<br />

Execută trei sarcini de bază:<br />

– caută pe Internet sau „selectează" părţi din Internet, pe<br />

baza cuvintelor importante;<br />

– reţin un index al cuvintelor pe care le găsesc şi a locului<br />

acestora;<br />

– permit utilizatorilor să caute cuvinte sau combinaţii de<br />

cuvinte găsite în acest index.<br />

39


INTERNET - Motoare de căutare<br />

Motoarele de căutare de pe Internet alătură<br />

date separate pentru ca utilizatorul să<br />

găsească ceea ce are nevoie.<br />

Pentru a găsi informaţii din miliardele de<br />

pagini web, un motor de căutare foloseşte o<br />

aplicaţie specială, numită „robot de căutare"<br />

sau „spider", pentru a construi o listă de<br />

cuvinte găsite în paginile web.<br />

40


INTERNET - Motoare de căutare<br />

Procesul prin care un spider îşi construieşte<br />

lista se numeşte „web crawling", iar pentru ca<br />

un motor de căutare/spider să construiască o<br />

listă eficientă de cuvinte, acesta trebuie să<br />

caute printr-o mulţime de pagini.<br />

41


Un "Spider" obţine conţinutul unei pagini web şi creează o listă de cuvinte<br />

cheie care permit utilizatorilor să găsească informaţiile pe care le doresc<br />

42


INTERNET - Motoare de căutare<br />

Un spider îşi începe căutarea prin web<br />

pornind de obicei de la o listă cu servere<br />

intens utilizate şi cu pagini web foarte<br />

populare. Spider-ul va începe cu un site<br />

popular indexând cuvintele din pagini şi<br />

urmând toate legăturile găsite în site-ul<br />

respectiv, ajungând în acest fel să traverseze<br />

şi să indexeze partea cea mai utilizată a<br />

web-ului.<br />

43


INTERNET - Motoare de căutare<br />

<br />

<br />

<br />

Google.com a început ca un motor de căutare<br />

academic.<br />

Sistemul a fost construit pentru a utiliza mai mulţi<br />

spider-i, trei de obicei, fiecare spider putând să ţină<br />

deschise 300 de conexiuni către pagini web la un<br />

moment dat.<br />

La cea mai ridicată performanţă, folosind patru<br />

spideri, sistemul putea căuta în peste 100 pagini pe<br />

secundă, generând 600 kilobytes de date în fiecare<br />

secundă<br />

44


INTERNET - Motoare de căutare<br />

Era necesară construirea unui sistem care să<br />

alimenteze spider-ii cu informaţii.<br />

Google.com iniţial avea un server dedicat<br />

pentru a oferi URL-uri spiderilor.<br />

Google avea şi propriul server DNS,<br />

translatarea numelor în adrese fiind<br />

semnificativ mai rapidă, micşorând în acelaşi<br />

timp şi întârzierile datorate reţelelor.<br />

45


INTERNET - Motoare de căutare<br />

<br />

<br />

<br />

În momentul în care un spider Google vizita o pagină<br />

HTML, acesta ţinea cont de două lucruri:<br />

– cuvintele găsite în pagină;<br />

– poziţia acestor cuvinte în pagină.<br />

Cuvintele găsite în titlu, subtitlu, metatag-uri şi alte<br />

poziţii de importanţă relativă erau notate cu o<br />

semnificaţie specială în timpul căutărilor iniţiate de<br />

utilizatori.<br />

Spider-ul a fost construit pentru a indexa toate<br />

cuvintele semnificative din pagină, lăsând la o parte<br />

cuvintele de legătură.<br />

46


INTERNET - Motoare de căutare<br />

<br />

Alţi spider-i folosesc alte procedee pentru indexare,<br />

permiţând, spre exemplu, spider-ilor să opereze mai<br />

rapid sau să permită utilizatorilor să caute mai<br />

eficient sau ambele. De exemplu, unii spideri menţin<br />

o listă de cuvinte din titlu, subtitlu şi legături,<br />

împreună cu cele mai utilizate 100 de cuvinte din<br />

pagină şi fiecare cuvânt din primele 20 de linii de<br />

text. Lycos utilizează această modalitate de indexare<br />

a conţinutului paginilor web.<br />

47


INTERNET - Motoare de căutare<br />

<br />

<br />

Alte sisteme, precum AltaVista.com, merg în altă<br />

direcţie, indexând toate cuvintele din pagină, inclusiv<br />

toate cuvintele de legătură sau „nesemnificative".<br />

Această împingere către completitudine are şi alte<br />

modalităţi de funcţionare, mai ales prin utilizarea<br />

meta-tag-urilor.<br />

Meta-tag-urile permit proprietarului unei pagini să<br />

specifice cuvintele cheie şi conceptele sub care va fi<br />

indexată pagina respectivă<br />

48


INTERNET - Motoare de căutare<br />

După ce spider-ii au terminat sarcina de<br />

găsire a informaţiilor în paginile web, motorul<br />

de căutare trebuie să stocheze informaţiile<br />

adunate într-o modalitate utilizabilă.<br />

Există două componente care fac datele<br />

adunate accesibile utilizatorilor:<br />

– informaţia stocată cu datele;<br />

– metoda în care este indexată informaţia<br />

49


INTERNET - Motoare de căutare<br />

<br />

<br />

<br />

Un motor de căutare va stoca doar cuvintele şi URLul<br />

unde au fost găsite.<br />

– Motor de căutare cu utilizări limitate<br />

Motoarele de căutare stochează mult mai multe date<br />

decât cuvântul şi URL-ul în care a fost găsit.<br />

Un motor ar putea stoca numărul de apariţii al<br />

cuvântului în pagină, putând de asemenea să<br />

asigneze câte o „greutate" fiecărei intrări, cu valori<br />

mai mari ataşate cuvintelor care apar către începutul<br />

documentului, în subtitluri, legături, meta-tag-uri sau<br />

titlul paginii.<br />

50


INTERNET - Motoare de căutare<br />

Fiecare motor de căutare are diferite formule<br />

sau modalităţi pentru asignarea greutăţii<br />

pentru cuvintele din index. Acesta este unul<br />

din motivele pentru care o căutare după<br />

acelaşi cuvânt în motoare de căutare diferite<br />

va produce liste de rezultate diferite, cu<br />

paginile prezentate în ordini diferite, chiar<br />

dacă sunt indexate aceleaşi pagini.<br />

51


INTERNET - Motoare de căutare<br />

<br />

<br />

<br />

Datele vor fi stocate în mod codat, pentru a<br />

economisi spaţiul de stocare.<br />

După ce informaţia este compactată/codată, aceasta<br />

este gata de indexare.<br />

Scop: permite găsirea foarte rapidă a informaţiei.<br />

Există mai multe modalităţi de a construi un index,<br />

dar una din cele mai eficiente modalităţi este<br />

utilizarea unui tabel hash (hash table). Prin hashing,<br />

se aplică o formulă matematică pentru ataşarea unei<br />

valori numerice fiecărui cuvânt, formula fiind<br />

construită pentru a distribui în mod egal intrările de-a<br />

lungul unui număr predeteminat de diviziuni.<br />

52


INTERNET - Motoare de căutare<br />

<br />

<br />

Combinaţia de indexare şi stocare eficientă face<br />

posibilă obţinerea rapidă a rezultatelor, chiar dacă<br />

utilizatorul creează o interogare complexă.<br />

Căutarea printr-un index presupune construirea unei<br />

interogări de către utilizator şi transmiterea ei către<br />

motorul de căutare. Interogarea poate fi simplă,<br />

alcătuită din minim un cuvânt sau mai complexă,<br />

necesitând operator booleeni, care permit rafinarea<br />

şi extinderea căutării.<br />

53


INTERNET - Motoare de căutare<br />

Operatorii booleeni cei mai des utilizaţi sunt următorii:<br />

<br />

<br />

<br />

<br />

<br />

<br />

AND - toţi termenii separaţi prin „AND" trebuie să apară în pagină sau<br />

în document. Unele motoare de căutare pot folosi „+" în loc de „AND";<br />

OR - cel puţin unul din termenii separaţi prin „OR" trebuie să apară în<br />

pagină sau document;<br />

NOT - termenul sau termenii care urmează după „NOT" nu trebuie să<br />

apară în document. Unele motoare de căutare pot folosi „-" în locul<br />

cuvîntului „NOT";<br />

FOLLOWED BY - unul din termeni trebuie să fie urmat în mod direct<br />

de către altul;<br />

NEAR - unul din termeni trebuie să fie la o distanţă specificată în<br />

cuvinte de celălalt termen;<br />

Ghilimele - cuvintele dintre ghilimele sunt tratate sub formă de frază,<br />

iar acea frază trebuie să fie găsită în interiorul documentului sau<br />

paginii.<br />

54


INTERNET<br />

55<br />

O altă aplicaţie a Internetului o reprezintă<br />

INTRANET-UL şi EXTRANET-UL.<br />

Un Intranet este o reţea din interiorul unei<br />

organizaţii care leagă utilizatori multipli prin<br />

intermediul tehnologiilor Internet.<br />

Intraneturile limitează teritoriul nelimitat al<br />

Internetului, stabilind sectoare cu acces controlat în<br />

care utilizatorii pot să comunice şi să interacţioneze<br />

în mod liber. Reţelele au la bază World Wide Webul,<br />

permiţând utilizatorilor comunicarea între<br />

platforme diferite în timp real.


Intranetul funcţionează pe baza tehnologiilor<br />

Internet, dar în interiorul unei organizaţii.<br />

Permite mai multor persoane să interacţioneze în<br />

timp real, să stocheze şi să caute arhive de<br />

documente, să colaboreze pentru crearea unor<br />

documente, să schimbe grafice, imagini, documente<br />

audio şi video şi nu în ultimul rând, să converseze în<br />

timp real prin intermediul chat-ului. în plus,<br />

depinzând de modul de construcţie al intranetului,<br />

utilizatorii pot să navigheze pe Internet, fără să facă<br />

vreo diferenţă între accesul de pe intranet spre<br />

Internet.<br />

56


57<br />

Intraneturile oferă o gamă largă de beneficii<br />

care se încadrează în două mari categorii:<br />

eficienţă şi eficacitate.<br />

– eficienţa reprezintă îmbunătăţirea mecanismelor<br />

de schimb al informaţiei înlăturând obstacolele<br />

logistice pentru a aduna şi/sau distribui informaţia<br />

necesară în timpul cerut (corespunzător).<br />

– eficacitatea presupune impactul organizaţional<br />

asupra colaborării îmbunătăţite şi asupra luării<br />

deciziilor.


EXTRANET = INTRANET şi pentru alţii<br />

Extranet = un site Web cu acces controlat, în care o<br />

parte din vizitatori provin din afara organizaţiei.<br />

Extraneturile sunt utilizate pentru:<br />

– multe tipuri de aplicaţii de afaceri<br />

– B2B sau de comerţ electronic<br />

– managementul proiectelor sau<br />

– extraneturile colaborative permit schimbul de documente,<br />

planificări asociate unui anumit proiect sau unui partener.<br />

58


Extranetul permite :<br />

– partajarea documentelor actualizate, fişiere sau imagini cu<br />

parteneri sau clienţi aflaţi în locaţii disparate;<br />

– lucrarea în colaborare prin disponibilizarea pentru editare,<br />

revizuire, actualizare şi stocare a documentelor şi a<br />

bunurilor digitale;<br />

– gestionarea proiectelor într-un spaţiu de lucru centralizat;<br />

– oferirea de versiuni curente ale documentelor actualizate în<br />

mod frecvent.<br />

59


Tehnologia de recunoaşterea optică a<br />

caracterelor OCR<br />

Este utilizată în operaţiile de digitizare a<br />

datelor de tip text.<br />

În scop comercial, se foloseşte în magazine<br />

la citirea codurilor de bare de pe diferite<br />

produse.<br />

60


Tehnologia de recunoaştere optică a<br />

caracterelor OCR<br />

Principiile Tehnologiei OCR<br />

Sistemele de recunoaştere optică a caracterelor (OCR)<br />

recunosc numai imprimatele / materiale tipărite la imprimantă.<br />

Recurgând la tehnologia de suprapunere peste<br />

matrice/tipar, OCR traduce formele şi tipul specific/fontul<br />

caracterelor tipărite în codurile computerizate<br />

corespunzătoare. Deşi sistemele cele mai performante sunt<br />

capabile să recunoască fonturi multiple, ele pot prelucra numai<br />

fonturi standard, cum ar fi Times Roman şi Arial.<br />

O dată ce au fost recunoscute toate caracterele dintr-un cuvânt<br />

dat, cuvântul este confruntat cu un vocabular de răspunsuri<br />

potenţiale pentru rezultatul final.<br />

61


Tehnologia de recunoaştere optică a<br />

caracterelor OCR<br />

<br />

<br />

Procesul de recunoaştere a caracterelor segmentează apoi<br />

liniile textului sau cuvintelor în caractere separate, care sunt<br />

recunoscute după modul de asamblare a formelor ce le<br />

constituie. Caracterele scrisorilor printate ocupă spaţii uniforme<br />

pe tot cuprinsul unei pagini şi aşezate simetric de sus în jos,<br />

ceea ce permite sistemului OCR să citească textul caracter<br />

cu caracter.<br />

Segmentarea în caractere singulare constituie un punct slab<br />

de importanţă crucială în procesul de recunoaştere, pentru<br />

organizaţiile centrate pe prelucrarea formei, întrucât<br />

tehnologia de recunoaştere OCR necesită imagini de calitate<br />

superioară, cu un contrast, cu caractere şi claritate excelente.<br />

62


Tehnologia de recunoaştere optică a<br />

caracterelor OCR<br />

<br />

<br />

Un text mai puţin decât perfect va determina şi cele<br />

mai sofisticate sisteme OCR să producă diminuări<br />

considerabile ale gradului de acurateţe, la<br />

procesarea unor imagini degradate.<br />

De exemplu, atunci când caracterele se distanţează<br />

din cauza unei slabe calităţi a imaginii; sau când<br />

multiple caractere se suprapun din cauza fundalului<br />

neclar sau tulbure dintre ele, acurateţea procesului<br />

de recunoaştere poate fi redusă chiar şi cu 20 de<br />

procente.<br />

63


Tehnologia de recunoaştere optică a<br />

caracterelor OCR<br />

<br />

<br />

<br />

Evaluarea gradului de acurateţe – aplicat asupra<br />

OCR – este reprezentat de procentul de caractere<br />

citite corect pe o pagină dată de text, iar<br />

sistemele prezintă un mare grad de variaţie,<br />

realizând o acurateţe între 95 şi 99 procente.<br />

Orice valoare / coeficient situat sub 100 de procente<br />

poate avea drept consecinţă mari pierderi în cadrul<br />

productivităţii.<br />

o întreagă aplicaţie sau proces de verificare poate fi<br />

compromis, dacă şi numai 5 procente din date sunt<br />

fie introduse greşit, fie citite incorect.<br />

64


Tehnologia de recunoaştere optică a<br />

caracterelor OCR<br />

Sistemele OCR trebuie să posede abilitatea<br />

de a „corecta citirea” rezultatelor:<br />

– marcând caracterele pe care sistemul nu le<br />

recunoaşte<br />

– redirecţionând textul respins operatorilor umani,<br />

pentru procesare manuală.<br />

65


Tehnologia de recunoaştere optică a<br />

caracterelor OCR<br />

Analiza imaginii utilizează un set de tehnici de<br />

recunoaştere/identificare a tiparelor, care permite<br />

sistemelor computerizate să recunoască şi să<br />

interpreteze imaginile.<br />

Analiza Imaginilor constă din două etape:<br />

– Procesarea/Prelucrarea şi Analiza Imaginilor şi<br />

– Recunoaşterea/Identificarea Tiparelor<br />

1. Procesarea şi analiza imaginilor include paşi, cum ar fi:<br />

– Restaurarea imaginii în scopul de a ameliora problemele<br />

stringente legate de calitate şi facilitate a utilizării<br />

– Extragerea caracteristicilor care urmează a fi folosite în<br />

stadiul ulterior de recunoaştere/identificare a tiparelor.<br />

66


Tehnologia de recunoaştere optică a<br />

caracterelor OCR<br />

2. Recunoaşterea tiparelor include la rândul său:<br />

– Localizarea ariei de interes în cadrul imaginii originare<br />

– Extragerea datelor<br />

– Validarea unei reprezentări sau a unui context preexistent<br />

Exemple de analiză a imaginilor:<br />

– Localizarea zonelor de interes pe scrisori, fişe/hărţi şi<br />

planuri, precum şi pachete<br />

– Localizarea şi detectarea automată a indiciilor pe imaginile<br />

reprezentând plicuri<br />

– Verificarea/Inventarierea colecţiei/stocului de control şi<br />

identificarea semnăturii<br />

67


Tehnologia de recunoaştere optică a<br />

caracterelor OCR<br />

Soft OCR<br />

Procesare<br />

video<br />

Extragerea<br />

caracteristicilor<br />

Recunoaşterea<br />

caracterelor<br />

Comanda<br />

de pornire<br />

Dispozitiv<br />

alimentare<br />

documente<br />

Stocarea<br />

secvenţei<br />

Editare<br />

Salvare/<br />

inregistra<br />

re<br />

Afişare<br />

Tastatură<br />

68


Tehnologia de recunoaştere optică a<br />

caracterelor OCR<br />

Informaţii generale<br />

69<br />

În termeni generali, software-ul OCR examinează o<br />

imagine scanată în hartă binară şi traduce textul<br />

din interiorul acesteia într-un fişier care poate fi<br />

editat.<br />

Primele sisteme OCR traduceau textul într-un singur<br />

font şi dimensiune.<br />

Programele actuale încearcă să reproducă nu numai<br />

fonturile, ci şi trăsături complexe de aşezare în<br />

pagină, cum ar fi:<br />

– coloane, tabele, antete şi note de subsol<br />

– chiar şi grafice


Tehnologia de recunoaştere optică a<br />

caracterelor OCR<br />

Software-ul OCR citeşte textul caracter cu<br />

caracter<br />

Există tipuri diferite de scheme de<br />

recunoaştere a tiparelor, şi fiecare software<br />

OCR<br />

– utilizează un set diferit de modele şi<br />

– le implementează de maniere diferite.<br />

70


Tehnologia de recunoaştere optică a<br />

caracterelor OCR<br />

Componentele software-ului OCR<br />

Sistemele OCR utilizate în mod frecvent<br />

includ trei componente:<br />

– Un scanner de imagine<br />

– Software-ul (Programul) şi Hardware-ul<br />

(Echipamentul) OCR<br />

– O interfaţă pentru afişarea rezultatelor<br />

procesării<br />

71


Tehnologia de recunoaştere optică a<br />

caracterelor OCR<br />

<br />

<br />

<br />

Procesul implică trei operaţiuni:<br />

Analiza imaginii (Extragerea imaginilor – pe<br />

caractere individuale – din documentul scanat)<br />

Recunoaşterea imaginii<br />

(Recunoaşterea/Identificarea acestor imagini după<br />

formă)<br />

Procesarea imaginii în funcţie de context<br />

– fie pentru a corecta clasificările greşite efectuate de<br />

algoritmul de recunoaştere<br />

– fie pentru a limita opţiunile de recunoaştere<br />

72

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!