Cap.4 - Tehnologii informationale
Cap.4 - Tehnologii informationale
Cap.4 - Tehnologii informationale
Create successful ePaper yourself
Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.
<strong>Cap.4</strong>.<strong>Tehnologii</strong> informaţionale<br />
Curs:<br />
Tehnologia informaţiei<br />
în cercetare<br />
Mat. Gabriela MAILAT<br />
Prof.dr.ing. Elena HELEREA<br />
1
1. Concepte de bază privind tehnologia<br />
informaţională<br />
1.1. Informaţia<br />
2. Tehnologia informaţională<br />
2.1. Internetul<br />
2.2. OCR (Optical Character Recognition)<br />
2
Informaţia a fost identificată drept una din<br />
cerinţele fundamentale ale existenţei umane.<br />
Posedă trei caracteristici principale:<br />
informaţia este cea mai importantă resursă<br />
economică,<br />
consumul de informaţie este intens,<br />
dezvoltarea infrastructurii informaţionale globale<br />
este primordială.<br />
3
4<br />
Zona informaţională comună este constituită din mai<br />
multe niveluri indivizibile, şi anume:<br />
1. Informaţia ca atare, în format electronic (baze de date,<br />
baze de documente, baze de imagini ş.a.);<br />
2. Componentele hardware şi software disponibile<br />
utilizatorilor pentru a prelucra aceste informaţii;<br />
3. Infrastructura fizică (cablu, reţele de comunicaţii radio şi<br />
prin satelit);<br />
4. Serviciile de bază ale telecomunicaţiilor, în special e-mail,<br />
transfer electronic de date, acces interactiv la baze de date<br />
şi transmiterea interactivă a imaginii digitale;
5<br />
5. Aplicaţiile care oferă utilizatorilor serviciile<br />
specifice de care au nevoie pentru a utiliza<br />
nivelurile anterior menţionate.<br />
6. Utilizatorii care nu au fost instruiţi în vederea<br />
folosirii aplicaţiilor, dar care sunt conştienţi de<br />
potenţialul utilizării tehnologiei informaţionale<br />
şi de comunicaţii şi de condiţiile pe care<br />
trebuie să le îndeplinească pentru a beneficia<br />
de avantajele ei.
Informaţia<br />
1. informaţie ca produs (categoria de „intermediatori<br />
de informaţii" care se ocupă de ordonarea şi distribuţia<br />
informaţiilor prin cărţi, reviste, radio şi televiziune)<br />
2. informaţie ca mijloc de producţie (numărul celor<br />
care se ocupă de informaţii ca mijloc de producţie a<br />
crescut mult în ultimii ani, ei participând „la alcătuirea<br />
stocurilor interne de informaţii, necesare în activitatea<br />
continuă şi eficientă a oricărei instituţii.<br />
6
7<br />
Data = forma concretă de exprimare a<br />
informaţiei.<br />
Data = un număr, o mărime, o relaţie care<br />
serveşte la rezolvarea unei probleme sau<br />
care este obţinută în urma unei cercetări,<br />
urmând a fi supusă unor prelucrări.<br />
Data poate fi considerată materia primă<br />
pentru informaţie
Schematic relaţia dintre date şi informaţii<br />
poate fi reprezentată astfel:<br />
8 Relaţia date-informaţii
Evaluarea informaţiei<br />
Pentru evaluarea calitativă a informaţiei pot<br />
fi luate în considerare trei aspecte:<br />
1. dimensiunea temporală,<br />
2. conţinutul şi<br />
3. forma informaţiei.<br />
9
Evaluarea informaţiei<br />
1. Dimensiunea temporală<br />
Informaţia - oportună<br />
o anumită frecvenţă<br />
actuală.<br />
Perioada la care se raportează<br />
informaţia constituie un atribut temporal<br />
de mare importanţă.<br />
10
Evaluarea informaţiei<br />
2.Conţinutul - cea mai importantă<br />
dimensiune a informaţiei.<br />
Informaţia:<br />
exactă<br />
pertinentă<br />
completă<br />
exhaustivă<br />
concisă.<br />
11
Evaluarea informaţiei<br />
3. Forma<br />
Defineşte modalitatea de prezentare a informaţiei,<br />
fiind cea care face informaţia atrăgătoare, uşor de<br />
utilizat şi înţeles.<br />
Informaţiile trebuie să fie clare, precise, ordonate,<br />
prezentate într-o modalitate adecvată (text, grafice,<br />
scheme etc.) şi pe un suport accesibil (hârtie,<br />
transparente, ecranul unui calculator etc.).<br />
12
Tehnologia informaţională<br />
Pentru a deveni utilă în orice domeniu de<br />
activitate informaţia trebuie să fie colectată,<br />
stocată, prelucrată şi transmisă celor care au<br />
nevoie.<br />
Utilizarea tehnologiei informaţionale<br />
ameliorează oportunităţile în valorificarea<br />
informaţiei.<br />
13
Tehnologia informaţională<br />
<strong>Tehnologii</strong>le informaţionale permit<br />
colectarea, prelucrarea, stocarea şi<br />
transmiterea informaţiilor sub formă de voce,<br />
imagine, text şi numerică pe baza<br />
microelectronicii, prin intermediul combinării<br />
informaticii cu telecomunicaţiile.<br />
14
Tehnologia informaţională<br />
Tehnologia informaţională = o paradigmă a<br />
dezvoltării tehnico-economice ce include<br />
comunicaţiile, fotonica, sistemele de<br />
fabricaţie, reţelele, softul, echipamentele de<br />
stocare a informaţiei şi memoriile.<br />
15
Tehnologia informaţională<br />
TEHNOLOGIILE INFORMAŢIONALE<br />
PROCESE METODE TEHNICI OPERAŢII<br />
PRELUCRARE AUTOMATĂ A DATELOR<br />
16
Tehnologia informaţională<br />
Aspecte şi activităţi din cadrul tehnologiilor<br />
informaţionale pot fi grupate în categoriile<br />
prezentate în schema de mai jos:<br />
17
Tehnologia informaţională<br />
• COLECTAREA INFORMAŢIILOR<br />
• REPREZENTAREA INF.<br />
• ÎNREGISTRAREA INF. (SCRIEREA)<br />
• IDENTIFICAREA INF. (CITIREA)<br />
PRELUCRAREA INFORM.<br />
• ORGANIZAREA ÎN MEMORIE ŞI<br />
• PĂSTRAREA INFORMAŢIILOR<br />
18
Tehnologia informaţională<br />
PRELUCRAREA INFORM.<br />
• CĂUTAREA/REGĂSIREA INF.<br />
• EXTRAGEREA/SELECTAREA INF.<br />
TRANSMITEREA INFORMAŢIILOR<br />
ASIGURAREA SECURITĂŢII<br />
INFORMAŢIILOR<br />
REDAREA INFORMAŢIILOR<br />
19
Tehnologia informaţională<br />
<br />
Caracteristici globale:<br />
Asigurarea accesibilităţii oricărei informaţii sub formă<br />
verbală, simbolică, prin intermediul calculatorului;<br />
Punerea la dispoziţie de capacităţi mari de<br />
memorare pentru sistemele de prelucrare a<br />
informaţiilor;<br />
Posibilitatea utilizării limbajului uman pentru<br />
interogarea sistemelor de prelucrare a informaţiilor;<br />
20
Tehnologia informaţională<br />
<br />
<br />
Orice informaţie care se dovedeşte utilă va putea fi<br />
transmisă în alt punct din acelaşi sistem cu costuri<br />
scăzute;<br />
Sistemele de prelucrare a informaţiilor sunt din ce în<br />
ce mai capabile de a informa, de a sprijini procesul<br />
decizional şi, mai mult, de a învăţa.<br />
21
Tehnologia informaţională<br />
Două schimbări esenţiale :<br />
Descentralizarea puterii informatice şi a<br />
stocării datelor şi deplasarea către utilizator;<br />
Utilizarea pe scară largă a telecomunicaţiilor<br />
care fac legătura electronică între diferitele<br />
componente ale sistemelor informaţionale.<br />
22
Tehnologia informaţională<br />
Tehnologia informaţională cuprinde, pe lângă<br />
elementele care asigură colectarea,<br />
prelucrarea, stocarea şi transmiterea<br />
informaţiilor (sub formă de voce, imagine,<br />
text şi numerică pe baza microelectronicii,<br />
prin intermediul combinării informaticii cu<br />
telecomunicaţiile) şi elementele teoretice şi<br />
metodologice privind dezvoltarea sistemelor<br />
informatice.<br />
23
Tehnologia informaţională<br />
<br />
<br />
<br />
<br />
Principalele tehnologii informaţionale:<br />
Internetul<br />
<strong>Tehnologii</strong> de recunoaşterea optică a caracterelor<br />
OCR (Optical Character Recognition)<br />
<strong>Tehnologii</strong> tip Bancomatele (Automat Teller Machine<br />
- ATM)<br />
<strong>Tehnologii</strong> online de realizare a întâlnirilor (de<br />
conferenţiere)<br />
24
Tehnologia informaţională<br />
Tehnologia multimedia<br />
Tehnologia de gestiune electronică a<br />
documentelor<br />
Alte tehnologii informaţionale<br />
25
INTERNETUL<br />
Internet = Reţea a tuturor reţelelor<br />
Reţelele de calculatoare – Avantaje:<br />
a) Partajarea resurselor – echipamentele şi în<br />
special datele sunt disponibile pentru<br />
oricine din reţea, indiferent de localizarea<br />
fizică a utilizatorului<br />
26
INTERNETUL<br />
b) Accesul la informaţie de la distanţă – poate<br />
lua diferite forme, de la accesul la programe<br />
până la accesul la baze de date la distanţă<br />
(rezervări de locuri, de cărţi, operaţiuni<br />
bancare etc.)<br />
c) Comunicaţii interpersonale – pot lua forme<br />
de mesaje de e-mail, întâlniri virtuale,<br />
instruire la distanţă<br />
d) Realitate virtuală partajată.<br />
27
INTERNETUL<br />
Internetul are la bază reţele de calculatoare<br />
dispersate la nivel mondial în toate colţurile<br />
lumii, care comunică între ele prin<br />
intermediul unui protocol Internet – Protocol<br />
(IP).<br />
Fiecare gazdă din Internet are o adresă IP<br />
care codifică adresa sa de reţea şi de gazdă,<br />
combinaţia fiind unică.<br />
28
INTERNETUL - Poştă electronică<br />
Mesajele de poştă electronică sunt compuse<br />
din mesajul în sine şi un plic.<br />
To: xxx@yahoo.com<br />
From: zzz@gmail.com<br />
Date: sat 17 th nov<br />
Subject: Conferinta<br />
Avshvchvjhdcvjhdvjh<br />
29<br />
Attachments:
INTERNETUL - Poştă electronică<br />
MTS din Internet permite transportul<br />
mesajelor prin reţea Internet pe bază de<br />
“stochează şi înaintează” sau “stochează şi<br />
descarcă”.<br />
Informaţiile pot fi transmise la orice oră<br />
30
INTERNETUL - Poştă electronică<br />
Elementele unui sistem de e-mail şi ale<br />
sistemului de transfer<br />
31
INTERNETUL - Poştă electronică<br />
Operaţiunile sistemului de e-mail<br />
(message relay<br />
32
INTERNET – PROCESAREA UNEI<br />
INTEROGĂRI DE LA CLIENT<br />
33<br />
Paşii executaţi de serverul web pentru<br />
procesarea unei interogări recepţionate de<br />
la clientul web:<br />
1. Browserul web sau alt client web trimite către<br />
serverul web o interogare cerând anumite<br />
resurse. Interogarea este transmisă în formă<br />
HTTP, în timp ce adresa resursei cerute este<br />
specificată în format Uniform Resource Locator<br />
(URL). Interogările sunt făcute de obicei<br />
utilizând comanda HTTP Get.
INTERNET – PROCESAREA UNEI<br />
INTEROGĂRI DE LA CLIENT<br />
2. După recepţionarea interogării de la client, serverul<br />
web determină existenţa resursei în cadrul<br />
resurselor controlate de serverul respectiv;<br />
3. în cazul în care resursa este disponibilă, serverul<br />
web determină drepturile de acces, iar dacă aceste<br />
drepturi nu au fost încălcate, returnează către client<br />
conţinutul resursei dorite;<br />
4. în cazul în care drepturile de acces au fost<br />
încălcate, serverul web respinge interogarea,<br />
returnând clientului atenţionarea de rigoare;<br />
34
INTERNET – PROCESAREA UNEI<br />
INTEROGĂRI DE LA CLIENT<br />
5. în cazul în care resursa nu se găseşte pe serverul<br />
web, serverul determină informaţia despre resursă<br />
din fişierele de configuraţie, acestea cuprinzând<br />
inclusiv o posibilă relocare în reţea. Dacă resursa a<br />
fost alocată serverului, dar a fost redirectată<br />
temporar către o altă locaţie, serverul informează<br />
clientul despre acest fapt;<br />
6. dacă serverul web suportă un arbore virtual<br />
construit din alte servere web, căutarea va fi<br />
redirecţionată către resursele necesare;<br />
35
INTERNET – PROCESAREA UNEI<br />
INTEROGĂRI DE LA CLIENT<br />
7. dacă serverul web este utilizat ca şi server proxy, el<br />
acţionează pe de-o parte ca şi server web pentru clientul care<br />
a transmis interogarea, iar pe de altă parte ca şi client web<br />
pentru a interoga un alt server web. Acesta este un simplu<br />
agent de retransmisie care regăseşte şi stochează în cache<br />
pagini web pentru persoanele din interior dar care nu permite<br />
accesul vizitatorilor la resursele interne. Pentru a utiliza un<br />
server proxy, fiecare browser trebuie configurat să poată:<br />
a. trimite toate cererile GET către serverul proxy şi nu către gazda<br />
specificată în URL;<br />
b. să includă întregul URL, inclusiv numele serverului şi portul în<br />
cererea GET.<br />
8. după returnarea informaţiilor către client, serverul închide<br />
conexiune cu acesta.<br />
36
INTERNET – PROCESAREA UNEI<br />
INTEROGĂRI DE LA CLIENT<br />
Interacţiunile dintre client şi server<br />
37
INTERNET – PROCESAREA UNEI<br />
INTEROGĂRI DE LA CLIENT<br />
<br />
Server web pe post de agent de retransmisie<br />
(proxy)<br />
38
INTERNET - Motoare de căutare<br />
<br />
<br />
Motoarele de căutare pe Internet sunt site-uri web<br />
specializate, create pentru a ajuta oamenii să<br />
găsească informaţii stocate în alte site-uri.<br />
Execută trei sarcini de bază:<br />
– caută pe Internet sau „selectează" părţi din Internet, pe<br />
baza cuvintelor importante;<br />
– reţin un index al cuvintelor pe care le găsesc şi a locului<br />
acestora;<br />
– permit utilizatorilor să caute cuvinte sau combinaţii de<br />
cuvinte găsite în acest index.<br />
39
INTERNET - Motoare de căutare<br />
Motoarele de căutare de pe Internet alătură<br />
date separate pentru ca utilizatorul să<br />
găsească ceea ce are nevoie.<br />
Pentru a găsi informaţii din miliardele de<br />
pagini web, un motor de căutare foloseşte o<br />
aplicaţie specială, numită „robot de căutare"<br />
sau „spider", pentru a construi o listă de<br />
cuvinte găsite în paginile web.<br />
40
INTERNET - Motoare de căutare<br />
Procesul prin care un spider îşi construieşte<br />
lista se numeşte „web crawling", iar pentru ca<br />
un motor de căutare/spider să construiască o<br />
listă eficientă de cuvinte, acesta trebuie să<br />
caute printr-o mulţime de pagini.<br />
41
Un "Spider" obţine conţinutul unei pagini web şi creează o listă de cuvinte<br />
cheie care permit utilizatorilor să găsească informaţiile pe care le doresc<br />
42
INTERNET - Motoare de căutare<br />
Un spider îşi începe căutarea prin web<br />
pornind de obicei de la o listă cu servere<br />
intens utilizate şi cu pagini web foarte<br />
populare. Spider-ul va începe cu un site<br />
popular indexând cuvintele din pagini şi<br />
urmând toate legăturile găsite în site-ul<br />
respectiv, ajungând în acest fel să traverseze<br />
şi să indexeze partea cea mai utilizată a<br />
web-ului.<br />
43
INTERNET - Motoare de căutare<br />
<br />
<br />
<br />
Google.com a început ca un motor de căutare<br />
academic.<br />
Sistemul a fost construit pentru a utiliza mai mulţi<br />
spider-i, trei de obicei, fiecare spider putând să ţină<br />
deschise 300 de conexiuni către pagini web la un<br />
moment dat.<br />
La cea mai ridicată performanţă, folosind patru<br />
spideri, sistemul putea căuta în peste 100 pagini pe<br />
secundă, generând 600 kilobytes de date în fiecare<br />
secundă<br />
44
INTERNET - Motoare de căutare<br />
Era necesară construirea unui sistem care să<br />
alimenteze spider-ii cu informaţii.<br />
Google.com iniţial avea un server dedicat<br />
pentru a oferi URL-uri spiderilor.<br />
Google avea şi propriul server DNS,<br />
translatarea numelor în adrese fiind<br />
semnificativ mai rapidă, micşorând în acelaşi<br />
timp şi întârzierile datorate reţelelor.<br />
45
INTERNET - Motoare de căutare<br />
<br />
<br />
<br />
În momentul în care un spider Google vizita o pagină<br />
HTML, acesta ţinea cont de două lucruri:<br />
– cuvintele găsite în pagină;<br />
– poziţia acestor cuvinte în pagină.<br />
Cuvintele găsite în titlu, subtitlu, metatag-uri şi alte<br />
poziţii de importanţă relativă erau notate cu o<br />
semnificaţie specială în timpul căutărilor iniţiate de<br />
utilizatori.<br />
Spider-ul a fost construit pentru a indexa toate<br />
cuvintele semnificative din pagină, lăsând la o parte<br />
cuvintele de legătură.<br />
46
INTERNET - Motoare de căutare<br />
<br />
Alţi spider-i folosesc alte procedee pentru indexare,<br />
permiţând, spre exemplu, spider-ilor să opereze mai<br />
rapid sau să permită utilizatorilor să caute mai<br />
eficient sau ambele. De exemplu, unii spideri menţin<br />
o listă de cuvinte din titlu, subtitlu şi legături,<br />
împreună cu cele mai utilizate 100 de cuvinte din<br />
pagină şi fiecare cuvânt din primele 20 de linii de<br />
text. Lycos utilizează această modalitate de indexare<br />
a conţinutului paginilor web.<br />
47
INTERNET - Motoare de căutare<br />
<br />
<br />
Alte sisteme, precum AltaVista.com, merg în altă<br />
direcţie, indexând toate cuvintele din pagină, inclusiv<br />
toate cuvintele de legătură sau „nesemnificative".<br />
Această împingere către completitudine are şi alte<br />
modalităţi de funcţionare, mai ales prin utilizarea<br />
meta-tag-urilor.<br />
Meta-tag-urile permit proprietarului unei pagini să<br />
specifice cuvintele cheie şi conceptele sub care va fi<br />
indexată pagina respectivă<br />
48
INTERNET - Motoare de căutare<br />
După ce spider-ii au terminat sarcina de<br />
găsire a informaţiilor în paginile web, motorul<br />
de căutare trebuie să stocheze informaţiile<br />
adunate într-o modalitate utilizabilă.<br />
Există două componente care fac datele<br />
adunate accesibile utilizatorilor:<br />
– informaţia stocată cu datele;<br />
– metoda în care este indexată informaţia<br />
49
INTERNET - Motoare de căutare<br />
<br />
<br />
<br />
Un motor de căutare va stoca doar cuvintele şi URLul<br />
unde au fost găsite.<br />
– Motor de căutare cu utilizări limitate<br />
Motoarele de căutare stochează mult mai multe date<br />
decât cuvântul şi URL-ul în care a fost găsit.<br />
Un motor ar putea stoca numărul de apariţii al<br />
cuvântului în pagină, putând de asemenea să<br />
asigneze câte o „greutate" fiecărei intrări, cu valori<br />
mai mari ataşate cuvintelor care apar către începutul<br />
documentului, în subtitluri, legături, meta-tag-uri sau<br />
titlul paginii.<br />
50
INTERNET - Motoare de căutare<br />
Fiecare motor de căutare are diferite formule<br />
sau modalităţi pentru asignarea greutăţii<br />
pentru cuvintele din index. Acesta este unul<br />
din motivele pentru care o căutare după<br />
acelaşi cuvânt în motoare de căutare diferite<br />
va produce liste de rezultate diferite, cu<br />
paginile prezentate în ordini diferite, chiar<br />
dacă sunt indexate aceleaşi pagini.<br />
51
INTERNET - Motoare de căutare<br />
<br />
<br />
<br />
Datele vor fi stocate în mod codat, pentru a<br />
economisi spaţiul de stocare.<br />
După ce informaţia este compactată/codată, aceasta<br />
este gata de indexare.<br />
Scop: permite găsirea foarte rapidă a informaţiei.<br />
Există mai multe modalităţi de a construi un index,<br />
dar una din cele mai eficiente modalităţi este<br />
utilizarea unui tabel hash (hash table). Prin hashing,<br />
se aplică o formulă matematică pentru ataşarea unei<br />
valori numerice fiecărui cuvânt, formula fiind<br />
construită pentru a distribui în mod egal intrările de-a<br />
lungul unui număr predeteminat de diviziuni.<br />
52
INTERNET - Motoare de căutare<br />
<br />
<br />
Combinaţia de indexare şi stocare eficientă face<br />
posibilă obţinerea rapidă a rezultatelor, chiar dacă<br />
utilizatorul creează o interogare complexă.<br />
Căutarea printr-un index presupune construirea unei<br />
interogări de către utilizator şi transmiterea ei către<br />
motorul de căutare. Interogarea poate fi simplă,<br />
alcătuită din minim un cuvânt sau mai complexă,<br />
necesitând operator booleeni, care permit rafinarea<br />
şi extinderea căutării.<br />
53
INTERNET - Motoare de căutare<br />
Operatorii booleeni cei mai des utilizaţi sunt următorii:<br />
<br />
<br />
<br />
<br />
<br />
<br />
AND - toţi termenii separaţi prin „AND" trebuie să apară în pagină sau<br />
în document. Unele motoare de căutare pot folosi „+" în loc de „AND";<br />
OR - cel puţin unul din termenii separaţi prin „OR" trebuie să apară în<br />
pagină sau document;<br />
NOT - termenul sau termenii care urmează după „NOT" nu trebuie să<br />
apară în document. Unele motoare de căutare pot folosi „-" în locul<br />
cuvîntului „NOT";<br />
FOLLOWED BY - unul din termeni trebuie să fie urmat în mod direct<br />
de către altul;<br />
NEAR - unul din termeni trebuie să fie la o distanţă specificată în<br />
cuvinte de celălalt termen;<br />
Ghilimele - cuvintele dintre ghilimele sunt tratate sub formă de frază,<br />
iar acea frază trebuie să fie găsită în interiorul documentului sau<br />
paginii.<br />
54
INTERNET<br />
55<br />
O altă aplicaţie a Internetului o reprezintă<br />
INTRANET-UL şi EXTRANET-UL.<br />
Un Intranet este o reţea din interiorul unei<br />
organizaţii care leagă utilizatori multipli prin<br />
intermediul tehnologiilor Internet.<br />
Intraneturile limitează teritoriul nelimitat al<br />
Internetului, stabilind sectoare cu acces controlat în<br />
care utilizatorii pot să comunice şi să interacţioneze<br />
în mod liber. Reţelele au la bază World Wide Webul,<br />
permiţând utilizatorilor comunicarea între<br />
platforme diferite în timp real.
Intranetul funcţionează pe baza tehnologiilor<br />
Internet, dar în interiorul unei organizaţii.<br />
Permite mai multor persoane să interacţioneze în<br />
timp real, să stocheze şi să caute arhive de<br />
documente, să colaboreze pentru crearea unor<br />
documente, să schimbe grafice, imagini, documente<br />
audio şi video şi nu în ultimul rând, să converseze în<br />
timp real prin intermediul chat-ului. în plus,<br />
depinzând de modul de construcţie al intranetului,<br />
utilizatorii pot să navigheze pe Internet, fără să facă<br />
vreo diferenţă între accesul de pe intranet spre<br />
Internet.<br />
56
57<br />
Intraneturile oferă o gamă largă de beneficii<br />
care se încadrează în două mari categorii:<br />
eficienţă şi eficacitate.<br />
– eficienţa reprezintă îmbunătăţirea mecanismelor<br />
de schimb al informaţiei înlăturând obstacolele<br />
logistice pentru a aduna şi/sau distribui informaţia<br />
necesară în timpul cerut (corespunzător).<br />
– eficacitatea presupune impactul organizaţional<br />
asupra colaborării îmbunătăţite şi asupra luării<br />
deciziilor.
EXTRANET = INTRANET şi pentru alţii<br />
Extranet = un site Web cu acces controlat, în care o<br />
parte din vizitatori provin din afara organizaţiei.<br />
Extraneturile sunt utilizate pentru:<br />
– multe tipuri de aplicaţii de afaceri<br />
– B2B sau de comerţ electronic<br />
– managementul proiectelor sau<br />
– extraneturile colaborative permit schimbul de documente,<br />
planificări asociate unui anumit proiect sau unui partener.<br />
58
Extranetul permite :<br />
– partajarea documentelor actualizate, fişiere sau imagini cu<br />
parteneri sau clienţi aflaţi în locaţii disparate;<br />
– lucrarea în colaborare prin disponibilizarea pentru editare,<br />
revizuire, actualizare şi stocare a documentelor şi a<br />
bunurilor digitale;<br />
– gestionarea proiectelor într-un spaţiu de lucru centralizat;<br />
– oferirea de versiuni curente ale documentelor actualizate în<br />
mod frecvent.<br />
59
Tehnologia de recunoaşterea optică a<br />
caracterelor OCR<br />
Este utilizată în operaţiile de digitizare a<br />
datelor de tip text.<br />
În scop comercial, se foloseşte în magazine<br />
la citirea codurilor de bare de pe diferite<br />
produse.<br />
60
Tehnologia de recunoaştere optică a<br />
caracterelor OCR<br />
Principiile Tehnologiei OCR<br />
Sistemele de recunoaştere optică a caracterelor (OCR)<br />
recunosc numai imprimatele / materiale tipărite la imprimantă.<br />
Recurgând la tehnologia de suprapunere peste<br />
matrice/tipar, OCR traduce formele şi tipul specific/fontul<br />
caracterelor tipărite în codurile computerizate<br />
corespunzătoare. Deşi sistemele cele mai performante sunt<br />
capabile să recunoască fonturi multiple, ele pot prelucra numai<br />
fonturi standard, cum ar fi Times Roman şi Arial.<br />
O dată ce au fost recunoscute toate caracterele dintr-un cuvânt<br />
dat, cuvântul este confruntat cu un vocabular de răspunsuri<br />
potenţiale pentru rezultatul final.<br />
61
Tehnologia de recunoaştere optică a<br />
caracterelor OCR<br />
<br />
<br />
Procesul de recunoaştere a caracterelor segmentează apoi<br />
liniile textului sau cuvintelor în caractere separate, care sunt<br />
recunoscute după modul de asamblare a formelor ce le<br />
constituie. Caracterele scrisorilor printate ocupă spaţii uniforme<br />
pe tot cuprinsul unei pagini şi aşezate simetric de sus în jos,<br />
ceea ce permite sistemului OCR să citească textul caracter<br />
cu caracter.<br />
Segmentarea în caractere singulare constituie un punct slab<br />
de importanţă crucială în procesul de recunoaştere, pentru<br />
organizaţiile centrate pe prelucrarea formei, întrucât<br />
tehnologia de recunoaştere OCR necesită imagini de calitate<br />
superioară, cu un contrast, cu caractere şi claritate excelente.<br />
62
Tehnologia de recunoaştere optică a<br />
caracterelor OCR<br />
<br />
<br />
Un text mai puţin decât perfect va determina şi cele<br />
mai sofisticate sisteme OCR să producă diminuări<br />
considerabile ale gradului de acurateţe, la<br />
procesarea unor imagini degradate.<br />
De exemplu, atunci când caracterele se distanţează<br />
din cauza unei slabe calităţi a imaginii; sau când<br />
multiple caractere se suprapun din cauza fundalului<br />
neclar sau tulbure dintre ele, acurateţea procesului<br />
de recunoaştere poate fi redusă chiar şi cu 20 de<br />
procente.<br />
63
Tehnologia de recunoaştere optică a<br />
caracterelor OCR<br />
<br />
<br />
<br />
Evaluarea gradului de acurateţe – aplicat asupra<br />
OCR – este reprezentat de procentul de caractere<br />
citite corect pe o pagină dată de text, iar<br />
sistemele prezintă un mare grad de variaţie,<br />
realizând o acurateţe între 95 şi 99 procente.<br />
Orice valoare / coeficient situat sub 100 de procente<br />
poate avea drept consecinţă mari pierderi în cadrul<br />
productivităţii.<br />
o întreagă aplicaţie sau proces de verificare poate fi<br />
compromis, dacă şi numai 5 procente din date sunt<br />
fie introduse greşit, fie citite incorect.<br />
64
Tehnologia de recunoaştere optică a<br />
caracterelor OCR<br />
Sistemele OCR trebuie să posede abilitatea<br />
de a „corecta citirea” rezultatelor:<br />
– marcând caracterele pe care sistemul nu le<br />
recunoaşte<br />
– redirecţionând textul respins operatorilor umani,<br />
pentru procesare manuală.<br />
65
Tehnologia de recunoaştere optică a<br />
caracterelor OCR<br />
Analiza imaginii utilizează un set de tehnici de<br />
recunoaştere/identificare a tiparelor, care permite<br />
sistemelor computerizate să recunoască şi să<br />
interpreteze imaginile.<br />
Analiza Imaginilor constă din două etape:<br />
– Procesarea/Prelucrarea şi Analiza Imaginilor şi<br />
– Recunoaşterea/Identificarea Tiparelor<br />
1. Procesarea şi analiza imaginilor include paşi, cum ar fi:<br />
– Restaurarea imaginii în scopul de a ameliora problemele<br />
stringente legate de calitate şi facilitate a utilizării<br />
– Extragerea caracteristicilor care urmează a fi folosite în<br />
stadiul ulterior de recunoaştere/identificare a tiparelor.<br />
66
Tehnologia de recunoaştere optică a<br />
caracterelor OCR<br />
2. Recunoaşterea tiparelor include la rândul său:<br />
– Localizarea ariei de interes în cadrul imaginii originare<br />
– Extragerea datelor<br />
– Validarea unei reprezentări sau a unui context preexistent<br />
Exemple de analiză a imaginilor:<br />
– Localizarea zonelor de interes pe scrisori, fişe/hărţi şi<br />
planuri, precum şi pachete<br />
– Localizarea şi detectarea automată a indiciilor pe imaginile<br />
reprezentând plicuri<br />
– Verificarea/Inventarierea colecţiei/stocului de control şi<br />
identificarea semnăturii<br />
67
Tehnologia de recunoaştere optică a<br />
caracterelor OCR<br />
Soft OCR<br />
Procesare<br />
video<br />
Extragerea<br />
caracteristicilor<br />
Recunoaşterea<br />
caracterelor<br />
Comanda<br />
de pornire<br />
Dispozitiv<br />
alimentare<br />
documente<br />
Stocarea<br />
secvenţei<br />
Editare<br />
Salvare/<br />
inregistra<br />
re<br />
Afişare<br />
Tastatură<br />
68
Tehnologia de recunoaştere optică a<br />
caracterelor OCR<br />
Informaţii generale<br />
69<br />
În termeni generali, software-ul OCR examinează o<br />
imagine scanată în hartă binară şi traduce textul<br />
din interiorul acesteia într-un fişier care poate fi<br />
editat.<br />
Primele sisteme OCR traduceau textul într-un singur<br />
font şi dimensiune.<br />
Programele actuale încearcă să reproducă nu numai<br />
fonturile, ci şi trăsături complexe de aşezare în<br />
pagină, cum ar fi:<br />
– coloane, tabele, antete şi note de subsol<br />
– chiar şi grafice
Tehnologia de recunoaştere optică a<br />
caracterelor OCR<br />
Software-ul OCR citeşte textul caracter cu<br />
caracter<br />
Există tipuri diferite de scheme de<br />
recunoaştere a tiparelor, şi fiecare software<br />
OCR<br />
– utilizează un set diferit de modele şi<br />
– le implementează de maniere diferite.<br />
70
Tehnologia de recunoaştere optică a<br />
caracterelor OCR<br />
Componentele software-ului OCR<br />
Sistemele OCR utilizate în mod frecvent<br />
includ trei componente:<br />
– Un scanner de imagine<br />
– Software-ul (Programul) şi Hardware-ul<br />
(Echipamentul) OCR<br />
– O interfaţă pentru afişarea rezultatelor<br />
procesării<br />
71
Tehnologia de recunoaştere optică a<br />
caracterelor OCR<br />
<br />
<br />
<br />
Procesul implică trei operaţiuni:<br />
Analiza imaginii (Extragerea imaginilor – pe<br />
caractere individuale – din documentul scanat)<br />
Recunoaşterea imaginii<br />
(Recunoaşterea/Identificarea acestor imagini după<br />
formă)<br />
Procesarea imaginii în funcţie de context<br />
– fie pentru a corecta clasificările greşite efectuate de<br />
algoritmul de recunoaştere<br />
– fie pentru a limita opţiunile de recunoaştere<br />
72