12.07.2015 Views

Elektronika 2009-03.pdf - Instytut Systemów Elektronicznych

Elektronika 2009-03.pdf - Instytut Systemów Elektronicznych

Elektronika 2009-03.pdf - Instytut Systemów Elektronicznych

SHOW MORE
SHOW LESS
  • No tags were found...

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

General InformationFor several years the DSP group atthe Chair of Control and SystemEngineering at Poznan University ofTechnology leads for the students ofAutomation and Robotics courses(lectures, laboratory experiments, andprojects) on modern Digital SignalProcessing. Their contents includeDSP theory and applications of theTMS320, Blackfin, and dsPICprocessors. These topics are taught,e.g., in the following courses:• Introduction to digital signal processing,• Systems, signals, and information• Digital filters,• Audio and video processing,• DSP designer laboratory.Principles of operation of DSP's, theirarchitectures, programming technique,and DSP applications are taught bythe staff at the Division of SignalProcessing and Electronic Systems intwo didactic laboratories. Both areequipped with PC computers togetherwith the DSP based hardware andsoftware. In these laboratories weteach the basics of preparing andtesting applications using:• Starter Kits C5402,• Starter Kits C6711,• Starter Kits C6713,• EZ-Kit BF535,• dsPIC 30F/33F modules.The laboratories are also equippedwith scopes, generators,basic electroacoustic devices(speakers, microphones, mixers,amplifiers, CD-players, etc.),camcorders, audio/videomixers and the specializedDSP equipment, e.g.:• sample rate convertersSRC4392• DaVinci modulesDM643,• NanoBoards NB2 byAltium,• various DSP and dataacquisition equipment by NationalInstruments including CompactDAQseries, CompactRIO, and ELVIS IIeducational design and prototypingplatforms,• Tucker Davis system 3 modularDSP workstations.Specially for the students we havewritten the handbook entitled "SignalProcessing using Signal Processors"("Przetwarzanie sygnaùów przy uýyciuprocesorów sygnaùowych" in Polish). Wehave also prepared a wide rangecollection of laboratory instructions,which are available on our web sites.Industrial projectsOne of our first commercialDSP projects with thehardware/softwarewas theprofessionalmulti channelaudio PC carddesigned in cooperationwith theDynaBit companystarted in 1999. The systemhas included TMS320C542 from TIand CS4226 from CrystalSemiconductor. Beside the task ofcontrolling the signal flow,the DSP was usedfor various realtimeaudioprocessingfunctions and effects,supported by themultichannel capacityof the card.Our newest project isAccino 2 – amicrocontroller basedmeasurement system. Itis intended to test roadrestraint systems, i.e., tomeasure and compute the followingparameters: ASI (acceleration severityindex), THIV (theoretical head impactvelocity), and PHD (post-impact headdeceleration). These parameters areneeded to test new road restraintsystems according to the currentstandards (e.g., PN-EN 1317-1: 1998).ACCINO 2 contains a microprocessoracceleration recorder with iMEMSdevices (accelerometers andgyroscope). It is mounted in a testvehicle observed also with an externalcamera. The recordermeasures and registersaccelerations in three(XYZ) dimensions. Anadditional PC softwarereads the data fromthe recorder andcomputes ASIparameter. Afterincluding additionalinformation about the impactgeometry extracted from the


gyroscope and from the videosequence recorded by the camera,the other two parameters, namelyTHIV and PHD are calculated.Illustrative grants and projects• Emergency telephone conversationsdatabase with signal analysis,classification, and identificationfacilities,• Extended precision method foraccumulation of floating-pointnumbers using DSP's,• Bluetooth versus other shortrangewireless systems forinformation transmission in biomedicaldevices,• Computing tricks, and architecturesfor signal processingtasks,• Chosen techniques for processingof pseudowhisper of thelaryngectomized,• Flexible architecture of ultra-lowpowercurrent-mode interleavedsuccessive approximationanalog-to-digital converter forwireless sensor networks,• Polish Platform for HomelandSecurity (PPBW) project: “Systemfor analysis, classification, andassistance for recognition ofpersons by means of recordings oftelephone calls to the emergencyservices”,• EU 7th Framework ProgrammeProject: “Intelligent InformationSystem Supporting Observation,Searching and Detection forSecurity of Citizens in UrbanEnvironment”.IEEE SPA ConferenceEvery year our DSP Group organizes ascientific workshop called SPA (SignalProcessing: Algorithms, Architectures,Arrangements, and Applications).Among the conference aims are: presentationof the newest achievements ina wide and interdisciplinary area ofsignal processing and integration ofresearchers active in this and in relatedfields of science and technology, asthese specialists usually representdifferent or even traditionally disjointscientific disciplines.Full information about the conferenceis available on the web site:http://www.ieee.put.poznan.plProf. Adam DàbrowskiGroup chairmanTomasz Marciniak, Ph. D.DSP implementationPaweù Pawùowski, Ph. D.DSP & µC implementationAndrzej Meyer, Ph. D.Audio processingIrena Chmielewska, Ph. D.Communication systemsAdam KonieczkaFace recognitionTomasz Janiak,TechnicianMaùgorzata Piskorz,SecretaryDamian Cetnarowicz, Ph. D.Speech separationSzymon Drgas, M. Sc.Audio processingMarek Portalski, Ph. D.Analog IC frontendPiotr Kardyú, Ph. D.Measurement systemsJulian BalcerekStereovision and DatabasesAndrzej NamerùaTechnicianContactDivision of Signal Processing and Electronic SystemsChair of Control and Systems EngineeringPoznan University of Technologyul. Piotrowo 3a60-965 Poznan, Polandwww.dsp.put.poznan.plwww.ieee.put.poznan.pl (IEEE SPA Conference)e-mail: Adam.Dabrowski@put.poznan.plphone: +48 61 665 2841 or -2831, or -2745; fax: +48 61 665 2840


konstrukcje technologie zastosowaniaMIESIECZNIK NAUKOWO-TECHNICZNYrok L nr 3/<strong>2009</strong>• MATERIAŁY • KONSTRUKCJE • UKŁADY• SYSTEMY • MIKROELEKTRONIKA• OPTOELEKTRONIKA • FOTONIKA• ELEKTRONIKA MIKROFALOWA• MECHATRONIKA• ENERGOELEKTRONIKA • INFORMATYKAZESPÓŁ REDAKCYJNYprof. dr hab. inż. Jerzy Klamka - redaktor naczelny,Bożena Lachowicz - sekretarz redakcjiStali współpracownicy: mgr inż. Wiesław Jabłoński,mgr inż. Krzysztof Kowalski, dr Juliusz SzczęsnyAdres redakcji: ul. Chmielna 6 m.6, 00-020 Warszawa,tel./fax: (022) 827 38 79; tel.: (022) 826 65 64,e-mail: elektronika@red.pl.pl, www.elektronika.orf.plZamówienia na reklamę przyjmuje redakcja lub Dział Reklamyi Marketingu, ul. Mazowiecka 12, 00-950 Warszawa, skr. 1004,tel./fax (022) 8274366, 8268016, e-mail: reklama@sigma-not.plKolportaż: ul. Ku Wiśle 7, 00-716 Warszawa, tel.: (022) 840 35 89;tel./fax:: (022) 840 59 49, (022)891 13 74RADA PROGRAMOWAprof. dr hab. inż. Władysław Torbicz (PAN) - przewodniczącyprof. dr hab. inż. Leonard Bolc, prof. dr hab. Zdzisław Drozd, prof. drhab. inż. Jerzy Fraczek, dr inż. Józef Gromek, mgr inż. Jan Grzybowski,prof. dr hab. Ryszard Jachowicz, prof. dr hab. WłodzimierzJanke, prof. dr hab. Andrzej Jakubowski, prof. dr hab. WłodzimierzKalifa, inż. Stefan Kamiński, prof. dr hab. inż. Marian P. Kaźmierkowski,dr inż. Wojciech Kocańda, prof. dr hab. Bogdan Kosmowski, mgrinż. Zbigniew Lange, prof. dr hab. Benedykt Licznerski, dr inż. ZygmuntŁuczyński, prof. dr hab. Bohdan Mroziewicz, prof. dr hab. TadeuszMorawski, prof. dr hab. Andrzej Napieralski, prof. dr hab. TadeuszPałko, prof. dr hab. inż. Marian Pasko, prof. dr hab. Józef Piotrowski,dr hab. inż. Ryszard Romaniuk, dr hab. inż. Grzegorz Różański, drhab. inż. Edward Sędek, prof. dr hab. Ludwik Spiralski, prof. dr hab.inż. Zdzisław Trzaska, mgr inż. Józef Wiechowski, prof. dr hab.inż. Marian Wnuk, prof. dr hab. inż. Janusz ZarębskiCzasopismo dotowane przez Ministerstwo Naukii Szkolnictwa Wyższego. Za opublikowane w nim artykułyMNiSzW przyznaje 6 punktów.“<strong>Elektronika</strong>” jest wydawanaprzy współpracy Komitetu Elektronikii Telekomunikacji Polskiej Akademii NaukIEEEWYDAWNICTWOCZASOPISM I KSIĄŻEKTECHNICZNYCHSIGMA - NOTSpółka z o. o.00-950 Warszawaskrytka pocztowa 1004ul. Ratuszowa 11tel.: (0 22)818 09 18, 818 98 32fax: (0 22) 619 21 87Internethttp://www.sigma-not.plPrenumeratae-mail: kolportaz@sigma-not.plInformacjae-mail: informacja@sigma-not.plRedakcja współpracujez Polską Sekcją IEEE“<strong>Elektronika</strong>” jest notowanaw międzynarodowej bazie IEEInspecPublikowane artykuły nukowe byłyrecenzowane przez samodzielnychpracowników naukiRedakcja nie ponosi odpowiedzialnościza treść ogłoszeń. Zastrzegasobie prawo do skracania i adjustacjinadesłanych materiałów.Indeks 35722Nakład do 2000 egz.Druk: Drukarnia SIGMA-NOT Sp. z o.o.SPIS TREŚCI • CONTENTSEstimation of object size in the calibrated camera image(Estymacja rozmiaru obiektów w obrazach ze skalibrowanej kamery)- G. Szwoch, P. Dalka, A. Czyżewski .................................Video coding using redundant dictionary of base functions(Koder wideo z użyciem nadmiarowego słownika funkcji bazowych)- Ł. Saganowski ..............................................................Dependence of the head-related transfer function on pinnaflare angle (Zależność funkcji transmitancji odniesionej dogłowy od kąta wychylenia małżowiny usznej) - P. Plaskota,A. B. Dobrucki ..............................................................................Automatyczna weryfikacja mówcy oparta na cechach prozodycznych(Speaker verification based on prosodic features) -Sz. Drgas, D. Cetnarowicz, A. Dąbrowski ....................................Badania przestrzennych cech dźwięku mis dźwiękowych(Research of the sound spatial properties of the sound bowls) -A. Meyer, H. Portalska, M. Portaski .............................................Metoda wizualizacji pola akustycznego mis dźwiękowych (Visualizationmethod of sound bowl acoustic field) - A. Meyer,H. Portalska, M. Portaski, A. Konieczka, J. Balcerek ..................Current-mode analog memory with extended storage timefor hardware-implemented neural networks (Pracująca w trybieprądowym pamięć analogowa o wydłużonym czasie przechowywaniainformacji do sprzętowej realizacji siecineuronowych) - R. Wojtyna ........................................................Efficient image watermarking in the transform domain withthe discrete trigonometric transforms (Zagadnienie efektywnegooznaczania obrazów znakami wodnymi za pomocą transformacjitrygonometrycznych) - P. Korohoda, A. Dąbrowski .......Fractional delayor application in self-tuning sub-sampledelay estimator (Aplikacja filtru ułamkowo-opóźniającego wsamonastrajalnym estymatorze podpróbkowego opóźnienia) -E. Hermanowicz, M. Rojewski ....................................................Digital network of labelled nodes for image processing (Cyfrowasieć do równoległego przetwarzania obrazów) - P. Brylski,M. Strzelecki ..............................................................................DVB-T2 - nowy standard naziemnej telewizji cyfrowej porównaniez DVB-T (DVB-T2 - the new digital terrestrial televisionstandard comparison with DVB-T) - M. Dąbrowski,J. Modelski..................................................................................Novel techniques applied to biometric human identification(Nowe metody w biometrycznej identyfikacji osób) - M. Choraś ...Real-time procedures for automatic recognition of roadsigns (Procedury rozpoznawania znaków drogowych w czasierzeczywistym) - P. Pawłowski, D. Prószyński, A. Dąbrowski ....Stereowizyjne metody tworzenia wrażeń trójwymiarowych zobrazów dwuwymiarowych (Stereovision methods for creating3D impressions from 2D images) - J. Balcerek, A. Dąbrowski,A. Konieczka .............................................................................Influence of subband signal denoising for voice activity detection(Wpływ odszumiania w podpasmach na detekcję sygnałumowy) - T. Marciniak, A. Dąbrowski .......................................TECHNIKA SENSOROWA: Mikroprocesorowy sterownik temperaturydo mikroreaktora chemicznego wykonanego technikąLTCC (Microprocessor temperature controller forLTCC-based chemical microreactor) - D. Jurków, K. Malecha,P. Durczyński, L. J. Golonka ...........................................................10141921252934394346515457626771ELEKTRONIKA 3/<strong>2009</strong> 3


TECHNIKA MIKROFALOWA I RADIOLOKACJA: Wybrane problemykompresji i syntezy sygnałów radarowych (Chosenproblems of pulse compression and radar signals synthesis) -A. Kawalec, Cz. Leśnik, J. Sołowicz, E. Sędek, M. Łuszczyk ..........Szkło dla fotoniki. Część 7. Szkło optyczne gradientowe(Glasses for photonics. Part 7. Optical gradient glasses) - R. Romaniuk.........................................................................................Systemy identyfikacji radiowej - technologiczna globalizacja(Radio Frequency Identification Systems - Technological Globalization)- J. Bogucki ........................................................................Wpływ szumów mikrofonowania na stanowisko do pomiaruszumów fazowych generatorów mikrofalowych pracującychw paśmie X (The influence of the microphonic noiseon phase noise measurement system for generators working inthe X band) - B. Idźkowski, A. Utko ................................................76849092State-of-the-art bolometers - principles, devices, applications(Nowoczesne bolometry - zasady działania, konstrukcje,zastosowania) - P. Wierzba ........................................................... 95Analiza wpływu samonagrzewania na charakterystyki liniowegostabilizatora napięcia z tranzystorem MOS (Analysis ofthe influence of selfheating on the characteristics of the linearvoltage regulator including the MOS power transistor) -K. Górecki, J. Zarębski .............................................................. 103Zalety homodynowego, jednotorowego stanowiska do pomiarówszumów fazowych generatorów mikrofalowych (Theadvantages of homodyne single line phase noise measurementsystem for microwave oscillators) - B. Idźkowski, A. Francik ........ 106Electrical and thermal conductivities of nano- and microcrystallinecopper and composite thin-layer electrod (Elektrycznei termiczne konduktywności cienkich warstw z miedzii kompozytów o strukturze nano- i mikrokrystalicznej wytwarzanychelektrochemicznie) - M. Trzaska ......................................... 109Streszczenia artykułów • Summaries of the articlesSZWOCH G., DALKA P., CZYŻEWSKI A.: Estymacja rozmiaruobiektów w obrazach ze skalibrowanej kamery<strong>Elektronika</strong> (L), nr 3/<strong>2009</strong>, s. 10W artykule opisano metodę estymacji rzeczywistych rozmiarów obiektówśledzonych przez kamery. Obraz z kamery jest najpierw poddawanykalibracji, po czym proponowany algorytm dokonuje estymacjiszerokości i wysokości śledzonych obiektów ruchomych. Wyniki estymacjirozmiarów są wykorzystywane następnie w algorytmie klasyfikującymobiekty ruchome. Porównano dwie metody kalibracji kamery,opisano i przedyskutowano wyniki testów przeprowadzonychz użyciem opisywanego algorytmu. Proponowany algorytm ma byćzastosowany w systemie monitoringu wizyjnego dokonującego automatycznejdetekcji zdarzeń w obrazie z kamer.Słowa kluczowe: analiza obrazu, śledzenie obiektów, estymacja rozmiaru,klasyfikacja obiektów, monitoring wizyjnySZWOCH G., DALKA P., CZYŻEWSKI A.: Estimation of object sizein the calibrated camera image<strong>Elektronika</strong>(L), no 3/<strong>2009</strong>, p. 10In the paper, a method of estimation of the physical sizes of the objectstracked by the camera is presented. First, the camera is calibrated,then the proposed algorithm is used to estimate the real widthand height of the tracked moving objects. The results of size estimationare then used for classification of the moving objects. Two methodsof camera calibration are compared, test results are presentedand discussed. The proposed estimation algorithm is intended to beused in the video surveillance system for automatic detection ofevents in the camera images.Keywords: image analysis, object tracking, size estimation, objectclassification, video monitoringSAGANOWSKI Ł.: Koder wideo z użyciem nadmiarowego słownikafunkcji bazowych<strong>Elektronika</strong> (L), nr 3/<strong>2009</strong>, s. 14W artykule przedstawiony został Koder Obrazów Wideo z użyciemSłownika Funkcji Bazowych - SFB. W standardowych rozwiązaniachsygnał błędu predykcji kodowany jest z użyciem transformacji DCT.W zaproponowanym koderze wideo błąd predykcji zakodowany zostałz użyciem Słownika Funkcji Bazowych. SFB został zaadaptowanydo charakterystyki sygnału błędu predykcji.Słowa kluczowe: koder wideo, Słownik Funkcji Bazowych, błądpredykcjiSAGANOWSKI Ł.: Video coding using redundant dictionary ofbase functions<strong>Elektronika</strong> (L), no 3/<strong>2009</strong>, p. 14In this paper video coder with Base Function Dictionary - BFD hasbeen presented. In classic approach prediction error signal is encodedwith block based transformation such as popular Discrete CosineTransform - DCT. The coder proposed in this article uses BFD dictionaryto encode prediction error signal. BFD has been adapted toprediction error signal characteristic.Keywords: video coder, Base Function Dictionary, prediction errorPLASKOTA P., DOBRUCKI A. B.: Zależność funkcji transmitancjiodniesionej do głowy od kąta wychylenia małżowiny usznej<strong>Elektronika</strong> (L), nr 3/<strong>2009</strong>, s. 19Funkcja Transmitancji Odniesiona do Głowy (HRTF) opisuje modyfikacjęwidma fali akustycznej docierającej do ucha. HRTF wpływa nalokalizację źródła dźwięku przez system słuchowy. Zostało udowodnione,że cechy osobnicze silnie wpływają na HRTF. ZastosowanieHRTF, które jest różne dla każdego słuchacza powoduje pogorszeniezdolności lokalizacji źródła dźwięku podczas odsłuchu przezsłuchawki. Celem pracy jest zbadanie wpływu kąta odchyleniamałżowiny usznej na przebieg HRTF.Słowa kluczowe: HRTF, lokalizacja źródła dźwięku, małżowinausznaPLASKOTA P., DOBRUCKI A. B.: Dependence of the head-relatedtransfer function on pinna flare angle<strong>Elektronika</strong> (L), no 3/<strong>2009</strong>, p. 19Head Related Transfer-Function (HRTF) describes the modificationof the spectrum of acoustic wave arriving to the ear. The HRTF influencessound source localization by auditory system. It has beenproved that individual properties strongly influence HRTF. Applicationof HRTF which is different for each individual decreases the ability ofsound source localization by the listener during headphones soundprojection. The aim of the paper is the study of influence of pinna flareangle on the HRTF shape.Keywords: HRTF, sound source localization, pinna4 ELEKTRONIKA 3/<strong>2009</strong>


Streszczenia artykułów • Summaries of the articlesDRGAS SZ., CETNAROWICZ D., DĄBROWSKI A.: Automatycznaweryfikacja mówcy oparta na cechach prozodycznych<strong>Elektronika</strong> (L), nr 3/<strong>2009</strong>, s. 21W artykule oceniano skuteczność systemu automatycznej weryfikacjimówcy opartego na cechach prozodycznych. Poprawność rozpoznawaniamówcy zbadano za pomocą modeli opartych na bigramach.Na podstawie uzyskanych rezultatów wykazano, że rytm prozodii niesieistotne informacje zależne od mówcy. Ponadto opracowano metodędoboru liczby poziomów kwantyzacji w zależności od czasówtrwania segmentów.Słowa kluczowe: weryfikacja mówcy, cechy prozodyczne,współczynniki melkepstralne, bigramy, częstotliwość podstawowa F0MEYER A., PORTALSKA H., PORTASKI M.: Badania przestrzennychcech dźwięku mis dźwiękowych<strong>Elektronika</strong> (L), nr 3/<strong>2009</strong>, s. 25W artykule przedstawiono wielomikrofonowe stanowisko pomiarowedo badania dźwięku mis dźwiękowych. Podano również wyniki pomiarówzmienności procesów wybrzmiewania dźwięku oraz widmauśrednionej energii w funkcji położenia na obwodzie misy i miejscauderzenia w misę. Potwierdzono obserwowaną przez terapeutów anizotropiępola akustycznego mis i wpływ miejsca uderzenia na to pole.Słowa kluczowe: misa dźwiękowa, dźwięk przestrzennyMEYER A., PORTALSKA H., PORTALSKI M., KONIECZKA A.,BALCEREK J.: Metoda wizualizacji pola akustycznego mis dźwiękowych<strong>Elektronika</strong> (L), nr 3/<strong>2009</strong>, s. 29W artykule przedstawiono wielomikrofonowe stanowisko pomiarowedo badania dźwięku mis dźwiękowych. Podano metodę komputerowejgeneracji obrazu przedstawiającego przestrzenny rozkład energiidźwięku mis oraz przykładowe obrazy tego rozkładu. Potwierdzonoobserwowaną przez terapeutów zmienność w czasie i anizotropiępola akustycznego mis, a także wirowy charakter tego pola.Słowa kluczowe: wizualizacja, pole akustyczne, misa dźwiękowaDRGAS SZ., CETNAROWICZ D., DĄBROWSKI A.: Speaker verificationbased on prosodic features<strong>Elektronika</strong> (L), no 3/<strong>2009</strong>, p. 21In this paper accuracy of the speaker verification system based onprosodic features was evaluated. Efficiency of bigram models for thespeaker recognition was assessed. The results showed that in speechthe prosody rhythm carries valuable speaker specific information. Appropriatenumbers of quantization levels in relation to segments’ durationwas determined.Keywords: speaker verification, prosodic features, mel-frequencycepstral coefficients, bigrams, fundamental frequency F0MEYER A., PORTALSKA H., PORTASKI M.: Research of thesound spatial properties of the sound bowls<strong>Elektronika</strong> (L), no 3/<strong>2009</strong>, p. 25In this paper, the multimicrophone measurement position testing thesound bowls was presented. The results of the sound decay measurementsand the sound energy spectra as a function of the positionon the sound bowl circuit and the hit point onto the bowl were shown.The anisotropy of the acoustic field generated by sound bowls observedby therapists and the influence of the hit point on the acousticfield were confirmed.Keywords: sound bowl, spatial soundMEYER A., PORTALSKA H., PORTALSKI M., KONIECZKA A.,BALCEREK J.: Visualization method of sound bowl acousticfield<strong>Elektronika</strong> (L), no 3/<strong>2009</strong>, p. 29In this paper multimicrophone measurement post to test of specialsound bowls is presented. The method of digital image generationsshowing spatial distribution of bowls’ sound energy and image of energydistribution examples are given. The influence of bowl’s acousticfield on time and space both and circular character of this acousticfield are confirmed.Keywords: visualization, acoustic field, sound bowlWOJTYNA R.: Pracująca w trybie prądowym pamięć analogowao wydłużonym czasie przechowywania informacji do sprzętowejrealizacji sieci neuronowych<strong>Elektronika</strong> (L), nr 3/<strong>2009</strong>, s. 34W pracy przedstawiono ulepszone rozwiązanie pracującej w trybieprądowym pamięci analogowej z wydłużonym czasem przechowywaniainformacji. W typowych pamięciach analogowych, gdzie informacja jesttrzymana w postaci ładunku na kondensatorze, występują trudności z jejprzechowywaniem przez długi okres czasu. Wynika to głównie z prądówupływu w tranzystorze MOS, który pełni rolę klucza przełączającegomiędzy fazami zapisu i trzymania informacji w tej pamięci. Żeby zmniejszyćtę wadę, zaproponowano użycie dodatniego sprzężenia zwrotnegowokół klucza po to, by podać na bazę tranzystora MOS taki sam potencjałjak potencjał przechowywany w kondensatorze. W rezultacieprąd upływu został znacznie zmniejszony, a czas przechowywania informacjiwydłużony o kilka rzędów wielkości w porównaniu z taką samąpamięcią, ale bez sprzężenia zwrotnego. Przy odpowiednim zaprojektowaniuuzyskuje się mały pobór mocy przez pamięć. Omówiono takżeproblem niedopasowania wymiarów tranzystorów i okazało się, że niejest on krytyczny w naszym przypadku. Przedstawione wyniki symulacjiw pełni potwierdzają przewidywania teoretyczne.Słowa kluczowe: sprzętowe przetwarzanie sygnałów, przetwarzaniew trybie prądowym, układy analogowe ASIC, energooszczędneukłady CMOSWOJTYNA R.: Current-mode analog memory with extended storagetime for hardware-implemented neural networks<strong>Elektronika</strong> (L), no 3/<strong>2009</strong>, p. 34In this paper, improved solution of an analog current-mode memorywith prolonged holding time is presented. In typical analog memories,where the information is held as charge on a capacitor, there are difficultieswith storing it for a long period of time. This is mainly due toleakage currents in MOS transistors playing a role of keys switchingbetween sample and hold phases of the memory. To reduce this disadvantage,we propose to apply a positive feedback around theswitch to provide the same potential to the switching MOS-transistorbase as the potential across the holding capacitor. As a consequence,the current leakages have been decreased considerably and thememory storing time extended by several orders of magnitude comparedto the same memory but without feedback. Power consumed bythe memory is low when properly designed. Transistor size mismatchingproblem is also discussed and it turned out not to be criticalin our case. The presented simulation results fully confirm theoreticalpredictions.Keywords: hardware signal processing, current-mode processing,analog ASIC’s, low-power CMOS circuitsELEKTRONIKA 3/<strong>2009</strong> 5


KOROHODA P., DĄBROWSKI A.: Zagadnienie efektywnego oznaczaniaobrazów znakami wodnymi za pomocą transformacji trygonometrycznych<strong>Elektronika</strong> (L), nr 3/<strong>2009</strong>, s. 39W artykule zaprezentowano wykorzystanie pełnego zestawu 16-tudyskretnych transformacji trygonometrycznych (DTT) do efektywnegooznaczania obrazów za pomocą znaków wodnych tworzonych w dziedzinietransformaty.Zaproponowano technikę bazującą na transformacji całego obrazu,przy czym znak wodny umieszczano w części pola transformaty. Opisanokorzystne cechy takiego rozwiązania w połączeniu z rodziną DTT.Do weryfikacji efektywności proponowanej techniki oraz transformacjiDTT wybrano dwa podstawowe sposoby ataku: filtrację gaussowskąoraz kodowanie JPEG. Zbadano także problem, gdy do generowaniaznaku wodnego jest użyta inna transformacja niż do jego odtworzenia,uzyskując wskazanie do opracowania względnej klasyfikacji rodziny DTT.Przeprowadzone badania wykazały, że wszystkie transformacjeDTT są równie efektywne jak parzysta dyskretna transformacja kosinusowatypu II (DCT IIe) i mogą być traktowane jako zbiór alternatywnychpropozycji w celu poprawy efektywności oznakowania.Słowa kluczowe: znaki wodne w obrazach, dyskretne transformacjetrygonometryczneHERMANOWICZ E., ROJEWSKI M.: Aplikacja filtru ułamkowoopóźniającegow samonastrajalnym estymatorze podpróbkowegoopóźnienia<strong>Elektronika</strong> (L), nr 3/<strong>2009</strong>, s. 43W artykule przedstawiono nowe rozwiązanie samonastrajalnego estymatoraopóźnienia sygnału sinusoidalnego. Estymator działa w czasiedyskretnym. Proponowane rozwiązanie wykorzystuje kaskadowepołączenie cyfrowego filtru ułamkowo opóźniającego służącego do synchronizacjipróbkowania i liniowo-fazowego cyfrowego filtru Hilberta.Oryginalność polega na zastosowaniu tu filtrów cyfrowych o bardzomałej złożoności numerycznej. Jest ona znacznie mniejsza niż w dotychczasopublikowanych rozwiązaniach estymatora służącego do tegosamego celu i osiągającego wyniki o tej samej dokładności. W pracyprzeanalizowano charakterystyki opracowanego samonastrajalnegoestymatora i zilustrowano jego działanie w obecności szumu.KOROHODA P., DĄBROWSKI A.: Efficient image watermarkingin the transform domain with the discrete trigonometric transforms<strong>Elektronika</strong> (L), no 3/<strong>2009</strong>, p. 39In this paper a possibility of the use of the whole set of 16 discretetrigonometric transforms (DTTs) is presented for efficient image watermarkingin the transform domain.The proposed technique is based on transformation of the wholeimage with the watermark defined in a part of the transform domain.Advantageous properties of this approach are shown for all DTTs. Twoattacking techniques, namely: Gaussian filtering and JPEG codinghave been selected to verify the efficiency of all DTTs applied in theconsidered task. Additional discussion of a case of two different DTTsthe first one used for watermark generation and the second for the reconstruction,has provided hints to mutual classification of the DTTs.The study indicates that all DTTs perform as efficiently as thecommonly used discrete cosine transform type II-even (DCT IIe) andmay be considered as a set of alternative solutions for better watermarkingefficiency.Keywords: image watermarking, discrete trigonometric transformsHERMANOWICZ E., ROJEWSKI M.: Fractional delayor applicationin self-tuning sub-sample delay estimator<strong>Elektronika</strong>(L), no 3/<strong>2009</strong>, p. 43In this paper a novel solution of a self-tuning time delay estimator operatingin the discrete time domain on a sinusoidal signal is presented.The proposed solution is based on a concept of series connection ofa fractional delay filter and linear-phase Hilbert transform filter. Thenovelty of this solution lies in low numerical complexity, smaller thanpresented in hitherto published results. The performance of our selftuningtime delay estimator is analysed and illustrated by the resultsof its operation in presence of noise.Keywords: self-tuning estimator, fractional delay filter, Hilbert transformfilter, complex filterSłowa kluczowe: samonastrajalny estymator, filtr ułamkowo opóźniający,filtr Hilberta, filtr zespolonyBRYLSKI P., STRZELECKI M.: Cyfrowa sieć do równoległegoprzetwarzania obrazów<strong>Elektronika</strong> (L), nr 3/<strong>2009</strong>, s. 46Artykuł przedstawia koncepcję cyfrowego procesora graficznego zdolnegodo realizacji kilku operacji takich jak segmentacja obrazu, detekcjakrawędzi oraz redukcja szumów. Układ ten stanowi realizacjęSieci Synchronizowanych Oscylatorów (SSO) w technice cyfrowej.Cechy zaproponowanego układu zostały porównane z analogową implementacjąsieci SSO. W artykule zawarto również symulację funkcjonalnąIP Core opracowanego procesora podczas segmentacjiprzykładowego obrazu binarnego.Słowa kluczowe: segemntacja obrazu, FPGADĄBROWSKI M., MODELSKI J.: DVB-T2 - nowy standard naziemnejtelewizji cyfrowej porównanie z DVB-T<strong>Elektronika</strong> (L), nr 3/<strong>2009</strong>, s. 51Przedstawiono propozycję nowego standardu naziemnej telewizji cyfrowejDVB-T2 oraz porównano ją z obecnym standardem DVB-T.Słowa kluczowe: telewizja cyfrowa, DVB-T, DVB-T2CHORAŚ M.: Nowe metody w biometrycznej identyfikacji osób<strong>Elektronika</strong> (L), nr 3/<strong>2009</strong>, s. 54W artykule przedstawiono nowe biometryczne metody identyfikacjiosób. Kolejno zaprezentowano rozpoznawanie ust, biometrię odciskudłoni oraz biometrię ucha. Zaproponowano także wykorzystanie kostekdłoni w multimodalnym podejściu wykorzystującym 3 rodzaje cechdłoni.Słowa kluczowe: biometria, identyfikacja osób, rozpoznawanie obrazówBRYLSKI P., STRZELECKI M.: Digital network of labelled nodesfor image processing<strong>Elektronika</strong> (L), no 3/<strong>2009</strong>, p. 46This paper proposes a digital image processor able to perform severalimage processing operations like image segmentation, edge detectionand noise removal. This circuit is a digital realization of synchronizedoscillators’ network. Properties of digital processor will be comparedand discussed with analogue network chip. Functional simulation ofprocessor IP Core during segmentation of sample binary image will bealso presented.Keywords: image segemntation, processing network, FPGADĄBROWSKI M., MODELSKI J.: DVB-T2 - the new digital terrestrialtelevision standard comparison with DVB-T<strong>Elektronika</strong> (L), no 3/<strong>2009</strong>, p. 51The new standard proposal of a digital terrestrial television DVB-T2has been presented and compared with the current standard DVB-T.Keywords: digital television, DVB-T, DVB-T2CHORAŚ M.: Novel techniques applied to biometric human identification<strong>Elektronika</strong> (L), no 3/<strong>2009</strong>, p. 54In many cases human identification biometrics systems are motivatedby real-life criminal and forensic applications. Some methods, such as fingerprintingand face recognition, proved to be very efficient in computervision based human recognition systems. In this paper we focus on novelmethods of human identification motivated by the forensic and criminalpractice. Our goal is to develop computer vision systems that would beused to identify humans on the basis of their lips, palm and ear images.Keywords: biometrics, human identification, image processing, patternrecognition6 ELEKTRONIKA 3/<strong>2009</strong>


PAWŁOWSKI P., PRÓSZYŃSKI D., DĄBROWSKI A.: Proceduryrozpoznawania znaków drogowych w czasie rzeczywistym<strong>Elektronika</strong> (L), nr 3/<strong>2009</strong>, s. 57Artykuł przedstawia procedury wykrywania i rozpoznawania podstawowychgrup pionowych znaków drogowych. Zaproponowany algorytmjest przeznaczony do zastosowania w pojazdach, w związkuz tym jest przystosowany do pracy w czasie rzeczywistym. Przedstawionyproces rozpoznawania składa się z kilku etapów.W pierwszym, za pomocą kwantyzacji metodą minimalnej wariancjioraz przekształcenia wejściowych ramek wideo do obrazów zindeksowanym kolorem, jest redukowana liczba kolorów. Proces tenznacząco zmniejsza liczbę danych do przetworzenia bez istotnegopogorszenia jakości rozpoznawania.Następnie są wykrywane obiekty o kolorach zbliżonych do wykorzystywanychw znakach drogowych. Aby zminimalizować wpływzmian oświetlenia i otoczenia na poprawne wykrywanie kolorów natym etapie, zamiast klasycznej przestrzeni barw np. RGB, użyto przestrzenipercepcyjnych takich jak HSI i JCh.W kolejnym kroku w obszarach o dopasowanych kolorach, za pomocąmomentów geometrycznych i współczynników kształtu, są wykrywanekształty znaków. Ponieważ znaczenie większości znakówokreślają symbole umieszczone wewnątrz znaków, kluczową procedurąjest wykrycie i rozpoznanie tych symboli. Ten etap został zrealizowanyza pomocą sztucznych sieci neuronowych.Dodatkowo zaproponowano procedurę wykrywającą wybraneznaki poziome, jakimi są linie rozdziału pasów ruchu. Wyniki zostanąwykorzystywane do śledzenia trajektorii pojazdu, co w połączeniuz pozostałymi procedurami, może przyczynić się do zwiększenia bezpieczeństwana drogach i zmniejszenia liczby kolizji i wypadków.Słowa kluczowe: automatyczne rozpoznawanie znaków drogowych,przetwarzanie sekwencji wizyjnych, przestrzenie barw, sztuczne siecineuronoweBALCEREK J., DĄBROWSKI A., KONIECZKA A.: Stereowizyjne metodytworzenia wrażeń trójwymiarowych z obrazów dwuwymiarowych<strong>Elektronika</strong> (L), nr 3/<strong>2009</strong>, s. 62Zaprezentowano proste autorskie metody tworzenia wyrazistychi wiarygodnych wrażeń trójwymiarowych (3D) z pierwotnych obrazówdwuwymiarowych (2D) za pomocą nieliniowych przekształceń geometrycznych.Celem było przygotowanie półautomatycznych metodprzekształcania obrazów 2D w przekonywujące wersje 3D realizowanew postaci anaglifów. Przeanalizowano wpływ różnych przesunięćskładowych koloru RGB na wrażenia 3D i zaproponowano trzymetody konwersji oparte na binarnej mapie głębokości.Słowa kluczowe: stereowizja, anaglif, wrażenie 3D, konwersja 2Ddo 3D, mapa głębokości, składowe koloru RGB, metoda skalowaniasegmentów obrazu, metoda przesuwania segmentów obrazuMARCINIAK T., DĄBROWSKI A.: Wpływ odszumiania w podpasmachna detekcję sygnału mowy<strong>Elektronika</strong> (L), nr 3/<strong>2009</strong>, s. 67W artykule zaproponowano nowe ujęcie detekcji sygnału mowy (VAD- Voice Activity Detection) i wyznaczania początków i końców słów(EPD - Endpoint Detection) w przypadku sygnałów mowy zarejestrowanychw obecności szumu. Opisane metody wykorzystują specjalnyetap odszumiania sygnału w podpasmach z użyciem transformacji zafalowaniowej.Na podstawie wyników eksperymentalnych zaprezentowanoskuteczność algorytmów zawierających ten etap przetwarzaniaw przypadku automatycznego rozpoznawania izolowanych słów.Słowa kluczowe: detekcja sygnału mowy, wyznaczenie początków i końcówsłów, automatyczne rozpoznawanie mowy, odszumianie sygnałuJURKÓW D., MALECHA K., DURCZYŃSKI P., GOLONKA L. J.: Mikroprocesorowysterownik temperatury do mikroreaktora chemicznegowykonanego techniką LTCC<strong>Elektronika</strong> (L), nr 3/<strong>2009</strong>, s. 71W artykule przedstawiono konstrukcję przepływowego ceramicznego mikroreaktorachemicznego oraz sterownik temperatury do tego urządzenia.Mikroreaktor wykonano w technologii LTCC (niskotemperaturowa ceramikawspółwypalana). Charakterystyki temperaturowe mikrosystemu zmierzonostosując bezstykowy pomiar termograficzny. W pamięci mikroprocesorasterującego temperaturą zaimplementowano algorytm PID (regulatorproporcjonalno-całkująco-różniczkujący). Umożliwia on dobór parametrówstabilizacji temperatury mikroreaktora zależnie od zapotrzebowania.Słowa kluczowe: Mmikroreaktor, ceramika LTCC, mikroprocesor,temperaturaPAWŁOWSKI P., PRÓSZYŃSKI D., DĄBROWSKI A.: Real-timeprocedures for automatic recognition of road signs<strong>Elektronika</strong> (L), no 3/<strong>2009</strong>, p. 57In this paper we propose procedures for detection and recognition ofmain groups of vertical road signs. The algorithm is intended for theuse in vehicles, thus it is optimized to work in real-time. The describedrecognition process consists of several following stages.At first we are reducing the number of colors using the minimumvariance quantization and changing the representation of an inputvideo to the indexed color images. By this step the total amount of datais significantly reduced without decreasing the recognition quality.Then we check, which objects in individual images of the examinedvideo have similar colors to those of particular road signs. Tosolve this problem, i.e., to determine proper RGB dependencies forthe color-based segmentation of real world scenes, we use perceptivecolor spaces such as HSI and JCh instead of, e.g., the RGB space.The next step is to determine, which regions from those just foundin the previous step by the color matches exhibit the road sign likeshapes. This classification is done by computing geometric momentsand appropriate shape factors.As the meaning of most road signs lies in the shape of the symboljust inside the sign, the essential process consists in recognitionof this symbol. Thus in the final stage we recognize and classify thesign symbols using an artificial neural network (ANN).Additionally we propose a procedure to detect road marking,which can be used to track the car position on the road.All presented procedures work in real-time and improve safetyof driving and, in consequence, may possibly decrease numbers ofaccidents.Keywords: automatic recognition of road signs, video processing,color spaces, artificial neural networksBALCEREK J., DĄBROWSKI A., KONIECZKA A.: Stereovisionmethods for creating 3D impressions from 2D images<strong>Elektronika</strong> (L), no 3/<strong>2009</strong>, p. 62In this paper simple techniques based on nonlinear geometric transformationsare presented for creating effective 3D (stereovision or illusionof depth) impressions from single 2D originals. The aim was topropose semi-automatic ways to transform 2D images into their suggestivebut plausible 3D anaglyph versions. Three conversion methodsbased on a binary depth map were proposed and the influence ofvarious RGB component shifts on the quality of the resulting 3D impressionswas studied.Keywords: stereovision, anaglyph, 3D impression, 2D to 3D transformation,depth map, RGB color components, segment scalingmethod, segment shifting methodMARCINIAK T., DĄBROWSKI A.: Influence of subband signal denoisingfor voice activity detection<strong>Elektronika</strong> (L), no 3/<strong>2009</strong>, p. 67In this paper a new approach is proposed for the so-called voice activitydetection (VAD) and word endpoint detection (EPD) both underassumption that the analyzed speech signal is recorded in the presenceof noise. The described VAD and ERP methods contain a specialstage of the wavelet subband denoising. We presenteffectiveness of the algorithm with this stage of processing for automaticrecognition of isolated words by means experimental results.Keywords: voice activity detection, word endpoint detection, automaticspeech recognition, signal denoisingJURKÓW D., MALECHA K., DURCZYŃSKI P., GOLONKA L. J.: Microprocessortemperature controller for LTCC-based chemicalmicroreactor<strong>Elektronika</strong> (L), no 3/<strong>2009</strong>, p. 71In this paper, construction and investigation of a flow-through ceramicmicroreactor with integrated microprocessor temperature controllerproperties is reported. The microreactor is made using LTCC (LowTemperature Co-fired Ceramics) technology. Transient measurementsof the temperature were made using thermography system. PID (Proportional-Integral-Derivativecontroller) algorithm was implemented ina microcontroller memory. Therefore, parameters of the temperatureregulator can be adopted to specific demands.Key words: Microreactor, LTCC, microprocessor, temperatureELEKTRONIKA 3/<strong>2009</strong> 7


Streszczenia artykułów • Summaries of the articlesKAWALEC A., LEŚNIK Cz., SOŁOWICZ J., SĘDEK E., ŁUSZCZYK M.:Wybrane problemy kompresji i syntezy sygnałów radarowych<strong>Elektronika</strong> (L), nr 3/<strong>2009</strong>, s. 76W artykule omówiono ogólną ideę kompresji sygnałów złożonychw zastosowaniach radiolokacyjnych. Przedstawiono podstawy algorytmówkompresji cyfrowej oraz dokonano ich porównania pod względemwymaganej mocy obliczeniowej. Dokonano przegląduaktualnego stanu techniki implementacyjnej oraz tendencji rozwojumetod kompresji sygnału echa radarowego. Zaprezentowano takżeogólną metodę syntezy sygnałów złożonych na przykładzie sygnałówz modulacją częstotliwości.Słowa kluczowe: kompresja sygnałów, generacja sygnałówzłożonych, synteza sygnałów radarowych, cyfrowe przetwarzaniesygnałówROMANIUK R.: Szkło dla fotoniki. Część 7. Szkło optyczne gradientowe<strong>Elektronika</strong> (L), nr 3/<strong>2009</strong>, s. 84Szkła, obok półprzewodników i metali, są podstawowym materiałemdo budowy elementów w optoelektronice i mikroelektronice. Praktycznawiedza o tych materiałach rozszerza się wraz z rozwojem ichzastosowań w telekomunikacji, czujnikach i budowie mikrosystemów.Wiele elementów funkcjonalnych fotoniki budowanych jest ze szkiełnieliniowych i gradientowych. Szkła gradientowe pozwalają na budowęnowych mikroelementów fotonicznych, zastępujących złożonerozwiązania klasycznej optyki objętościowej.W kolejnym artykule z cyklu prac o szkłach dla fotoniki opisanoszkła gradientowe, których właściwości są odmienne od klasycznychjednorodnych szkieł optycznych. W szkłach takich, wykonywanychnp. metodą wymiany jonów, impregnacji jonowej lub cząsteczkowej,czy metodą zol-żel, możliwe jest zapisanie przy pomocy gradientu refrakcjizłożonej wewnętrznej struktury funkcjonalnej, wykonującejtakie funkcje, jak: transmisję wiązki światła, skupianie wiązki i jej kolimację,efektywną bezstratną zmianę kierunku propagacji, rozdzielaniei łączenie wiązek, tworzenie anizotropii (dwójłomności)optycznej, obrazowanie, wykonywanie niektórych operacji matematycznychitp.Słowa kluczowe: szkła optyczne, fotonika, szkła gradientowe, elementyoptyczne typu GRIN, gradient refrakcji, metoda wymiany jonóww szkle, technologia zol-żelBOGUCKI J.: Systemy identyfikacji radiowej - technologicznaglobalizacja<strong>Elektronika</strong> (L), nr 3/<strong>2009</strong>, s. 90W artykule opisano rozwój systemów identyfikacji radiowej RFID. Opisanozalety tych systemów, jak również obawy, jakie niesie wprowadzenieidentyfikatorów RFID.Słowa kluczowe: identyfikacja radiowa, RFIDIDŹKOWSKI B., UTKO A.: Wpływ szumów mikrofonowania nastanowisko do pomiaru szumów fazowych generatorów mikrofalowychpracujących w paśmie X<strong>Elektronika</strong> (L), nr 3/<strong>2009</strong>, s. 92Artykuł opisuje znaczenie dokładności pomiarów szumów fazowychgeneratorów mikrofalowych mających komercyjne zastosowanie.Przedstawiono pokrótce czynniki zewnętrzne i wewnętrzne, któremają wpływ na jakość wyników pomiarów szumów fazowych.Opisano także metodę pomiarów szumów mikrofonowania,będących jednym z czynników mających negatywny wpływ na jakośćpomiaru. Metoda ta wykorzystuje czujnik przyspieszenia pracującyw paśmie do 6 kHz. Zmierzono częstotliwości rezonansowe układufalowodowej linii opóźniającej, która jest najbardziej podatna na tegotypu zakłócenia. Pomiary pozwoliły udoskonalić konstrukcję linii opóźniającejw taki sposób, aby wyeliminować, bądź znacznie zminimalizowaćszumy mikrofonowania.Słowa kluczowe: szum fazowy, stanowisko pomiarowe, generatorymikrofalowe, szum mikrofonowaniaKAWALEC A., LEŚNIK Cz., SOŁOWICZ J., SĘDEK E., ŁUSZCZYK M.:Chosen problems of pulse compression and radar signals synthesis<strong>Elektronika</strong> (L), no 3/<strong>2009</strong>, p. 76In this paper a basic concept of the matched filter and pulse compressiontechnique are discussed in detail. Additionally the papercomprises the digital pulse compression algorithms and presents theireffectiveness for a given radar signal on the basis of number of floatingpoint operations per second required to realize compression. Traditionaltechnique of pulse compression based on SAW device iscompared to digital filtering with FPGA. The synthesis problem for awaveform with frequency modulation is considered and synthesis algorithmis presented.Keywords: pulse compression, radar waveform generator, radar signalsynthesis, digital signal processingROMANIUK R.: Glasses for photonics. Part 7. Optical gradientglasses<strong>Elektronika</strong> (L), no 3/<strong>2009</strong>, p. 84Glasses, together with semiconductors and metals, are fundamentalmaterials for building of components for optoelectronics and microelectronics.Practical knowledge about glasses extends considerablywith strong development of their applications in telecommunications,sensors and the construction of microsystems. Many functional componentsof the photonics is manufactured of nonlinear and gradientglasses. Optical gradient glasses allow for building of new micro-components,replacing complex solutions of classical volume optics. Inthe paper, which is the seventh part of a cycle on glasses for photonics,the subject are gradient glasses, which properties are quite differentfrom classical, homogeneous optical glasses. These glassesare manufactured by a number of different methods including: ion exchange,ion interchange, ion or molecular stuffing or sol-gel methods.It is possible to write into such a monolithic piece of glass with a gradientof refraction a full functional structure embracing: beam transmissionchannels, beam focusing and collimation, lossless directionalchange, splitting and adding beams, excitation of anisotropy (birefringence),imaging, Fourier transform, etc. Practical applications includeGRIN lenses.Keywords: optical glasses, photonics, gradient glasses, optical GRINcomponents, refraction gradient, ion exchange in glasses, sol-geltechnologyBOGUCKI J.: Radio Frequency Identification Systems - TechnologicalGlobalization<strong>Elektronika</strong> (L), no 3/<strong>2009</strong>, p. 90Radio Frequency Identification Systems are described in this paper.Its influence on technology, science and the general public are explainedtoo.Keywords: Radio Frequency Identification, RFIDIDŹKOWSKI B., UTKO A.: The influence of the microphonic noiseon phase noise measurement system for generators working inthe X band<strong>Elektronika</strong> (L), no 3/<strong>2009</strong>, p. 92This article concentrates on the importance of precise phase noisemeasurements of microwave generators having a commercial usage.In former part of this article we briefly present external and internalphenomena which have the influence on the quality of the phasenoise measurement results. In the latter part we analyze microphonicnoise by proper measurements using acoustic accelerometer workingup to 6 kHz bandwidth. This kind of measurement allows us to see theresonating frequencies of the delay line built using rectangular waveguide,working in the X band. As the conclusion for this type of measurementswe could eliminate most of the microphonic noise byimproving the construction of the delay line.Keywords: phase noise, measurement system, microwave generators,microphonic noise8 ELEKTRONIKA 3/<strong>2009</strong>


WIERZBA P.: Nowoczesne bolometry - zasady działania, konstrukcje,zastosowania<strong>Elektronika</strong> (L), nr 3/<strong>2009</strong>, s. 95W artykule przedstawiono zasadę działania bolometrów wykorzystywanychdo detekcji promieniowania elektromagnetycznego w zakresieod mikrofal, przez promieniowanie terahercowe do promieniowania X.Omówiono materiały stosowanych w konstrukcji bolometrów. Przedstawionoreprezentatywne rozwiązania konstrukcyjne nowoczesnychbolometrów, w tym bolometry nadprzewodzące oraz bolometry wykorzystującezjawiska kwantowe. Zaprezentowano wybrane techniczne,przemysłowe i wojskowe zastosowania bolometrów.Słowa kluczowe: bolometry, detektory termiczne, promieniowanie terahercowe,podczerwień, matryce detektorów, detektory nadprzewodząceGÓRECKI K., ZARĘBSKI J.: Analiza wpływu samonagrzewaniana charakterystyki liniowego stabilizatora napięcia z tranzystoremMOS<strong>Elektronika</strong> (L), nr 3/<strong>2009</strong>, s. 103W pracy przeanalizowano wpływ zjawiska samonagrzewania w tranzystorzeregulacyjnym na charakterystyki liniowych stabilizatorów napięciazawierających tranzystor mocy MOS. Przeprowadzonopomiary i obliczenia zależności napięcia wyjściowego stabilizatoraoraz temperatury obudowy tranzystora regulacyjnego od napięcia wejściowegooraz rezystancji obciążenia stabilizatora przy różnych warunkachchłodzenia tego tranzystora. Przedyskutowano uzyskanewyniki obliczeń i pomiarów.Słowa kluczowe: liniowe stabilizatory napięcia, tranzystor mocyMOS, SPICE, samonagrzewanieIDŹKOWSKI B., FRANCIK A.: Zalety homodynowego, jednotorowegostanowiska do pomiarów szumów fazowych generatorówmikrofalowych<strong>Elektronika</strong> (L), nr 3/<strong>2009</strong>, s.106Precyzyjne pomiary szumu fazowego dla różnego typu generatorówstanowią wyzwanie dla współczesnej metrologii. Najbardziej popularna,ze względu na dokładność, technika pomiarowa wykorzystuje pętlęPLL, ale jednocześnie jest ona złożona i sprawdza się najlepiej w przypadkugeneratorów wysokostabilnych (kwarcowych czy atomowych).W artykule zaprezentowano koncepcję nowej metody pomiarowejszumu fazowego, którą można stosować szczególnie dla „szumiących”generatorów, pracujących na częstotliwościach mikrofalowych. Koncepcjatego systemu wykorzystuje metodę autokorelacyjną opracowanąprzez Easdalea, Dyera, Howesa i Pollarda. Gdy w systemie takimzastosujemy detekcję homodynową, to otrzymane w ten sposób wynikipowinny cechować się zwiększoną dokładnością i dynamiką przyjednoczesnym zachowaniu prostoty układu i jego kalibracji.Słowa kluczowe: szum fazowy, detekcja homodynowa, kontaktowymodulator fazyTRZASKA M.: Elektryczne i termiczne konduktywności cienkichwarstw z miedzi i kompozytów o strukturze nano- i mikrokrystalicznejwytwarzanych elektrochemicznie<strong>Elektronika</strong> (L), nr 3/<strong>2009</strong>, s. 109W artykule przedstawiono wyniki intensywnych badań cienkich warstwz miedzi i kompozytów o strukturach nano- i mikrokrystalicznych, którezostały wytworzone metodą elektrochemiczną. W pierwszym etapieokreślone zostały elektryczne i fizyko-chemiczne charakterystyki cienkichwarstw z miedzi i ustalono optymalne parametry ich wytarzania.Zasadnicza uwaga została odniesiona do takich wielkości jak wymiarymikrokrystalitów, termicznych i elektrycznych konduktywności i do parametrówrealizacji procesu, które prowadzą do znacznych różnic tychwielkości w wyrobie końcowym. Uzyskane wyniki ukazują, że na jakośćwytwarzanych cienkich warstw mają wpływ odpowiednie pulsyprądu zasilającego reaktor oraz mała stosunkowo gęstość prądu dodatniegoa duża gęstość krótkotrwałych pulsów prądu ujemnego. Badaniawykazały, że odpowiednia kombinacja dodatnich i ujemnychpulsów znacznie poprawia jednorodność rozkładu materiału w mikrownękachi mikrootworach. Zmniejszenie wymiarów ziarn polikrystalicznejmiedzi i kompozytów skutkuje zwiększeniem się ich zarównotermicznej konduktywności, jak i elektrycznej rezystywności wraz zewzrostem temperatury. Stąd też znaczenia nabiera ustalenie dokładnychrelacji miedzy termicznymi elektrycznymi charakterystykami a takimiwłaściwościami cienkich warstw jak ich grubość i rozkładwymiarowy krystalitów oraz dynamika ich wzrostu.WIERZBA P.: State-of-the-art bolometers - principles, devices,applications<strong>Elektronika</strong> (L), no 3/<strong>2009</strong>, p. 95The paper outlines operation principles of bolometers used for detectionof electromagnetic radiation in the range from microwaves,through terahertz radiation to x-rays. Materials used in the manufacturingof bolometers are presented. Representative state-of-the-artbolometers are presented, including superconducting and quantumeffectbolometers. Selected technical, industrial and military applicationsof bolometers are presented. Moreover, selected bolometersand bolometer arrays are presented, as well as their applications.Keywords: bolometers, thermal detectors, terahertz radiation, infrared,detector arrays, superconducting detectorsGÓRECKI K., ZARĘBSKI J.: Analysis of the influence of selfheatingon the characteristics of the linear voltage regulator includingthe MOS power transistor<strong>Elektronika</strong> (L), no 3/<strong>2009</strong>, p. 103In the paper the influence of selfheating in the regulating transistor onthe characteristics of the linear voltage regulators including MOSpower transistor is considered. Some measurements and calculationsof the dependences of the regulator output voltage and the case temperatureof the regulating transistor on the input voltage and the loadresistance of the regulator for different cooling conditions of the transistorwere performed. The obtained results of calculations and measurementsare discussed.Keywords: linear voltage regulator, MOS power transistor, SPICE,electrothermal modelingIDŹKOWSKI B., FRANCIK A.: The advantages of homodyne singleline phase noise measurement system for microwave oscillators<strong>Elektronika</strong> (L), no 3/<strong>2009</strong>, p. 106Proper measurement of phase noise for different oscillators is still avery problematic metrology issue. The most common way of measuringphase noise is the PLL technique, but it is complicated and efficientonly when dealing with high stability crystal oscillators, masers,etc. In this article we present the new concept of measuring phasenoise, which is applicable especially for noisy oscillators workingwithin the microwave bands. The whole concept of the measurementsystem is based on the single line discriminator method developedby Easdale, Dyer, Howes and Pollard. This system, enhanced withhomodyne signal detection, significantly improves sensitivity and dynamicrange of measurement, keeps the simplicity of the constructionand calibration of the measurement system.Keywords: phase noise, homodyne detection, contacting phasemodulatorTRZASKA M.: Electrical and thermal conductivities of nano- andmicrocrystalline copper and composite thin-layer electrod<strong>Elektronika</strong> (L), no 3/<strong>2009</strong>, p. 109In this paper, the electrodeposition by direct and pulse periodic currentsof nano- and micro-crystalline copper films and composite thinlayersis effectively examined. In the first step, electrical andphysico-chemical characterizations of the copper films are realized,and the optimized electrodeposition parameters are so considered.The attention is focused on such material characteristics as microstructure,thermal and electrical conductivities and on process realizationparameters leading to major differences in final products.The obtained results show that the addition of a spike, and a decreasein forward current can improve the throwing power in plating quality.The study also found that the combination of multiple spikes, a low forwardcurrent and a high reverse current can significantly improve copperdistribution in microvias plating. Decrease in the grains dimensionof the polycrystalline copper and composite layers results in an increaseof both the thermal conductivity and the electrical resistivitywith the temperature. The purpose is to relate thermal and electricalperformances to material properties such as grain-size distributionand the films’ thicknesses.Keywords: electrodeposits, thin layers, microstructures, thermal andelectrical conductivities, nanocompositesSłowa kluczowe: procesy elektrochemiczne, cienkie warstwy, mikrostruktura,termiczna i elektryczna konduktywności, nanokompozytyELEKTRONIKA 3/<strong>2009</strong> 9


Estimation of object sizein the calibrated camera image(Estymacja rozmiaru obiektów w obrazach ze skalibrowanej kamery)dr inż. GRZEGORZ SZWOCH, mgr inż. PIOTR DALKA,prof. dr hab. inż. ANDRZEJ CZYŻEWSKIGdańsk University of Technology, Faculty of Electronics, Telecommunications and Informatics,Multimedia Systems DepartmentVideo surveillance systems are becoming a common tool forimproving the public security. However, the efficiency of thesesystems is limited by a fact that a human operator has to observeconstantly a large number of monitors for detection ofevents occurring in the images captured by cameras. Onemethod of improving the efficiency of the discussed systemsis introduction of the automatic tool that assists the humanoperator by automatically analysing the camera images andinforming the operator about important events that were detected[1]. However, accurate detection of events in the cameraimages requires that the detected moving objects areassigned to proper classes and this classification requiresthat the physical size of the tracked object (not the size inimage pixels) is known. Estimation of the physical width andheight of the three-dimensional object from the flat cameraimage is not trivial.In this paper, a simple but efficient method of such estimation,using the data obtained during the camera calibration,is proposed.Automatic video surveillance systemThe proposed system for automatic analysis of the camera imagesis composed of multiple modules, starting from the lowlevelprocedures (background subtraction, removal of shadows,detection of moving objects in the current frame and trackingmoving objects in the successive frames) towards the high-levelprocessing (object classification and event detection) [2].The background subtraction module separates the movingobjects from the static background. An approach based onGaussian mixture models was used as it proved to be an efficientmethod of background modelling in the previous experiments[2]. Since shadows of the objects are also detectedas a part of moving object, they need to be removed in orderto avoid errors in estimation of the physical size of the object.The object tracking module detects the movement of the objectsin the successive camera image frames by assigning thedetected connected components (blobs) to the tracker thatrepresents a moving object. In order to resolve object collisions(e.g. objects overlapping in the camera image), Kalmanfilters were implemented in order to predict the next state ofthe moving objects [3].The high-level image processing modules perform objectclassification and event detection. Each tracked object is assignedto one of the defined classes (vehicles, humans, animals,objects, etc.). A large number of objects parametersmay be used for classification, including object’s velocity, pathof movement, colour, shape, etc. However, the most commonlyused object descriptor is the size (usually the width andthe height). Due to the perspective effect in the camera image,it is not possible to obtain a correct object classification basedon the ‘pixel size’ of the objects. Therefore, a conversion betweenimage pixel coordinates and the physical sizes is required.This is achieved by means of a camera calibration, asdescribed further in the paper.The event detection module was divided into two parts.The low-level event detector uses parameters describing theobject’s position, physical size, class, statistics, etc. for detectionof low level-events, such as object entering or leavingthe screen, object that stopped or started moving, etc. Thetask of the high-level event detector is interpretation of the detectedlow-level events and detection of complex events, suchas a car parking in the observed area, a person getting into abuilding, etc. Both parts of the event detector have their ownset of rules. The rules for detection of high-level events aredefined using terms that are similar to the description ofevents in the natural language.Camera calibrationDue to the perspective distortion in a typical camera image, itis not possible to use the size of an object measured in imagepixels for classification purposes, but the width and the heightof the object in physical units (i.e. metres or inches) have to beknown. Therefore, a conversion between the camera coordinatesand the world (physical) coordinates has to be definedand this can be achieved by means of the camera calibrationprocedure. Various calibration methods were proposed, butTsai’s method [4] is one of the most popular and accurate oneand this method was implemented in the described system.Tsai’s calibration method requires marking several pointsin the area observed by the camera and measuring their positionsrelative to each other, both in the real world and in thecomputer image. One of these points is usually set as an originof the world coordinate system. The calibration algorithmprocesses pairs of the world coordinates and the image coordinatesof each point, in order to calculate 11 conversion coefficients,describing translation and rotation of the camerarelative to the world coordinates, camera lens distortions,camera focal length, etc. [4]. Two modes of camera calibrationsare available. In the coplanar calibration, it is assumedthat all calibration points are situated on the same z plane. Ifthe calibration points differ in height, a more complex noncoplanarcalibration has to be used. At least 7 points in thecoplanar mode and 11 points in the non-coplanar mode areneeded in order to achieve a proper calibration accuracy.After the calibration process is done, the world coordinates(x w ,y w ,z w ) of any point may be converted to the image coordinates(x i ,y i ). This is not true for the inverse conversion: translationfrom the two-dimensional image coordinates to thethree-dimensional world coordinates is ambiguous. In orderto make this conversion possible, a constraint has to be introducedby specifying the height of the point in the world coordinates(z w ). However, this height must be known and this10 ELEKTRONIKA 3/<strong>2009</strong>


is not the case if only the camera image is available. Therefore,the only method to input the height value to the conversionroutine is to apply an estimation procedure.Physical size estimationEach tracked moving object is described by its bounding box(a rectangle). The height and the width of this box may betreated as object’s sizes in the image coordinates, providedthat this box encloses the whole single object and it does notinclude other objects, shadows, etc. Therefore, high accuracyof background subtraction and shadow removal algorithms isrequired. Moreover, an accurate estimation of the object’s sizeis possible only if there are no conflicts in object tracking (a singletracker is related only to a single blob), therefore the sizeestimation is not performed unless this condition is fulfilled.Assuming that the bounding box describes the size of theobject in the image coordinates, it is possible to estimate thewidth and the height of the object using the size of this box.Estimation of the physical width of the object is straightforward,because it may be usually assumed that both the lowercorners of the box are situated on the same plane and theyhave identical z w coordinate (which may be set to zero inorder to simplify the calculations). Therefore, the estimatedphysical width w of the object is calculated by converting theimage coordinates of the lower left (x i1 ,y i1 ) and the lower right(x i2 ,y i2 ) corners of the box to the world coordinates (x w1 ,y w1 ,0)and (x w2 ,y w2 ,0) and then using the triangle formula:Estimation of the physical height of the object is muchmore complicated, because the two points that define the object’sheight (e.g. the lower right and the upper right box corners)are situated on different horizontal planes. Therefore,an algorithm described below and illustrated in Fig. 2 was developedand implemented in the system. Any point P is describedas P i =(x iP ,y iP ) in the image coordinates and as P w =(x wP ,y wP ,z wP ) in the world coordinates.• The point A i is the lower right corner of the object’s boundingbox. This point is converted to the world coordinatesA w . It is assumed that z wA = 0 (the point is situated on the‘ground’ plane).• A reference point B w is found, situated h R above A w , i.e.B w =(x wA ,y wA ,h R ). This point is converted to the image coordinatesB i .• The point B w is cast on the ground plane, i.e. C i =B i and C wis calculated by converting C i to the world coordinates withz wC = 0. Therefore, a ‘shadow’ of the point B is found.• The point E i , determining the object’s height, is found on theintersection of the line connecting points A i and B i with theupper border of the box (see Fig. 2).• The point E i is cast on the ground plane as in stage 3, assumingthat D i =E i and converting this point to the worldcoordinates D w with z wD = 0.• Now the world coordinates of all points are known, exceptthe point E w =(x wA ,y wA ,z wE ), where z wE is the estimatedobject’s height h. which may be easily calculated using theproportion (Fig. 1):(1)(2)Fig. 1. Illustration of the method of object’s physical height estimationRys. 1. Ilustracja metody estymacji wysokości obiektuBecause the results of the size estimation in the consecutiveframes exhibit variations due to inaccuracies of the backgroundsubtraction procedure, post-processing of theestimation results is necessary. In the described system, theoutput value of the estimated width or height of the object iscalculated as a moving average of the last 10 measurements.The number of averaged measurements was chosen experimentallyso that shorttime errors in the object detection do notinfluence the estimation accuracy. A new measurement isadded if, and only if, the tracker for the given object is relatedto only one detected blob (therefore, no conflict in object trackingexists). This condition helps to avoid errors in size estimationfor overlapping objects. However, if the object isoverlapped by another one for long time, estimation of its sizemay not be possible. The estimation of the conflicting objectssize will be a subject of further research. The choice of thereference height h R in Eq. 2 has an important influence on theestimation accuracy. The value of this parameter should beselected so that the difference between this value and the realheight of most tracked objects is low. Therefore, in the experimentsvalue h R = 1.8 m was used.A simple object classifierFor the purpose of the experiments described in this paper,a very basic object classification algorithm was implemented.The estimated physical width and height of the object are theonly parameters used for classification, other descriptors (relatedto object’s movement and appearance) were purposelyomitted in this version of the algorithm in order to validate theestimation procedure described in the previous section and toprovide the base for further development of the object classifier.In this test system, three classes of objects were createdand the rules of object classification according to their averagedestimated physical width and height were as follows:• humans (H) - objects having width in range 0.5 m ≤ w ≤ 2.5 mand height in range 1 m ≤ h ≤ 3 m;• big trucks (T) - objects having width w >6m and heighth > 4.5 m;• small trucks (S) - objects having width 4.5 m ≤ w ≤ 6 m andheight 3 m ≤ h ≤ 4.5 m• passenger cars (C) - objects having width 3 m ≤ w ≤ 4.5 mand height 1.5 m ≤ h ≤ 3m• other vehicles (V) - objects having width greater than 2.5 mand not belonging to any other vehicle classes;• unknown objects (U) - all other objects.The threshold values were chosen experimentally by processingthe video recordings and examining the estimated sizesof various moving objects, as described further in the paper.The rules listed above are of course greatly simplified andthey will not allow for accurate object classification in complexreal scenarios. However, they are sufficient for testing the pro-ELEKTRONIKA 3/<strong>2009</strong> 11


posed system for object classification based on their estimatedsize. The results of the simulations are discussed further in thepaper. This simplified classification system will be extended inthe future research by adding new object classes and additional,more complex classification rules, based not only on thephysical size of objects, but also using other descriptors, relatedto movement and appearance of the tracked objects.ExperimentsThe modules of the system developed according to the structureshown in Fig. 1, were implemented in C++, using theopen source OpenCV library [1]. The preliminary tests wereperformed using the video recordings from the PETS 2001dataset [5], using only five calibration points. The results ofthese tests proved that the proposed method allows for satisfactoryaccuracy of the size estimation. However, it was concludedthat using a larger number of calibration points,spanning a larger area in the camera image and includingpoints situated above the ground (hence using the non-coplanarcalibration), should improve the estimation accuracy, especiallyfor the height estimation [6].In the recent experiments, a stationary camera wasmounted on the roof of the building. The camera image showsa fragment of the street with sidewalks. The camera axis is almostperpendicular to the path of vehicles movement. The calibrationpoints that were measured included posts placed atthe site for the purpose of camera calibration, as well as landmarkssuch as road sign posts, small trees, sidewalk borders,etc. (Fig. 2). Selected points were used for camera calibration.In coplanar calibration, 10 points were used. Since themoving object is examined. The size estimation is performedif the object is fully in the image frame (the bounding box of theobject does not touch the image frame margin), the object isnot in conflict with any other moving object (no overlappingwith other objects) and the size of the bounding box is largerthan the imposed threshold (estimation error for distant, smallobjects may be very large, because a small difference in objectsize in pixels results in a large difference in estimatedphysical size).As an example, the camera video recording (4 min. and42 sec. long) was processed twice, first with the coplanardata, then with the non-coplanar data. For each tracked movingobject, a mean and standard deviation of the momentary(not averaged) estimated width and height were calculated.The results for the selected moving objects, shown in Fig. 3,are presented in Table 1.Fig. 3. Moving objects whose size is estimated as shown in Table 1(car, small truck, big truck, human)Rys. 3. Obiekty ruchome, których rozmiar jest estymowany jak pokazanow tab. 1 (samochód osobowy, ciężarowy mały, ciężarowyduży oraz człowiek)Tabl. 1. Estimated width and height (mean ± standard deviation) of theselected moving objects, for coplanar and non-coplanar calibration dataTab. 1. Estymowana szerokość i wysokość wybranych obiektów ruchomych(średnia ± odchylenie standardowe), dla danych z kalibracji planarneji nieplanarnejObjectCoplanar calib.Non-coplanar calib.width [m] height [m] width [m] height [m]car 5.07 ± 0.18 1.95 ± 0.05 4.97 ± 0.11 2.49 ± 0.05small truck 5.64 ± 0.62 2.89 ± 0.15 5.49 ± 0.48 3.66 ± 0.16Fig. 2. Calibration points used in the experimentsRys. 2. Punkty kalibracyjne użyte w eksperymencieheight of the posts placed at the site was known (h p = 2.20 m),the tops of these posts were added to a set of coplanar(ground plane) points, forming a set of points for the noncoplanarcalibration (15 points in total).In the first experiment, the coplanar calibration was performed,so only calibration points on the ground were used.The pixel coordinates of the calibration points were found inthe VGA resolution camera image (640 x 480 pixels) andused, together with the measurement results, as an input tothe Tsai’s algorithm that calculated the transform parameters.Next, the non-coplanar calibration was performed, using alsothe measured points above the ground. These two sets of calibrationdata were then used in the video analysis system forestimation of size of the detected moving objects. After thebackground subtraction and object tracking, each detectedbig truck 7.13 ± 0.51 5.44 ± 0.23 6.91 ± 0.35 7.00 ± 0.26human 1.25 ± 0.12 1.83 ± 0.18 1.20 ± 0.12 2.30 ± 0.22It should be noted here that the size of the bounding boxof the moving object and not the real size of the object is estimatedhere. Because the camera sees the street from theabove, the height of the box is larger than the height of thereal object, as the roof of a vehicle is also counted, which isevident from Fig. 3. Therefore, the estimated height of the objectmay be larger than it should be. The same remark appliesto the estimated width of the object.From the Table 1 it can be seen that the widths estimatedusing the coplanar and non-coplanar calibration data are similar.The small differences are mainly caused by a greaternumber of the calibration points in the non-coplanar data set.Much larger differences may be observed in the estimatedheight. If the coplanar data set is used, the height of small ob-12 ELEKTRONIKA 3/<strong>2009</strong>


jects (like humans) seems to be underestimated. On the contrary,if the non-coplanar data is used, the height estimation ismore accurate if the object’s real height is close to the referenceheight used in the estimation procedure, but if the realheight increases, the calculated height is overestimated,which is evident for big objects like large trucks. The values ofthe standard deviation indicate the changes of the estimatedvalues that are mainly caused by the variations of the movingobjects’ bounding boxes size due to the inaccuracies of theobject detection and object tracking procedures.Although the comparison of the estimated width andheight of the tracked objects with their exact real sizes wasnot performed, from the assessment of the simulation resultsit may be concluded that if the goal is to know the real size ofthe object, the proposed estimation procedure does not providevery high accuracy. However, the main objective of developingthis algorithm was its application in the objectclassifier. For classification of the moving objects, it is not necessaryto have a size estimator with very high accuracy. Inorder to formulate a set of rules that divide the moving objectsinto classes, it is only necessary that the relations betweenthe sizes of objects belonging to different classes are preserved.For example, the data presented in Table 1 indicatethe difference of the estimated size of various types of objects.Specifically, the vehicle classes differ in height (and, to smallerdegree, also in width), in both the coplanar and non-coplanarcalibration sets.In order to test whether the presented algorithm for sizeestimation is usable for the object classification task, a set ofrules described in Section 5 was implemented. These rulesexamine the averaged estimates of the width and height ofeach moving objects and assign the object to one of classespresented in Table 1. If none of the rules match for the object,it is labelled as ‘unknown’. The same video recording that wasused before, was processed by the system and after that,a number of objects belonging to each group was counted.The results of object classification, for both coplanar andnon-coplanar calibration data sets, are presented in Table 2.From the analysis of the results it can be concluded that the accuracyof the estimation procedure is sufficient for the task ofobject classification based only on real size of the object. Of allTabl. 2. Results of object classification for non-coplanar and coplanarcalibration. Letters represent classes of objects: actual (index a) andassigned by the classifier (index c)Tab. 2. Wyniki klasyfikacji obiektów dla kalibracji planarnej i nieplanarnej.Litery oznaczają klasy obiektów: rzeczywiste (indeks a) i przydzieloneprzez klasyfikator (indeks c)Coplanar calibrationC c S c T c V c H cC a 87 7S a 2 2T a 1 3V a 0H a 6Non-coplanar calibrationC c S c T c V c H cC a 90 4S a 4T a 1 3V a 0H a 6110 moving objects that appeared in the analysed video recording,89% were properly classified when the coplanar calibrationset was used and 94% with the non-coplanar calibration data.The main difference between the two camera calibration methodsis that in case of the non-coplanar calibration, some of thepassenger cars were not classified properly because of the underestimatedheight, while for the non-coplanar calibration therewere problems with the small truck class objects. The overalldifference between the two calibration method is not significant,so if only the coplanar calibration data is available, a satisfactoryaccuracy of object classification may be obtained after theclassification rules are tuned.The results presented here were obtained for a case whenthe moving objects are clearly visible and the rarely change adirection of movement. In more complex situations, for exampleon a busy crossroad in the city, the problem of object classificationwould be more difficult, as objects would be seen bythe camera at different angles. In this case, the proposed setof rules would not be sufficient. In order to obtain a properclassification of the moving objects, more parameters than justthe size should be used in the rules. Parameters like speed,shape, colour, etc. provide more detailed description of theobjects and, as a consequence, may provide more accurateclassification. Additionally, some post-processing of the classificationresults and the analysis of variability of the movingobject parameters may provide further improvement of theclassification accuracy. This will be the topic of the further research.It should also be noted that in the experiments presentedhere, the passenger cars constituted 85% of allobjects. It is necessary to test the algorithm at other siteswhere the distribution of moving object types is different.It has to be stressed that an accurate object classificationis not possible if errors appear at the earlier stages of the cameraimage processing. Specifically, during the backgroundsubtraction, processing parameters have to be tuned so thatonly moving objects, and the whole moving objects, are separatedfrom the background. Shadow removal is essential forobject classification, because if the shadows are not removed,they disturb the size estimation. Although in the recordingused in tests, shadows were not clearly visible, turning off theshadow removal procedure resulted in oversized objectboxes. In the object tracking procedure it is necessary to implementconflict resolving, so that overlapping moving objectsremain separated and the estimation of size of the single objectis possible. In the experiments, a simple method of conflictresolving was implemented, which worked well for mostsituations, but in some cases (mainly a new object enteringthe screen and overlapping another one that leaves thescreen), the object tracking was disturbed and it was not possibleto estimate the size and classify the object. It is also necessaryto test whether the whole object is inside the cameraframe, so that the size of partially visible object is not used inaveraging of the estimated size.ConclusionsIn this paper, the novel algorithm for estimation of the physicalsizes of objects in the camera image, using the calibrationdata, was proposed. The results of the preliminary tests indicatethat this method provides estimation accuracy that is sufficientfor the needs of the simple object classification modulepresented in the paper. For the size-based object classification,camera calibration has to be done. Two calibration methodswere compared. Using the non-coplanar calibrationmethod, a slightly higher accuracy of object classification wasELEKTRONIKA 3/<strong>2009</strong> 13


obtained. However, if it is not possible to obtain this type ofcalibration, the coplanar calibration also provides good classificationaccuracy, but the classification rules need to betuned. Although the estimated object sizes obtained using themethod presented here are not highly accurate, it is possibleto use them in the object classifier. The errors in size estimationmay be reduced by employing more calibration pointsspaced on the whole area covered by the camera and by eliminatingthe errors in the measurements (both in the real worldand in the camera image) as much as possible.In the future works on the system for automatic analysis ofthe camera image, the object classification module will be enhancedby adding more parameters for classification, optimisingthe set of classification rules and testing the algorithmin various conditions. At the same time, the results of objectclassification will be used for automatic detection of the definedevents occurring in the area surveyed by the camera.The event detector will work by checking whether any of therules for event detection is fulfilled, analysing the parametersobtained from the object tracking and the object classificationmodules. For example, if the tracked object belongs to theclass ‘human’ and this object disappears inside another objectwhich leaves the surveyed area and is assigned to theclass ‘passenger car’, an event would be detected and describedby ‘a person entered the car and drove away’ [6].A simple event detector implemented in the current version ofthe system will be enhanced in the future research and togetherwith other image processing modules, it will form acomplete, intelligent system for automatic event detection inthe video surveillance systems that will be used for improvingthe public security.The research leading to these results has received funding fromthe Polish Ministry of Science and Higher Education within GrantNo. R00 O0005/3 and from the European Community‘s SeventhFramework Program (FP7/2007-2013) under grant agreement no218086.References[1] Chen T., Haussecker H., et al.: Computer Vision Workload Analysis:Case Study of Video Surveillance Systems. Intel TechnologyJournal, vol. 9, no. 2, pp. 109-118, 2005.[2] Szwoch G., Dalka P.: Identification of regions of interest in videofor a traffic monitoring system. Proc. 1st Intern. Conf. on InformationTechnology, Gdańsk 2008, pp. 337-340.[3] Czyzewski A., Dalka P.: Moving Object Detection and Trackingfor the Purpose of Multimodal Surveillance System in UrbanAreas. Proc. 1st Int. Symp. on Intell. Interactive Multim. Syst. andServices, Piraeus, 2008.[4] Tsai R.: A Versatile Camera Calibration Technique For High Accuracy3d Machine Vision Metrology Using Off-The-Shelf TV CamerasAnd Lenses. IEEE J. Robotics Automat., vol. RA-3, no. 4,1987, pp. 323-344.[5] PETS’2001. Second IEEE International Workshop on PerformanceEvaluation of Tracking and Surveillance, Kauai, Hawaii,USA, 2001. Available at: http://www.cvg.cs.rdg.ac.uk/PETS2001/.[6] Szwoch G., Dalka P., Czyzewski A.: Objects Classification Basedon Their Physical Sizes for Detection of Events in Camera Images.NTAV/SPA 2008, Poznań 2008, pp. 15-20.Video coding using redundant dictionaryof base functions(Koder wideo z użyciem nadmiarowego słownika funkcji bazowych)dr inż. ŁUKASZ SAGANOWSKIUniversity of Technology and Life Sciences, Institute of Telecommunications, BydgoszczMany transforms have been proposed for image and videocompression. The most popular transforms fall into two categories:block-based and image based. Examples of blockbasedtransforms include the Karhunen-Loeve Transform(KLT), Singular Value Decomposition (SVD) and popular DiscreteCosine Transform (DCT). Each of these transformationsoperates for example on blocks of image or prediction errorsignal. Block transformations have low memory requirementsand are well-suited to compression of block based motioncompensation residuals but tend to suffer from artefacts atblock edges. Presented coder uses BFD to encode predictionerror signal. Base functions approximate characteristicparts of prediction error signal. In the article complete hybridvideo encoder is presented. Results of image sequence encodingwere compared to the latest standard of video compressionAVC/H264 [1].Video CoderBFD for prediction error Signac codingFor video coder, dictionary of base functions [2-5] wasadapted to the characteristic of prediction error signal. In Figure1 block diagram of video encoder is presented. Predictionerror signal D n is encoded and decoded (reconstructed signalD’ n ). On the decoder side (Figure 2) prediction error signalis reconstructed D’ n and added to the Motioncompensated prediction P in order to achieve reconstructedframe. Input frames are organized in GOP (Group of Picture)structure (Figure 3) (GOP frame structure is a compromisebetween achieved compression rate and quality of decodedsequence). Coding order of GOP frames was presented inFigure 4. Prediction error signal has a local energy concen-14 ELEKTRONIKA 3/<strong>2009</strong>


trations on edges of motion objects. Base functions have abilityto capture these local energy concentrations. In the proposedimage coder three base functions were used to builddictionary. The first function is a smooth 2D Gaussian function(Equation 1) which captures low frequency parts of inputimage signal.(1)where: - vector of image coordinatesThe second generation function was built with using secondderivative of 2D Gaussian function. This function has abilityto adapt to image curves which are predominant in naturalimages. This feature is very important at high compressionrates where reconstruction of image curves has great influenceon overall image quality.Fig. 2. Video decoder - block diagramRys. 2. Dekoder Wideo - schemat blokowy(2)The last base function (Modulated Gauss function) -helps toapproximate textures and uniform background areas in images.(3)Fig. 3. Group of Picture with frame prediction directionsRys. 3. Struktura kodowanych ramek GOP z zaznaczeniem kierunkówpredykcjiIn order to create overcomplete set of 2D base functions dictionaryD was built by varying geometric atom parameters:• Rotation θ - to adapt atoms to contours,• Translation - to move atoms all over the image,• Scaling - to adapt to contour smoothness.Equation 4 presents generation function with using rotation θ,scaling and translation parameters.Fig. 4. Coding order of GOP framesRys. 4. Kolejność kodowania ramek GOP(4)where:Fig. 1. Video encoder - block diagramRys. 1. Koder Wideo - schemat blokowyFig. 5. Examples of atoms from dictionaryRys. 5. Przykładowe atomy ze Słownika Funkcji BazowychELEKTRONIKA 3/<strong>2009</strong> 15


As an example Figure 5 presents various atoms takenfrom proposed dictionary.Atoms from BFD are selected from tree structure dictionaryin order to shorten atoms search time. In proposed coderCIF frame sequences were used as an input signal. Dimensionof BFD functions was set to 1/4 of chrominance component(Figure 6). As a result of tiling process luminance Ycomponent is divided into 16 blocks. BFD used in presentedsolution consists of 900 base functions.Prediction error signal energy depends on motion estimationand compensation process and characteristic of input signal.More accurate motion compensation process results insmaller prediction error signal energy. In case of encoding sequenceswith fast moving objects prediction error signal energyrises. After encoding prediction error with BFD weachieve: At id = [1,2,…,n] - atom index vector; Q k = [1,2,…,n] -projection coefficients; P x = [1,2,…,n] and P y = [1,2,…,n] - positionvectors of atoms. Maximal value of projection coefficientQ is additionally limited. All coefficients are later arithmeticallyencoded with RangeCoder [6].In Figure 7. graphic representation of dictionary structurewas shown. In Figure 8. relationship between atom-parentand atom-children was presented.BFD structure and atom search processIn basic Matching Pursuit algorithm atoms are selected atevery step from entire dictionary which has flat structure. Inthis case algorithm causes significant computational complexity.In our coder, dictionary with internal structure wasused. Dictionary is built from Atoms and Centered atoms.Centered atoms group such atoms from D that are as muchcorrelated as possible to each other. To calculate measure ofcorrelation between atoms function o(a,b) can be used [7].Fig. 7. Dictionary structureRys. 7. Struktura Słownika Funkcji Bazowych(5)Fig. 8. Relationship between atoms - first on the left atom-parent,the rest of atoms are atom-children’sRys. 8. Zależności pomiędzy atomami - pierwszy od lewej atom-rodzic,pozostałe atomy są potomkami tego atomuRate-Distortion OptimizationFig. 6. Dimension of BFD base functionsRys. 6. Rozmiary atomów Słownika Funkcji BazowychThe quality of centered atom can be estimated according to (6):LP k,l is a list of atoms grouped by centered atom. O k,l is meanof local distances from centered atom W c(k,l) to the atoms A c(i)which are strongly correlated with A c(i) Centroid W c(k,l) representsatoms A c(i) which belongs to the set i ∈ LP k,l . List ofatoms LP k,l should be selected according to the Expression 7:(6)(7)Size of video output bitstream signal mainly depends on motionestimation and compensation process, motion vector MVselecting and prediction error signal coding. In order to controlcompression rate and quality of output video bitstream RDO(Rate-Distortion Optimization) mechanism was used. In caseof video coding every frame has to be encoded with differentcompression rate to achieve expected quality of output sequence.In presented coder Lagrange RDO was used (Figure9). For large λ we have to minimize rate r. This causeslarger distortion d.For small λ values we have to minimize distortion d. Lagrangeminimization process is presented in Equation 8:Frame quality changes and rate parameter is controlledby parameter λ. In presented coder simple quality controllingwas used. Two different λ parameters were used for frame Pand B. Target PSNR value for P frame was set to 0.7 dB lowerthan previous I frame. Target PSNR value for B frame was setto 0.3 dB lower then closest P frame. Frame quality changesfor first 50 frames was presented in Figure 10.(8)16 ELEKTRONIKA 3/<strong>2009</strong>


anges of compression rates (high and medium rates, smalland medium frame resolution) presented coder may achievebetter results than AVC/H264. In Table there are results of encoding11 test sequences. PSNR difference changes dependson character of encoded sequences and ability of BFD to captureprediction error signal characteristic.BFD video coder results (PSNR [dB]) compared to AVC/H264Wyniki kompresji proponowanego kodera wideo z użyciem SFB(PSNR [dB])) porównane do rozwiązania standardowego AVC/H264PSNR Difference in favour ofNr Sequence NameBFD video coder [dB]1 Foreman 0,1 - 1,262 Football 0,1 - 0,4Fig. 9. RDO - Lagrange optimizationRys. 9. Optymalizacja (Lagrange) zniekształcenia-stopień kompresji3 Mother & Daughter 0,9 - 1,614 New Mobile Calendar 0,1 - 2,915 Paris 0,2 - 0,976 Blue Sky 0,28 - 2,907 Pedestrian area 0,91 - 1,948 Rush hour 1,27 - 2,429 Tractor 0,1 - 2,37Fig. 10. Luminance PSNR changes for first 50 frames for ”Foreman”and ”Riverbed” test sequencesRys. 10. Zmiany PSNR luminancji dla pierwszych 50. ramek sekwencjitestowych „Foreman” i „Riverbed”10 Sunflower 0,1 - 1,3411 Riverbed 0,1 - 1,34Experimental resultsProposed coder was tested by 11 test sequences. Test sequenceswithout significant move (Mother & Daughter, Paris,New Mobile Calendar) and with fast move of many objects(Football, Pedestrian area, Riverbed) were used. In Figure 13and 14 we can see decoded frames with different frame rates,prediction error and encoded prediction error. In Figure 13.fprediction error encoded with 103 atoms was presented.Atoms are mainly encoded on edges of moving objects wheresignificant energy concentrations are. Sequence Riverbedpresented in Figure 14 is very hard to code. In this case wehave to encode prediction error signal (Figure 14f) with moreatoms than in other tested sequences. Quality of decoded testsequences was compared to the latest standard of video compressionAVC/H264. Configuration of proposed coder wascomparable to AVC/H264 configuration in order to ensureproper comparisions. Selected parameters of AVC/H264coder: - AVC/H264 coder profile:• Main Profile - Input signal - CIF 4 : 2 : 0,• Frame types - I, P i B,• RDO - Rate Distortion Optimisation - on,• Rate Control - on,• Group of Pictures - GOP 15 frames,• ME Search range 16.In Figure 11 and 12 PSNR = f(rate) characteristics werepresented. Presented coder was compared to the AVC/H264in very high, high and medium compression rates. In thisFig. 11. PSNR = f(rate) (PSNR of luminance component) characteristicfor: ”Blue Sky” (on the left) and ”Pedestrian area” test sequencesRys. 11. Zmiany PSNR luminancji dla pierwszych 50 ramek sekwencjitestowych „Pedestrian area” i „Blue Sky”Fig. 12. PSNR = f(rate) (PSNR of luminance component) characteristicfor: ”Riverbed” (on the left) and ”Foreman” test sequencesRys. 12. Zmiany PSNR luminancji dla pierwszych 50 ramek sekwencjitestowych „Riverbed” i „Foreman”ELEKTRONIKA 3/<strong>2009</strong> 17


Fig. 13. Selected frames of ”Foreman” test sequence encodedwith: a), b) 124.41 kb/s; c), d) 265.49 kb/s; e) Prediction error; f) BFDencoded prediction errorRys. 13. Wybrane ramki sekwencji testowej „Foreman” zakodowanez przepływnością: a), b) 124.41 kb/s; c), d) 265.49 kb/s; e) błądpredykcji; f) błąd predykcji zakodowany z użyciem Słownika FunkcjiBazowychFig. 14. Selected frames of ”Riverbed” test sequence encodedwith: a), b) 596.34 kb/s; c), d) 1382.46 kb/s; e) Prediction error;f) BFD encoded prediction errorRys. 14. Wybrane ramki sekwencji testowej „Riverbed” zakodowanez przepływnością: a), b) 596.34 kb/s; c), d) 1382.46 kb/s;e) błąd predykcji; f) błąd predykcji zakodowany z użyciem SłownikaFunkcji BazowychReferences[1] HHI - Institut Nachrichtentechnik Heinrich - Hertz H.264/AVC JMReference Software. www.iphome.hhi.de. , 2007.[2] Mallat S., Zhang Matching Pursuit with time frequency dictionaries.IEEE Trans. Signal. Process vol. 41 no. 12, 1993, pp. 3397-3415.[3] Tropp J. A.. Greed is Good: Algorithmic Results for Sparse Approximation.IEEE Transactions on Information Theory, vol. 50.no. 10, 2004.[4] Gribonval R., Vandergheynst P.. On the Exponential Convergenceof Matching Pursuits In Quasi Incoherent Dictionaries.IEEE Transactions on Information Theory, vol. 52. no. 1, pp. 255-261, 2006.[5] Neff R., Zakhor A.. Matching Pursuit Video Coding - Part I: DictionaryApproximation. Trans. on Circuits and Systems for VideoTechnology vol.12. no. 1, 2002, pp. 13126.[6] Campos A. E.. Range Coder. www.arturocampos.com 2005.[7] Gribonval R.. FastMatching Pursuit with a Multiscale Dictionaryof Gaussian Chirps. IEEE Transactions on Signal Processing vol.49. no. 5, 2001.[8] Tropp J. A.. Just Relax: Convex Programming Methods for SubsetSelection and Sparse Approximation. The Univ. Texas at Austin,ICES Rep. 2004.[9] Neff R., Zakhor A.. Matching Pursuit Video Coding - Part II: OperationalModels for Rate and Distortion. IEEE Transactions onCircuits and Systems for Video Technology vol. 12 no. 1. pp.27139, 2002.[10] Gribonval R., Nielsen M.. Sparse representation in union ofbases IEEE Transactions on Information Theory, vol. 49. o. 1,2003, pp. 3320-3.[11] Jost P., Vandergheynst P., Frossard P. Redundant image representationsin security applications, IEEE ICIP 2004 , vol. 4. no.1, 2006, pp.2151-2154.Przypominamy o prenumeracie miesięcznika <strong>Elektronika</strong> na <strong>2009</strong> r.18 ELEKTRONIKA 3/<strong>2009</strong>


Dependence of the head-related transfer functionon pinna flare angle(Zależność funkcji transmitancji odniesionej do głowyod kąta wychylenia małżowiny usznej)dr inż. PRZEMYSŁAW PLASKOTA, prof. dr hab. inż. ANDRZEJ B. DOBRUCKIWrocław University of Technology, Institute of Telecommunications, Teleinformatics and Acoustics, WrocławThe outer ear with human head and torso form acoustic systemwhich is significant in the process of sound source localizationby a human [5]. It appears that the pinna has a crucialinfluence on sound spectrum reaching middle ear. The impactof particular parts of the pinna on sound spectrum is also wellknown. However, changes in frequency response introducedby the pinna are dependent on individual traits. Since it is notpossible to make a universal set of HRTF, research is beingconducted in order to personalize the set of above mentionedfunctions, eg. [6]. It is possible to calculate HRTF for each personusing numerical methods on the basis of mapping theshape of the real object.The research presented in this paper should give the answerto the question: what accuracy of mapping the pinna positionin relation to the head is needed during the formation ofnumerical model of human head. The method of the conversionof geometrical shape to the numerical domain was illustratedin [3]. The method consists of two parts. In the first onehuman head is transformed, whereas in the second one thepinna is. Next, the two models should be combined. Does thechange of flare angle in the process of joining the pinna modelwith head model have a significant influence on HRTF values?The research which is shown in the paper will provide theanswer to the question whether the pressure of headphonesshell on the pinna has an impact on localization of sound sourcelocated in the listeners surroundings. The pressure ofheadphones shell causes the change of pinna flare angle.Open headphones are characterized by their capability totransmit the environmental sounds without significant influenceon sound spectrum. Thus, the localization of sound sourcewhich is placed in listener’s surroundings with openheadphones on the head can be held. Nevertheless, it is stillunclear if the pressure of the phones shell on the pinna changesthe precision of sound source localization. In the otherwords, whether the change of the pinna flare angle influencesthe HRTF values.The numerical calculation was provided using the model ofNeumann KU-100 dummy head [3,4]. The model appears tobe appropriate to conduct the research mainly due to high accuracyof mapping the geometrical shapes of the real object.The Sysnoise was used in the simulations.The changes in the model were done in the following way:the pinna was being rotated in relation to an axis. The rotationaxis is orthogonal to horizontal plane of the model. It crossesthe line which extend across the middle of ear entrance. Thecrossing point is situated 5 mm from the ear canal entrance.The distance corresponds to the position of measuring microphoneduring HRTF measurement on the real object. In Figure1 the rotation axis matches the vertical Z-axis. Fifteendifferent rotations of the pinna were done, in the range from+10° to -20° with step 2°. Positive values of θ flare angle meanlonger distance between the pinna and the head, whereas negativevalues of θ angle mean closer position of the pinna inrelation to the head.Due to the size of the model elements the numerical calculationis proper below the frequency of 7 kHz. The conditionof 6 elements per wave length is fulfilled bellow thisfrequency. The calculation was done in the range of frequencyfrom 100 Hz to 7.5 kHz with the resolution of 200 Hz.The numerical calculation was conducted for one positionof sound source. The coordinates of source are: elevationangle 0°, horizontal angle 90°. Thus, it is the source located infront of the ear entrance, on the line extending across the middleof the ear entrance. The distance of the source is 1 m fromthe center of the model. The calculation was done for ipsilateralear (situated closer to the sound source) and contralateralear (situated further from the sound source).The Figure 2 shows the position of pinna for maximum andminimum value of the flare angle θ. In Figure 2a the primaryposition of pinna is shown. In this case the flare angle θ = 0°.The Figure 2b presents pinna for the maximum of θ = +10° vs.primary pinna position and last the Figure 2c presents pinna forthe minimum flare angle (θ = -20°) vs. primary pinna position.Modeling of HRTFFig. 1. Coordinate system used for definition of the flare angle. Therotation axis matches the vertical Z-axisRys. 1. Układ współrzędnych wykorzystany do definicji kąta odchylenia.Osią obrotu jest oś ZELEKTRONIKA 3/<strong>2009</strong> 19


a)a)b)b)c)Fig. 2. Changes of pinna flare angle (top of the head view): a) primaryposition of pinna, b) maximum flare angle vs. primary pinnaposition, θ = +10 deg, c) minimum flare angle vs. primary pinna position,θ = -20 degRys. 2. Zmiana kąta odchylenia małżowiny usznej (widok z góry):a) pierwotne położenie małżowiny, b) maksymalne wychyleniemałżowiny usznej względem położenia pierwotnego, θ = +10°,c) minimalne wychylenie małżowiny usznej względem położeniapierwotnego, θ = -20°The results of the numerical calculationsThe results of the numerical calculations of HRTF are presentedin Fig. 3. The solid line presents the HRTF for the primaryposition of the pinna. The results of the calculation indecibels are related to the pressure in free field, which is calculatedat the central point of the model.In Figure 3a three important points can be noticed, for thefrequency of ca. 2.1 kHz, ca. 4.3 kHz and ca. 6.1 kHz. Thesepoints define ranges inside of which the changes of HRTFvalue depending on flare angle θ have one direction. In can benoted that in the range of the frequency from 0 to 2.1 kHz theHRTF values are independent on the flare angle. The thesisthat the pinna influences sound spectrum for the frequenciesabove 3 kHz has been confirmed. The second range appearsin the frequency range between 2.1 kHz and 4.3 kHz. In thisrange the increase of flare angle causes the increase of signalgain provided by the pinna. Similar situation can be foundin the range of the frequency above 6.1 kHz. In the range ofthe frequency from 2.1 kHz to 4.3 kHz the maximum valuechange does not exceed 2 dB. In the range above 6.3 kHz thechange of value does not exceed 1 dB.Fig. 3. HRTF for ipsilateral ear (a) and contralateral ear (b). Solidline indicates HRTF value for primary position of the pinna, dottedline - for the flare angle θ = +10 deg , dashed line - for the flareangle θ = -10 degRys. 3. HRTF dla ucha ipsilateralnego (a) i kontralateralnego (b).Linia ciągłą oznaczono HRTF dla pierwotnego położeniamałżowiny, linia kropkowana - θ = +10°, linia kreskowana - θ = -10°In the range of frequency from 4.3 kHz to 6.3 kHz differentsituation can be observed. The increase of flare angle causesthe decrease of signal gain provided by the pinna. The greatestchange can be observed for the frequency equal to5.3 kHz, the change of HRTF value is ca. 3 dB. It can be seen,that with the increase of the pinna flare angle HRTF responseis to some extend smoothed.In the case of the contralateral ear (Fig. 3b), the changesof HRTF value can be noticed in two frequency ranges: fromca. 1.3 kHz to ca. 5.3 kHz and above 5.3 kHz. For the frequenciesbelow 1.3 kHz the value of HRTF does not dependon the pinna flare angle.In the frequency range between 1.3 kHz and 5.3 kHzHRTF value increases with the increase of the flare angle θ.The maximum difference appears for the frequency of ca.4 kHz and has the value of ca. 4 dB. In the range above5.3 kHz HRTF value decreases with the increase of the pinnaflare angle. The maximum difference appears for the frequencyof ca. 6.5 kHz and it has the value of ca. 5 dB.It can be noticed that the frequency values which definethe change ranges of HRTF are different for ipsilateral ear andcontralateral ear. The second crucial difference is that thereare three ranges of HRTF changes for ipsilateral ear, whereas20 ELEKTRONIKA 3/<strong>2009</strong>


there are only two for contralateral one. It was found thatchanges of HRTF depending on the flare angle for contralateralear are greater than for ipsilateral ear. Despite of this factthe primary HRTF dynamics for ipsilateral ear is ca. 5 dB greaterthan for contralateral ear.The influence of the position of acquiring point on HRTFwas studied. It has been stated that this influence is strongerthan influence of flare angle. Changes of HRTF value for presentedmodification of pinna flare angle are no grater than5 dB. The change of the result acquiring point in the range±2 mm along the axis Y (see Fig. 1) relatively to the originalacquiring point position influence the HRTF value maximum±7 dB. The changes of HRTF value for different acquiringpoint position are presented in Figure 4. It can be observedthat for frequency ca. 7 kHz the difference between maximumand minimum of HRTF value is equal ca. 14 dB.ConclusionThe paper presents the influence of the pinna flare angle onthe HRTF. The rotation of the pinna was taken into considerationin the horizontal plane in the range from +10° to -20°.Presented results show that the pinna flare angle influencesHRTF. However, this influence is rather qualitative than quantitative.The general character of HRTF is kept. The maximaand minima of HRTF appear for the same frequencies independentlyon the flare angle. However, the signal gain introducedby pinna changes do not exceed several dB.It is known that the most important cues for sound sourcelocalization are the relations between maxima and minima ofHRTF in frequency domain. On this basis it can be noted thatdeformation of pinna position presented in the paper does nothave any influence on sound source localization. Particularly,the change of the flare angle smaller than 2 deg causes changesin HRTF value which do not exceed 0.5 dB. Thus, it canbe noted that mapping of the pinna flare angle with accuracyof 1° is sufficient to get proper results of numerical calculationof HRTF. It can be stated that the displacement of the pinnacaused by open headphones does not influence the localizationof sound source direction.ReferencesFig. 4. Result of numerical calculation of HRTF for different positionof the result acquiring point (ipsilateral ear). Solid line indicatesHRTF value for primary position of the result acquiring point, dottedline - for the point placed 2 mm closer to the ear entrance, dashedline - for the point placed 2 mm faraway to the ear entrance.Rys. 4. Zależność HRTF od punktu zbierania odpowiedzi dla uchaipsilateralnego. Linia ciągła oznacza HRTF dla standardowej pozycjipunktu pomiarowego, linia kropkowana - dla punktu przesuniętegoo 2 mm w kierunku wlotu do kanału usznego, liniakreskowana - dla punktu przesuniętego o 2 mm w kierunku przeciwnymdo wlotu do kanału usznego[1] Algazi V. R., Duda R. O., Thompson D. P., Axjendano C., TheCIPIC HRTF database. Proc. IEEE WASPAAOI, New Paltz, NY,2001, pp. 99-102.[2] Dobrucki A. B., Plaskota P., Computational modelling of headrelatedtransfer function. Arch. Acoust. vol. 32, 2007.[3] Plaskota P., Acoustical model of the head for HRTF calculation,in LIV Open Seminary on Acoustics, Proc. Rzeszów-Przemyśl,10-14.09.2007.[4] Plaskota P., Dobrucki A. B., Reduction of numerical head modelfor calculation of head-related transfer function, in Signal processingalgorithms, architectures, arrangements, and applications.SPA 2007, Workshop proceedings, Poznań, 7thSeptember 2007.[5] Shaw E. A. G. The External Ear. In W.D. Keidel and W.D. Neff(Eds.), Handbook of sensor psychology. vol. V/1, Springer-Verlag,Berlin, 1974, pp. 455-490.[6] Zotkin D. N., Hwaiig J., Duraiswami R., Davis L.S., HRTF personalizationusing anthropometric measurements. IEEE Workshopon Applications of Signal Processing to Audio andAcoustics, New Paltz NY, 2003, pp. 157-160.Automatyczna weryfikacja mówcyoparta na cechach prozodycznychmgr inż. SZYMON DRGAŚ, dr inż. DAMIAN CETNAROWICZ,prof. dr hab. inż. ADAM DĄBROWSKIPolitechnika Poznańska, Katedra Sterowania i Inżynierii Systemów, PoznańRozpoznawanie mówcy jest to proces podejmowania decyzji,w którym wykorzystuje się cechy sygnału mowy w celu określenia,czy dana osoba wyartykułowała określoną wypowiedź.Istnieją dwie główne klasy systemów automatycznego rozpoznawaniamówcy: identyfikacja mówcy i weryfikacja mówcy.Identyfikacja mówcy polega na wskazaniu osoby, która wypowiedziałazarejestrowane słowa. W zadaniu weryfikacji mówcypróbka mowy jest porównywana do modelu mówcy i podejmowanajest decyzja o tym, czy wypowiedź należy do mówcy.Skuteczne rozpoznawanie mówcy w różnych warunkach(zakłóceniach i zniekształceniach) wymaga analizowania sygnałumowy na wielu poziomach. Podział na poziomy wynikaz opisu procesu wytwarzania mowy. W czasie rozmowymówca w charakterystyczny dla siebie sposób formułuje wypowiedź(dobiera słownictwo, stosuje reguły gramatyczne, semantyczneitp) i popełnia charakterystyczne dla siebie błędy.Następnie ponownie w charakterystyczny dla danego mówcysposób są wysyłane sygnały do artykulatorów, które realizująELEKTRONIKA 3/<strong>2009</strong> 21


proces wytwarzania mowy przez aparat głosowy. Mowę należyanalizować na każdym z tych etapów (poziomów), wydobywająccechy charakterystyczne dla danej osoby.Rozpoznawanie mówcy wykorzystujące cechy widmowe(które są w dużym stopniu zależne od wymiarów traktu głosowego)daje bardzo dobre rezultaty. Obecnie stosowane sąsystemy wykorzystujące współczynniki MFCC (ang. Mel-FrequencyCepstral Coefficients) i klasyfikatory takie jak GMM(ang. Gaussian Mixture Models) czy SVM (ang. Support VectorMachines). Te systemy cechują się wysoką skutecznościąw warunkach eksperymentalnych (nawet ponad 90% poprawniezidentyfikowanych wypowiedzi dla bazy TIMIT). Wrzeczywistych sytuacjach liczba błędów znacznie wzrasta.Należy zauważyć, że w tych systemach wykorzystywana jestjedynie informacja oparta na krótkich fragmentach czasowych(takich, w których można założyć quasi-stacjonarność sygnału- ok. 20 ms), natomiast informacja obejmująca dłuższefragmenty (o czasach trwania sylaby, słowa, zdania) jest utracona.W artykule opisano badaną skuteczność systemu automatycznegorozpoznawania mówcy opartego na cechach prozodycznych.Matematyczny opis prozodiiW opisywanym eksperymencie cechy prozodyczne oparte sąna częstotliwości podstawowej (F0), energii sygnału i czasachtrwania segmentów prozodycznych. Jak pokazano w [1]zmiany wysokości mogą być modelowane za pomocą liniowejaproksymacji - tzw. stylizacji. W znacznej liczbie przypadkówmowa uzyskana w procesie syntezy opartej na stylizowanychprzebiegach F0 jest percypowana podobnie do mowy syntetyzowanejz wykorzystaniem oryginalnego przebiegu F0.Przykład stylizacji częstotliwości podstawowej F0 jest zaprezentowanyna rys. 1. (środkowy wykres). Częstotliwośćpodstawowa jest szacowana w każdej ramce o określonejRys. 2. Histogramy wybranych parametrów prozodycznychFig. 2. Histograms of chosen prosodic parametersdługości (zazwyczaj 10 ms). Przebieg F0 jest podzielonyw taki sposób, że w każdym segmencie może on być aproksymowanyza pomocą prostej. Każda prosta jest określonaprzez nachylenie. W podobny sposób można parametryzowaćprzebieg logarytmu energii sygnału. Wtedy stylizacjęopiera się na granicach segmentów wyznaczonych dla częstotliwościpodstawowej i dopasowuje się metodą regresji liniowej- rys. 1. (dolny wykres).Wartości uzyskane w procesie stylizacji są kwantyzowane.Następnie kombinacje trzech wartości (nachylenia częstotliwościpodstawowej, energii sygnału i czasu trwania) zaindeksowano.Każdy segment wypowiedzi został opisany liczbą.Po analizie parametru opisującego czas trwania segmentu,okazało się, że prezentowane cechy niosą informacjędługoterminową. Histogram czasów trwania jest przedstawionyna górnym wykresie rys. 2. Jak można zauważyć większośćsegmentów ma długość przekraczającą typowy czasramki cech krótkoterminowych (10 ms).Modelowanie za pomocą bigramówi n-gramówW celu zamodelowania sekwencji symboli s 1 ,s 2 …s n cech prozodycznych,można oszacować prawdopodobieństwoP(s 1 ,s 2 …s n ) jako iloczyn prawdopodobieństw warunkowych:(1)Rys. 1. Kształt fali oraz stylizacja częstotliwości podstawowej F0i natężenia sygnałuFig. 1. Waveform and stylization of fundamental frequency F0 andsignal intensityZależność (1) daje możliwość przybliżenia prawdopodobieństwaP(s 1 ,s 2 …s n ) przez ograniczenie kontekstu:(2)22 ELEKTRONIKA 3/<strong>2009</strong>


dla niektórych n ≥ 1. W przeprowadzonych eksperymentachwybrano n = 2, czyli bigramy :(3)Prawdopodobieństwo bigramu może być oszacowanejako stosunek liczby wystąpień podsekwencji s i-1 = a, s i = bdo liczby wszystkich bigramów w modelowanej sekwencji.Na rysunku 3. przedstawiono przykład kodowania prozodii.Pokazano dwie wypowiedzi słowa „Anna” dwóch różnychosób. Dla każdego sygnału zaprezentowano trzy wykresy:przebieg czasowy sygnału, przebieg częstotliwości podstawowejoraz zmiany zlogarytmowanej energii sygnału. Na wykresyenergii i częstotliwości F0 nałożono proste otrzymanew wyniku stylizacji.Każdy segment może przyjąć jedną z 12 wartości (3 wartościF0, 2 wartości natężenia oraz dwie możliwe długości).Patrząc na kodowane wypowiedzi (rys. 3.), można zauważyćróżnice pomiędzy obserwowanymi parametrami takimijak F0, natężenie i długość segmentu. To pokazuje, żenawet te same wypowiedzi, wypowiedziane przez różnychmówców generują różne bigramy. Na rys. 4. przedstawionorozkład prawdopodobieństwa występowania bigramów dladużej liczby mówców (worldmodel).Rys. 4. Rozkład bigramów dla modelu odniesienia (tzw. worldmodelu)Fig. 4. Bigram of the worldmodelEksperymentCelCelem eksperymentu była ocena zawartości informacji osobniczejw różnych cechach prozodycznych. Testowano dokładnośćweryfikacji mówcy wykorzystując cechy prozodyczne zaproponowaneprzez Adami [5]. Zbadano efektywność automatycznegorozpoznawania mówcy w zależności od rytmu mowy.Bazy nagrańEksperyment wykonano używając bazę nagrań NIST 2004 [3].Modele trenowano na wypowiedziach z dialogów „8 sides” i „1sides”. W omawianym eksperymencie wytrenowano 100 modeli.Model odniesienia (worldmodel) trenowano używając bazęnagrań NIST 2002. Do tego treningu wykorzystano wyłączniegłosy męskie.Przetwarzanie sygnałówOmawiany eksperyment wykonano używając znanego oprogramowaniaPRAAT [4] i środowiska programistycznego Matlab.Program PRAAT zastosowano do obliczeń chwilowych wartościF0, stylizacji wysokości tonu i obliczeń intensywności. Linowa aproksymacjaintensywności, służąca do stylizacji intensywności,a także trenowanie i testowanie wykonano w środowisku Matlab.WynikiRys. 3. Dwie wypowiedzi imienia “Anna” dwóch różnych mówców(sygnały z bazy nagrań CORPORA [2])Fig. 3. Two utterances of name “Anna” by different speakers (signalsfrom CORPORA database [2])Do opisu charakterystycznych stanów opisujących prozodięwykorzystano symbole. Każdy z symboli opisuje kierunekzmiany częstotliwości podstawowej i energii, dźwięcznośći czas trwania opisywanego fragmentu. Adami [5] zaproponowałmodelowanie tych sekwencji stosując n-gramy.W pierwszym eksperymencie zastosowano symbole z zakresuod 1 do 12. Wartość symbolu zależy od czynnikówcząstkowych tj. od dźwięczności (dźwięczny/bezdźwięczny),od zmiany częstotliwości podstawowej (wzrost/spadek), odzmiany energii (wzrost/spadek) i czasu trwania (krótki/długi).Wszystkie możliwe kombinacje prowadzą do 12. stanów (gdyfragment jest bezdźwięczny wówczas zmiana częstotliwościpodstawowej nie jest opisywana). Krzywa DET (ang. DetectionError Trade-Off) uzyskana dla tego rodzaju sekwencji modelowanychbigramami jest pokazana na rys. 5. Parametr EER(ang. Equivalent Error Rate) dla tego systemu osiągnął 23%.ELEKTRONIKA 3/<strong>2009</strong> 23


Rys. 5. Krzywa DET będąca oceną modelowania prozodii bigramamiFig. 5. DET plot for prosody modelled with bigramsRys. 7. Krzywe DET dla systemu modelującego długość segmentówi dźwięcznośćFig. 7. DET plot for duration and voicing patternsZwiększanie liczby poziomów kwantyzacji opisującychczas trwania przyczyniło się w omawianym przypadku dozmniejszenia dokładności rozpoznawania, z powodu niedostatecznejilości danych treningowych. Należy zauważyć, żew ten sposób liczba symboli wzrasta przy tej samej liczbiesegmentów, na które podzielone zostały wypowiedzi. Dlaprzykładu, podwojenie liczby poziomów w kwantyzacji czasutrwania sprawia, że liczba symboli wzrasta do 24. W takiej sytuacjipodczas treningu należy estymować prawdopodobieństwo576. bigramów (zamiast 144. dla 12. symboli).W drugim eksperymencie zbadano zależność informacjio długości segmentu od mówcy. W tym przypadku symbolekodowały informację wyłącznie o długości segmentu. Na rys. 6pokazano rodzinę krzywych DET dla różnej liczby poziomówkwantyzacji długości. Dla dwóch poziomów kwantyzacji parametrEER osiągnął około 40%. Dwukrotne zwiększenie liczbypoziomów przyczyniło się do znacznej poprawy. Dalsze zwiększaniedo 6. poziomów nie przyniosło korzyści. Na tej podstawieustalono, że 4 poziomy kwantyzacji są najbardziejodpowiednie. W porównaniu z wcześniejszym eksperymentem,gdzie dodatkowo wykorzystywano informację o F0 i energii,obecny wynik jest tylko nieznacznie gorszy.W trzecim eksperymencie, do informacji o czasie trwaniadołączono informację o dźwięczności danego fragmentu.W tej sytuacji każdy symbol kodował informację o czasie trwaniai dźwięczności lub bezdźwięczności. Wyniki przedstawionona rys. 7. Podobnie do pierwszego eksperymentudotyczącego wyłącznie czasów trwania, różnica między 4.i 6.poziomami kwantyzacji jest mała. Wynik ten przybliża wynikotrzymany przy zastosowaniu całkowitej informacji o prozodii(F0 + energia + dźwięczność + czas trwania).PodsumowanieRys. 6. Krzywe DET dla systemu modelującego wyłącznie długośćsegmentówFig. 6. DET plot for duration patternsArtykuł przedstawia wyniki modelowania prozodii w zastosowaniudo identyfikacji mówcy. Uzyskane krzywe DET wskazują,że rytm prozodii mowy zawiera istotne informacjecharakterystyczne dla mówcy. Niemniej jednak docelowy systemrozpoznawania mówcy powinien wykorzystywać informacjęo częstotliwości podstawowej, energii i w czasie trwaniasygnału.Badania wykonano w ramach PPBW konsorcium i projektuMniSz.W Nr 1443/T02/2006/30Literatura[1] Ravuri S., Ellis D.: Stylization of Pitch with Syllable-Based LinearSegments. In ICASSP-08. Las Vegas, 2008, pp. 3985-3988.[2] Grocholewski S.: Statystyczne podstawy systemu ARM dla językapolskiego. Poznan University of Technology, 2001.[3] Martin A., Przybocki M.: 2004 NIST Speaker Recognition Evaluation.P. Linguistic Data Consortium, Ed., 2004.[4] Boersma P., Weenink D.: Praat: doing phonetics by computer.5.0.27 ed, 2008.[5] Adami A., Mihaescu R., Reynolds D. A., Godfrey J.: Modellingprosodic dynamics recognition. presented at ICASSP 2003, 2003.24 ELEKTRONIKA 3/<strong>2009</strong>


Badania przestrzennych cech dźwiękumis dźwiękowychdr inż. ANDRZEJ MEYER, dr inż. HALINA PORTALSKA, dr inż. MAREK PORTASKIPolitechnika Poznańska, Wydział Informatyki i ZarządzaniaDźwięki i wibracje specjalnych metalowych mis nazywanychmisami dźwiękowymi są stosowane w celach terapeutycznychod czasów starożytnych głównie na Dalekim Wschodzie.Obecnie metoda ta po jej adaptacji przez Petera Hessa jestwykorzystywana również w Europie podlegając dalszemu rozwojowi[1,2]. Terapia misami dźwiękowymi polega napołożeniu ich w odpowiednich punktach ciała lub obok niegoi delikatnym pobudzaniu do drgań. Stosuje się także tylkoodsłuch dźwięku mis, zwłaszcza w seansach zbiorowych.Misy dźwiękowe po uderzeniu wytwarzają dźwięk będącyzłożonym wielotonem nieharmonicznym. Jego składowe skupionew charakterystyczne grupy dają dudnienia o częstotliwościachleżących głównie poniżej pasma akustycznegow strefie większości rezonansów mechanicznych organówciała ludzkiego [10] oraz fal alfa i theta mózgu [5,6].W dostepnych publikacjach zagranicznych, na przykład[1-4] ogólnie brak jest opisu fizyki zjawisk akustycznych w misachdźwiękowych, a nawet bardziej szczegółowych danycho ich dźwięku. Właściwości widma dźwięku mis, a takżewidma jego obwiedni były przedmiotem wielu badań [7-9] prowadzonychod wielu lat na Politechnice Poznańskiej.Uzyskane wyniki nie wyjasniają jednak wszystkich aspektówstosowania mis w terapii, szczególnie pewnych subiektywnychodczuć terapeutów, zwłaszcza o wieloletnim stażui dużej wrażliwości. Wielu z nich stwierdzało, że dźwięk typowouderzanej misy (około 2...3 cm poniżej krawędzi) zależyod miejsca jej uderzenia, pomimo osiowej symetrii misy.Także rodzaj użytej pałki w istotny sposób wpływa na dźwiękwydobywany z misy. Padały również stwierdzenia, że dźwiękmis rozchodzi się zarówno prostoliniowo, jak również w postacikoncentrycznych kręgów oraz wirów nad misami.Do weryfikacji tych hipotez najlepszy byłby pomiar drgańmisy przy użyciu skaningowego wibrometru laserowego. Autorzynie dysponując tym kosztownym urządzeniem postanowilizastosować metodę przybliżoną polegającą na rejestracji i analiziesygnału z mikrofonów umieszczonych blisko badanej misy.Nagrania wielomikrofonoweW badaniach zastosowano rejestrację dźwięków za pomocą8. mikrofonów rozmieszczonych symetrycznie wokół misy dźwiękowej.Nagrania wykonano w komorze bezechowej PracowniUkładów <strong>Elektronicznych</strong> i Przetwarzania Sygnałówmikrofonami elektretowymi typu ME 92d [XLR] o charakterystycedookolnej. Jako zespół wzmacniaczy mikrofonowychz przetwornikami A/C wykorzystano urządzenie OctaMic.Nagrania wykonano z szybkością próbkowania44100 smp/s. Jak wynika z wcześniejszych analiz dźwiękumis [7-9] szybkość ta jest całkowicie wystarczająca. Dla ekstrakcjiobwiedni wykorzystano prosty algorytm obliczania uśrednionejenergii w stałych przedziałach czasu. Schematukładu pomiarowego przedstawiono na rys. 1.Do zamocowania mikrofonów wykonano specjalny przyrząd.Na rys. 2 przedstawiono jego zdjęcie wraz z badanąmisą na stanowisku pomiarowym w komorze bezechowej.Rys. 1. Schemat układu pomiarowegoFig. 1. The measurement system schemeRys. 2. Widok stanowiska pomiarowego wraz z przyrządem mocującymmikrofonyFig. 2. The view of the multimicrophone measurement positionWidoczna na rys. 2. podstawa ze sklejki stoi na stole na 4.wibroizolacyjnych nóżkach. W otwór podstawy wstawia siębadaną misę na elastyczną podkładkę leżącą na stole. Mikrofonysą przypięte klipsami do wewnętrznych końcówkątowników. Położenie tych kątowników względem badanejmisy można regulować dzięki wyciętym w nich szczelinomumożliwiających przesuwanie ich względem śrub M5 wklejonychw klocki.Dla wygody regulacji odległości mikrofonów od badanejmisy kątowniki wyposażono w skalę milimetrową. Typowa odległośćmikrofonów od misy dźwiękowej wynosiła 2 cm.Wyniki badańPrzedmiotem badań były dwie misy dźwiękowe. Pierwszaz nich oznaczona dalej jako M1 - tzw. brzuszna o średnicy23,7 cm miała częstotliwość głównego prążka widma 115 Hz.ELEKTRONIKA 3/<strong>2009</strong> 25


Analiza trendów wybrzmiewania energii dźwiękumis w czasieAmplituda sygnałów z mikrofonów maleje wykładniczo w czasie.Dla ilustracji na rys. 4 pokazano przykładowo postać czasowąsygnału z mikrofonu 1.Rys. 3. Widok badanych mis i pałekFig. 3. The view of examined bowls and sticksDruga, mniejsza oznaczona jako M2, tzw. stawowa o średnicy22 cm miała najsilniejsze prążki widmowe o częstotliwościach99,5 i 280 Hz. Misy te uderzano dwoma rodzajami pałek - dużąo średnicy 69 mm i średnią o średnicy 57 mm. Miejsca uderzeńprzypadały między mikrofonami 1 i 2, 3 i 4, 5 i 6 oraz 7 i 8.Siły uderzeń dla danej pałki były zbliżone do siebie. Badanemisy i pałki przedstawiono na rys. 3. W pierwszej fazie doświadczeńpostanowiono zbadać charakter zmian w czasie poziomudźwięku na każdym z mikrofonów w zależności odmiejsca uderzenia w misę i rodzaju pałki. Następnie w podobnysposób zbadano widma fluktuacji energii dźwięku.Przedmiotem analiz była zmiana średniej energii sygnałóws we wszystkich kanałach obliczonej w stałych wycinkach czasowychzawierających K próbek zgodnie ze wzorem:Rys. 4. Postać czasowa sygnału z mikrofonu nr 1 dla misy M1Fig. 4. The time waveform of signal from microphone 1 for bowl M1Zastosowana regresja liniowa zlogarytmowanych trendówwybrzmiewania wykazała wysokie współczynniki korelacjir>0,99 dla każdego analizowanego sygnału. Wartości szybkościspadków poziomów energii w czasie t [dB/s] obliczonozgodnie ze wzorem:(3)gdzie: s e - średnia energia sygnału, s - sygnał, m - indeks kanałuzapisu sygnału, n- indeks wycinka czasowego sygnałudla danego kanału, k - indeks próbki w danym wycinku czasowymdla danego kanału.Długość czasu uśredniania energii wynika z szerokościpasma widma fluktuacji energii, ważnego dla terapii. W eksperymencieustalono wartość K = 882 próbki, co w przypadkuszybkości próbkowania równej f s = 44100 próbek/s daje przedziałczasowy równy 20 ms.Dla wyliczenia trendów spadku poziomu energii sygnałuzastosowano wstępnie filtrację dolnoprzepustową uśrednionejenergii s e (m,n) zgodnie ze wzorem:(1)gdzie: a(m) - wartość szybkości spadku poziomu energii,t(m,l) - skala czasu dla m-tego sygnału, L - liczba próbektrendu danego sygnału.Wyniki przedstawiono na rys. 5, 6, 7 i 8 dla różnych pałeki różnych miejsc uderzeń.Jedynie na rys. 5 spadki poziomów energii wokół misy sąw miarę wyrównane, mało zależne od położenia mikrofonui miejsca uderzenia. Na pozostałych widać wyraźne różnicespadków poziomów energii. Użycie mniejszej pałki powodujekrótsze wybrzmiewanie dźwięku dla obu mis.(2)gdzie: s e # (m) - uśredniona energia po filtracji, h(n) - odpowiedźimpulsowa filtru.Do wyznaczenia trendów wybrzmiewania dźwięku powstępnej ocenie widm energii zaprojektowano filtr dolnoprzepustowyFIR rzędu 500 i górnej częstotliwości granicznej równej1,25 Hz. Do wyznaczenia fluktuacji czasowych energii zastosowanofiltr górnoprzepustowy o tych samych parametrach. W obuprzypadkach zastosowano filtrację minimalnofazową.Rys. 5. Spadek poziomu energii dla misy M1 uderzanej dużą pałkąFig. 5. The decay rate of energy level for the bowl M1 of struck withthe large stick26 ELEKTRONIKA 3/<strong>2009</strong>


Rys. 6. Spadek poziomu energii dla misy M1 uderzanej średniąpałkąFig. 6. The decay rate of energy level for the bowl M1 struck withthe medium stickRys. 9. Widma uśrednionej energii misy M1. Uderzenie dużą pałkąmiędzy mikrofonami 1 i 2Fig. 9. The energy spectrum of the bowl M1. The hit with the largestick between 1 and 2 microphonesRys. 10. Widma uśrednionej energii misy M1. Uderzenie dużą pałkąmiędzy mikrofonami 5 i 6Fig. 10. The energy spectrum of the bowl M1. The hit with the largestick between 5 and 6 microphonesRys. 7. Spadek poziomu energii dla misy M2 uderzanej dużą pałkąFig. 7. The decay rate of energy level for the bowl M2 of struck withthe large stickRys. 11. Widma uśrednionej energii misy M1. Uderzenie średniąpałką między mikrofonami 1 i 2Fig. 11. The energy spectrum of the bowl M1. The hit with the mediumstick between 1 and 2 microphonesRys. 8. Spadek poziomu energii dla misy M2 uderzanej średniąpałkąFig. 8. The decay rate of energy level for the bowl M2 of struck withthe average stickAnaliza widm fluktuacji energiiJak podawano we wcześniejszych pracach [7-9], cechą charakterystycznądźwięku mis dźwiękowych są dudnienia,często o złożonej postaci. Dla zbadania wpływu miejsca i rodzajuuderzenia na parametry tych dudnień wykonano analizywidma uśrednionej energii dla sygnału z każdegoRys. 12. Widma uśrednionej energii misy M1. Uderzenie średniąpałką między mikrofonami 7 i 8Fig. 12. The energy spectrum of the bowl M1. The hit with the mediumstick between 7 and 8 microphonesELEKTRONIKA 3/<strong>2009</strong> 27


Rys. 13. Widma uśrednionej energii misy M2. Uderzenie dużą pałkąmiędzy mikrofonami 1 i 2Fig. 13. The energy spectrum of the bowl M2. The hit with the largestick between 1 and 2 microphonesRys. 16. Widma uśrednionej energii misy M2. Uderzenie średniąpałką między mikrofonami 7 i 8Fig. 16. The energy spectrum of the bowl M2. The hit with the mediumstick between 7 and 8 microphonesPodsumowanieRys. 14. Widma uśrednionej energii misy M2. Uderzenie dużą pałkąmiędzy mikrofonami 7 i 8Fig. 14. The energy spectrum of the bowl M2. The hit with the largestick between 7 and 8 microphonesWykonane pomiary potwierdziły, że charakter dźwięku misy,zależy wyraźnie od miejsca jej uderzenia oraz od rodzajuużytej pałki. Miejsce i rodzaj uderzenia ma wpływ zarówno nawybrzmiewanie dźwięku misy, jak i na sposób zróżnicowaniaprzestrzennego układu prążków widmowych dudnień, tak istotnychw terapii. Potwierdza to anizotropię samych mis, jakrównież generowanego przez nie pola akustycznego.Wpływ użytej pałki na badane parametry dźwięku jestinny dla obydwu mis. W przypadku większej i cięższej misyM1 użycie mniejszej pałki powoduje znacznie większą nierównomiernośćemisji dźwięku z różnych części misy. Dlamisy M2 - mniejszej i o cieńszej ściance nierównomiernośćemisji dźwięku z różnych jej części jest większa niż w przypadkumisy M1. Wpływ na tą nierównomierność rodzajuużytej pałki jest mniejszy.Przeprowadzone badania pokazały zgodność wynikówpomiarów z odczuciami wielu terapeutów. Potwierdziły teżkonieczność odpowiedniego przeszkolenia terapeutówi dobrego poznania właściwości mis przez terapeutę stosującegoje w swojej pracy. Nie bez znaczenia jest też wykorzystaniewyników takich badań dla lepszego dalszegoszkolenia i doskonalenia terapeutów.LiteraturaRys. 15. Widma uśrednionej energii misy M2. Uderzenie średniąpałką między mikrofonami 1 i 2Fig. 15. The energy spectrum of the bowl M2. The hit with the mediumstick between 1 and 2 microphonesmikrofonu. Analizowane widma nie są widmami obwiedni sygnału.Wybrane wyniki tych analiz dla misy M1 przedstawionona rys. 9 do 12, a dla misy M2 na rys. 13 do 16.Na wszystkich tych rysunkach widać wyraźne różnice w widmachuśrednionej energii zależne od fragmentu misy, któregodźwięk był badany. Na te zbiory widm wyraźny wpływ mają zarównomiejsce uderzenia w misę, jak również rodzaj pałki.Nie ulegają przy tym zmianom położenia głównych prążkówwidmowych, chociaż dla częstotliwości powyżej 12 Hz wyraźniezmienia się układ prążków o mniejszych energiach.[1] Hess P.: Klangmassage nach Peter Hess. Seminare und InformationenAus- und Fortbildung. Uenzen, Institut für Klang - Massage- Terapie, 1999.[2] Hess P.: Klangschalen für Gesundheit und innere Harmonie.Ludwig Buchverlag GmbH, München 1999.[3] Huyser A.: Singing Bowl. Exercises for Personal Harmony. BinkeyKok Publications, Havelte/Holland 1999.[4] Jansen E. R.: Singing Bowls. A practical Handbook of Instructionand Use. Binkey Kok Publications, Havelte/Holland 1992.[5] Kulmatycki L.: Stres, joga, relaksacja. Wyd. W. Bagiński i Synowie,Wrocław 1993.[6] Majkowski J.: Atlas elektroencefalografii. PZWL, Warszawa 1991.[7] Portalska H., Portalski M.: Wielotony nieharmoniczne mis tybetańskich.Międzynarodowa Konferencja Naukowo - Techniczna„Ergonomia niepełnosprawnym” MKEN’2000. Łódź 2000.[8] Portalska H., Portalski M.: Wielotony nieharmoniczne mis tybetańskich- dlaczego wspomagają organizm. Rozdział w książcepod red. L. Kataryńczuk - Mani: Wybrane elementy terapii w procesieedukacji artystycznej. UZG, Zielona Góra 2002.[9] Portalska H., Portalski M.: Misy tybetańskie i ich oddziaływaniena organizm. Rozdział w monografii pod red. L. Kataryńczuk -Mani „Terapia dźwiękiem”, UZG, Zielona Góra 2007.[10] Wasserman D. E.: Human Aspects of Occupational Vibration.Amsterdam - Oxford - New York - Tokyo, ELSEVIER, 1987.28 ELEKTRONIKA 3/<strong>2009</strong>


Metoda wizualizacji pola akustycznegomis dźwiękowychdr inż. ANDRZEJ MEYER 1 , dr HALINA PORTALSKA 2 , dr inż. MAREK PORTALSKI 1 ,mgr inż. ADAM KONIECZKA 1 , mgr inż. JULIAN BALCEREK 11 Poznań University of Technology, Institute of Control and System Engineering,Division of Signal Processing and Electronic Systems2 Poznań University of Technology, Institute of Management EngineeringDźwięki i wibracje specjalnych metalowych mis dźwiękowychsą obecnie stosowane w celach terapeutycznych w Europiedzięki adaptacji tych dalekowschodnich technik przez PeteraHessa [2,3]. W trakcie zabiegu misy kładzie się w odpowiednichmiejscach na ciele lub obok niego i delikatnie pobudza dodrgań. W odsłuchu dźwięki mis stosuje się w seansach zbiorowychlub indywidualnie w specyficznych przypadkach (autyzm,schorzenia onkologiczne, pulmonologiczne).W dostępnych publikacjach zagranicznych [2-5] brak jestopisu zjawisk akustycznych w misach dźwiękowych orazszczegółowych danych o ich dźwięku. W Polsce badaniawłaściwości dźwięku mis, jego widma i widma obwiedni prowadzonesą od wielu lat na Politechnice Poznańskiej [8-10].Misy dźwiękowe po uderzeniu wytwarzają dźwięk będącyzłożonym wielotonem nieharmonicznym [8-10]. Jego składoweskupiają się w charakterystyczne grupy dając dudnieniao częstotliwościach leżących głównie poniżej pasma akustycznegow strefie większości rezonansów mechanicznych organówciała ludzkiego [11] oraz fal alfa i theta mózgu [6,7].Uzyskane dotychczas wyniki wyjaśniły już wiele zagadnieńzwiązanych ze stosowaniem mis w terapii. Dotyczy tozwłaszcza pewnych subiektywnych odczuć terapeutów, głównieo wieloletnim stażu i dużej wrażliwości. Z wypowiedzi doświadczonychterapeutów wynika, że dźwięk typowouderzanej misy (nieco poniżej krawędzi - 2 do 3 cm) zależyzarówno od miejsca jej uderzenia, jak i miejsca emisji, pomimoosiowej symetrii misy. Także rodzaj użytej pałki w istotnysposób wpływa na dźwięk wydobywany z misy.Padały również stwierdzenia, że dźwięk mis rozchodzi sięzarówno prostoliniowo, jak również w postaci koncentrycznychkręgów oraz wirów nad misami. Na rys. 1 przedstawiono przykładoworysunek jednego z terapeutów przedstawiajacy, jakjego zdaniem rozchodzi się dźwięk misy widzianej z góry.Dla pomiarowego potwierdzenia, bądź wykluczenia tychstwierdzeń postanowiono przeanalizować dźwięk mis nagranymetodami wielomikrofonowymi.Wstępne analizyWstępnie zbudowano układ pomiarowy, w którym rejestrowanostereofonicznie dźwięk misy z dwóch mikrofonów ustawionychpod kątem prostym zgodnie z rys. 2. Nagraniawykonano w komorze bezechowej Pracowni Układów <strong>Elektronicznych</strong>i Przetwarzania Sygnałów korzystając z mikrofonówB3 Studio Project z ustawieniem charakterystykikardioidalnej.Sygnały z mikrofonów po rejestracji zostały poddane ekstrakcjiobwiedni metodą opisaną w [1], a następnie poddanekonwersji szybkości próbkowania do 400 próbek/s. Następnietak przetworzone sygnały przedstawiono na wykresie 3D,gdzie na osiach X i Y mamy wartości obwiedni sygnałów zmikrofonów, a na osi Z czas. Takie ustawienie osi uzasadnionejest tym, że fala akustyczna przemieszcza się w czasiew przestrzeni, tak wiec składową Z możemy również traktowaćjako składową przestrzenną.Przykładowy wynik analizy przedstawiono na rys. 3.Widać na nim wyraźnie złożoną przestrzenną strukturę o charakterzewiru. Podobne wyniki otrzymano badając inne misydźwiękowe o porównywalnej wielkości.Rys. 1. Subiektywny obraz rozchodzenia się dźwięku misyFig. 1. Subjective image of bowl’s sound propagationRys. 2. Ustawienie mikrofonów względem badanej misyFig. 2. Microphones localization during the sound bowls recordELEKTRONIKA 3/<strong>2009</strong> 29


Do zamocowania mikrofonów wykonano specjalny przyrząd.Typowa odległość mikrofonów od badanej misy dźwiękowejwynosiła 2 cm. Na rys. 4 przedstawiono zdjęcie stanowiskapomiarowego z badaną misą w komorze bezechowej.Przedmiot badańPrzedmiotem badań były dwie misy dźwiękowe - tzw. brzusznao średnicy 23,7 cm (115 Hz) oznaczona dalej jako M1 i mniejsza,tzw. stawowa o średnicy 22 cm (99,5 i 280 Hz) - M2. Misyte uderzano dwoma rodzajami pałek - dużą o średnicy 69 mmi średnią o średnicy 57 mm. Miejsca uderzeń przypadały międzymikrofonami 1 i 2, 3 i 4, 5 i 6 oraz 7 i 8. Siły uderzeń dladanej pałki były zbliżone do siebie.Rys. 3. Przykładowe wyniki analizy metodą 2-mikrofonową dlamisy brzusznejFig. 3. Analysis results example for 2 microphones method for abdominalsound bowlNagrania wielomikrofonoweZaobserwowane przy wstępnych badaniach wyraźne różnicemiędzy sygnałami z mikrofonów oraz wiele wątpliwości, którepojawiły się po pierwszych eksperymentach spowodowały koniecznośćkontynuacji tych badań za pomocą bardziejzłożonych układów mikrofonowych.W dalszych badaniach zastosowano rejestrację dźwiękówz pomocą 8. mikrofonów rozmieszczonych symetryczniewokół misy dźwiękowej. Nowe nagrania wykonano wkomorze bezechowej mikrofonami elektretowymi typu ME92d [XLR] o charakterystyce dookolnej. Jako zespół wzmacniaczymikrofonowych z przetwornikami A/C wykorzystanourządzenie OctaMic.Nagrania wykonano z szybkością próbkowania 44100smp/s. Jak wynika z wcześniejszych analiz dźwięku mis [8-10], szybkość ta jest całkowicie wystarczająca. Dla ekstrakcjiobwiedni wykorzystano prosty algorytm obliczania uśrednionejenergii w stałych przedziałach czasu dany wzorem:Wizualizacja danych pomiarowychProgram do wizualizacji przestrzennej propagacji energii zostałstworzony w formie wykonywalnego skryptu w środowiskuprogramistycznym Matlab (w wersji 7.0). Danymi wejściowymibyły zarejestrowane wartości energii z ośmiu mikrofonówumieszczonych w jednakowych odległościach od misy. Danymiwyjściowymi są pliki graficzne tworzące kolejne klatkisekwencji wizyjnej. Widok skryptu do wizualizacji przedstawionona rys. 5.gdzie: M - liczba próbek, m - indeks fragmentu czasu, n - indekspróbki w m-tym fragmencie.Rys. 4. Widok stanowiska pomiarowegoFig. 4. The view of the measuring stand(1)Rys. 5. Wygląd skryptu do wizualizacjiFig. 5. Preview of visualization of scriptWartości energii zostały zapisane w formie ośmiokolumnowychmacierzy, w których kolejne kolumny zawierają danezarejestrowane przez poszczególne mikrofony. Każdy wierszreprezentuje wartości energii z poszczególnych mikrofonóww tych samych chwilach.Przyjęto, że wizualizacja przedstawia misę widzianą odgóry, a wykreślana energia propaguje się w płaszczyźnie poziomej.W pierwszej linijce skryptu określa się nazwę macierzyz zapisaną energią.W linijce drugiej określa się miejsce uderzenia misypałeczką, podając numer mikrofonu, przy którym nastąpiłouderzenie. Przyjęto numerację mikrofonów przedstawioną narys. 6. Jeśli uderzenie nastąpiło pomiędzy mikrofonami, podajesię wartości ułamkowe (np. jeśli uderzono między mikrofonem3, a 4 - należy podać „3.5”). Miejsce to zostaniezaznaczone na pierwszych 75. klatkach, czyli 3 s wizualizacji(przy założeniu standardu prezentacji 25. klatek/s, jak ma tomiejsce w standardach telewizji PAL/Secam) w formie zielonegopunktu we właściwym miejscu na obwodzie koła przedstawiającegomisę.30 ELEKTRONIKA 3/<strong>2009</strong>


W 3. i 4. linijce określa się w pikselach rozdzielczość generowanychobrazów. Optymalnie jest przyjąć rozdzielczośćobrazu dla standardu PAL/Secam, tj. 720 × 576 pikseli. W linijce5. należy podać promień koła (w pikselach), które naśrodku każdej klatki przedstawia misę.6. linijka określa rozdzielczość liniową wykreślanego obrazu,tzn. ile próbek energii ma przypadać na jeden piksel odległościod środka misy. Podanie wartości mniejszej od 1sprawi, że uniknie się efektu aliasingu i pominięcia wyświetlenianiektórych wartości energii. Przykładowo, dla wartości „0.2”jedną próbkę opisie 5. interpolowanych pikseli. W 7. linijce należypodać, o ile pikseli wygenerowane wartości mają się przesuwaćod środka misy na zewnątrz w kolejnych klatkach.W 8. linijce podaje się dynamikę (d) wyświetlanych obrazówokreślaną wg zależności (2). Za wartość e max przyjmujesię największą wartość energii znajdującą się w macierzy:(2)kodek i stopień kompresji. Tworzenie filmu nieskokompresowanegojest również możliwe, jednak powstały plik byłbyogromny (przy rozdzielczości 720 × 756 pikseli i 25. klatkach/sminuta zajęłaby ok. 1,7 GB)Wartość każdego piksela w każdej klatce, jest obliczanaosobno na podstawie interpolacji wartości z macierzy energii.Przyjęto, że środek misy znajduje się w środku klatki nagrania.Najpierw, na podstawie twierdzenia Pitagorasa, jest wyznaczanaodległość (w pikselach) danego piksela od środkaklatki. Jeżeli jest ona mniejsza od określonego promieniamisy, piksel otrzymuje kolor jasnobrązowy, imitujący kolormisy. W przeciwnym razie zostaje ustalone, między którymimikrofonami on się znajduje. Odbywa się to na podstawiekąta, jaki tworzy prosta przechodząca przez piksel i środekklatki z poziomem. Położenie i numerację mikrofonów przedstawionona rys. 6.Kolejnym krokiem jest wyznaczenie numeru wiersza (u)macierzy energii, który jest najbliższy dla tego piksela dladanej klatki. Zostaje on obliczony ze wzoru:Pierwszą wizualizowaną wartością jest wartość z chwili, wktórej energia w macierzy, dla dowolnego mikrofonu,osiągnęła wartość co najmniej e min obliczoną z zależności (2).Analogicznie, ostatnią wizualizowaną wartością będzie z tejchwili, w której energia ostatni raz osiągnęła co najmniej e min .Dzięki temu wizualizowany jest jedynie istotny zakres danych,bez potrzeby ingerencji użytkownika. Ostatnim parametrem,który określa się w 9. linijce, jest wartość poprawek dla poszczególnychmikrofonów w formie 8-elementowego wektora.Poprawki to współczynniki, przez jakie są mnożone wartościw kolumnach macierzy energii, wynikające z różnic w poziomienatężeń sygnałów wyjściowych mikrofonów.Po uruchomieniu skryptu rozpoczyna się tworzenie wizualizacjiw postaci plików graficznych, zapisywanych w formaciebmp. Pliki są kolejno numerowane, co umożliwia m.in.łatwe przekonwertowanie ich w film o określonym sposobiei stopniu kompresji. Do tego celu można wykorzystać programdo nieliniowego montażu wideo, np. Video Editor,będący składnikiem pakietu Ulead MediaStudio Pro 8. Programten automatycznie wygeneruje film po wskazaniupierwszego pliku graficznego. Można określić przy tymgdzie: n - numer klatki (przy założeniu, że numeracja klatekwizualizowanych rozpoczyna się od 1), s - określona w 7. linijceszybkość propagacji energii, p - określona w 6. linijcerozdzielczość liniowa wykreślanego obrazu, o - odległość pikselaod środka klatki.Dodanie jedynki we wzorze (3) wynika ze sposobu numerowaniaelementów w Matlabie od 1, zamiast od 0. Dla każdejwartości u wyznacza się jej część całkowitoliczbową (w) orazczęść całkowitoliczbową powiększoną o 1 (w + 1). To szukanenumery wierszy macierzy energii dla danego piksela.Jeżeli otrzymana wartość w jest mniejsza od 1, oznaczato, że do tego miejsca fala energii jeszcze nie dotarła i pikselotrzymuje kolor czarny. Jeżeli w jest większe od wyliczonejilości klatek do wygenerowania, znaczy to, że w tym miejscuwizualizowanie energii się zakończyło i piksel również otrzymujekolor czarny.Znając numery mikrofonów (mic i mic + 1) oraz wartościenergii z macierzy energii - E(mic,w), E(mic + 1,w),E(mic,w + 1) i E(mic + 1,w + 1) dla danego piksela, można obliczyćjego wartość pamiętając, że dla mic = 8 za mic + 1 należyprzyjąć 1 (za ósmym mikrofonem znajduje się pierwszy).Schemat wyliczania wartości piksela przedstawiono na rys. 7.(3)Rys. 6. Numeracja mikrofonów znajdujących się wokół misyFig. 6. Position of microphones around the bowlRys. 7. Wyliczanie wartości pikselaFig. 7. Pixel value computationELEKTRONIKA 3/<strong>2009</strong> 31


Wartości energii E1 i E2 z rys. 7 wyliczono wzorem:(4)Są to wartości energii dla poszczególnych mikrofonów wpunktach znajdujących się w tej samej odległości od środkaklatki, co obliczany piksel. Szukana wartość energii piksela Ejest obliczana z zależności (5):(5)gdzie k - kąt, jaki tworzy prosta przechodząca przez pikseli środek klatki z poziomem.Otrzymana wartość jest logarytmowana logarytmem dziesiętnym,aby uwzględnić logarytmiczność ludzkiego sposobuwidzenia. Zlogarytmowane logarytmem dziesiętnym najmniejszai największa wyświetlana wartość energii wyznaczajądolną i górną granicę wyświetlanego zakresu odcieni. Pierwszejz nich jest przypisywana wartość 0, odpowiadająca czerni,a drugiej 1, odpowiadająca bieli. Uzyskana wartość jest liniowonormalizowana do tego zakresu dając odcień piksela.W wizualizacji nie uwzględniono zanikania energii zależnegood zwiększania się odległości od misy, gdyż nie przeprowadzonotakich badań. Niewielka odległość misy odmikrofonów uniemożliwia przyjęcie założenia, że misa jestpunktowym źródłem dźwięku.Na koniec do każdej klatki są dodawane po bokach paskiz przejściami tonalnymi od bieli do czerni. Ułatwiają one w trakcieoglądania długiej wizualizacji ocenę zanikania energii wczasie. Stwierdzono bowiem, że po kilkunastu sekundachludzkie oko zatraca prawidłową ocenę skali szarości, jeśli niema punktu odniesienia. Ponadto u dołu każdej wygenerowanejklatki znajduje się wskaźnik pokazujący upływ czasu.Rys. 9. Misa M1, 4 s po uderzeniu średnią pałkąFig. 9. The M1 bowl, 4 s after hitting by the average stickWynikiNa rysunkach 8-15. przedstawiono wybrane klatki z wygenerowanych2. filmów dla misy M1 i 2 filmów dla misy M2. Obrazyna rysunkach celowo spłaszczono. Na środku każdegorysunku widać koło imitujące misę oraz czarny punkt wska-Rys. 10. Misa M1, 38 s po uderzeniu dużą pałkąFig. 10. The M1 bowl, 38 s after hitting by the bigger stickRys. 8. Misa M1, 4 s po uderzeniu dużą pałkąFig. 8. The M1 bowl, 4 s after hitting by the bigger stickRys. 11. Misa M1, 38 s po uderzeniu średnią pałkąFig. 11. The M1 bowl, 38 s after hitting the average stick32 ELEKTRONIKA 3/<strong>2009</strong>


Rys. 12. Misa M2, 4 s po uderzeniu dużą pałkąFig. 12. The M2 bowl, 4 s after hitting by the bigger stickRys. 14. Misa M2, 38 s po uderzeniu dużą pałkąFig. 14. The M2 bowl, 38 s after hitting by the bigger stickRys. 13. Misa M2, 4 s po uderzeniu średnią pałkąFig. 13. The M2 bowl, 4 s after hitting by the average stickzujący miejsce uderzenia. Energia rozchodzi się promieniście,stopniowo docierając do krawędzi klatki. Paski po bokachułatwiają ocenę natężenia energii, a suwak u dołu pokazujepostęp wizualizacji.Dla misy M1 krótko po uderzeniu (rys. 8 i 9) widać asymetrycznierozchodzącą się energię akustyczną z wyraźniezaznaczonymi dudnieniami. Charakter zmian energii sugerujewirowy charakter pola akustycznego.38 sekund po uderzeniu (rys. 10 i 11) dudnienia rozkładająsię bardziej równomiernie wokół misy, widoczne są uprzywilejowanekierunki emisji energii w dwóch prostopadłych dosiebie osiach. Energia szybciej zanika w czasie po uderzeniuśrednią pałką.Dla misy M2 obraz rozkładu energii w przestrzeni i w czasiejest całkowicie inny. Widoczna jest złożona struktura dudnieńo znacznie różniących się częstotliwościach. Również tumożna zauważyć wirowy charakter pola akustycznego.Po 38. sekundach widać wyraźnie obszary okresowychsilnych spadków poziomu energii, szczególnie po uderzeniudużą pałką (rys. 14). Leżą one na kierunku emisji dźwiękuo szczególnie wyraźnych dudnieniach.Rys. 15. Misa M2, 38 s po uderzeniu średnią pałkąFig. 15. The M2 bowl, 38 s after hitting by the average stickWnioskiPrzeprowadzone pomiary i symulacje komputerowe pomimoużycia zaledwie 8. mikrofonów umożliwiły wizualizację rozchodzeniasię dźwięku mis dźwiękowych w płaszczyźnie poziomejz przyzwoitą jakością.Jak pokazały badania, dźwięk mis dźwiękowych rozchodzisię nierównomiernie w przestrzeni, ma też różne parametry(zwłaszcza obwiedni) zależne od kierunku jego emisji z misy.Jest to zgodne z odczuciami wielu terapeutów, zwłaszczaz wieloletnim stażem, stosujących misy. Niektóre obrazy malowaneprzez nich przedstawiające dźwięki mis są zadziwiającopodobne do obrazów otrzymanych w wynikusymulacji, czego przykładem może być rys. 1.Stworzone narzędzia badawcze i pierwsze filmy z wynikamisymulacji staną się pomocne do szkolenia i doskonaleniaterapeutów posługujących się w swej pracy misamidźwiękowymi. Pozwoli to na udoskonalenie technik terapeutycznychi wzrost skuteczności samej terapii.ELEKTRONIKA 3/<strong>2009</strong> 33


Autorzy planują kontynuację tych badań z wykorzystaniemznacznie większej liczby mikrofonów (minimum 64) i aparaturyNational Instruments. Pozwoli to, na znacznie dokładniejszeodwzorowanie pola akustycznego mis dźwiękowych,również w przestrzeni 3D.Literatura[1] Dąbrowski A., Meyer A., Portalski M.: Analiza obwiedni sygnałówakustycznych w podpasmach. IX Sympozjum Reżyserii i InżynieriiDźwięku ISSET 2001. Warszawa 2001.[2] Hess P.: Klangmassage nach Peter Hess. Seminare und InformationenAus- und Fortbildung. Uenzen, Institut für Klang - Massage- Terapie, 1999.[3] Hess P.: Klangschalen für Gesundheit und innere Harmonie.Ludwig Buchverlag GmbH, München 1999.[4] Huyser A.: Singing Bowl. Exercises for Personal Harmony. BinkeyKok Publications, Havelte/Holland 1999.[5] Jansen E. R.: Singing Bowls. A practical Handbook of Instructionand Use. Binkey Kok Publications, Havelte/Holland 1992.[6] Kulmatycki L.: Stres, joga, relaksacja. Wyd. W. Bagiński i Synowie,Wrocław 1993.[7] Majkowski J.: Atlas elektroencefalografii. PZWL, Warszawa1991.[8] Portalska H., Portalski M.: Wielotony nieharmoniczne mis tybetańskich.Międzynarodowa Konferencja Naukowo - Techniczna„Ergonomia niepełnosprawnym” MKEN’2000. Łódź 2000.[9] Portalska H., Portalski M.: Wielotony nieharmoniczne mis tybetańskich- dlaczego wspomagają organizm. Rozdział w książcepod red. L. Kataryńczuk - Mani: Wybrane elementy terapii w procesieedukacji artystycznej. UZG, Zielona Góra 2002.[10] Portalska H., Portalski M.: Misy tybetańskie i ich oddziaływaniena organizm. Rozdział w monografii pod red. L. Kataryńczuk -Mani „Terapia dźwiękiem”, UZG, Zielona Góra 2007.[11] Wasserman D. E.: Human Aspects of Occupational Vibration.Amsterdam - Oxford - New York - Tokyo, ELSEVIER, 1987.Current-mode analog memorywith extended storage timefor hardware-implemented neural networks(Pracująca w trybie prądowym pamięć analogowa o wydłużonym czasieprzechowywania informacji do sprzętowej realizacji sieci neuronowych)dr hab. inż. RYSZARD WOJTYNA prof. UTPUniversity of Technology and Life Sciences, The Academy of Information Technology, PolandCurrent-mode signal processing may be more power-savingand faster than a voltage mode one. Its low-power operationresults from the fact that no supply current can be consumedif input signal of the processing circuit is equal to zero. As anexample of current-mode fast operations, we can mentionarithmetic calculations. This is because addition and multiplicationcan be extremely fast when operating on current signals.Furthermore, the low power consumption mentionedabove means a possibility of parallel data processing ona large scale. The larger the scale the higher the total speedof the processing system. For this reason, one observes notonly a general tendency to develop hardware and mixed hardware-softwaresignal processing methods [1-5] but also,a growing interest in new analog microelectronic circuits andmixed analog-digital ASIC’s (Application Specific IntegratedCircuits) [6-9], where a lot of operations is carried out in a currentmode. This concerns analog memories as well [9].Simple current mode memory cellFig. 1. Basic current mode memory cellRys. 1. Podstawowa komórka pamięci pracującej w trybie prądowymSimple analog memories based on a single capacitor connectedwith one or two single- or double-transistor switchessuffer from a rather short holding time. This is because of imperfectionsof the switches, especially leakage currents encounteredin MOS-transistors used to implement the switches.For this reason, capacitive memories belong to short-termones. An example of such a memory is shown in Fig. 1.In Figures 1, the M 1 transistor serves as a current to voltageconverter and M 2 as a voltage to current one. Thus, the wholecircuit operates in current mode. Input current, I i , causes a relativelyfast charging or discharging the C capacitor (recordingphase) when both switches, S 1 and S 2 are “on”. In the holdingphase (S 1 and S 2 are “off”), voltage across the capacitor shouldbe constant but, unfortunately, leakage currents flowing troughS 2 are the reason for variations of V C and, as a result, the memorycell is characterized by a rather short storage time.For S 2 realized by means of a single MOS transistor, twoleakage currents are the main cause for of V C variations. Oneflows through the S 2 MOS transistor channel and the otherleaks to the transistor base (substrate) through a reversed biasedp-n junction (drain to base junction). Typically, the leakageto the base is much higher than that through the channeland it is the main cause of the V C changes.In [5], both leakage currents are taken into account and arestrongly reduced by applying a switches feedback. In thispaper, we propose an approach which is simpler and relies onreducing only the leakage current to the base by applying continuoustime feedback around S 2 instead of the switched one.34 ELEKTRONIKA 3/<strong>2009</strong>


Simple way of effective extendingthe memory storage timeFigures 2 illustrates the proposed idea of increasing the timeinterval over which the information is held in the memory cell.In order to considerably reduce (by several orders of magnitude)the S 2 - switch main leakage current, i.e. the currentleaking to the PMOS transistor base, a positive feedback loophas been applied. This feedback is constantly active and providesthe V C voltage from the C capacitor to the transistorbase making use of the VF voltage follower. It is reasonableto introduce to the circuit a continuous feedback provided thatthe leakage current along the PMOS channel is negligiblysmall compared to that leaking to the base. This takes placewhen both the switch transistor sizes and the controlling V convoltage are properly designed.Superiority of the proposed continuous-time feedbackover the switched feedback of [5] is that the obtained circuitis simpler, i.e. contains a lower number of transistors. This, inturn, leads to lower area occupied by the circuit on a chip andlower power consumption. The simplicity of the circuit structurecan be utilized to increase transistor sizes and, by this,reduce the size mismatching problem. The solution shown inFig. 2 is an effective way to extend the memory storage timeif precision of the applied voltage follower is high enough, i.e.if its gain is close to one.consumption, sensitivity to transistor mismatching, speed andprecision of recording operations, storage time of the held information,occupation of chip area and others. Apart from thetransistor, also sizes of the capacitor play here a significantrole. Technology in which the circuit is to be implemented andregions of transistor operations (strong or weak inversion) areof great importance as well. Operation in weak inversionmeans a small power consumption (positive feature) and slowsignal processing (negative feature). When operating in stronginversion, high power consumption is usually a problem. It canby overcome by designing transistors with long and narrowchannels. Then, transistor channel currents are relativelysmall which implies reduced power consumption (advantage)but also lower operation speed (disadvantage).By increasing capacitor area we extend not only holdingbut, unfortunately, also recording time. Another negative consequenceof that is an enlarged chip area occupied by the capacitor.An advantage of larger capacitor and transistor sizesis a less severe size mismatch problem.This problem can also be minimized by choosing a moreprecise CMOS process to implement the circuit for given transistorand capacitor sizes.In this paper, we focus mainly on prolonging the memorystorage time without extending the recording one and on ensuringits low power operation. Two designs of the circuit ofFig. 3 have been carried out. Resulting transistor sizes areshown in Tabl. 1 and Tabl. 2. The values gathered in Table 1concern a relatively small chip area occupied on by the memorywhile that of Table 2 the memory low-power operation.Fig. 2. Simple concept of applying positive feedback to extend thememory storing time without increasing the recording oneRys. 2. Prosta koncepcja zastosowania dodatniego sprzężeniazwrotnego do wydłużenia czasu przechowywania informacji bezzwiększenie czasu zapisuCMOS realization of the memory cellA simple CMOS realization of an analog memory cell basedon the idea of Fig. 2 is shown in Fig. 3. M 1 and M 2 transistorsare used to implement current-to-voltage and voltage-tocurrentconverters and make up input and output stages ofthe proposed circuit. C capacitor serves to hold informationrepresented by a proper charge stored. M 3 , M 4 , M 7 and M 8transistors are used to realize the VF voltage follower, M 6 transistorto implement the S 1 switch and M 5 to implement the S 2one. M 9 transistor (drawn in broken line) is a low resistanceload of the memory suitable to ensure conditions for currentmode operation at the memory output. M 5 is a p-channel MOStransistor as well as M 6 , M 7 , M 8 and M 9 . The difference betweenM 5 and other transistors is that base (n-well) of M 6 - M 9is connected to positive supply voltage (V DD ), like in standarddigital CMOS circuits, while base of M 5 is biased by the VFvoltage follower. All n-channel transistors in the circuit havetheir bases grounded. To achieve good properties of the VF,M 3 and M 4 transistors should have the same channel sizesas well as M 7 and M 8 should be identically sized.Designing the circuit relays, among others, on proper determiningtransistor sizes. Sizes of the transistors have a significantinfluence on such circuit parameters like: powerFig. 3. The proposed memory cell circuitRys. 3. Proponowany układ komórki pamięciTabl. 1. Area saving design of the circuit of Fig. 3Tab. 1. Projekt układu z rys. 3 dla małej powierzchni zajmowanejw układzie scalonymTran. M1 M2 M3 M4 M5 M6 M7 M8W[µm] 0.6 0.6 2 2 0.6 0.6 2 2L[µm] 0.6 0.6 2 2 0.6 0.6 2 2Tabl. 2. Power saving design of the circuit of Fig. 3Tab. 2. Projekt układu z rys. 3 dla pracy energooszczędnejTran. M1 M2 M3 M4 M5 M6 M7 M8W[µm] 0.6 0.6 1 1 0.6 0.6 1 1L[µm] 0.6 0.6 8 8 0.6 0.6 8 8ELEKTRONIKA 3/<strong>2009</strong> 35


Simulation resultsIn this section, results of PSPICE simulations of the circuitshown in Fig. 3 designed for CMOS 0.35 µm process are presented.Transistor sizes given in Table 1 relate to the lowarea-occupationdesign of the memory of Fig. 3 while thatgiven in Table 2 to the low-power-consumption one. The circuitsupply voltage was V DD =2V. V con voltage, used to controlM 5 and M 6 transistors (S 2 and S 1 switches), varies from-1 to 2 V. Pinch-off voltages of NMOS and PMOS transistorsare equal to 0.4655 V and -0.617 V, respectively. The holdingcapacitance is C = 0.1 pF.Figures 4-8 show properties of the memory cell for the chiparea-savingcase of Table 1 while Fig. 9 and Fig. 10 concern thecell properties for the low-power-consumption case of Table 2.Figures 4 presents speed of information recording to thememory of Fig. 3, i.e. settling time of the circuit output currentafter turning on the S 1 and S 2 switches. This is seen from thebottom plot, where output current, I o , versus time is given, aswell as from the second from the bottom plot, where dI o /dt derivativeis presented. The maximum value of the dI o /dt derivative,equal to about 1.4 kA/s, points out the highest speedwith which the output current settles when the information isrecorded to the memory. From both plots it is seen that therecording time (settling time interval) lasts approximately 10nsfor C = 0.1 pF. V con voltage, controlling S 1 and S 2 switches, asa function of time is shown in the top plot, and input current,I i , versus time in the second from the top plot.Storage properties of the memory when opening the feedbackloop, i.e. when removing the VF voltage follower (M 3 , M 4 ,M 7 , M 8 transistors) from the circuit and when base of M 5 is connectedto the V DD supply voltage are illustrated in Fig. 5. As canbe noticed (bottom plot), output current, I o , goes to V DD =2Vwith a speed equal to, roughly, several mA/s, i.e. slower by about6 orders of magnitude than the recording speed (see Fig. 4).This relatively short holding time (fast increase of the outputcurrent in each time interval determined be the voltagecontrolling the switches) is a consequence of charging the Ccapacitor by a leakage current flowing from the supply sourcethrough the M 3 transistor base (n-well) to the transistor drain(reverse biased drain-base p-n junction of the M 3 PMOS).The effect of extending storage time in the proposed memorycell of Fig. 3, due to using the positive feedback, is demonstratedin Figs. 6, 7, 8 and 10. Bottom plots in these figuresshow sinusoidal input current, I i , and output one, I o , as functionsof time. Medium plots in these figures present a differencebetween the VF follower input and output voltages whilethe top plots the controlling V con voltage.Fig. 6 demonstrates a situation when voltage gain, A V , ofthe VF follower is equal to one with a high precision. This correspondsto the transistor sizes being exactly like shown inTable 1. From the bottom plot it is seen that changes of the outputcurrent (the black marker trace) are practically invisible withintime intervals determined by the pulses of the V con voltageshown in the top plot of Fig. 6. In these time intervals, informationis held in the memory and the V c voltage should be constant.Thus, our memory cell exhibits the required property of along-term storing ability when the follower gain is close to unity.From the bottom plot of Fig. 6 it is also seen that therecording (sampling) operation is related to some systematicerror. This error results mainly from so called “charge injectioneffect” that takes place in MOS transistors that are usedas switches controlling the sample and hold phases. Becauseof systematic character of these errors, they can be compensatedby adding to the input current some correction component.There are also other methods of reducing these errors.This can be achieved, for example, making use of so called“dummy transistors”. In current mode circuits, variations ofvoltages in particular nodes are typically much smaller thanin voltage mode ones. The current-mode low V C changes,which correspond to a wide range of I i variations, create a favorablecondition for applying the dummy-transistor error reductiontechnique.Fig. 4. Time characteristics concerning the memory recordingphase for C = 0.1 pF: a) voltage controlling the S 1 and S 2 switches,b) input current (I i ), c) output current derivative with respect totime, d) output current (I o )Rys. 4. Przebiegi czasowe dotyczące fazy zapisu dla C = 0,1 pF:a) napięcie sterujące kluczami S 1 i S 2 , b) prąd wejściowy I i , c) pochodnapo czasie prądu wyjściowego, d) prąd wyjściowy I oFig. 5. Illustration of short-term character of the basic memoryshown in Fig. 1 (standard CMOS technology, C = 0.1 pF): a) voltagecontrolling the S 1 and S 2 switches, b) output current derivative withrespect to time, c) output current (white markers) and sinusoidalinput current (black markers)Rys. 5. Ilustracja krótkoterminowego charakteru pamięci podstawowejz rysunku 1 (standardowa technologia CMOS, C = 0,1 pF):a) napięcie sterujące kluczami S 1 i S 2 , b) pochodna po czasie prąduwyjściowego, c) prąd wyjściowy I o (białe wskaźniki) i sinusoidalnyprąd wejściowy (czarne wskaźniki)36 ELEKTRONIKA 3/<strong>2009</strong>


Figs. 7 and 8 present cases when the VF follower gain, A V ,differs from unity. In practice, such a situation appears, amongothers, as a result of transistor size mismatching. To simulate thisproblem, two cases have been considered. One, when the VFgain is higher than 1 and the other, when it is lower than 1 (by 5%in each case). The 5% changes are, in fact, really bad cases and,a typical influence of the transistor size mismatching on the A Vvalue is not as large. In our simulations, the A V changes hasbeen forced by decreasing channel width of M 4 , W M4 , from 2 µm(Table 1) to 1.9 µm and by increasing it to 2.1 µm.Fig. 7 illustrates the obtained results when A V = 1.05(W M4 = 1.9 µm). Notice (bottom plot) that the output current,I o , increases in the hold-mode time intervals, but not as fast asin the case without the feedback, illustrated in Fig. 5. In Fig. 7,the I o variation speed is roughly equal to 6 µA/s and is lowerFig. 6. Demonstration of long storage time of the memory of Fig. 3 forthe VF gain equal precisely to one and for C = 0.1 pF: a) voltage controllingthe S 1 and S 2 switches, b) a difference between the V C voltageand the voltage delivered to the S 2 substrate, c) output current, I o(white markers), and sinusoidal input current I i (black markers)Rys. 6. Ilustracja długiego czasu przechowywania informacji w pamięciz rys. 3 dla wzmocnienia wtórnika napięciowego równego dokładniejeden i dla C = 0,1 pF: a) napięcie sterujące kluczami S 1 i S 2 ,b) różnica między napięciem V C i napięciem dostarczonym do podłożaklucza S 2 , c) prąd wyjściowy I o (białe wskaźniki) i sinusoidalnyprąd wejściowy I i (czarne wskaźniki)Fig. 8. Influence of increasing the VF gain to 1.05 on the memorystorage time, for C = 0.1 pF: a) voltage controlling the S 1 and S 2switches, b) a difference between the V C voltage and the voltagedelivered to the S 2 substrate, c) output current, I o (white markers),and sinusoidal input current I i (black markers)Rys. 8. Wpływ zwiększenia wzmocnienia wtórnika napięciowegodo wartości 1,05 na czas przechowywania informacji w pamięci, dlaC = 0,1 pF: a) napięcie sterujące kluczami S 1 i S 2 , b) różnica międzynapięciem V C i napięciem dostarczonym do podłoża klucza S 2 ,c) prąd wyjściowy I o (białe wskaźniki) i sinusoidalny prąd wejściowyI i (czarne wskaźniki)Fig. 7. Influence of reducing the VF gain to 0.95 on the memorystorage time, for C = 0.1 pF: a) voltage controlling the S 1 and S 2switches, b) a difference between the V C voltage and the voltagedelivered to the S 2 substrate, c) output current, I o (white markers),and sinusoidal input current I i (black markers)Rys. 7. Wpływ zmniejszenia wzmocnienia wtórnika napięciowegodo wartości 0,95 na czas przechowywania informacji w pamięci, dlaC = 0,1 pF: a) napięcie sterujące kluczami S 1 i S 2 , b) różnica międzynapięciem V C i napięciem dostarczonym do podłoża klucza S 2 , c)prąd wyjściowy I o (białe wskaźniki) i sinusoidalny prąd wejściowy I i(czarne wskaźniki)Fig. 9. DC characteristics of the memory cell: a) output current, I o ,versus the input one I i (the white marker trace), b) current takenfrom the supply voltage source (the black marker trace).Rys. 9. Charakterystyki stałoprądowe komórki pamięci: a) prąd wyjściowyI o w funkcji prądu wejściowego I i (krzywa oznaczona białymiwskaźnikami), b) prąd pobierany ze źródła zasilania w funkcjiprądu wejściowego I i (krzywa oznaczona czarnymi wskaźnikami)ELEKTRONIKA 3/<strong>2009</strong> 37


than that in Fig. 5 by about three orders of magnitude. Thismeans that even if the A V gain is realized with a 5% error,holding time of the memory can be extended by three ordersof magnitude compared to the case without the feedback (seeFig. 5). For higher precision of the VF gain realization, theachievable storage time extension can be even higher, whichis a very promising outcome.The same observation can be made looking at Fig. 8 concerningthe A V = 1.9 (W M4 = 2.1 µm) VF gain. From the bottomplot it is seen that the output current, I o , is a decreasingfunction of time. As expected, speed with which the output currentdecreases in the holding phase intervals equals approximatelyminus 6 µA/s, i.e. its absolute value is roughly equalto that concerning the A V = 2.1 case.For transistor sizes given in Table 1, the hold-mode memoryoperation is combined with a rather high power consumption.To decrease this consumption, lengths of M 3 , M 4 , M 7 andM 8 channels have been increased from 2 to 8 µm and theirwidths reduced from 2 to 1 µm (see Table 2). As a result, thearea occupied by these transistors has increased twice butcurrents flowing through it decreased eight times. This impliesthat power consumed by the memory cell decreases abouteight times as well. Simulation results presented in Fig. 9(holding time) and Fig. 10 (current consumption) fully confirmtheoretical predictions in this respect.In Fig. 9, the white marker curve is the memory output current,I o , delivered to the M 9 loading transistor and the blackmarker curve presents the current taken from the V DD sourcebeing a sum of I o and currents flowing through M 7 and M 8 .Since M 9 is an external load, current consumed be the memoryis a difference between these currents. From Fig. 9 it isseen that the black marker curve takes values larger than thewhite marker one by about 10%. Thus, the memory currentconsumption equals to about 10% of I o , which is a good result.Fig. 10 illustrates, what price we pay for the obtained currentreduction and also reduction of power consumed by thememory. In Fig. 10, we have the same relations as in Fig. 8.Comparing bottom plots of these figures, one can notice thatspeed with which the output current decreases is in Fig. 10twice as high as in Fig. 8 and equals approximately 12 µA/s.The resulting speed increase is acceptably low.ConclusionsA current-mode CMOS circuit has been presented which canplay a role of a capacitive medium-term analog memory cell.Such a memory is attractive in analog hardware signal processing,for example in hardware implemented artificial neuralnetworks. This is because it enables to carry out within onechip all operations that require analog data storing, like it takesplace, for instance, when learning neural networks on silicon.Even though the proposed memory cell is simple (includesone capacitor and eight transistors), it is characterized bya very long storing time (extended by several orders of magnitudecompared to the basic version of Fig. 1) and a shortrecording time (approximately the same as in the Fig. 1 case).The obtained long storage time is due to applying a positivefeedback around the S 2 switch. This reduces the M 5 leakagecurrent significantly, decreasing, in this way, charge and voltagevariations of the holding C capacitor, considerably. Toachieve the desired feedback effect, good properties of theVF voltage follower are required, mainly a close to unity valueof the follower gain. A simply VF that includes only 4 transistorshas been proposed. It is able to ensure the theoreticallyexpected huge extension of the memory storage time.Operating in current mode, the memory cell is power economic.In its basic form of Fig. 1, no power is consumed duringthe holding phase. In case of Fig. 3, a small power isconsumed then but only if a different from zero information isstoried, i.e. when V C is higher than pinch-off voltage of M 2 .In our memory, low variations of V c voltage are related tolarge variations in the circuit input and output currents (current-modefeature). As a consequence, one can apply with agood result so called dummy transistor methods to improvewriting precision of our memory cell.ReferencesFig. 10. Time domain characteristics of the memory cell for thepower-saving designed of Table 2 (C = 0.1 pF): a) voltage controllingthe S 1 and S 2 switches, b) a difference between the V C voltageand the voltage delivered to the S 2 substrate, c)output current, I o(white markers), and sinusoidal input current I i (black markers)Rys. 10. Charakterystyki czasowe pamięci zaprojektowanej dopracy energooszczędnej (tab. 2): a) napięcie sterujące kluczami S 1i S 2 , b) różnica między napięciem V C i napięciem dostarczonym dopodłoża klucza S 2 , c) prąd wyjściowy I o (białe wskaźniki) i sinusoidalnyprąd wejściowy I i (czarne wskaźniki)[1] Cauwenberghs G., Bayoumi M.: Learning on silicon, adaptiveVLSI neural systems. Kluwer Academic Publishers, 1999.[2] Hikawa H.: Frequency-based multilayer network with on-chiplearning. IEEE Transactions on Neural Networks, vol. 10, no. 3,1999, pp.545-553.[3] A. F. Murray, “The Future of Analog Neural VLSI”, Proceedingsof the Second ICSC International Symposium on Engineering ofIntelligent Systems, 2000, pp.13-19.[4] Kohonen T.: Self-organizing maps. Springer Verlag, Berlin, 2001.[5] Bult K., Wallinga H.: A Class of Analog CMOS Circuits Based on theSquare-Law Characteristic of an MOS Transistors in Saturation. IEEEJournal of Solid-State Circuits, vol. sc-22, no.3, 1987, pp. 357-365.[6] Talaśka T., Długosz R., Pedrycz W.: Adaptive Weight ChangeMechanism for Kohonens’s Neural Network Implemented inCMOS 0.18 µm Technology. 11th European Symposium on ArtificialNeural Networks, Bruges, Belgium, April 2007.[7] Długosz R., Talaśka T., Dalecki J., Wojtyna R.: Experimental Kohonenneural network implemented in the CMOS 0.18 µm technology.IEEE Int. Conf. Mixed Design of Integrated Circuits andSystems MIXDES’2008, pp. 250-255, Poznań 2008, pp. 243-248.[8] Wojtyna R.: CMOS analog memory with increased storing time.IEEE Int. Conf. Signals and Electronic Systems ICSES2006, pp.437-440.[9] Wojtyna R.: A concept of current-mode long-term analog memoryfor neural network learning on silicon. IEEE Int. Conf. Signal Processing,NTAV/SPA 2008, pp. 121-126.38 ELEKTRONIKA 3/<strong>2009</strong>


Efficient image watermarking in the transformdomain with the discrete trigonometric transforms(Zagadnienie efektywnego oznaczania obrazów znakami wodnymiza pomocą transformacji trygonometrycznych)dr inż. PRZEMYSŁAW KOROHODA 1 , prof. dr hab. inż. ADAM DĄBROWSKI 21 University of Science and Technology AGH, Chair of Electronics, Kraków2 Poznań University of Technology, Chair of Control and System Engineering, PoznańIn the area of the still image watermarking, the approachwhere the watermark is introduced in the transform domain isconsidered in numerous descriptions. Apart from the Fourierand wavelet transform the discrete cosine transform (DCT) ismentioned quite often [1,3-5,10-12]. However, the commonlyused DCT, is in fact one member of a larger set of 16 discretecosine and sine transforms [2, 6] also referred to as the discretetrigonometric transforms (DTTs). In this context, the DCTcommonly proposed for watermarking is the two dimensionalDCT of type II-even (in short: DCT IIe), while there are all togetherfour even DCTs, four odd DCTs, and similarly eight respectivediscrete sine transforms (DSTs) - four even and fourodd [2,6], thus there are 16 DTTs in total.In the presented work the 16 DTTs are comparatively investigatedto verify if the remaining 15 DTTs could also beused together with the DCT IIe for similar tasks of the watermarkingto extend the set of available transformations.The set of similar transforms may be considered as a kindof a dictionary, so that the choice of one of them can create anadditional unknown parameter for the attacker, and thus canimprove the watermarking efficiency.In section 2 the DTTs are briefly introduced and the consideredwatermarking technique is described in section 3.Section 4 contains a study of the suggested watermarks definedin the DTT domain. In sections 5 and 6 the results of twoattacks are studied, namely of Gaussian filtering and JPEGcoding. Section 7 shows that similarities within the set of theDTTs can be used in such a way that the transform numbersmay be regarded as a set of coding keys improving the encryptingflexibility of the watermarking. Concluding remarksare provided in section 8.The discrete trigonometric transformsThe DTTs may be defined in several ways, however in thiswork the unified definition [7] is be used. For the sake of convenienceof further reference the 16 transforms are numberedThe numbering of the DTTs and the relevant inverse transforms [2]Przypisanie numerów transformacjom DTT oraz odpowiednie transformacjeodwrotne [2]the transform k k inv the transform k k invDCT Ie 1 1 DST Ie 9 9DCT IIe 2 3 DST IIe 10 11DCT IIIe 3 2 DST IIIe 11 10DCT IVe 4 4 DST IVe 12 12DCT Io 5 5 DST Io 13 13DCT IIo 6 7 DST IIo 14 15DCT IIIo 7 6 DST IIIo 15 14DCT IVo 8 8 DST IVo 16 16according to Table. This Table also indicates that the inversetransforms are easily available for all DTTs. For half of them thetransform is its own inverse, while for the other half the transformsthey themselves and their inverses may be grouped inpairs. All DTTs are linear and their two-dimensional extensionsmay be easily obtained thanks to their separability.The watermarking in the transformdomainLet us formally describe the process of inserting a watermarkW (defined in the transform domain) to the image P (originallyin the primary domain). Both W and P are matrices of thesame size. The DTT and DTT -1 denote the forward and theinverse two-dimensional transforms, respectively. P W is theimage (in the primary domain) with the watermark inserted.Let us denote the basic process in the following way:where the square brackets denote rounding to the nearestinteger.Then, the reconstruction of the watermark may be describedasNote, that when only linear transform and rounding is applied,then (1) and (2) is equivalent toThe reconstructed pattern may be not identical with the originalone because of rounding performed twice in this process.A possible attack against the watermark may be denotedwith operator A(·), somewhat changing the image with the watermark.Then, the reconstruction of the watermark results in(1)(2)(3)(4)(5)ELEKTRONIKA 3/<strong>2009</strong> 39


A similarity between the original pattern and the reconstructedone is evaluated after stretching both matrices to thevector form and then computing the correlation coefficient r,which is the same as the scalar product of the normalized vectors,with the zero mean value. For identical patterns r = +1.Value r =-1 means that the patterns may also be consideredidentical after one of them has been multipied by -1. Therefore,the weakest (or none) similarity is represented by r = 0.In the described study some additional assumptions havebeen made. First, the pattern does not cover the whole areaof matrix W only the upper-left block of it, denoted as W 0 . Theremaining part of W is set to zero. This is represented by parameterB, thus the area of pattern W 0 is of relative size versusthe size of the W area given by(6)here, the following values are considered: B = 2, 4, 8, 16.The second assumption is that the pattern W 0 is made ofthe same number of values +(B/2) and -(B/2), pseudo-randomlydistributed over the W 0 area. Then the DC coefficient inW is set to 0. The first assumption was made to create the advantageof the transform domain watermarking over the watermarkingin the original domain. The second was meant toprovide the watermark, which would not strongly manifest itselfin the image.As a result of the above observation, the correlation coefficientverifying the similarity of the reconstructed pattern (5)in the transform domain is computed only for the W 0 area:while in a part of the study, where the watermark is comparedwith the reference pattern in the primary domain, the wholeimage area is taken into account.The watermark transformedto the primary domainThe watermark W 0 in the transform domain is assumed to consistonly of +1 and -1, multiplied by B/2, apart from the DCcomponent, which is always set to 0. For all DTTs the roundedinverse transform, which results in the pattern spreading overthe whole image area, consists of only values +2, +1, 0, -1,and -2 [9]. The non-zero values are at about 33% of all pixels,while the values outside the -1,+1 range are in about 0.33% ofthe whole image area (roughly: in one out of a thousand pixels).Therefore, it is quite safe to state, that for the defined watermarkthe distortion in the image domain is such that only 1/3of the pixels change for no more than ±1. For the 8-bit pixelsthe change is definitely not detectable by visual inspection.An additional advantage of the proposed watermarking techniqueis that the layout of non-zero changes from original pixelvalues forms a random pattern in the image domain - see theexample in Figure 1. This observation applies also to all DTTs.(7)(8)Fig. 1. Distribution in the picture domain of the +1 and +2 watermarkvalues (in white), and -1, -2 (in black) for: a) B = 2, b) B = 4, c)B = 8, d) B = 16. Examples obtained for the DST IVo (k = 16)Rys. 1. Rozmieszczenie wartości znaku wodnego w dziedzinie obrazu,+1 i +2 na biało, -1 i -2 na czarno, dla: a) B = 2, b) B = 4, c) B =8, d) B = 16. Przykłady uzyskane dla DST IVo (k = 16)The attack with Gaussian filteringTo compare the immunity of the watermark defined in any DTTdomain as the basic attack the Gaussian low-pass filtering hasbeen selected. The test image was 8-bit grey-level Lena [12],of size 256 ´ 256 pixels. Therefore W 0 had the size: 128 x 128,64 x 64, 32 x 32 and 16 x 16, for B = 2, 4, 8, and 16, respectively.For filtering three options have been selected with thefollowing Gaussian mask: a) of size 3 x 3 obtained for two-dimensionalGaussian with σ=0.4; b) 5 x 5 mask and σ=0.5;c) 7 x 7 mask and σ=1.0. The distortion introduced by suchfiltering to the P W image was measured with the root meansquare error (RMSE), then converted to the form of peak signalto noise ratio (PSNR) for 8-bit images, expressed in dB.The watermark was generated pseudo-randomly 100 timesand the whole procedure was applied. The PSNR values didnot differ more than 0.01 dB for the same filtering option, so itmay be stated that for a) PSNR = 45.6 dB; b) PSNR =37.6 dB, c) PSNR = 28.9 dB. Typically, distortions with thePSNR values around 45 dB are considered unnoticeable, andabout 30 dB are hardly acceptable. For each combination ofthe three filtering options and the four B values, the watermarkwas generated 100 times and inserted to the test image, assumingconsecutively the 16 DTTs (1). After filtering (4) andreconstruction (5) the result was compared according to (7)with the initially generated pattern. The obtained results areshown in Figure 2. Note, that there is no important differenceamong the DTTs, and for filtering options a) and b) even theranges of the resulting correlation coefficients for hundredtests do not differ noticeably. In Figure 2 the black dots at theends of vertical sections mark the minimum and the maximumvalue within each group of hundred tests for the same B, DTT,and filtering option.40 ELEKTRONIKA 3/<strong>2009</strong>


(9)Figure 3 presents the obtained results. The vertical sectionsdepict ranges from the minimum to the maximum of the relevantresults, averaged over the DTTs. The correlation coefficientsr P , computed in the original domain do not exhibitimportant sensitivity to the watermark size defined by B - seeFigure 3b, while higher B resulted in the improvement in r 0 -Figure 3a The graphs depicting ratio R reveal the maximum atcertain PSNR level - Figure 3c. The sensitivity to the choice ofthe DTT seems to be neglegible. The values of R provide evidenceof the advantages of the transform domain watermarking,especially for stronger compression (smaller PSNR)and larger B.Fig. 2. The averaged correlation coefficient r 0 of the reconstructedwatermark (for n = 100 samples) and the assumed pattern, after theattack with Gaussian filtering with: a) 3 x 3 mask, σ=0.4, b) 5 x5mask, σ = 0.5, c) 7 x 7 mask, σ = 1.0. The four graphs, from top tobottom, correspond to the options: B = 16, B = 8, B = 4 and B = 2,consecutively. The vertical sections in black depict the relevantranges prior to the averagingRys. 2. Współczynniki korelacji r 0 uśredniony po 100 próbkach, wyznaczonymiędzy odtworzonym znakiem wodnym i założonymwzorcem, po ataku z wykorzystaniem filtracji Gaussa, o parametrach:a) maska 3 x 3, σ = 0.4, b) maska 5 x 5, σ = 0.5, c) maska 7 x 7,σ = 1.0. Cztery wykresy, kolejno od góry, odpowiadają przyjęciu odpowiednio:B = 16, B = 8, B = 4 i B = 2. Czarne pionowe odcinkiobrazują zakresy wartości przed uśrednieniemThe attack with JPEG codingThe quite common image compression standard is still thebaseline JPEG [12], which is based on the DCT-IIe transform.The routinely performed compression may be also consideredan attack on the watermark, however quite often unintentional.Therefore, the DCT-IIe seems to be somewhatmore relevant as a source of the watermark introduced in thetransform domain. The following tests were intended to verifysuch presumption. The 16 DTTs domains were used toform the watermark, as in the previously described experiment.Then, the image P W with the watermark was storedwith JPEG (Matlab, version: 7.1.0.246 (R14)), controlled bythe quality parameter q. The parameter takes values from 0to 100, which is eqivalent to the worst and the best quality, respectively,of the reconstructed image while compared to theoriginal one. The decoded images were compared with theP W with the 8-bit PSNR measure, expressed in dB. Again,the PSNR values, for within each q option varied so little thatit may be considered constant for a given q and the testimage. The q values were varied within the range from 25 to100, while from 25 to 80 the increasing step was 5, and from80 to 100 the increment was 1. For q = 25 the PSNR =30.6 dB, and for q = 100 the PSNR = 58.4 dB. The obtainedresults were additionally used to compare the efficiency ofthe transform domain watermarking with the original domainwatermarking (8). After coding and decoding with JPEG, thewatermark was reconstructed in the original and the tramsformdomain. In the original domain the recosntructed watermarkwas confronted with the assumed pattern according to(8). To compare both techniques by means of their efficiency,considered as robustness against the JPEG coding, the followingratio was computedFig. 3. Results of the JPEG attack on the test image with the watermarkcreated in the DTT domain: a) r 0 (7), b) r P (8), and c) R (9). Theresults are averaged over the 16 DTTs, and the short vertical sections(in black), which indicate ranges before averaging, show thatall DTTs have similar efficienciesRys. 3. Wyniki przeprowadzenia ataków za pomocą standarduJPEG na znak wodny wprowadzony w dziedzinie DTT: a) r 0 (7), b) r P(8), c) R (9). Wyniki są uśrednione po 16. transformacjach DTT,a krótkie pionowe odcinki na czarno, określające zakresy wartościprzed uśrednieniem, wskazują na podobną efektywność wszystkichtransformacji DTTDifferences between DTTsA proper watermark should not only be hidden from the observerwhile viewing the picture in the original domain but alsoshould be difficult to find if someone tries to check if the imagehas been watermarked in the transform domain. Detection ofthe watermark may be the first step to its removal. Therefore,if might be useful to have a set of transforms, all equally suitablefor watermarking but the selection of the transform (itsnumber within the set) would become additional encryptingfeature. A couple of introductory experiments were performedto verify the capability of the set of the DTTs for such a task [9].Some additional results are presented below.In the first experiment the randomly generated watermarkwas placed in the k 1 th DTT domain, inversely transformed tothe image domain and rounded, then transformed to the k 2 thDTT domain and rounded again. The reconstructed watermarkwas verified according to (7). In Figure 4 the matrices ofELEKTRONIKA 3/<strong>2009</strong> 41


correlation coefficents r 0 , depicted as the grey-level maps, arepresented. The mapping is linear, with black for r 0 = 0 andwhite for r 0 = 1. The results indicate, that having the given DTTthe remaining set of the DTTs may be divided into three subsets:similar, slightly similar and different. For some DTTs onlytwo subsets are available. For example if we take k 1 = 3, thenthe similar DTTs are: k 2 = 4, 7, 8, semi-similar: k 2 = 1, 2, 5, 6,9, 10, 13, 14, and different: k 2 = 11, 12, 15, 16. The suggestedclassification is quite obvious for B = 16 and becomes morefuzzy for smaller B.The described properties have been confirmed with thenext experiment, where the watermark was inserted to the testimage and the JPEG coding was introduced in the middle odthe process. Figure 5 presents the selected results, whichclearly confirm the previous observations.Concluding remarksThe presented study indicates that all 16 DTTs are equallywell suitable for the discussed method of image watermarking.The obtained results motivate for further investigation of the2D DTT properties. In the presented study the same transformwas used in both directions - the vertical and the horizontaldirection. In fact, thanks to separability of all DTTs, theset of 2D DTTs may be considered to consist of 256 transforms(as there are 16 transformations to choose for each direction).Such a wide choice should make it possible and infact quite easy to really confuse the potential attacker.A location of the watermark in the upper-left part only ofthe transform domain suggests that the resulting properties ofthe watermark may also be investigated immediately in theprimary domain, however, with the use of appropriate 2D lowpassfilter as it was described for the case of the half-band filtersin [6-8].An interesting additional result is the proposed mutualclassification of particular transforms in the set of all DTTs.ReferencesFig. 4. The grey-level maps of the absolute values of the correlationcoefficients r 0 , obtained after using different transforms for insertionand reconstruction of the watermark: a) B = 2, b) B = 16. TheDTTs are numbered from 1 to 16, according to Tabl.Rys. 4. Przedstawione w postaci map szarości macierze współczynnikówkorelacji r 0 , otrzymane po zastosowaniu innych transformacjiDTT do tworzenia znaku wodnego niż do jegoodtworzenia: a) B = 2, b) B = 16. Transformacje DTT są ponumerowaneod 1 do 16, zgodnie z tab.Fig. 5. The correlation coefficients r 0 between the reconstructedwatermark and the assumed pattern, after the attack with the JPEGcoding and all DTTs (k 2 = 1, 2,...,16) used for reconstruction: a) B =2, k 1 = 2 (DCT IIe); b) B = 8, k 1 = 4 (DCT IVe). The red graph is for theresults with k 2 = k 1Rys. 5. Współczynniki korelacji r 0 wyznaczone pomiędzy odtworzonymznakiem wodnym i założonym wzorcem, po ataku kodowaniemJPEG oraz zastosowaniu wszystkich DTT (k 2 = 1, 2...,16) doodtworzenia znaku wodnego: a) B = 2, k 1 = 2 (DCT IIe); b) B = 8, k 1 =4 (DCT IVe). Czerwony wykres dotyczy wyników, gdy k 2 = k 1[1] Barni M., Bartolini F.: Watermarking Systems Engineering. MarcelDekker Inc., 2004.[2] Britanak V., Yip P., Rao K. R.: Discrete Cosine and Sine Transforms- General Properties, Fast Algorithms and Integer Approximations.Elsevier, Academic Press, 2007.[3] Hernández J. R., Amado M., Pérez-González F.: DCT-DomainWatermarking Techniques for Still Images: Detector PerformanceAnalysis and a New Structure. IEEE Transactions on Image Processing,vol.9, no.1, pp. 55-68, 2000.[4] O-Hyung Kwon, Young-Sik Kim, Rae-Hong Park: Watermarkingfor Still Images Using the Human Visual System in the DCT Domain.Proceedings of the International Symposium on Circuitsand Systems - ISCAS‘99, (Orlando, USA), pp. IV-76-79, 1999.[5] Katzenbeisser S., Petitcolas F.A.P. (ed.): Information HidingTechniques for Steganography and Digital Watermarking. ArtechHouse, 2000.[6] Korohoda P., Dąbrowski A.: Fast filtering by generalized convolutionrelated to discrete trigonometric transforms. Signal Processing- Algorithms, Architectures, Arrangements, andApplications - SPA 2007, (Poznań, Poland), pp. 57-62, 2007.[7] Korohoda P., Dąbrowski A.: Digital filtering by discrete trigonometrictransforms realized with generalized convolution. <strong>Elektronika</strong>,nr 4, str. 95-98, 2008.[8] Korohoda P., Dąbrowski A.: Generalized convolution as a tool forthe multi-dimensional filtering task. Multidimensional Systemsand Signal Processing, vol. 19, pp.361-377, 2008.[9] Korohoda P., Dąbrowski A.: The Discrete Trigonometric Transformsfor Still Image Watermarking in the Transform Domain - A ComparativeStudy. Proc. of the New Trends in Audio and Video, and SignalProcessing - Algorithms, Architectures, Arrangements, and Applications(NTAV/SPA 2008), (Poznań, Poland), pp. 143-148, 2008.[10] Kuroda K. i in.: A Digital Watermarking using Public-Key Cryptographyfor Open Algorithm. Proceedings of the International Conferenceon Information Theory and Application - ICITA’02, 2002.[11] Seitz J. (ed.): Digital Watermarking for Digital Media. InformationScience Publishing, 2005.[12] Shih F. Y.: Digital Watermarking and Steganography - Fundamentalsand Techniques. CRC Press, 2007.42 ELEKTRONIKA 3/<strong>2009</strong>


Fractional delayor application in self-tuningsub-sample delay estimator(Aplikacja filtru ułamkowo-opóźniającego w samonastrajalnymestymatorze podpróbkowego opóźnienia)prof. dr hab. inż. EWA HERMANOWICZ, dr inż. MIROSŁAW ROJEWSKIGdansk University of Technology, Faculty of Electronics, Telecommunications and Informatics, GdanskEstimation of propagation delay between signals received attwo separate sensors is a problem of considerable interest inareas such diverse as GPS, radar, sonar, biomedicine, ultrasonic,geophysics and others. In this paper we focus on theestimation of delay in time domain. In classical time domainestimators, the resolution is limited to the sampling period.However, now, sub-sample resolution is possible using interpolationby means of fractional delay (FD) filtering.Here we achieve the delay estimation in discrete time domainvia Hilbert transform filtering together with FD filtering.The performance of our self-tuning time delay estimator isanalysed and illustrated in presence of noise.Novelty of the proposed solution lies in lowl numericalcomplexity. It is economical and efficient due to reduced loadof processing in comparison with, e.g., [1].Problem statementIn Fig. 1, in the upper part of the scheme, the received realvaluedsignal x[n] passes through the linear-phase HTF givinga complex-valued output with Hilbertian noise term g H [n]:whose spectrum is periodical, Hilbertian, thus right-handsided; in other words equal to zero for ω ∈ (-π,0). This complex-valuedsignal y[n] is pointed out in the scheme by usinga bold line. Then in Fig. 1 the same signal y[n] is multiplied byanother complex-valued signal y γ [n] obtained from the referencereal-valued signal x γ [n] by passing it through a seriesconnection of FD with d of, generally, nonzero value, and thelinear-phase HTF [2], and taking the complex conjugate value(denoted by ) of the result. Therefore, at the multiplier outputwe have:(3)We assume that the received signal has the form:(1)(4)where the amplitude A > 0, ω 0 is the angular frequency in radiansper sample whose value is known, φ is the unknown initialphase whose value we want to estimate/measure, g[n]stands for a white Gaussian noise realisation and n stands forthe time index (number) of sample; n = 0, ±1,…. We estimatethe value of φ by comparison of (1) with the reference cosinesignal (chrono-signal otherwise called the timing waveform):whose initial phase is, by assumption, of zero value and A 1can differ from A. For solution we apply a fractional delay filterFD with a fractional delay value d restricted to the intervald ∈ [-1/2,1/2] and a complex linear-phase Hilbert filter HTF.The proposed solutionThe block scheme of the proposed solution is shown in Fig. 1.Fig. 1. Block scheme of the proposed solution of self-tuning timedelay estimatorRys. 1. Schemat blokowy proponowanego rozwiązania samonastrajalnegoestymatora opóźnienia(2)with noise term denoted by g 0 [n], assuming that both filtersare ideal. Thus for given n we obtain a complex numberAA 1 exp(jφ) depending on unknown φ=φ[n] plus a noise component.If ω 0 = π/2, then the value of φ has to be restricted tothe interval φ ∈ [-π/4,π/4] in order to have:as desired.Next, in Fig. 1, the estimated value is computed atthe output of the multiplier by using the block Arg() - four quadrantarctangent referred to as angle.m in MATLAB. Further on,is multiplied by the inverse of the angular frequencyω 0 =2πf 0 ,|f 0 | ∈ (0,1/2) to give an estimate of the delaybetween the signals: x[n] (1) and x γ [n] (2). This estimate is accumulatedin the ACC block as indicated in Fig. 1 and the resultis averaged over two neighbouring samples in a MA -moving average block to give the value responsible for tuningthe fractional delay in FD block operating in the self-tuningsub-sample time delay synthesis by analysis loop in Fig. 1.The general rule is that the smaller the loop delay, thefaster is the reaction of the loop to phase jumps in the receivedsignal x[n]. That is why the averaging used further in animplementation of our scheme from Fig. 1, shown in Fig. 2, isrealized by a very simple finite impulse response (FIR) filterhaving the transfer function:(5)(6)ELEKTRONIKA 3/<strong>2009</strong> 43


and the transfer function in the lower part of the schemebetween x γ [n] and y γ [n], in steady state, when we can assumethat :(11)The amplitude response corresponding to (11) achievesthe desired values: 2 for ω=ω 0 = π/2 and 0 for ω=ω 0 = -π/2.Of course, (11) resolves to (10) for d = 0.a)Fig. 2. Detailed block scheme of the proposed self-tuning sub-sampletime delay estimator from Fig. 1Rys. 2. Szczegółowy schemat blokowy proponowanego samonastrajalnegoestymatora opóźnienia z rys. 1This averaging is preceded by an accumulator:(7)The transfer function of the ACC and MA cascade is:(8)b)and the corresponding frequency response is:(9)whose values are: for ω=±π/2, 0 for ω=±π and forω 0 = 0.Below we present the algorithm of the proposed self-adjustingsub-sample time delay estimator from Fig. 2 based onthe possibly shortest maximally flat FD and HTF and the recursiveaccumulator followed by a simple FIR averager in thelast line of the loop.The phase delay of the H ACC (z)H MA (z) cascade (8) isπ/(2ω) which is not astonishing. However, the group delay introducedis desirably of zero value. Thus we deal with a zerogroup-delayingaccumulator followed by the MA just tailored toour application in a feedback loop.c)Fig. 3. The performance of a cascade of FD filter and HTF, maximallyflat at ω 0 = π/2, thus f 0 = 0.25. For better visibility the fractionalpart of the group delay response is presented only in theregion of interest, i.e. for nonnegative frequency fRys. 3. Charakterystyki kaskady filtru opóźniającego FD i filtru HilbertaHTF maksymalnie płaskie dla ω 0 = π/2, czyli f 0 = 0,25. Dla lepszejwizualizacji ułamkową część opóźnienia grupowegozaprezentowano jedynie w interesującym nas przedziale nieujemnychwartości częstotliwości fPerformanceFinally, the transfer function H 0 between x[n] and y[n] of theHTF of length N = 2 implemented in the upper part of Fig. 2 is:(10)In Figs. 3, 4, 5, 6 and 7 we illustrate the performance of theproposed self-tuning sub-sample time delay estimator fromFigs. 1 and 2.The magnitude of the complex approximation error (CAE)curves between the ideal (desired) frequency response of FDin series with HTF and that corresponding to (11) are presented44 ELEKTRONIKA 3/<strong>2009</strong>


in Fig. 4. The best performance is observed in the vicinity of thefrequency of the sine signal (1) in the upper part of Fig. 1.Fig. 5 shows the characteristics of the FD introduced to(2) in order to compensate for the delay in the signal (1) havingω 0 = π/2 and with g[n] =0, thus without noise. We see thatthe convergence of the algorithm from Fig. 2 applied herewithout averaging and accumulation is very fast. The speed ofconvergence does not depend on the value of d. Furtherdrawings allow us to track the influence of averaging in MA -Fig. 5b and accumulation in ACC - Fig. 5c independently aswell as applied together - Fig. 5d for the input signal not corruptedby noise.The same experiment as in Fig. 5, where we had g[n]=0,was repeated in Fig. 6 with noise, thus with g[n] ≠ 0. The additivewhite Gaussian noise - AWGN was used such that the signalpower to noise power ratio - SNR - was 30 dB. The presenceof noise is clearly seen in Fig. 6a. Simple averaging reduces inFig. 6b the influence of noise to some extend, but the main workfor this aim is done by the ACC, see Fig. 6c. The final characteristicsshown in Fig. 6d for this SNR, where both: the averagingand ACC are engaged, are very close to those from Fig. 5d.In order to better clarify the matter we present in Figs. 5eand 6e the “horseshoe” of clusters of phase values correspondingto the FD values used previously in experimentsfrom Figs. 3 and 4.The smaller the SNR, the dimensions of clusters increase,but they still remain distinguishable down to the SNR of approximately15 dB, similarly as in [1], and even less. A confir-a) b)c) d)Fig. 4. The CAE for the cascade of FD filter and HTF from Figs. 2and 3Rys. 4. Charakterystyki modułu zespolonego błędu aproksymacjidla kaskady filtru opóźniającego FD i filtru Hilberta HTF z rys. 3a) b)e)c) d)e)Fig. 6. The performance of self-tuning sub-sample time delay estimatorfrom Fig. 2 with additive white Gaussian noise of SNR =30 dB; a, b, c, d, e as in Fig. 5Rys. 6. Osiągi samonastrajalnego estymatora opóźnienia z rys. 2z addytywnym białym szumem gaussowskim i stosunku mocysygnału do szumu SNR = 30 dB; a, b, c, d, e jak na rys. 5a) b)Fig. 5. The performance of self-tuning delay estimator from Fig. 2without noise and: a) without both ACC and MA, b) with MA, c) withACC, d) complete scheme with ACC and simple MA e) the “horseshoe”of clusters of phase values for FD values as above in Fig. 5a,b, c and dRys. 5. Osiągi samonastrajalnego estymatora opóźnienia z rys. 2bez szumu i a) bez ACC i bez MA, b) z MA, c) z ACC, d) kompletnyschemat z ACC i MA e) “podkowa” skupień wartości fazy odpowiadającychwartościom FD jak powyżej na rys. 5a, b, c i dFig. 7. Illustration of clusters of signals in Fig. 2 of length 2000 samples:a) for y[n] when x[n] is corrupted by AWGN of SNR = 30 dBand b) of SNR = 15 dBRys. 7. Ilustracja skupień sygnałów z rys. 2 o długości 2000 próbek:a) dla y[n], gdy x[n] jest zakłócony addytywnym białym szumemgaussowskim (AWGN) o SNR = 30 dB i b) o SNR = 15 dBELEKTRONIKA 3/<strong>2009</strong> 45


mation is presented in Fig. 7. There, assuming the initial phaseof x[n] in (1) corresponding to the fractional delay d = 1/2 (theworst case for processing) the clusters of the signal valuesafter the both HTF are shown for SNR equal to 30 dB as inFig. 6 and also for SNR = 15 dB. These clusters illustrate notonly the phase discrepancy around φ but also independenceof this discrepancy on φ. Nevertheless, our result is obtainedby a solution whose numerical load of processing issignificantly reduced in comparison with that needed in [1].The FD filter and both HTF filters in the solution engineeredin Fig. 1, and implemented in Fig. 2 need altogetheronly 2 multiplications (1 real-valued multiplication for the fractionaldelay d update and one complex-valued multiplicationfor p[n] computation) versus 13 multiplications utilized in [1].Moreover, they need only 6 adders of real-valued samples insteadof 25 adders required in [1]. Also the number of integerdelay (storage) elements in our design is smaller.Summing up: the proposed solution achieves similar performanceas that published in [1] but with much lower numericalcomplexity. That was accomplished by taking advantage ofthe extremely narrow bandwidth of the signal under processing.Concluding remarksIn the paper a novel solution of a self-tuning time delay estimatoroperating in the discrete time domain on a sinusoidalsignal has been successfully developed. The proposed solutionis made up of a series connection of fractional delay filterand Hilbert transform filter.The performance of our self-tuning time delay estimatorwas illustrated by the results of its operation in presence ofnoise. The analysis of the solution mastered here in comparisonwith other solutions of comparable performance knownfrom available literature, not only that given in [1], shows thatour proposal here is the most favourable with respect to lownumerical complexity.References[1] Maskell D. L., Woods G. S.: Adaptive subsample delay estimatorusing quadrature estimator. Electronics Letters, 4th March2004, vol. 40, no. 5, pp. 347-349.[2] Hermanowicz E.: Cyfrowy filtr Hilberta i jego zastosowania. <strong>Elektronika</strong>nr 9, 2007, ss. 30-34.Digital network of labelled nodes for image processing(Cyfrowa sieć do równoległego przetwarzania obrazów)mgr PRZEMYSŁAW BRYLSKI, dr hab. MICHAŁ STRZELECKITechnical University of Lodz, Institute of ElectronicsImage segmentation is still a challenging task despite of manyworks devoted to this part of image analysis. One of promisingapproaches to this problem is a network of synchronised oscillators.It has been proven that such a network is a reliable toolnot only for image segmentation but also for its processing. Itsoperation is based on “temporary correlation” theory [1,4],which attempts to explain scene recognition as performed by ahuman brain. This theory assumes that different groups of neuralcells code different properties of homogeneous image regions(e.g. shape, texture). Monitoring of temporal activity ofcell groups allows for scene segmentation. To implement thistheory, Wang [1] proposed an oscillator model to emulate neuralcell and oscillator network for image segmentation. This networkis suitable for hardware realisation, speeding up imagesegmentation. It was realized already as an ASIC CMOS VLSI[2,3] and contains a matrix with 8 x 8 size. Unfortunately, theanalogue approach suffers many drawbacks. One of them issmall matrix size, which limits practical applications of networkcircuit. Another problem arises due to differences between networkoscillators scattering of transistor channel length leads tosignificant changes is oscillators output characteristics. The latterinfluence synchronisation process making image segmentationless accurate. To overcome these problems, digitalnetwork realisation and algorithm are considered. This wouldallow to implement larger network structure and to assure thesame oscillator characteristics, since each oscillator would bethe same digital circuit. For implementation of the digital networkthe Virtex-5 FPGAS by XILINX [6] are considered.A digital network circuitThis section describes a concept of a digital circuit which implementsa network of labelled nodes. A block diagram of proposedimage processor is presented in Fig. 1. It containscontrol unit and a matrix of N x N nodes, which representimage pixels processing units. The objective of control unit(CU) is downloading the image into processing matrix, controllingthe segmentation process, and delivering theprocessed image to the output bus. The meaning of signalsshown in Fig. 1 is as follows:• Image IN - input bus for image downloading,• Result OUT - output bus for image uploading,• GI - global inhibitor signal connected to all nodes,• R - reset signal (node initialisation),• A ik - node activity array,• I/O BUS - bi-directional internal bus for transferring pixelvalues to each node, labels assignment for leader nodes,node labels retrieval after segmentation,• PL ik - array of leader nodes,• clk - system clock for processing synchronization.In proposed digital network realization, nodes labellingsubstituted oscillations. Nodes connected to homogeneousimage region possess the same unique label that is assignedto them during iterative network operation. During each clockcycle, the label is assigned to all these neighbors of given activenode (which already has is labelled), for which connectionweight is sufficiently high.46 ELEKTRONIKA 3/<strong>2009</strong>


Step 11. Image downloading via the central unit input bus.2. Node initialization - Reset signal is activated.3. Transferring to the nodes corresponding image pixel values(of the given node and its neighborhood).4. Clock signal generation - node weights calculation, definitionof leader nodes that will initiate the segmentation (PLbit then set). If there are no leaders, procedure ends.The image segmentation was began.Step 2Fig. 1. A block diagram of digital networkRys. 1. Schemat blokowy cyfrowej sieci5. Nodes activity bits A OUT ik are disabled.6. Central unit selects one of leader nodes and assigns to idad unique label. Activity bit of this node is set, while its PLbit is reset (to be no more selected as the leader).7. Central unit (CU) generates clk signal and calculates GIstate based on nodes activity (GI is set if at least one A ik isset, otherwise GI = 0).8. Segmentation takes place until after subsequent clk signalthere is no label change in any node.This completes recognition of the single object.9. CU performs operation starting from p. 5. If there are nomore leaders (PL bits of all nodes are reset),the segmentation is finished.Step 310. Labels L ik of all nodes are transferred to CU via I/O BUS.11. The labeled image is uploaded outside of the network circuitusing output bus.After Reset signal from CU, network node is not active.Then it performs the following operations, after rising edge ofclk signal:1. It calculates the weights between its neighbors using theformula:(1)Fig. 2. A single network node Rys. 2. Węzeł sieciTo simplify the network structure and to save hardware resources,there are no weight connections between matrixnodes. Each node calculates weights to their neighbors basedon pixel intensities assigned to them before initialization ofsegmentation.Figures 2 presents a single network node. The meaningof the node signals is as follows:• PL ik - output signal indicating whether the node is the leader• A IN ik - input signals for analyzing the activity status of itsneighbors• A OUT ik - output signal indicating node activation• L IN ik - n-bit label input signals for analyzing status of itsneighbors,• L OUT ik - n-bit output signal containing a node label after itsactivation,• GI - global inhibitor input,• R - synchronous reset input,• I/O BUS - bi-directional control unit communication bus,• clk - clock signal.A digital network performs the following segmentationalgorithm:where: i, k- node coordinates, NoN - number of all neighborsconnected to each node, I ik - pixel value in image point (i,k),I n - intensity in n-th neighbor pixel of node (i,k).2. If node is not active (A OUT ik bit is reset), then it checks thestatus of its neighbors, according the formula:where: H is a Heaviside function (equal to 1 if its argument isgreater than zero, and zero otherwise), AL is an activation level,if AL >0then node (i,k) assumes a label from its active neighbor.3. Finally, if AL > 0, node changes its status to active one(A OUT ik bit is set) and sets its output label signal L OUT ik .Simulations of digital labelled networkcircuitThis section describes simulations results of a digital networkcircuit implementation for 8 x 8 nodes and neighborhood sizeN=4. The network has been described in VHDL [7,8] languageand its functional simulation has been performed usingModelSim software.(2)ELEKTRONIKA 3/<strong>2009</strong> 47


Fig. 3. Control signals required for node initialization Rys. 3. Przebiegi czasowe sygnałów sterujących podczas inicjalizacji węzłaFig. 4. Node processing after image loading to the network Rys. 4. Przebiegi czasowe węzła po inicjalizacji sieciFig. 5. Node activation based on neighbors activity Rys. 5. Przejęcie etykiety przez węzeł od aktywnego sąsiadaFig. 6. Central unit processing Rys. 6. Przetwarzanie jednostki centralnejFig. 7. Central unit waveforms while waiting for the end of segmentation processRys. 7. Przebiegi czasowe jednostki centralnej podczas oczekiwania na koniec segmentacji48 ELEKTRONIKA 3/<strong>2009</strong>


Figures 3 shows transfer of image pixel value to a singlenetwork node using I/O BUS parallel interface. Central unit(CU) addresses selected node, next on the rising edge ofio_clk signal the “load features” command is set and the datais transferred to the node.The meaning of signals shown in Fig. 3 is as follows:• io_cs - the node selection signal, when it is active (“0”) thenode analyzes (reads) data of I/O BUS• io_clk - BUS clock for data communication synchronization• io_data - data sent/received to/from nodesFigures 4 shows estimation of nodes weights (based on eq.1), definition of its leadership (PL bit value) and node activation(in this example CU assigns label of value 1 to this node).Process of node activation based on its neighbor is shownin Fig. 5. As can be observed, the node analyzes A OUT i,k signalsof its neighbors, calculates AL value (based on eq. 2)and, if AL > 0 it assumes the label form the neighbor with thelowest difference in gray level value.Figures 5 presents control unit processing after nodes initialization.CU analyses PL flags of nodes, then chooses one of themto start the segmentation process. In Fig. 6 sample activenode enables also the global inhibitor (bit net_gi is set). CUgenerates clock signal (net_clk) for the network and waits forthe end of segmentation (all PL bits reset, A OUT does notchange after network iteration).Fig. 8. Sample binary image Rys. 8. Przykładowy obraz binarny0 1 0 0 1 0 0 20 1 0 0 1 0 0 20 1 0 0 1 0 0 20 1 1 1 1 0 0 20 1 0 0 1 0 0 20 1 0 0 1 0 0 20 1 0 0 1 0 0 20 1 0 0 1 0 0 2Fig. 9. Segmentation result of sample binary imageRys. 9. Wynik segmentacji przykładowego obrazu binarnegoSample binary image with two objects (white pixels) onbackground (black pixels) used for the digital labeked networktesting is shown in Fig. 8.Figures 9 present segmentation result. As can be seen,the network recognized two homogeneous areas on a sampleimage. Pixels belonging to these two areas were marked bydistinct labels “1” and “2”. Background of the image was not labeled(initial value of the label equal to 0 was maintained) ;accordingly to eq. 1 background nodes (corresponding to pixelswith zero value) are always disable due to their weightsequal to zero.Proposed in image processor [5] have been synthesizedthen placed and routed for XC3S1600E with Xilinx ISE 8.2.The implemented design utilizes approximately 93% slices ofthe XC3S1600E FPGA (20% of slices for flip-flops, 87% ofslices for 4 input LUTs).A new concept digital network circuitThe network structure and algorithm described in previoussection has been modified in aim of reduction of utilization ofthe FPGA area. These modifications have to make possiblethe processing of larger images:• The serial synchronous interface IO_BUS and the cascadeconnection of nodes. Replacement of the parallel interfacethat requires routing to all nodes 11 global lines, by a serialinterface with use only 2 global lines:- SCK - bus clock for data communication synchronization- EXEC - the node execution command trigger. When it isactive (“1”) the node analyses command latched in itsshift registerand locally connected 2 lines:- SDI - serial data input- SDO - serial data outputAnother benefit of this solution it is possibility of publicationof different commands to all nodes at the same moment.• Weights for each node being computed by the external microcontroller.It will make possible implementation of morecomplex weights equations calculated on basis of largerquantity of image features.• Nodes receives the processed information about imagefrom CU in form of table with contains indexes of the neighborsrelated with them by the greatest value of weight aswell as information indicating whether the node is theleader. The table defines the order of checking the statusof its neighbours.• E.g. if the table contains values as follow: tab[0] = 1,tab[1] = 1, tab[2] = 1, tab[3] = 1 (for N = 4) means thatnode can only activate from neighbour numbered as 1.This solution considerably reduces the number of flipflopsnecessary to storage of information about node’senvironment.A digital network performs the following segmentation algorithm:Step 11. Image information downloading via the central unit inputbus.2. Node initialization - Reset signal is activated.3. Transferring to the nodes a table contains indexes of theneighbors related with them by the greatest value ofweight.Weights between each node’s neighbors being computed bythe external processor using the formula:ELEKTRONIKA 3/<strong>2009</strong> 49


where: i, k- node coordinates, NoN - number of all neighborsconnected to each node, I ik - pixel value in image point (i,k),I n - intensity in n-th neighbor pixel of node (i,k).The image segmentation was begunStep 24. Nodes activity bits A OUT ik are disabled.5. Central unit selects one of leader nodes and assigns to itand unique label. Activity bit of this node is set, while its PLbit is reset (to be no more selected as the leader).6. Central unit (CU) generates clk signal and calculates GIstate based on nodes activity (GI is set if at least one A ik isset, otherwise GI = 0).7. Segmentation takes place until after subsequent clk signalthere is no label change in any node.This completes recognition of the single object.8. CU performs operation starting from p. 4. If there are nomore leaders (PL bits of all nodes are reset).The segmentation is finished.Step 39. Labels L ik of all nodes are transferred to CU via I/O BUS.10. The labelled image is uploaded outside of the networkcircuit using output bus.After Reset signal from CU, network node is not active.Then it performs the following operations, after rising edge ofclk signal:1. If node is not active (A OUT ik bit is reset), then it checks thestatus of its neighbors in order defined by table (table withcontains indexes of the neighbors related with them bygreatest value of weight), according to the formula:where: H is a Heaviside function (equal to 1 if its argument isgreater than zero, and zero otherwise), AL is an activationlevel, if AL >0then node (i,k) assumes a label from its activeneighbor.If GI is in active state (“1”), node needs activation of atleast two active neighbors otherwise it needs one.2. Finally, if AL > 0, node changes its status to active one(A OUT ik bit is set) and sets its output label signal L OUT ik .(3)(4)ConclusionProposed digital network model has the following advantageswhen compared to analogue version:• All network nodes are exactly the same; there is no problemof technological parameter scattering and technologyinaccuracies. Thus, the node tuning is not needed;• Network circuit scalability, relatively chip easy design usingHardware Description Language and its implementation asPLD circuit;• Simpler control of segmentation process, additional informationabout number of pixels in each image object;• Possibility of implementation of different image processingfunctions, like edge detection or morphological operationsby changing definition of network weights;• Larger circuit resistance for external (synchronous operation)and internal (propagation of oscillations may influencedisabled oscillators in analogue chip) distortions.The possible drawback of digital chip can be speed of segmentation.Contrary to analogue one, where segmentationtime depends only on oscillator characteristics, in digital realizationthis time depends on number of clock cycles neededfor image object analysis. Thus, image size; number of objectsand object shape will strongly influence this process. Ofcourse, the segmentation time is mainly depending on selectedPLD chip frequency.Simulations of digital oscillator network show its correctoperation in case of binary image segmentation. Furtherworks will concern the modification of network weights in orderto perform segmentation of grey level images.References[1] Çesmeli E., Wang D.: Texture Segmentation Using Gaussian-Markov Random Fields and Neural Oscillator Networks. IEEETransactions on Neural Networks, 12, 2, 2001, pp. 394-404.[2] Kowalski J., Strzelecki M., Majewski P.: CMOS VLSI Chip of NetworkOf Synchronised Oscillators: Functional Tests Results.Proc. of IEEE Workshop on Signal Processing 2006, Poznan,Poland, pp. 71-76.[3] Strzelecki M., Kowalski J., Majewski P., Kim H.: SynchronizedOscillator Network ASIC CMOS Chip for Segmentation of BinaryImages. Proc. of the 6th International Workshop on MultimediaSignal Processing & Transmission, 20.11.06, Chonbuk NationalUniversity, Jeonju, Korea, pp. 113-122.[4] Wang D. Ternan D.: Image segmentation based on oscillatorycorrelation. Neural Computation, 9, 1997, pp. 805-836.[5] Brylski P., Strzelecki M.: Network of Synchronized Oscillators - DigitalApproach. NTAV / SPA 2008, Poznan, Poland, pp. 161-164[6] http://www.xilinx.com/products/virtex5/index.htm last visited December2008.[7] Skahill K.: VHDL for Programmable Logic. Addison-Wesley 1996.[8] Pedroni Volnei A.: Circuit Design witch VHDL. MIT Press 2004.50 ELEKTRONIKA 3/<strong>2009</strong>


DVB-T2 - the new digital terrestrial television standardcomparison with DVB-T(DVB-T2 - nowy standard naziemnej telewizji cyfrowej porównanie z DVB-T)mgr inż. MARCIN DĄBROWSKI, prof. dr hab. inż. JÓZEF MODELSKISelected abbreviationsWarsaw University of Technology, Institute of RadioelectronicsBCH Bose and Ray-ChaudhuriCC Convolutional CodeCD3 Coded Decision Directed DemodulationDVB Digital Video BroadcastingDVB TDVB system for terrestrial broadcastingDVB T2Second generation of DVB system for terrestrialbroadcastingEIT Event Information TableFEC Forward Error CorrectionHP High PriorityIP Internet ProtocolLDPC Low-Density Parity CheckLP Low PriorityMISO Multiple Input Single OutputPAPR Peak-to-Average Power RatioPLP Physical Layer PipeRS Reed-SolomonTFS Time-Frequency SlicingTS MPEG Transport StreamDVB-T along the past decade has shown it may be a sucessfulreplacement of analog terrestrial broadcasting and thanksto that standard SD, HD and interactive services appeared inmany households throughout Europe. However the physicaland the transport layers defined in the DVB-T standard fromtoday’s perspective seem to be rather outdated.The DVB forum have approved the DVB-T2 standard proposalas a DVB BlueBook, which was published in June 2008.After that the document has been sent to ETSI in order to beapproved and published as a European standard. This workflowenabled development of broadcast and receiving equipment,which is currently being done, before issuing a formalstandard. The publication of the standard is scheduled on April25, <strong>2009</strong>, however early demonstrator devices were presentedduring IBC 2008 exhibition.ModulationIn order to provide more flexibility and more options for tradeoffsbetween throughput and robustness, new constellation256-QAM and new numbers of subcarriers of 1K, 16K and32K, so called FFT sizes, have been specified in DVB-T2.Note that in order to preserve throughput, the bigger the numberof subcarriers, the shorter frame durationis. Thus the newFFT sizes allow longer channel impulse response, then morerobust SFN networks.The DVB-T option of hierarchical transmission of independenthigh-priority and low-priority TSs is no longer supportedin DVB-T2. Thus non-uniform constellations (example in Fig. 1)of DVB-T are no longer an option in DVB-T2. Note that in thenewer standard we may use different PLPs to transmit separateTSs. Those PLPs may be transmitted using different constellationsand coding, which is signaled in base-band headers.Fig. 1. Example of non-uniform modulation (16-QAM) for hierarchicaltransmission in DVB-T, no longer supported in DVB-T2Rys. 1. Przykład niejednorodnej modulacji (16-QAM) w hierarchicznymtrybie transmisji w DVB-T, nie wspieranym już w DVB-T2PAPR reductionIn DVB-T, no PAPR reduction techniques were implemented,which is a drawback because high OFDM signal amplitudesand clipping them at power amplifiers cause nonlinear distortions.In DVB-T2 four options for PAPR reduction have beenapplied:• no PAPR reduction,• ACE (Active Constellation Extension),• RCT (Reserved Carrier Technique),• both methods at the same time.The ACE algorithm has been described in details in thestandard proposal [2]. In brief, the time-domain OFDM signalobtained by modulation of the base-band symbols by IFFT operatoris oversampled, then low-pass filtered and then thresholded.After thresholding it is low-pass filtered again and thendownsampled.In the RCT method, special PAPR reducing subcarrierscalled “dummy carriers” are inserted. They do not carry anyuseful information and may be omitted by the receiver.Constellation rotationConstellation rotation by a constant angle is a new feature inDVB-T2. It is shown in Fig. 2. how constellation rotation enlargesEuclidean distance between constellation points forfaded symbols. Assuming that I and Q channels experienceindependent fades, only one channel is faded badly within onesymbol. In order to achieve such independence, data for I andQ paths are additionally interleaved.Is has been shown that constellation rotation provides gainin fading channels. However assuming a Gaussian channel,constellation rotation gives no gain.ELEKTRONIKA 3/<strong>2009</strong> 51


a)b)the above mentioned rules, the final values of parity bits areobtained by p i = p i ⊕ p i-1 . This kind of parity bit accumulationequations regularity enabled compact LDPC code definition.Without such a property, huge matrices or huge number ofequations must have been published as a part of the standard.The code was designed in such a way that the parity checkmatrix is lower triangular, which makes encoding easier.Fig. 2. Constellation rotation in a QPSK example. Here the Q channelis faded badly and using constellation rotation the Euclideandistance between points in the rotated case (b) is bigger than in thenon-rotated case (a)Rys. 2. Obrót konstelacji na przykładzie QPSK. W tym wypadkukanał Q jest silnie tłumiony. Stosując obrót konstelacji, odległośćeuklidesowa pomiędzy punktami w przypadku obróconym (b) jestwiększa niż w przypadku bez obrotu (a)Channel codingIn DVB-T2 as well as in DVB-T inner and outer channel codingis used. In DVB-T the Reed-Solomon code protects a 188-byteTS packet producing a 204-byte RS codeword and then thepunctured convolutional coding is applied. By standardization ofpuncturing of a basic code of R = 1/2, other values of R may beachieved. In DVB-H, an extension of DVB-T for mobile receivers,additional layer of coding was employed - MPE-FEC.The idea of inner and outer coding is continued in DVB-T2but in this case BCH and LDPC are the outer and inner codesrespectively. The new codes in DVB-T2 resulted in muchlonger codewords comparing with DVB-T, equaling eitherN LDPC = 16200 or 64800.A systematic LDPC code is used in DVB-T2 both for preambleprotection as well as for useful frame. LDPC codes belongto a class of Shannon-limit approaching codes. In [3] thedefinition of regular LDPC codes has been given in a form ofsimple explanation:• the parity check matrix H has constant row and columnweights,• row and column weights are small compared with thelength of the code,• the number of 1’s common between any two columns is nogreater than 1.The regular LDPC code defined in DVB-T2 is identical tothat in DVB-S2 standard. The code is defined in such a way,that the information bits are divided into groups of 360 bits.For every first bit in such a 360-bit group, i.e. for i 0 , i 360 , …there are parity bit equations defined in the form of a table:MISOIn DVB-T2 a MISO method based on Alamouti scheme hasbeen applied. In this mode there are two outputs from themodulator and they have to be passed to two transmitters.There are several differences to the original Alamouti scheme.The signal passed to the first transmitter remains unchangedand instead of processing two symbols adjacent in time, theDVB-T2 MISO processes two adjacent subcarrier cells ofa single OFDM symbol. The operation is shown in Fig. 3.Fig. 3. Modified Alamouti scheme in DVB-T2Rys. 3. Zmodyfikowany schemat Alamoutiego w DVB-T2Pilot subcarriers and guard intervalsDue to multipath propagation selective fading occurs. In orderto estimate channel frequency characteristics, pilot carriersare inserted. In DVB-T continual pilots (transmitted on fixedsubcarrier positions) and scattered pilots (transmitted on differentsubcarriers according to a given pattern) seem to taketoo much overhead. An algorithm facing this problem was presentedin [4]. It was based on a feedback in channel equalization.In this approach every symbol constellation on everysubcarrier is regenerated in the receiver, after the channel decoderblock. After the FEC we may reconstruct constellationpoints that have been likely transmitted. Comparing those with[dB]100-10a)Tabl. 1. LDPC parity accumulator equations example for R = 1/2 andN LDPC = 64800Tab. 1. Przykład równań akumulacji bitów parzystości kodu LDPC dlaR = 1/2 i N LDPC = 6480054 9318 14392 27561 26909 10219 2534 859755 7263 4635 2530 28130 3033 23830 3651...-20-30-40-50-60100-101K2K4K8K16K32Kb)Table 1 is interpreted as:Row 1: p 54 = p 54 ⊕ i 0 , p 9318 = p 9318 ⊕ i 0, p 14392 = p 14392 ⊕ i 0,p 27651 = p 27651 ⊕ i 0, p 26909 = p 26909 ⊕ i 0, p 10219 = p 10219 ⊕ i 0, p 2534= p 2534 ⊕ i 0, p 8597 = p 8597 ⊕ i 0Row 2: p 55 = p 55 ⊕ i 360 , p 7263 = p 7263 ⊕ i 360, p 4635 = p 4635 ⊕ i 360,p 2530 = p 2530 ⊕ i 360, p 28130 = p 28130 ⊕ i 360, p 3033 = p 3033 ⊕ i 360,p 3651 = p 3651 ⊕ i 360For all other bits in the 360-bit groups i.e. i 1 , i 2 , …, i 361 , i 362 ,…, the same equations as in Table 1 are used but with shiftedp indices by a specified value given in the norm. After applying-20-30-40-50-602K4K8K-8 -6 -4 -2 0 2 4 6 8 [MHz]Fig. 4. Power spectral densities of DVB-T2 (a) and DVB-T (b) signalsin 8 MHz channels all possible FFT sizesRys. 4. Widmowe gęstości mocy sygnałów DVB-T2 (a) oraz DVB-T(b) w kanale o szerokości 8 MHz dla wszystkich możliwych liczbpodnośnych52 ELEKTRONIKA 3/<strong>2009</strong>


eceived constellation points, we may estimate channel characteristicsfor every subcarrier. In [5] a method for reductionnumber of pilots was proposed. In DVB-T2 the CD3 algorithmhas been applied leading to reduction of number of pilots.What is more, contrary to DVB-T, many pilot patterns with differentpilot density may be used. The currently used pilot patternis being signaled in DVB-T2.Framing and transport capabilitiesIn order to preserve DVB-T2 transparency to upper layers,Physical Layer Pipe concept has been introduced. Note thatthrough DVB-T we can transmit one TS in non-hierarchicalmode and HP TS and LP TS in hierarchical mode.In the case of a single MPEG TS to be transmitted, the broadcastingnetwork operator may use single PLP and encapsulatea TS in it. Each PLP may take a format of a TS or threetypes of generic streams:• GSE (Generic Encapsulated Stream) for transport ofgeneric packetized streams,• GCS (Generic Continuous Stream) where packet boundariesare not known by the modulator• GFPS, another option for packetized streams, defined topreserve compatibility with DVB-S2.The signalling of stream type is defined in Base-band Headers.In multiple PLP scheme, PLPs are divided into their separateand common parts, called PLP(n) and Common PLP respectively.The common PLP may be useful for PSI/SItransport of multiple Transport Streams in order to preventrepetition of e.g. electronic program guide (EPG) transmittedin EIT tables.In consequence of introducing the PLPs, a new multiplexinglayer emerged. Note that for traditional TS-carrying systems,like DVB-T, multiplexing is performed in TS layer only.With PLPs we may decide which stream shall go throughwhich PLP, thus a new layer of multiplexing emerged. Notethat the above-mentioned multiplexing capabilities may be implementedin transmitters with multiple TS and IP inputs.Organization of OFDM framing resembles the one fromDVB-T. Again we have frames consisting of a specified numberof OFDM symbols. A number of frames constitute a superframe.OFDM symbols contain useful parts of duration T Uand guard intervals of duration ∆, which are cyclic continuationsof useful parts and are placed before the useful part.However in DVB-T2, some combinations of FFT size andguard interval durations are not allowed, whereas in DVB-Tall combinations are possible. In completely non-multipathpropagation environments there is no point of using guard intervals,which causes throughput losses. Thus. A DVB-T2broadcasting network may be precisely tailored to assumedpropagation conditions.In DVB-T the only signalling data is transmitted within dedicatedsignalling sub-carriers TPS (Transmission ParameterSignalling). In DVB-T2 the signalling mechanism is muchmore complex as there are more transmission parameters.Time-Frequency SlicingIn DVB-T only one RF channel could be reserved for onebroadcast and that channel must be a continuous segment ofspectrum. In DVB-T2 quite a revolutionary idea of Time-Frequency-Slicinghas been standardized. It is a new to thebroadcast technology method of frequency hoping and reservingmore channels for a single TV broadcast. In TFS thereserved channels may not be adjacent. In this mode PLPsare divided into subslices and those are sent over a numberof radio channels. Thus one input stream is interleaved bothover time, OFDM subcarriers and now additionally over RFchannels. Minimum frequency hoping time must be preservedin order to get AGC and PLL locks in the receiver. If the numberof tuners in the receiver equals the number of frequenciesused, no such restrictions are necessary. However in it is expectedthat practical tuners will have two tuners.Tabl. 2. Comparison between DVB-T2 and DVB-TTab. 2. Porównanie DVB-T2 z DVB-TQuality DVB-T2 DVB-TModulationGuard intervalsConstellationrotationFFT sizeExpected improvementIt is estimated that in an average case, the throughput gain ofDVB-T2 over DVB-T will equal around 30%. However in [4] itis expected that a DVB-T single-frequency network transmittinga 19.91 Mbps stream with 64-QAM, 8k, ∆/T U = 1/4, R =2/3 may be replaced by a DVB-T2 broadcast of a 33.3 Mbpsstream with 256-QAM, 32k, R = 3/5, ∆/T U = 1/16. In this casethe throughput improvement would equal 67%. However networkplanning criteria, including the required field strengths,are still not known for DVB-T2. For that we have to wait untilconsumer tuner and demodulator chips show up at the market.ReferencesBPSK (signalling only)QPSK16-QAM64-QAM256-QAM1/32, 1/16, 1/8, 1/4,1/128, 19/128,19/256Yes, optional1K, 2K, 4K, 8K,16K, 32KDBPSK (signalling only)QPSK16-QAM(uniform and non-uniform)64-QAM(uniform and non-uniform)1/32, 1/16, 1/8, 1/4[1] ETSI EN 300 744 V1.6.1, Digital Video Broadcasting (DVB); Framingstructure, channel coding and modulation for digital terrestrialtelevision. ETSI, <strong>2009</strong>.[2] DVB Document A122, Frame structure, channel coding and modulationfor a second generation digital terrestrial television broadcastingsystem (DVB-T2). DVB, 2008.[3] Lin S., Costello D. J.: Error Control Coding. Pearson PrenticeHall, 2004.[4] Morello A.: Lo standard DVB di seconda generazione per l’HDTV.Centro Ricerche e Innovazione Tecnologica, RAI, 2008.[5] Mignone V., Morello A.: CD3-OFDM: a novel demodulationscheme for fixed and mobile receivers. IEEE Transactions onCommunications, vol. 44, September 1996.NoInner coding LDPC CCOuter coding BCH RSPAPR reduction Yes, optionalTransportTS or generic continuousor packetizedstreams2K, 8K,(4k in Annex F)NoMISO Yes, optional NoTime-frequencyslicingYes, optionalTS or in hierarchicalmode HP TS nad LP TSNoELEKTRONIKA 3/<strong>2009</strong> 53


Novel techniques applied to biometric humanidentification(Nowe metody w biometrycznej identyfikacji osób)dr inż. MICHAŁ CHORAŚUniversity of Technology and Life Sciences, Institute of Telecommunications, BydgoszczBiometrics methods of human identification have gained muchattention recently, mainly because they easily deal with mostproblems of traditional identification. In biometrics humanidentification systems users are identified by who they are, notby something they have to remember or carry with them. Infact, only biometrics methods truly identify humans, not keysand cards they posses or passwords they should remember.Nowadays, there are many well-known, already implementedmethods of human identification (face, iris, retina,etc.), but still novel and innovative solutions are proposed andneeded. Such situation is most apparent due to a large-scalebiometrics problem, where even very successful methods failin real-life security systems, such as access control in airports.Even strong methods with errors of FNMR = 2% causeproblems when deployed in a large scale: for 100 000 passengersa day, such error effects in 2000 false rejects per day!The problem is that 99,99% accuracy in laboratory conditionsdoes not result in the same accuracy and efficiency in a largescale and non-controlled, real-life environments. So far thescaling issues in biometrics are not formalized or solved.Therefore, to cover up for possible errors, other biometricmodalities should be used, so that the overall accuracy andreliability of the hybrid systems is higher. Even though, thesenew emerging methods do not give results comparable withface or fingerprint systems, still such methods may improveaccuracy of the hybrid systems, especially for people forwhom standard systems fail to be effective.Some of the new biometrics modalities are: human scentrecognition, EEG biometrics, skin spectroscopy, finger-veinsand finger-nails recognition.Currently, new and unusual prints left at the crime-sceneare taken into account by the police and forensic specialists.Such novel procedures include earprints, noseprints, forehead-printsas well as shoeprints [1-3].In the following sections lips and palmprint recognition aswell as 2D ear biometrics are discussed. We propose novelfeature extraction methods from lips, palm and ear imagesand we discuss the achieved results.For example in a pioneer of cheiloscopy and otoscopy professorJ. Kasprzak defined 23 lip patterns [1].Such patterns (lines, bifurcations, bridges, pentagons,dots, lakes, crossings, triangles etc.) are similar to fingerprint,iris or palmprint patterns. However, in image analysis computerrecognition system, such features cannot be used sinceit is hard to extract them from acquired images.Therefore in our approach we do not use lipprints features,but we focus on characteristics extracted from lip/face images.Then we calculate color features of the masked out lipsand we merge them with shape features of the binarized lips.We calculate color statistics and moments as well as a set ofstandard geometrical parameters and the moments of Huand Zernike.We calculate statistical color features in three types ofcolor spaces: RGB, HSV and YUV.Features are calculated separately for each channel inthe used color spaces. Moreover, we use the MONO channelof the monochromatic image.The final feature vector describing lips consists of: 7 Humoments, central moments, moments of Zernike, 10 standardgeometrical parameters, statistical color features in RGB, YUVand in HSV color spaces [4]. Moreover, we added 9 originalgeometrical parameters developed especially for lips shapebiometrics [5].In the experiments we used our own database of lowerface images. We acquired 3 images per person. Databaseused in our experiments consists of 3 images from 38 people(114 images).So far the major problem of our system is the lips detectionstep. We detect lips easily from face images captured especiallyfor lip recognition project (lower face only - Figure 1).Lips biometricsOne of the most interesting emerging method of human identification,which originates from the criminal and forensic practice(cheiloscopy), is human lips recognition [1].The fact that lip features may be unique for humans havebeen confirmed by Yasuo Tsuchihasi and Kazuo Suzuki intheir studies at Tokio University (1968-1971). They examined1364 subjects form 3 to 60 years of age of both genders. Theirresearch proved that lip characteristics are unique and unchangeable(stable) for each examined person [2].Lip prints characteristics have been successfully used inforensics experts and criminal police practice. While examininghuman lips characteristics, most often, the anatomical patternson the lips are taken into account.Fig. 1. Lips images samples from our lower-face databaseRys. 1. Przykładowe obrazy ust z naszej bazy danych54 ELEKTRONIKA 3/<strong>2009</strong>


Fig. 2. Examples of detected and normalized lipsRys. 2. Przykładowe wykryte i znormalizowane ustaFig. 3. Overview of our novel approach to shape-texture palmprintbiometricsRys. 3. Graficzne przedstawienie naszego nowego podejścia dowydzielania cech tekstury i kształtu z obrazów odcisków dłoniUnfortunately, we struggle with satisfactory lips detectionon other datasets, especially face images from surveillancecameras. However, we have achieved very good recognitionresults for well detected lips images, which motivates our furtherresearch in this area.Palmprint biometricsPalmprint recognition is another biometrics technique originatingfrom forensic science. Palmprint is a perfect biometricidentifier because of its stability and uniqueness. The rich texturefeature information of human palmprint places palmprintas one of the powerful means in personal identification andauthentication [6].Palmprint verification system is one of the most interestingbiometrics approaches which offers significant advantages; itis non-intrusive, user-friendly, requires low spatial resolutionimaging and has stable as well as unique features [7].Palmprints are stable and show high accuracy in representingthe identity of each individual. Thus, they have beencommonly used in law enforcement and forensic environments.Palmprint feature extraction methods are mainly based ongeometrical parameters, lines topology, texture features,Wavelets and Fourier transforms etc.In general palmprint featurescan be divided into three different categories:• point features, which include minutiae features from ridgesexisting in the palm, and delta point features, from delta regionsfound in the finger-root region;• line features, which include the three relevant palmprintprincipal lines, due to flexing the hand and wrist in the palm,and other wrinkle lines and curves (thin and irregular);• texture features of the skin.In our palmprint recognition experiments we used bothscanned hands dataset and hands photos dataset. We alsoperformed some experiments on a hand dataset acquired bycellphone with digital camera.Firstly, we perform palm detection and segmentation. We developedoriginal methodology, in which standard square-shapepalm detection is merged with polygon-shape palm detection.Polygon shape detection is based on characteristic (fiducial)hand geometry points detection. Such approach increasedboth detection and recognition efficiency of ourpalmprint biometrics system.After detection, segmentation and normalization (size andorientation) steps, we calculate a set of palmprint texture features(e.g. DWT) and Zernike Moments. Moreover, since wedetect not only square-palm image, but also polygon-shapepalmimages we calculate shape features of detected palmpolygon [8].Fig. 4. Examples of detected polygon-shaped and rectangularpalms for shape-texture palmprint biometricsRys. 4. Przykład wydzielonych odcisków dłoni, zarówno do algorytmuobliczania cech kształtu (wielobok), jak I cech tekstury(kwadrat)3-Type hand biometricsSo far, we have experimented with hand-palm biometric featuresin order to build multimodal biometrics system. Our nextgoal is to enhance hand-palm information with knuckle-biometrics,to create 3-Type-feature biometric system.We are aware of the strong trend to search for perspectiveand novel biometrics methods that can enable to improveidentification rates and can overcome limitations of single biometricssystems.Therefore, we believe that one-sensor (camera) multimodalhand-palm-knuckle biometrics based on shape-textureinformation is a promising direction of biometrics research.Knuckles have not been considered as biometrics so far,apart from the work by Morales et. al. [9]. We decided to examineif knuckles texture information may improve the effectivenessand reliability of our hand-palm system.So far we have developed an algorithm to detect and segmentknuckles from the hand image.Now, we perform intense research to select best featuresfor knuckles recognition. We mainly focus on texture featuresand Zernike moments features. Another trend in a biometricscommunity is to use mobile-phones and handhelds cameraimages in biometrics systems and applications.Therefore, now we create 3-Type (hand + palmprint +knuckles) image database acquired by mobile-phones. Weplan to use such images in our further research in order tocreate mobile identification application.ELEKTRONIKA 3/<strong>2009</strong> 55


Furthermore, in ear biometrics there is no need to touchany devices and therefore there are no problems with hygiene.Even though ear biometrics have not been implementedcommercially so far, there are some known methodsof feature extraction from ear images.Recently, ear biometrics has gained some interest andseveral ear identification methods based on image analysishave been proposed [15]. The full coverage and surveys ofear biometrics methods are presented in [16,17]. It is noticeablethat even though all of the proposed techniques are developedto solve the same image processing task, manytotally different methodologies and algorithms have been developed.Such situation proves that ear biometrics latelygained much interest and popularity in computer science community.It also may be the indication that ear biometrics willbecome one of a standard means of human identification inunimodal or hybrid biometrics systems.ConclusionsFig. 5. Examples of detected knuckles images for 3-Type hand biometricsRys. 5. Przykład wykrytych kostek dłoniEar biometricsEar biometrics is an example of recently termed as “emerging”biometrics method that has now matured and became widelyrecognized in a community.The human ear is a perfect source of data for passive personidentification in many applications. In a growing need forsecurity in various public places, ear biometrics seems to bea good solution, since ears are visible and their images can beeasily taken, even without the examined person’s knowledge.Then the robust feature extraction method can be applied todetermine personality of individuals, for instance users of accesscontrol system or terrorists at the airports and stations.Human ears have been used as major feature in forensicscience for many years (for example in airplane crashes).Earprints, found on the crime scene, have been used as aproof in over few hundred cases in the Netherlands and theUnited States. Nowadays, police and forensic specialists useearprints as a standard proof of identity [10-12].There are many advantages of using the ear as a sourceof data for human identification. Firstly, the ear is one of themost stable human anatomical feature, as found by Iannarelli[13]. It does not change considerably during human life. Furthermore,the ear is one of our sensors, therefore it is usuallyvisible (not hidden underneath anything) to enable goodhearing. It is also important that ear biometrics is also highlyaccepted biometrics by users in possible access control applications.According to users, ear biometrics is less stressfulthan fingerprinting. Moreover, our test users admitted thatthey would feel less comfortable while taking part in face imagesenrolment (people tend to care how they look on photographs)[14].In the article we presented various approaches and solutionsto a problem of human identification for automated biometrics,criminal and forensics applications. We proposed novel methodsof feature extraction from lips, palmprint and ear images.After experiments we may conclude that these emergingmethods, originating from manual criminal and forensic applications,may be used in automated computer vision humanidentification systems.Since most of the well-known biometrics human identificationmethods have some drawbacks, the idea of buildingmultimodal (hybrid) biometrics systems is gaining lot of attention.Due to its advantages lip, palmprint and ear biometricsmight support other methods such as iris, fingerprint or facerecognition.References[1] Kasprzak J., Leczynska B.: Cheiloscopy. Human Identificationon the Basis of Lip Prints (in Polish). CLK KGP Press, Warsaw,2001.[2] Tsuchihasi Y.: Studies on Personal Identification by Means of LipPrints. Forensic Science, 3:3, 1974.[3] Huynh C., de Chazal P., Flynn J., Reilly R. B.: Automatic Classificationof Shoeprints for use in Forensic Science. In: Proc. ofthe Irish Machine Vision and Image Processing Conference,Dublin, Ireland, 2004.[4] Choraś M.: Human Lips as Emerging Biometrics Modality. In A.Campilho and M. Kamel (Eds.): Image Analysis and Recognition,ICIAR 2008, LNCS 5112, 994-1003, Springer-Verlag, 2008.[5] Choraś M.: The Lip as a Biometric. Pattern Analysis and Applications,online first, <strong>2009</strong>.[6] Chen, J., Zhang, C., Rong, G., Palmprint recognition usingcrease. Proc. Intl. Conf. Image Process., 234-237, Oct. 2001.[7] You J., Li W., Zhang D.: Hierarchical Palmprint Identification viaMultiple Feature Extraction. Pattern Recognition, 35, 847-859,2002.[8] Kozik R., Żelek A., Choraś M.: A Novel Shape-Texture Approachto Palmprint Detection and Identification. In Proc. Intelligent SystemsDesign and Applications, ISDA ‘08, 638-643, IEEE CSPress, Kaohsiung, Taiwan, 2008.[9] Morales A., Ferrer M. A., Travieso C. M., Alonso J. B.: A knucklestexture verification method in a transformed domain. In:Proc. of 1st Spanish Workshop on Biometrics (on CD), Girona,Spain, 2007.[10] Kasprzak J.: Polish Methods of Earprint Identification, The InformationBulletin for Shoeprint/Toolmark Examiners, vol. 9, no. 3,20-22, 2003.[11] Kasprzak J.: Forensic Otoscopy (in Polish). University of Warmiaand Mazury Press, 2003.[12] Pasescu G., Tanislav E.: Person Identification on the Basis of Earprintsin the Activity of Bucharest Police Department. InformationBulletin for SP/TM Examiners, vol. 3, no. 3, September 1997.56 ELEKTRONIKA 3/<strong>2009</strong>


[13] Iannarelli A.: Ear Identification, Forensic Identification Series. ParamontPublishing Company, 1989.[14] Choraś M.: Ear Biometrics in Passive Human Identification Systems.Proc. of Pattern Recognition in Information Society, IN-STICC Press, 169-175, 2006.[15] Choraś M.: Perspective methods of human identification: EarBiometrics. Opto-Electronics Review, vol. 16, no.1, 85-96, 2008.[16] Choraś M.: Image Feature Extraction Methods for Ear Biometrics- A Survey. Proc. of 6th International Conference on Computer InformationSystems and Industrial Management Applications(CISIM’07), IEEE CS Press, 261-265, Elk, June 2007.[17] Hurley, D. J., Arab-Zavar, B., Nixon, M. S.: The Ear as a Biometric.In Proceedings of Eusipco’07, pp. 25-29, Poznan (2007).Real-time procedures for automatic recognitionof road signs(Procedury rozpoznawania znaków drogowych w czasie rzeczywistym)dr inż. PAWEŁ PAWŁOWSKI, mgr inż. DAWID PRÓSZYŃSKI,prof. dr hab. inż. ADAM DĄBROWSKIPolitechnika Poznańska, Katedra Sterowania i Inżynierii SystemówIn our age of mass concentration of heavy traffic, road signsbecome a very important element of our everyday life. Theyare a kind of visual language for drivers as they can even representcurrent traffic circumstances, show dangers, and warnagainst difficult situations. In order to shorten the drivers’ reactiontime to the information contained in a road sign, whichcan be of primary importance, a system for automatic and reliableroad sign recognition in real time should nowadays beconsidered as an important drivers’ aid. By this means theroad transportation may be revolutionized in near future dueto a guarantee of efficient navigation and safety driving. However,realization of such system is still a challenge for signal/informationprocessing scientists and engineers.The prototype road sign identification system proposed inthis paper is based on a combination of artificial intelligenceand digital image processing. The main requirement for its realizationis operation in real time. Thus in this paper we aremainly focusing on effective information processing techniques.Their optimization, although important, is not of essentialpriority in this paper.Road signs present specific color information like, e.g., redborder and yellow background for warning signs or blue backgroundand white symbols for information signs. This is a keyfeature that algorithm can rely on. On the other hand, perceptionproperties of colors may vary depending on lightingconditions, weather conditions, and camera recording settings.Of course there are techniques (e.g., advanced colorspaces) that are able to manage with this kind of difficulties,but to explicitly overcome this problem we will use the shapedescriptive information. Having a sure sign-candidate we areextracting its interior and recognize the main informative symbolusing an artificial neural network (ANN).Image acquisitionFor the purpose of this project, a professional camcorderCanon XL2 (with XL 5.4-108 mm L IS f/1.6 lens) was used. Itwas mounted on a tripod attached to the passenger seat onthe right hand side to the driver.Video signal was recorded in the PAL standard (720 x 576pixels) [1] with the camera adjusted to the lowest availablefocal length. Wide angle is essential as the image shouldcover the required visual field and register signs that appearclosely nearby the car front (e.g., when approaching thecrossroad or coming out of corner).The exposure time should be short enough to avoid motionblur (caused by higher speed of the car) and to guaranteesharp and clear sign capturing. Taking advantage of theshutter speed, it is recommended to use the progressivemode of registration rather than the interlaced mode - after allwe do not need video to be smooth, because we will be workingonly with single frames. There is an additional benefit ofthe progressive mode - we do not need any interpolation filter.Furthermore, the optical image stabilization built-in thecamera lens, is another feature that improves the quality ofrecording.Indexed color imageDuring processing the separated frames on a computer, wewere generally working with 24-bit RGB color space (8-bitsper component channel). This gives us 16 777 216 possiblecolors. However, there is no need to process such a bigamount of data, as we especially want to focus on a few essentiallyrelevant hue ranges only.In the PAL standard (CCIR-601/ITU-R 601 recommendation)the image is composed of 720 x 576 = 414 720 pixels,thus there is maximally this amount of colors present in a singleimage out of the palette of over 16 million 24-bit RGB colors.However, this is still a far too big number to efficientlyoperate with, in our task.In order to achieve a good performance of computing, wehave proposed a quite smart procedure for the reduction ofthe number of colors to a specific reduced count say n usingthe so-called minimum variance quantization (MVQ) [2]. MVQworks by associating pixels into groups basing on the variancesbetween their color values. For example, a set of pixelsmight be grouped together, if none of their color valuesELEKTRONIKA 3/<strong>2009</strong> 57


Fig. 2. Statistical ROI (in red borders)Rys. 2. Statystyczny obszar istotności ROI (w czerwonych ramkach)Fig. 1. Illustrative pair of road signs: the source frame is in the lefthand side and its MVQ palette version reduced to 128-colors is inthe right hand sideRys. 1. Przykładowa para znaków: po lewej stronie obraz oryginalny,a po prawej stronie wersja obrazu po kwantyzacji do reprezentacji128-kolorowejexceed the center pixel color value of this group by say x. Duringsuch optimization of the amount of data to process, butkeeping the amount of the properly recognized signs as highas possible, we have decided to use palettes of 128 colors ineach frame. Figure 1 presents an MVQ example for a pair oftwo illustrative road signs. We can notice, that the proposedprocedure for reduction of the number of colors not only reducesthe amount of the required computations but it also reducesthe undesirable noise in the image and thus makes thecorrect sign recognition easier and more reliable.The result of this operation should be specifically formedto give us an indexed image. Indexing [2,3] is a practical wayof representing color images. The image is stored in two arrays.The first array has the same size as the original image,e.g., (720 x 576) for the PAL standard and contains one numberfor each pixel (the color index from the range defined bythe size n of the second array). The second array (table),called the color map or palette, contains definitions of n colorsconsisting of three (typically 8-bit) numbers (components) foreach color. Thus the color map is composed of (3 x n) 8-bitnumbers. The number in the first array describes, which colorof the palette should appear in place of this number in the finalimage visualization. This kind of image representation savesmemory and provides an efficient way for processing. Thusan indexed image (with 128-colors) uses ca. three times lessmemory than the standard 24-bit RGB image.Statistical region of interest (ROI)All features of road signs are formally determined in nationaland international traffic regulations. Using data from the relevantdocument it is possible to foresee positions and sizes ofroad signs that we can expect to capture on the input record.Fig. 3. Real world scene with ROI overlaidRys. 3. Nałożenie ROI na przykładową scenę materiału testowegoThen, following this information, we were able to outline theregion, in whose bounds the image should be analyzed(Fig. 3), i.e., the region of interest (ROI).Another, more practical, way of specifying the ROI is thestatistical analysis of the recording (Fig. 2). First by manualrecognition of road signs we were assigning their recognitionpositions and then we could define the (global) best recognitionposition (BRP), which we took as the ROI.As it is shown in Fig. 3 there are in fact two distinct ROIparts. Their location seems to agree with the standard positionsof the road signs in right hand side traffic countries. Typically,there are more signs on the right hand side of the roadthan on the left hand side. The right ROI part is bigger, as thesigns on the right hand side of the road remain statisticallylonger in the BRP and that their views are bigger at the end,i.e., when they are leaving the BRP. A real world scene exampleis presented in Fig. 3.Color spacesWhen we analyze recognition of colors, we have to discusstwo matters: representation of colors and their appearance.The main color representation method by RGB components[1,3-5] do not provide any simple method to analyze color appearance.For example, if we increase green by any value,and reduce blue by the same value, the luminance does notstay the same. The reason is that green appears muchbrighter than other colors for humans and that the RGB spacedoes not describe relations of this kind. The RGB mappingdoes not also create a color space with perceptually similar58 ELEKTRONIKA 3/<strong>2009</strong>


colors near to each other. Thus distances defined in the 3DRGB space can hardly be interpreted in perceptual color differences.In result, using the RGB components is inconvenientto describe perception of a specific color range, e.g., theyellow background of warning signs.A major step forward in the description of the color appearanceare HSV and HSI color spaces [3]. They are considerablycloser (than RGB) to the way the humansexperience, define, and describe color sensations. HSVstands for hue (shade, tint), saturation (vividness), value(brightness) while HSI - for hue, saturation, and intensity.Other concepts are CIELAB and CIELUV [1]. Both systemsattempt to provide a more perceptually uniform colorspaces basing on CIE (International Committee on Illumination)colorimetry. Both consist of one L (luminance) elementand two factors that represent the chrominance.Another problem related to the color spaces is that illuminationsource varies not only in intensity, but also in color.Even the daylight is changing depending on cloudiness, sunheight or weather, not to mention the artificial light illumination.To unambiguously describe the exact hue we have to usea color space that is illumination-invariant. That is why wewere using a special approach to modeling colors namely thenovel color appearance model CIECAM02, recently recommendedby CIE [6,7].CIECAM02 (new version of CIECAM97) provides a largenumber of features and functionality that tries to model howhumans perceive the color of an object under different lightingconditions and with different backgrounds. CIECAM02 modelsall these surround and background effects and provides perceptualcorrelates for brightness, colorfulness, and saturation.It can also predict certain luminance-dependent effects. Itmakes possible to make a system that can automatically selecta conversion preset and accommodates (dependent one.g. the weather).CIECAM02 takes for its input the tristimulus values [7] ofthe stimulus, the tristimulus values of the adopting white point,adopting background and surround luminance information.For the first experiments described in this paper we usedCIECAM conversion for average daylight with CIE standardilluminant D50 as the reference white. Output of theCIECAM02 transformation is represented by JCh (J - lightness,C - chroma and h - hue) matrix.Of course, in practice, the best solution is to use severaldifferent color spaces and to examine them separately. By reducingthe number of colors and forming an indexed imageas described in section 3, conversion to various color spacesmay strongly differ in efficiency. During the investigations tendifferent distributions of color converters were tested and thefastest one was chosen.For a standard PAL RGB image we need 720 x 576 =414 720 color conversions but for the indexed image the numberof these operations is reduced to the size of the color map,i.e., to 128 in our case. Thus the computing efficiency is increasedby more than three thousand times. For such an advancedtransformation as the RGB to CIECAM02 conversion,this is indeed a great saving of the processing power.In our approach the color segmentation is based on doublethresholding [3,4] with upper and lower threshold values.These values were experimentally chosen for each road signcolor and each channel of all considered color spaces independently.As a final mask for the sign-candidates we were usinga combination of outputs of all threshold operations (Fig. 4e).Additional segmentationSometimes as a result of previous operations we receive a region,which contains a sign connected with some trash - objectsor even two or more signs connected together. Colors ofFig. 5. Distance transform exampleRys. 5. Przykład transformaty dystansowejFig. 4. From top to bottom and left to right: the original image, yellowcolor thresholding in three JCh color space channels, final yellowmaskRys. 4. Z góry na dół i z lewej do prawej: obraz oryginalny, progowaniekoloru żółtego w trzech kanałach przestrzeni JCh, końcowamaska dla koloru żółtegoFig. 6. From left to right: the input merged object, its binary mask,the distance transform, the result of watershedingRys. 6. Od lewej do prawej: sklejony obiekt wejściowy, jego maskabinarna, transformata odległościowa, wynik algorytmu wododziałuELEKTRONIKA 3/<strong>2009</strong> 59


all these objects can be almost or exactly the same, thus it isimpossible to separate them in a color-based segmentations.In these cases we proposed to use a combination of the distancetransform and the watershed algorithm [3]. The distancetransform of a binary image is the Euclidean distance fromevery pixel to the nearest nonzero-valued pixel (Fig. 5).The second step is watersheding. This algorithm splits animage into areas based on their topology. As a result of theseoperations we obtain a sub-image with correctly separatedobjects (Fig. 6).Shape descriptionIn the next step of our procedure the shape description step,the regions with sign-candidates extracted from the inputimage (according to previous section) are tested using shapedescriptors, to check the shape matching (Fig. 7).By shape description we mean methods that result in a numericvalue descriptor of the specific shape. The goal is touniquely characterize the shape using an appropriate shapedescriptor vector. The required features of appropriate descriptorsshould be invariant to the translation, scale, and rotation.Among many possible descriptors, the so-calledgeometric moments [3-5,8-11] and shape factors [8,9] meetthese requirements in a usable way.All mentioned descriptors were tested with 300 rotationand deformation variants of the basic road sign shapes (circle,rectangle, and triangle).and in order to remove the translational variability we usedthe centralized moments:Moments u pq , where p + q ≥2, can be used to constructdescriptors given by (3) that are invariant to both translationand scale:Using descriptors h pq a set of moments M n , which are additionallyinvariant to rotation can be defined [17]. Thus thesemoments are invariant to translation, scale, and rotation. IndividualM n values do not have enough descriptive power touniquely represent required shapes, but a proper collection ofthem gives results of good quality (Fig. 8).(2)(3)Fig. 8. M 1 (top) and M 7 (bottom) values tested with circles (red), rectangles(blue), and triangles (yellow)Rys. 8. Wartości momentów M 1 (góra) i M 7 (dół) testowane z kołami(czerwony), kwadratami (niebieski) i trójkątami (żółty)Shape factorsShape factors, similarly to the discussed geometric moments,show features, with whose help we are able to express theshape of an object. We took the following factors into account:Fig. 7. Decision tree Rys. 7. Drzewo decyzyjneGeometric momentsThe regular moment of a shape in an M x N binary image isdefined as:(1)where f(x,y) is the intensity of the pixel (either 1 or 0) at the coordinates(x,y) and p + q is the order of the moment in expression(1). We used the centroid coordinates determined as:andFig. 9. W 4 (top), W 6 (middle), and W 9 (bottom) values tested withcircles (red), rectangles (blue), and triangles (yellow)Rys. 9. Wartości wskaźników W 4 (góra) W 6 (środek) i W 9 (dół) testowanez kołami (czerwony), kwadratami (niebieski) i trójkątami (żółty)60 ELEKTRONIKA 3/<strong>2009</strong>


W 1 , W 2 - circulation factors, W 3 - Malinowska factor, W 4 - Blair-Bliss factor, W 5 - Danielsson factor, W 6 - Haralick factor, W 7 -Lp1 factor, W 8 - Lp2 factor, W 9 - modified Malinowska factor,W 10 - Feret factor. These factors use different input data to calculatevalues of the shape, e.g., area, distance between themost distant points, maximal horizontal (vertical) diameter,minimal (maximal) distance of the contour from the center ofmass (COM), contour, distance of boundary pixels from theCOM, amount of pixels of the contour and others. Also, likemoments, they should not be used individually (Fig. 9).Extracting symbolsAt this moment all sign-candidates should be filtered to includeonly the items that have both color and shape similar to thereal road signs. In order to prepare these objects to final recognitionit is necessary to extract the symbol inside (Fig. 10).We introduced ideas to speed-up the recognitionprocess. An important issue towards the performance is toprocess a quotient of images in the sequence. For exampleexamining the motion vectors shows, which frames areworth analyzing and which will probably contribute no significantinformation.We extended the system to recognize not only roadsigns but also horizontal road marking. Our algorithm canrecognize solid or dashed white lines between lanes. Thefirst stage extracts white objects in the bottom part of theframe. Then the Hough transform should be computed [3,4].To properly describe road marking we should find maximumsin the Hough transform, which define positions andorientations of straight lines. Among the found lines we selectedthese, which met the perspective conditions. All relativelyclose and parallel lines were averaged. Finally, thealgorithm computes and highlights up to two lines: one onthe left hand side and one on the right hand side of the currentlane (Fig. 12).Fig. 10. Inside symbol extraction exampleRys. 10. Przykład ekstrakcji symbolu wewnętrznegoSymbol recognitionThe core of the recognition module is an artificial neural network(ANN) [9,12] as one of the main ANN applications is approximationof an arbitrary function with parameters learnedfrom the observed data. This ability is an ideal tool for the advancedshape recognition.In our approach we used a multi-layer feed-forward backpropagationnetwork. The inputs for this ANN were binary pixels(valued 1 or 0) of a symbol extracted as described inprevious section. In addition, the input image was normalizedto 25 x 25 rectangle to be as invariant to noise and other variationsas possible. The network was trained with manuallyprepared data set with a variable number of sign samples.Additional improvementsTaking advantage of video analyzing, it is also possible to exchangesome information between frames (Fig. 11) [15]. Bycreating a feature vector, accessible among different frames,we can increase efficiency of the whole recognition system.Currently we are using an quantitative qualifier, which finallychooses a proper result inside a given set of frames. Maintenanceof features of memory and data propagation needmany computational resources and should be well optimizedto use in the real-time application.Fig. 12. Visualization of detected horizontal road marksRys. 12. Wizualizacja wykrytych linii pasówSummary and future workThe experimental results indicate that the proposed procedureachieves a good recognition rate (effectiveness over 90%) forthe tested types of the road signs. Nevertheless it can still beimproved to decrease the number of false detections and toreduce the total computation time. Thus the future work willbe oriented on the improvement of performance of the realtimesoftware application (Fig. 13) and on the design of thestand-alone system working in hardware, e.g., with a signalprocessor.Fig. 11. Features memory Rys. 11. Pamięć cechELEKTRONIKA 3/<strong>2009</strong> 61


We will also continue the research on optimization of theshape descriptors and the color segmentation methods. Anadditional analysis is recommended to the Fourier descriptors[3-5,10,13,14], which are a potentially powerful tool, thus theyneed to be carefully examined. Testing of ANN’s is also requiredin order to improve the recognition accuracy. In futurewe will try to extend the system to recognize various vehicleson the road [16].Fig. 13. Demo application Rys. 13. Aplikacja testowaReferences[1] Poynton C. A.: Digital Video and HDTV: Algorithms and Interfaces.Morgan Kaufmann, 2003.[2] The MathWorks, Inc., Image Processing Toolbox For Use withMATLAB - User Guide. Version 4, 2003, pp. 370-378.[3] Gonzalez R. C., Woods R. E., Eddins S. L.: Digital Image ProcessingUsing Matlab. Pearson Prentice Hall, 2004[4] Gonzalez R. C., Woods R. E.: Digital Image Processing. PearsonPrentice Hall, 2002.[5] Pratt W. K.: J. Wiley & Sons, Digital Image Processing. 2001.[6] Moroney N., Fairchild M. D., Hunt R. W. G., Li C., Luo M. R.,Newman T.: The CIECAM02 Color Appearance Model. IS&T/SIDTenth Color Imaging Conference.[7] Fairchild M. D.: A Revision of CIECAM97s for Practical Applications.Color Research & Appl. (4), Wiley Interscience 2000, pp.260-266.[8] Tadeusiewicz R., Korohoda P.: Komputerowa analiza i przetwarzanieobrazów. Wydawnictwo Fundacji Postępu Telekomunikacji,Kraków, 1997.[9] Tadeusiewicz R.: Systemy wizyjne robotów przemysłowych.WNT, Warszawa 1992.[10] Qhusro A. A. M.: Invariant object recognition, King Fahd Universityof Petroleum & Minerals. 2004.[11] Shutler J.: Statistical Moments. University of Edinburgh, 2002.[12] Żurada J., Barski M., Jędruch W.: Sztuczne sieci neuronowe -Podstawy teorii i zastosowania. Wydawnictwo Naukowe PWN,Warszawa 1996.[13] Zhang D., Lu G.: A comparative study on shape retrieval usingFourier Descriptors with different shape signatures. Monash University,Australia.[14] Petkovic T., Krapac J.: Shape description with Fourier descriptors.2002.[15] Krüger V.: Integrating Visual Information over Time. Cognitive VisionSystems Workshop, Schloss Dagstuhl, International Conferenceand Research Center for Computer Science, 2003.[16] Krüger V., Kragic D., Geib C., Ude A.: The Meaning of Action:a review on action recognition and mapping. Aalborg Universitet,Copenhagen Institute of Technology, 2007.[17] Pawłowski P., Prószyński D., Dąbrowski A.: Recognition of roadsigns from video. NTAV/IEEE SPA 2008 Conf., Poznań 2008, pp.213-218.Stereowizyjne metody tworzenia wrażeńtrójwymiarowych z obrazów dwuwymiarowychmgr inż. JULIAN BALCEREK, prof. dr hab. inż. ADAM DĄBROWSKI,mgr inż. ADAM KONIECZKAPolitechnika Poznańska, Wydział Informatyki i ZarządzaniaRóżnice między polami widzenia oka lewego i prawego (rozstawoczu ludzkich to ok. 65 mm), tj. między dwoma dwuwymiarowymi,płaskimi obrazami (w skrócie 2D od ang. TwoDimensional), obserwowanymi równocześnie lecz osobnoprzez lewe i przez prawe oko są interpretowane w mózgu w takisposób, że powstaje wrażenie sceny trójwymiarowej (w skrócie3D od ang. Three Dimensional), tzn. zbioru obiektów postrzeganych- zgodnie z rzeczywistą sytuacją - w różnych odległościachod obserwatora [1]. Określa się je mianem wrażeniastereowizyjnego (ang. Stereovision Impression) [2].Interesującą cechą ludzkiej percepcji trójwymiarowościsceny jest to, że pomimo niektórych niekompletnych, a nawet,w pewnym zakresie, niespójnych informacji, jest możliweuzyskanie wrażenia 3D. Dla przykładu, przy użyciu trzechskładowych koloru takich jak RGB można zamodelować prawiecałą widoczną przestrzeń barw. Nawet, jeśli do jednegooka (np. do lewego) dociera tylko pojedyncza (np. czerwona)składowa z obrazu przeznaczonego dla tego oka, a drugie(prawe) oko widzi dwie pozostałe składowe (np. zieloną i niebieską)z obrazu przeznaczonego dla tego właśnie oka, mózgludzki pozwala dostrzec nie tylko efekt trójwymiarowy, aletakże niemal rzeczywiste kolory [3,4].Powyższy efekt 3D może być uzyskany przy obserwacjiodpowiednio przetworzonych dwuwymiarowych obrazów nazywanychanaglifami. W anaglifie składowa czerwona obrazupochodzi z widoku przeznaczonego dla jednego (lewego) oka,a pozostałe dwie składowe pochodzą z obrazu przeznaczonegodla drugiego (prawego) oka. Obserwacji dokonuje sięprzy użyciu okularów o filtrach, np. czerwonym dla lewego okai cyjanowym (błękitnym) dla prawego oka. W tym przypadkuczerwony filtr usuwa niebieskie i zielone składowe z widokudla lewego oka, a filtr cyjanowy usuwa czerwoną składowąz widoku dla prawego oka.Anaglif można łatwo otrzymać z pary obrazów nagranychprzy użyciu aparatu stereoskopowego [5]. Większość zdjęći filmów, z którymi spotykamy się na co dzień, to jednak ma-62 ELEKTRONIKA 3/<strong>2009</strong>


teriały monoskopowe, czyli zarejestrowane za pomocą aparatówbądź kamer z jednym obiektywem i jedną matrycąświatłoczułą. Dlatego istotnym zagadnieniem jest przygotowanieszybkich, mało obliczeniochłonnych, metod do tworzeniaobrazów z możliwie naturalnym i sugestywnym efektem3D z oryginalnych obrazów 2D przy użyciu łatwych do odtworzenia(np. binarnych) map głębokości. W niniejszym artykulezaproponowano kilka prostych alternatywnychrozwiązań tego problemu.Rozsuwanie składowych koloruWierne odwzorowanie 3D wymaga doboru parametrów takichjak: odległość pomiędzy osiami obserwacji, długość ogniskowejkamery referencyjnej i konwergencja [6].Autorzy stwierdzili eksperymentalnie, że efekt 3D pojawiasię nawet podczas prostego przesuwania w obrazie 2D pojedynczejnp. czerwonej składowej koloru w kierunku poziomym.Badania zostały więc rozpoczęte od sprawdzenia, jak takieprzesunięcie składowej lub ogólniej - rozsunięcie składowychwpływa na wrażenie 3D. Po rozsunięciu składowych, boki wynikowychobrazów były jednakowo przycinane z obu stronz dokładnością jednego piksela tak, aby zachować oryginalnąrozdzielczość obrazu. Przykładowe obrazy wynikowe po zastosowaniurozsunięć składowych koloru przedstawiono na rys. 1.Obszar w środkowej części obrazów na rys. 1b i 1c jestwspólny dla wszystkich składowych. W okolicy lewej i prawejkrawędzi obrazu znajdują się pasy ze zredukowaną liczbąskładowych, tj. tylko ze składową czerwoną po jednej stroniei tylko ze składowymi zieloną i niebieską po drugiej stronie.a)W przypadku obserwacji obrazu przy użyciu okularów z filtramiczerwonym i cyjanowym pasy po lewej i prawej stronieobrazu są widziane jako prawie czarne, jeżeli wartość 0 (kolorczarny) jest przypisana dla składowych poza oryginalnym obszaremobrazu (jak na rys. 1). Inna możliwość to przypisaniewartości 255 (kolor biały) poza obszarem oryginalnego obrazu.Odpowiednie pasy są wtedy postrzegane za pomocąokularów z filtrami czerwonym i cyjanowym, jako prawie białe.W przeprowadzonych eksperymentach badane osoby obserwowałyobrazy testowe na monitorze LCD o przekątnej 17cali z odległości 0,75 m od ekranu. W celu uzyskania jak najlepszejjakości obrazów rozdzielczość obrazów testowych byłarówna rozdzielczości monitora i wynosiła 1280 na 1024 piksele.Do eksperymentów przygotowano trzy obrazy testowe.W pierwszym eksperymencie pokazywane obrazy miałyskładową czerwoną przesuniętą w zakresie od 0 do ok. 20%szerokości obrazu (od 0 do 255 pikseli), zarówno w lewo jaki w prawo. A zatem, dla trzech obrazów testowych, w środowiskuprogramistycznym Matlab utworzono w sumie 1533 obrazy.W trakcie tego eksperymentu sekwencje obrazów pokazywanoz rosnącą wartością przesunięcia składowej czerwonej.Badani mieli zdecydować, czy dostrzegają efekt 3D i czyodległość obrazu od obserwatora zwiększa się czy też zmniejsza.W 83% przypadków zaobserwowano efekt trójwymiarowy.Spośród badanych, którzy zaobserwowali efekt 3Dpodczas przesuwania składowej czerwonej w lewo, 92% zauważyło,że odległość pomiędzy obserwatorem, a całą płaszczyznąobrazu, w porównaniu z obrazem pierwotnym,zwiększa się i obraz znajduje się „głębiej w ekranie”. Kiedyskładowa czerwona była przesuwana w prawą stronę, w 67%przypadków badani stwierdzili, że dystans od całej płaszczyznyobrazu zmniejsza się i obraz „wychodzi do przoduz ekranu”. Pozostałe osoby dostrzegły jednak odwrotny efekt.Zaobserwowano, że w czasie zwiększania wartości przesunięciaskładowej, efekt trójwymiarowy stawał się coraz silniejszy,ale jakość obrazu spadała, ponieważ były widoczneartefakty przy konturach obiektów. Począwszy od pewnej wartościprzesunięcia (charakterystycznej dla danej osoby) widzianojuż tylko dwa osobne obrazy bez efektu 3D.W drugim eksperymencie badanym osobom prezentowanooryginalne obrazy i te ze składową czerwoną przesuniętąo 50, 100, 150, 200 i 250 pikseli w obydwu kierunkach(w lewo i w prawo). Dla bardziej wiarygodnych wyników obrazybyły pokazywane w przypadkowej kolejności i losowo po-b) c)Rys. 1. Rozsunięcie składowych koloru: a) obraz pierwotny,b) obraz wynikowy po przesunięciu składowej czerwonej w lewoo 5% szerokości obrazu, c) obraz wynikowy po przesunięciuskładowej czerwonej w prawo o 15% szerokości obrazuFig. 1. Simple color components shift: a) original image,b) anaglyph after red component shift to the left by 5% of the imagehorizontal resolution, c) anaglyph after red component shift to theright by 15% of the image horizontal resolutionRys. 2. Subiektywna jakość anaglifu jako funkcja rozsunięciaskładowych koloruFig. 2. Subjective image anaglyph quality as a function of shiftingcolor componentsELEKTRONIKA 3/<strong>2009</strong> 63


wtarzały się. Badani mieli zadecydować, czy dostrzegają efekt3D i czy dystans pomiędzy płaszczyzną obrazu, a obserwatorempowiększa się, czy zmniejsza w porównaniu z obrazempierwotnym. Badani przyznawali punkty z zakresu od „1” do„3” w zależności od zaobserwowanej jakości obrazu. Najgorszajakość „1” charakteryzowała przypadek z widocznymidwoma osobnymi obrazami tj. bez efektu 3D, wartość „2”oznaczała, że pojawiały się artefakty, a wartość „3” oznaczaładobrą jakość obrazu niezależnie od tego, czy efekt 3D był zauważalny,czy też nie.W rezultacie, spośród badanych osób, które zaobserwowałyefekt 3D podczas przesuwania składowej czerwonejw lewo, w 71% przypadków zaobserwowano powiększającysię dystans pomiędzy badanym, a płaszczyzną obrazu. Kiedyskładowa czerwona była przesuwana w prawo, w 66% przypadkówrównież zaobserwowano zwiększanie się dystansupomiędzy badaną osobą, a płaszczyzną obrazu. Wyniki tegoeksperymentu zilustrowano na rys. 2.Krzywa Q 1 na rys. 2. pokazuje dostrzeżoną uśrednioną jakośćobrazu w odniesieniu do maksymalnej jakości, krzywaQ 2 przedstawia to samo co krzywa Q 1 ale tylko dla przypadkówz zaobserwowanym efektem 3D, a krzywa Q 3 ilustrujestosunek liczby przypadków z zaobserwowanym efektem 3Ddo wszystkich przypadków dla danego przesunięcia składowejczerwonej (tj. o liczbę pikseli równą przes). Parametr przesunięciaprzes został określony w procentach rozdzielczościpoziomej obrazu. Ujemne wartości odnoszą się do przesunięciaskładowej czerwonej w lewo, a dodatnie w prawo.W wyniku eksperymentu stwierdzono, że najlepsze obserwowalneefekty 3D występują w przypadku przesunięcia składowejczerwonej koloru o ok. 5% rozdzielczości poziomej obrazu.Obserwację tę wykorzystano w dalszych rozważaniach.Metody wykorzystujące mapy głębokościStereoskopowe obrazy wymagają informacji o głębokości,które mogą być przechowywane w tzw. mapach głębokości(ang. depth maps). Głębokość można interpretować jako odległośćod obserwatora do obiektu. Mapa głębokości jest obrazemo tej samej rozdzielczości, co oryginalny obraz. Służydo przechowywania informacji o względnej głębokości dlakażdego piksela, czyli każdy punkt mapy głębokości ma wartośćreprezentującą głębokość odpowiadającego mu piksela[7]. W istniejących metodach do automatycznej generacji mapgłębokości dla obrazów używa się wektorów ruchu, detekcjikrawędzi, kolorów i tekstur [8-11].Typowa mapa głębokości jest monochromatycznym obrazemzawierającym 8-bitowe wartości, które można przedstawićjako szarości [6]. Wartość Z max to odległość od oczuobserwatora do najdalszego planu, wartość Z min to odległośćod oczu do najbliższego planu. Zatem odległość Z dowolnegopiksela mieści się pomiędzy Z min i Z max . Wartości te są transformowanedo szarości v z zakresu od 0 do 255, przy czymv = 0 (kolor czarny) charakteryzuje największą wartość odległości,a szarość v = 255 (kolor biały) definiuje najmniejsząwartość odległości według poniższego wzoruν ∈ (1)Mając do dyspozycji 8 bitów można otrzymać 256 poziomówkwantyzacji głębokości (szarości), ale już 20 poziomówkwantyzacji mapy głębokości wystarcza do uzyskania znakomitegoefektu 3D, a w wielu przypadkach wystarczają nawetznacznie bardziej prymitywne mapy głębokości [12].Zaproponowane metody zaprojektowano dla najprostszychtj. binarnych map głębokości zawierających tylko dwie wartościnp. 255 i 0. Takie mapy głębokości mogą być przygotowywaneręcznie za pomocą podstawowych programów graficznych takichjak Paint. Na rys. 3. przedstawiono przykładowy obrazpierwotny i odpowiadającą mu binarną mapę głębokości.Aby uzyskać wrażenie trójwymiarowości, należy zastosowaćrenderowanie oparte na mapie głębokości, tzn. konwersjęmapy głębokości na obrazy dla lewego i prawego oka.Przetwarzanie tylko jednego obrazu z pary obrazów jestłatwiejsze i w wielu przypadkach bardziej efektywne niż przetwarzanieobydwu obrazów, ponieważ uzyskuje się lepszą jakość,ostrość i wiarygodność efektu 3D [13]. Do transformacjiwybrano obraz dla lewego oka, czyli składową czerwoną.Składowe zielona i niebieska (dla prawego oka) pozostają niezmienione.Ta idea jest przedstawiona na rys. 4.a) b)Rys. 3. Przykładowy obraz pierwotny (a) i odpowiadająca mu binarnamapa głębokości (b)Fig. 3. Example of original image (a) and its binary depth map(b)a) b)Rys. 4. Przetwarzanie składowych koloru w obrazie: a) przetwarzaniewszystkich składowych koloru, b) przetwarzanie jedynieskładowej czerwonejFig. 4. Processing of all original image components (a) and of onlyred component (b)Metoda bezpośredniaJak zaobserwowano w czasie przeprowadzania eksperymentów,przesunięcie składowej koloru wpływa na efektgłębokości? Oznacza to, że w celu wygenerowania obrazutrójwymiarowego składowa czerwona powinna być przesuniętao wartość współczynnika zależącego od mapy głębokości.Są jednak dwa problemy: redundancja informacjiw obszarach nakładania się składowych koloru i brakujące informacjew obszarach rozsunięcia składowych koloru w obrazie.Redundancja informacji może być utożsamianaz faktem, że niektóre informacje dostrzegane przez jedno okosą zbędne dla drugiego oka, ponieważ w widoku drugiego okasą przysłonięte przez inne obiekty. Brak informacji pochodzistąd, że jedno oko nie jest w stanie dostrzec obszarów sceny,które są przysłonięte pewnymi obiektami, przy czym te sameobszary sceny w obrazie widzianym drugim okiem nie musząbyć przysłonięte tymi obiektami. Ilustrację tych problemówprzedstawiono na rys. 5.64 ELEKTRONIKA 3/<strong>2009</strong>


W obszarach, w których informacje się nakładają, nadmiarowośćpowinna zostać usunięta, a w obszarach, gdzie brakujeinformacji, powinna być ona uzupełniona. Zaproponowano prosterozwiązanie problemu nadmiarowości - bliższe obiekty sąpokazywane, a dalsze, zakryte przez bliższe - znikają.Trudności z przetwarzaniem obrazu pojawiają się w obszarach,gdzie brakuje informacji o obrazie, czyli w obszarach„dziur” informacyjnych. W eksperymentach z widocznym efektem3D obszary z brakującymi informacjami są postrzeganejako czarne oraz białe obrysy obiektów, w zależności od wersjialgorytmu (rys. 6).W celu uzupełnienia obszarów dziur informacyjnychużywa się typowo asymetrycznego wygładzania (ang. asymmetricsmoothing) [14]. W opisanym przypadku, dla prostychbinarnych map głębokości, zastosowanie tej metody byłobyjednak utrudnione. Autorzy zaproponowali więc inne rozwiązaniewykorzystujące liniową poziomą interpolację wartościpikseli. Do interpolacji i wypełnienia dziur informacyjnychużywa się ostatniego piksela przed i pierwszego piksela poobszarze braku informacji według wzoru:x ∈ (2)gdzie: x 1 -współrzędna pozioma ostatniego piksela przeddziurą informacyjną, y 1 - wartość ostatniego piksela przeddziurą informacyjną, x 2 - współrzędna pozioma pierwszego pikselaza dziurą informacyjną, y 2 - wartość pierwszego pikselaza dziurą informacyjną, x - współrzędna pozioma obszarudziury informacyjnej, y - wartości pikseli po interpolacji.Przykład implementacji tej metody przedstawiono narys. 7., gdzie można bezpośrednio porównać anaglif z dziuramiinformacyjnymi i anaglif z obszarami dziur informacyjnychwypełnionymi obrazem interpolacyjnym.a) b)Rys. 5. Obszary nadmiarowości i braku informacjiFig. 5. Redundancy and lack of informationRys. 7. Anaglif z obiektami przesuniętymi w odniesieniu do mapygłębokości (a) i anaglif po zapełnieniu dziur informacyjnych za pomocąliniowej interpolacji składowej czerwonej (b)Fig. 7. Anaglyph after direct method for depth map based on imagearea shifting (a) and anaglyph after linear interpolation of red componentin information holes (b)Wśród zalet tej metody można wyróżnić:• wypełnione obszary dziur informacyjnych (brak białych lubczarnych obszarów),• efekt głębokości jest dokładnie taki jak zdefiniowano.Zaobserwowano też następujące wady tej metody:• brak efektu gradientowego dla binarnej mapy głębokości,• dziury informacyjne są wypełnione zdeformowanym obrazeminterpolacyjnym.W celu eliminacji problemu powstawania dziur informacyjnychi związanych z nimi widocznych w obrazie 3D fałszywychbiałych i czarnych obszarów na krawędziach obiektów,autorzy zaproponowali dwie nowe, proste metody do tworzeniaakceptowalnych wrażeń 3D z obrazów 2D przy użyciumap głębokości. W obydwu operuje się na poziomych liniachobrazu, dzielonych na segmenty wyznaczane na podstawiewartości głębokości w mapie głębokości.Metoda skalowania segmentów obrazuKażda linia obrazu jest dzielona na poziome segmentyo długościach a i (mierzonych w pikselach), w odniesieniu dowartości mapy głębokości. Otrzymujemy:a 1 , a 2 , a 3 , … (3)Rys. 6. Etapy przetwarzania obrazu w przypadku metody bezpośredniejopartej na przesuwaniu obszarów obrazu w odniesieniu domapy głębokości; obszary dziur informacyjnych są widoczne jakoczarne obrysy obiektówFig. 6. Direct method for depth map based on image area shifting;information holes are seen as black phantomsgdzie suma jest równa y, czyli poziomej rozdzielczości obrazu:a 1 + a 2 + a 3 +… = y (4)ELEKTRONIKA 3/<strong>2009</strong> 65


Długość każdego segmentu jest przemnażana przez wagęw i w zależności od głębokości danego segmentu:a 1 w 1 + a 2 w 2 + a 3 w 3 +… = y N (4)Dla binarnej mapy głębokości występują tylko wagi w 1 i w 2 .W celu przywrócenia pierwotnej rozdzielczości poziomejobrazu y modyfikuje się długości segmentów:(6)Oznaczając długości nowych segmentów jako a i ’ otrzymuje się:Ostatecznie, za pomocą liniowej interpolacji skaluje sięwartości pikseli z segmentów o długościach a i na segmentyo długościach a i ’. Przykładowa implementacja tej metodyw porównaniu z metodą przesuwania segmentów obrazu jestpokazana na rys. 8.Zaobserwowano następujące zalety tej metody:• brak dziur informacyjnych,• naturalny efekt gradientowy uzyskany na podstawie binarnejmapy głębokości z akceptowalnym poziomem zniekształceń,• brak zniekształceń przy krawędziach obiektów.Zaobserwowano też wadę: efekt 3D jest wyraźnie widoczny,ale nie w pełni przewidywalny co do naturalności.Metoda przesuwania segmentów obrazuPodobnie jak w poprzedniej metodzie definiowane są segmentypoziomych linii obrazu o długościach a i :Następnie środki poszczególnych segmentów są przesuwaneo wagi w i ’ przypisane do każdego segmentu w zależności odmapy głębokości:W przypadku binarnej mapy głębokości występują jedyniewagi w 1 ’ i w 2 ’.W kolejnym kroku, długości sąsiednich nakładających sięsegmentów są zmniejszane o połowę długości tychnakładających się obszarów, a obszary dziur informacyjnychsą wypełniane poprzez powiększenie długości sąsiadującychsegmentów o połowę długości obszarów dziur informacyjnychwedług wzoru:Nowe długości segmentów linii to:a 1 ’ + a 2 ’ + a 3 ’ +… = y (7)a 1 , a 2 , a 3 , … (8)w 1 ’, w 2 ’, w 3 ’,… (9)(10)a 1 ’’, a 2 ’’, a 3 ’’, … (11)Ostatecznie, za pomocą liniowej interpolacji skaluje się wartościpikseli z segmentów o długościach a i na segmentyo długościach a i ’’. Przykładowa implementacja tej metodyw porównaniu z metodą skalowania segmentów obrazu jestpokazana na rys. 8.Rys. 8. Porównanie metody skalowania segmentów obrazu z metodąprzesuwania segmentów obrazu dla przykładowego obrazuFig. 8. Comparison of segment scaling method and segment shiftingmethodZaobserwowano następujące zalety tej metody:• brak widocznych dziur informacyjnych,• wyraźny efekt głębokości,• naturalny efekt gradientowy dla binarnej mapy głębokościz akceptowalnym poziomem zniekształceń.Nie zaobserwowano wad tej metody. W serii eksperymentówzaobserwowano, że powyższa metoda daje przyjemnyi naturalny efekt 3D, a zniekształcenia są niemalniedostrzegalne.PodsumowanieUżywając prostych metod polegających na przesuwaniuskładowej koloru można tworzyć anaglify o dobrej jakościizdostrzegalnym efektem 3D. Jest to możliwe dzięki dużejtolerancji ludzkiego zmysłu postrzegania dla różnych rodzajówzniekształceń. Żeby uzyskać akceptowalne efekty 3D, parametrysterujące w obu metodach powinny być dobieraneeksperymentalnie.W przypadku metod bezpośrednich opartych na binarnychmapach głębokości, czyli odpowiednim przesuwaniu składowejczerwonej, usuwaniu obszarów nachodzących na siebiei liniowej interpolacji dziur informacyjnych, zaobserwowanoartefakty w postaci dokuczliwych zniekształceń w okolicachkonturów obiektów.Dwie proste autorskie metody oparte na binarnej mapiegłębokości i określonych deformacjach obrazu pozwalająuzyskać naturalne efekty 3D z prawie niedostrzegalnymi artefaktami.Oryginalne, niezdeformowane zielone i niebieskieskładowe koloru w obrazie są interpretowane przez mózg jakoodniesienie dla dostrzeganych kształtów. Obraz czerwony,który jest przesunięty i w pewnym stopniu zdeformowany, dostarczado mózgu informacje o głębokości i jest też oczywiściepotrzebny do postrzegania prawidłowych kolorów.Zaproponowane metody zostały pomyślnie zaaplikowanedo prostego półautomatycznego narzędzia służącego do konwersjiobrazów 2D do obrazów 3D. W podobny sposób możnaprzetwarzać sekwencję obrazów 2D na sekwencję obrazów3D. Narzędzie to może być pomocne w przygotowywaniu materiałówdla telewizji 3D, czyli nowego standardu telewizyjnegomającego funkcjonować w niedalekiej przyszłości.Wyniki, które opisano w niniejszym artykule, potwierdzająefektywność zaproponowanych przez autorów transformacji3D i zachęcają do dalszej pracy nad tym zagadnieniem. Przyszłebadania będą skoncentrowane na dalszych eksperymentachdotyczących opisanych metod i ich modyfikacji.66 ELEKTRONIKA 3/<strong>2009</strong>


Literatura[1] Balcerek J., Dąbrowski A., Konieczka A.: Simple efficient techniquesfor creating effective 3D impressions from 2D original images.Proc. of New Trends in Audio and Video (AES) / SignalProcessing: Algorithms, Architectures, Arrangements, and ApplicationsNTAV/SPA Scientific Conference, 25-27th September2008 pp. 219-224.[2] Onural L.: An Overview of Research In 3DTV. Systems, Signals andImage Processing, 2007 and 6th EURASIP Conference focused onSpeech and Image Processing, Multimedia Communications andServices. 14th International Workshop on 27-30 June 2007, p. 3.[3] Dumbreck A. A., Smith C. W.: 3-D TV displays for industrial applications.Stereoscopic Television, IEE Colloquium on, 15 Oct1992 pp. 7/1 - 7/4.[4] Dubois E.: A projection method to generate anaglyph stereo images.Acoustics, Speech, and Signal Processing, 2001. Proceedings.(ICASSP ‘01). 2001 IEEE International Conference on vol.3, 7-11 May 2001, pp. 1661-1664 vol.3.[5] Jsselsteijn W. A., de Ridder H., Vliegen J.: Subjective evaluationof stereoscopic images: effects of camera parameters and displayduration. Circuits and Systems for Video Technology, IEEETransactions on vol. 10, Issue 2, March 2000 pp. 225-233.[6] Fehn C.: Depth-Image-Based Rendering (DIBR), Compressionand Transmission for a New Approach on 3D-TV. Fraunhofer-Institutfür Nachrichtentechnik, Heinrich-Hertz-Institut (HHI).[7] Tam W. J., Zhang L.: 3D-TV Content Generation: 2D-TO-3DConversion. Multimedia and Expo, 2006 IEEE International Conferenceon July 2006, pp.1869-1872.[8] Chang Y. L. i in.: Depth Map Generation for 2D-to-3D Conversionby Short-Term Motion Assisted Color Segmentation. Multimediaand Expo, 2007 IEEE International Conference on 2-5July 2007 pp.1958-1961.[9] Ideses I., Yaroslavsky L. P., Fishbain B.: Real-time 2D to 3Dvideo conversion. Real-Time Image Proc (2007) 2:3-9.[10] Redert A. et all.: Philips 3D Solutions: From Content Creationto Visualization. 3D Data Processing, Visualization, andTransmission, Third International Symposium on June 2006,pp. 429-431.[11] Kim D., Min D., Sohn K.: Stereoscopic Video Generation MethodUsing Motion Analysis. 3DTV Conference, 2007, 7-9 May2007, pp. 1-4.[12] Ideses I. et all.: Depth Map Quantization - How Much is Sufficient?3DTV Conference, 2007, 7-9 May 2007, pp. 1-4.[13] Stelmach L. et all.: Stereo image quality: effects of mixed spatio-temporalresolution. Circuits and Systems for Video Technology,IEEE Transactions on vol. 10, Issue 2, March 2000,pp. 188-193.[14] Zhang L., Tam W. J.: Stereoscopic image generation based ondepth images for 3D TV. Broadcasting, IEEE Transactions onvol. 51, Issue 2, June 2005, pp. 191-199.Influence of subband signal denoisingfor voice activity detection(Wpływ odszumiania w podpasmach na detekcję sygnału mowy)dr inż. TOMASZ MARCINIAK, prof. dr hab. inż. ADAM DĄBROWSKIPolitechnika Poznańska, Katedra Sterowania i Inżynierii SystemówExact detection of voice activity endpoints is crucial in manyspeech processing procedures like, e.g., in:• speech coding in telephone communication,• speech enhancement,• automatic speech recognition (ASR).Determination of endpoints can significantly improve efficiencyof these tasks. For example, in case of speech coding,the transmission speed can be reduced, because, as it can beobserved, even a duplex conversation signal includes up to 60%of silence [1]. Transmission of only active speech signal partsreduces the channel occupation and saves the battery power.In case of automatic speech recognition, precise detectionof word boundaries is a crucial step, which decides about therecognition effectiveness.VAD/EPD can be realized in time and/or in frequency domainusing the TF (time-frequency) speech parameters. Therealready exist several VAD/EPD methods developed in the periodfrom 1975 [2] up to now (one of the latest papers waspublished in July 2008 [3]). They are based on:• spectral energy analysis,• zero-crossing rate (ZRC),• pitch variations,• robust entropy,• statistical methods.Recently, we have proposed a novel approach referred toas the slope endpoint algorithm, which is based on the slopetransformation [4].This quite wide range of voice activity detection algorithmsprovokes some questions like: which method is the best onefor a given application, which is a good compromise betweenthe quality and speed, which is resistant to noise, etc.?In this paper we concentrate on the last question and proposean approach, which is suitable to operate in the presenceof noise.VAD/EPD methodsStandard methodsThe simplest EPD or VAD methods consist in calculation ofthe signal volume or energy and then on the appropriatethresholding as it is illustrated using the ASR Toolbox [5]in Fig. 1.Energy threshold based methods give poor results in caseof weak sounds e.g., if fricatives, which are of relatively lowenergy and noisy character, are at the beginning or at the endof the word. To overcame this problem the zero-crossing rate(ZRC) for each frame can be computed [2]An example application of ZCR is presented in Fig. 2.(1)ELEKTRONIKA 3/<strong>2009</strong> 67


Fig. 1. Isolated word endpoint detection using energy thresholdRys. 1. Detekcja początku i końca słowa z zastosowaniem proguenergetycznegoIt can be observed that the spectral energy and ZCR aresensitive to noise and cannot be used if the signal-to-noiseratio is low. Thus other, additional parameters like linear predictivecoding (LPC) coefficients, cepstral coefficients or pitch,are reasonable. VAD with these parameters can be found inITU-T Rec.G.729 Annex B [6]. The first stage of this VAD/EPDalgorithm derives four parametric features extracted from theinput signal:• full band energy,• low band energy,• line spectral frequencies,• zero crossing rate.Band energies are calculated by means of autocorrelationcoefficients. If the frame number exceeds an assumed level,the VAD decision is made using four difference measures [6]:• spectral distortion,• energy difference,• low-band energy difference,• zero crossing difference.Similar parameters are calculated in digital cellular telecommunicationsystems in case of adaptive multirate (AMR)speech traffic channels [7]. This European standard includesadditional features like nonuniform subband analysis and thepreviously mentioned pitch detection.In result, the described approach to VAD is quite preciseand robust in the presence of noise.Recent advanced methodsAnother interesting parameter, which can be used for VAD, isspectral entropy, which, calculated for speech frames, is differentfrom that for nonspeech frames [8]. Spectral entropy ofk-th frame of the input speech is given by:(2)where P(i,k) is a probability associated with the spectral energy:Fig. 2. Isolated word endpoint detection using energy thresholdand ZCRRys. 2. Detekcja słów z użyciem progu energetycznego i licznikaprzejść przez zerofor i = 0,...,N - 1 (3)Spectral energy in equation (3) is calculated using STFT ofthe input signal. In order to overcame sensitivity of the spectralmagnitude to noise, a multiband analysis can be realized(eg. in 32 subbands). In such case a set of weighting factorsis needed [8] and the final parameter (called BSE - band-partitioningspectral entropy) is calculated as:(4)Fig. 3. Endpoint detection of highly noised isolated wordRys. 3. Przykład detekcji silnie zaszumionego słowaVAD algorithms can also be based on statistical analysis. Involvinga single observation vector, the voice activity can bedetected using likelihood ratio test (LRT) [9]. Speech can bemodeled in the time and frequency with generalized autoregressiveconditional heteroscedasticity (GARCH) process. AlthoughGARCH models are typically used in the analysis ofthe economic (financial) time series [10], they have been recentlyadopted to the voice activity detection. The detailed informationis included in [3].68 ELEKTRONIKA 3/<strong>2009</strong>


Proposed methodFig. 5. Detection of word boundaries using subband analysisRys. 5. Detekcja granic słów z użyciem analizy w podpasmachFig. 6. Detection of word boundaries using ZCR and subband analysisat 0 dB SNR levelRys. 6. Detekcja granic z zastosowaniem ZCR i analizy w podpasmachdla sygnału o poziomie SNR = 0 dBIn previous paper [4] we have used wavelets as a denoisingtool and finished with a conclusion that wavelets do not onlyremove noise from the speech, but also components, whichare significant for the recognition accuracy. In this paper we attemptto take a closer look at the problem how using waveletscan affect the speech in subbands as we planned to use theresults for the estimation of the speech endpoints.An idea of our algorithm is as follows. First we use directionalfiltering to improve the SNR of the signal. The secondstep is denoising with Daubechies20 wavelets. Then thespeech signal is divided into frames of 256 samples and foreach frame the spectrum is computed. After that the spectraare divided into 32 uniform bands (width of each band is 125or 250 Hz) and for each band the energy is computed. Finally,for each frame the mean energy is estimated and subtractedfrom the energy in each band. A scheme for this algorithm ispresented in Fig. 4.After analysis of energy distributions in each of 32 bandswe have discovered that in higher parts of the spectrum theenergy distribution remains almost constant and what is interestingit reveals the shape of the signal, which can be thenused for the endpoint selection.In order to do this we set an adaptive threshold, which iscomputed as follows. It is assumed that at the beginning (beforevoice activity) the signal consists of only noise and becauseof this we use it to compute the noise rms oralternatively the mean of absolute values of the noise samples,which is then used to determine the threshold. In orderto avoid detection of short peaks we set the threshold to twoor three times the mean value. Then, if we do not detect thepresence of speech, we update the noise mean according tothe last defined non-speech samples, otherwise we keep thethreshold constant. Results of the whole procedure can beseen in Fig. 5. Figure 6 presents detection results with two differentendpoint detection methods. Solid (pink) line representsthe ZCR method with zcrShiftGain = 4 and the dashed (red)line represents the proposed subband method.Experimental resultsFig. 4. Endpoint detection algorithmRys. 4. Algorytm detekcji granic słówWe have tested our wavelet based denoising algorithm undervarious white noise conditions. The results of experiments arecollected in Table. The tests were performed with the experimentalself-prepared automatic speech recognition softwaredescribed in [11].The obtained results have shown that the proposed algorithmcan offer better word boundaries than the algorithmbased on the energy and the zero crossing rate. This is an importantadvantage of our algorithm.By this means we take as little noise as possible for thecreation of the hidden Markov chain model. This causes alarger percentage of the correctly recognized words by 2 toca. 5 % (Table).An interesting but rather pessimistic issue is a relativelylarge processing time. On T9300 2.5 GHz Intel Pentiumprocessor it took 0.56 s to process 0.98 s wave. One of theELEKTRONIKA 3/<strong>2009</strong> 69


easons is the way we divide the signal into frames. We haveused very dense scheme with every frame starting after 10samples taken form the begin of the previous frame. Reducingthe number of frames would certainly have a positive impacton the computation speed.Another and rather positive issue is that after this algorithmstage we have already used FFT and computed thespectrum. Thus we can apply these results to get mel frequencycepstral coefficients (MFCC’s).Recognition results with various noise conditionsSkuteczność rozpoznawania dla różnych poziomów zaszumieniaSNR [dB]ConclusionsWithout denoising[%]Recognition resultsWith wavelet denoising[%]40 97.0 99.330 94.6 100.020 96.6 98.610 95.6 97.30 94.6 97.0The presented wavelet based denoising strategy can be appliedas a supplementary stage to various VAD methods.It has been experimentally shown that the proposed algorithmcomputes quite exact word boundaries and that e.g. theVAD procedure based on the energy and the zero crossing ratesupplemented with it offers performance better by ca. 2...5 %.However, our algorithm is an offline strategy, becausecomputations have been made for the entire file. In otherwords, the analysis has been made after the whole analyzedword was spoken. One way to deal with this problem is signalsegmentation and wavelet denoising framewise, i.e., not forthe entire signal. In this case, however, a question arises,namely would the subband analysis reveal the same signalstructure as this described above? With further experimentswe want to find it out and answer this important question.This work was supported by the PPBW consortiumReferences[1] Benyassine A. et al.: ITU-T recommendation G. 729 Annex B: Asilence compression scheme for use with G.729 optimized forV.70 digital simultaneous voice and data applications. IEEECommunication Magazine, pp. 64-73, September 1997.[2] Rabiner L. R., Sambur M. R.: An algorithm for determining theendpoints of isolated utterances. Bell System Tech. J., vol. 54,no. 2, pp. 297-315, Feb. 1975.[3] Tahmasbi R., Rezaei S.: Change point detection in GARCH modelsfor voice activity detection. IEEE Transaction on Audio, Speech,and Language Processing, vol. 16, no.5, pp. 1038-1046,July 2008.[4] Marciniak T., Rochówniak R., Dąbrowski A.: Detection of endpointsof isolated words using slope transformation. Proc. of MixedDesign of Integrated Circuits and Systems (MIXDES), pp. 655-659, Gdynia, Poland, 2006.[5] Jang R.: ASR (automatic speech recognition) toolbox,available from the link at the author’s homepage athttp://www.cs.nthu.edu.tw/~jang.[6] ITU-T Rec.G.729, Annex B: A silence compression scheme forG.729 optimized for terminals conforming to RecommendationV.70, ITU-T, 1996.[7] Voice activity detector (VAD) for adaptive multi rate (AMR) speechtraffic channels, Digital Cellular Telecommunications System(Phase 2+), 1999.[8] Wu B. F., Wang K. Ch.: Robust endpoint detection algorithmbased on the adaptive band-partitioning spectral entropy in adverseenvironments. IEEE Trans. on Speech and Audio Processing,vol. 13, no. 5, September 2005.[9] Sohn J., Kim N. S., Sung W.: A statistical model-based voice activitydetection. IEEE Signal Processing Letters, vol. 6, no. 1, pp.1-3, January 1999.[10] Matlab GARCH toolbox, Mathworks, 2005.[11] Rochówniak R.: Automatic recognition of isolated words - softwarewritten in C++” (B. Sc. dissertation). Poznań University ofTechnology, Poznań, 2006.Przypominamy o prenumeracie miesięcznika <strong>Elektronika</strong> na <strong>2009</strong> r.70 ELEKTRONIKA 3/<strong>2009</strong>


Mikroprocesorowy sterownik temperaturydo mikroreaktora chemicznego wykonanegotechniką LTCCmgr inż. DOMINIK JURKÓW, mgr inż. KAROL MALECHA, PAWEŁ DURCZYŃSKI,prof. dr hab. inż. LESZEK J. GOLONKAPolitechnika Wrocławska, Wydział Elektroniki Mikrosystemów i FotonikiDzięki bardzo szybkiemu rozwojowi technologii mikroelektronicznych,aktualnie wiele analiz (bio)chemicznych wykonujesię w mikroukładach przepływowych. W początkowym etapierozwoju mikrosystemów analitycznych (µTAS - Micro-TotalAnalysis System) do ich konstrukcji stosowano główniekrzem, szkło [1,2] oraz różne materiały polimerowe (np. poliwęglany,poliimidy). Aktualnie coraz częściej do wykonywaniatych układów wykorzystywane są inne materiały, np. niskotemperaturowaceramika współwypalana LTCC (Low TemperatureCo-fired Ceramics) [3,4]. Technologia bazująca na tejceramice pozwala na bardzo łatwą integrację elementów fluidycznych(np. kanały, komory) oraz elektronicznych (np. grzejniki,termistory) we wnętrzu jednego modułu ceramicznegoLTCC.W artykule przedstawiono konstrukcję mikroreaktora chemicznegoLTCC oraz prototyp regulatora temperatury do tegourządzenia i jego parametry.TechnologiaPrezentowany ceramiczny mikroreaktor składa się z dwóchkomór: reakcyjnej i z komory na produkty reakcji, które rozdzielonobarierą platynowego grzejnika grubowarstwowegoczterech srebrnych elektrod pomiarowych. Objętość całegomikroreaktora jest mniejsza niż 30 µl. Złoże katalityczne(wsad katalityczny) stanowią nośniki z różnego typu materiałów,najczęściej w postaci kulek, na powierzchni którychunieruchomiono odpowiedni (bio)katalizator. Wsad katalitycznyumieszczono w jednej z komór mikroukładu. Barierauniemożliwiała przemieszczanie się złoża katalitycznego doczęści detekcyjnej mikroreaktora.Mikroreaktor chemiczny wykonano z siedmiu warstw ceramikiLTCC DP951 A2. Po procesie wypalania grubość każdejwarstwy wynosiła 137 µm. Kanały przepływowe oraz komoryreakcyjne wycinano w surowych foliach ceramicznych za pomocąlasera Nd-YAG. Układ grzejnika oraz elektrody pomiarowenaniesiono na surową ceramikę LTCC metodą sitodrukuza pomocą sitodrukarki DEK 1202. Wygląd poszczególnychwarstw (folii), z których zbudowano mikroreaktor przedstawionona rys. 1. Warstwa (rys. 1a) jest spodem całego układu,Rys. 1. Warstwy ceramiczne tworzące mikroreaktor: a) spódukładu, b) grzejnik Pt, c) elektrody Ag, d) wyprowadzenia elektrodpomiarowych oraz grzejnika, e) komory mikroreaktora i bariera pomiędzynimi, f) kanał przepływowyFig. 1. Layers for the microreactor: a) bottom layer, b) platinum heater,c) silver electrodes, d) terminals for electrodes and heater,e) chambers and threshold, f) fluidic channelna foliach (rys. 1b i 1c) umieszono elementy grubowarstwowe(grzejnik oraz elektrody pomiarowe) wykonane techniką sitodruku.Warstwa (rys. 1d) zawiera wyprowadzenia elektryczne,natomiast w foliach (rys. 1e oraz 1f) wykonano komory, barierai kanały przepływowe mikroreaktora.Po procesie drukowania i suszenia, warstwy ceramicznezłożono razem i poddano procesowi laminacji w prasie izostatycznej.W celu zapobieżenia deformacji struktur przestrzennychwchodzących w skład mikrosystemu, laminacjęprowadzono metodą dwustopniową, z wykorzystaniem alkoholuetylowego jako warstwy poświęcanej [6]. Przygotowyukład mikroreaktora wypalono w piecu komorowym (maksymalnatemperatura 875 o C). Proces wypalania zawierał dodatkowyetap wygrzewania ceramiki LTCC w 200 º C w czasie1 godz., aby umożliwić powolne odparowywanie alkoholu etylowego.Gotową, po procesie wypalania strukturę mikroreaktorawykonaną z ceramiki LTCC przedstawiono na rys. 2.Kompletny mikroreaktor otrzymywano przykrywając strukturęLTCC przeźroczystą płytką polimerową z poli(dimetylosiloksanu)(PDMS) [7]. Ze względu na dużą mikroporowatośćELEKTRONIKA 3/<strong>2009</strong> 71


ceramiki LTCC, niezbędne było pokrycie jej powierzchnicienką warstwą szkliwa (FO-34, ITME Warszawa), co pozwoliłona znaczną poprawę szczelności układu LTCC/PDMS.Pierwszym etapem diagnostycznym wykonywanego mikroreaktorabyła ocena jego szczelności po dołączeniu polimerowegoprzykrycia. W tym celu układ LTCC/PDMSumieszczono w skrętnej obudowie ze szkła akrylowego, zaopatrzonejw króćce wlotowe, do których za pomocą wężykówwprowadzano z różną prędkością wodę dejonizowaną. Badaniawykazały, że tak zaprojektowany i wykonany mikroreaktorjest szczelny, a maksymalny sumaryczny przepływ,który uzyskano wewnątrz układu wynosił 800 µl/min. Powyżejtej wartości szybkości przepływu obserwowano rozszczelnieniepołączenia LTCC/PDMS.Regulator mikroprocesorowyRys. 2. Mikroreaktor chemiczny wykonany techniką LTCCFig. 2. LTCC MicroreactorW celu zapewnienia odpowiedniej aktywności stosowanych(bio)katalizatorów wymagana była stabilizacja warunków reakcji,a w szczególnie temperatury. W przypadku reakcji enzymatycznychnajwiększa aktywność enzymów obserwowanajest w wąskim zakresie temperatury 37...40 o C [5]. Z tego powodu,do kontroli temperatury w mikroreaktorze, zaprojektowanoi wykonano regulator oraz specjalny stolik pomiarowy,wyposażony w wentylator do chłodzenia mikroreraktora orazigły pomiarowe umożliwiające proste podłączenie układu regulatorado mikroreaktora, bez potrzeby lutowania wyprowadzeń.Schemat elektryczny układu sterującego temperaturą,którego jednostką decyzyjną jest mikrokontroler ATmega16,przedstawiono na rys. 3. Składa się on z:• dwóch stabilizatorów napięcia LM340MP-05,• scalonego czujnika temperatury LM35 (umieszczonego nastoliku pomiarowym),Rys. 3. Schemat elektryczny układu mikroprocesorowego regulatora temperaturyFig. 3. Electrical circuit of the microprocessor temperature regulator72 ELEKTRONIKA 3/<strong>2009</strong>


• diody LED,• wyprowadzeń na grzejnik i wentylator (z układami Darlingtonjako elementami kluczującymi).Układy stabilizacji napięcia ustalają napięcie na poziomie5 V, ponieważ konieczne jest ono do poprawnej pracy elementówscalonych (ATmega16 i LM35) oraz stabilizują napięciesterujące pracą grzejnika i wentylatora. Czujnik LM35mierzy temperaturę na mikroreaktorze, dioda LED sygnalizujeosiągnięcie zadanej temperatury, a wyprowadzenia do grzejnikai wentylatora służą do dostarczenia odpowiedniej ilościmocy do tych elementów.W mikrokontrolerze wykorzystano dwa kanały przetwornikacyfrowo-analogowego (ADC0 i ADC1) oraz trzy układy liczników:timer0, timier1, timer2. Za pomocą pierwszego z nich sąobsługiwane przerwania. Dwa ostatnie służą do sterowania baztranzystorów kluczujących procesy grzania i chłodzenia układumikroprzepływowego. Do regulacji temperatury używany jestPWM (wyprowadzenia timera1 i timera2: odpowiednio OCR1Ai OCR2). Z nóżki OCR1A jest sterowana baza tranzystora kluczującegowiatrak, a z OCR2 baza tranzystora kluczującegogrzejnik. W celu zmniejszenia liczby połączeń elektrycznych,na płytce obwodu drukowanego, zastosowano opcję sterowaniawyświetlacza zawierającego tylko z 4 bity. W programieużyto algorytmu PID (regulator proporcjonalno-całkującoróżniczkujący).Umożliwiło to zmniejszenie błędu regulacjii zwiększenie stabilności regulacji temperatury. ATmega16 analizujetemperaturę z LM35, zapewniając podgrzewanie lubchłodzi chłodzenie mikroreaktora.Maksymalną moc konieczną do ogrzania układu mikroreaktorachemicznego LTCC określono za pomocą układu dopomiaru rozkładu temperatury, składającego się z kamery napodczerwień, stolika pomiarowego przesuwanego za pomocąsilników krokowych oraz z wyposażonego w specjalne oprogramowanie,umożliwiające bezpośrednią obserwacjęrozkładu temperatury na monitorze. Krzywą kalibracyjną zależnościtemperatury w komorze mikroreaktora w funkcji mocydostarczanej do grzejnika przedstawiono na rys. 4.Zmiany napięcia w czasie na wentylatorze i grzejnikuprzedstawiono odpowiednio na rys. 5a i 5b. W przypadku obuprzebiegów wypełnienie impulsów jest dobierane adaptacyjnieprzez mikrokontroler w taki sposób, aby zapewnić zadanątemperaturę.Przedstawiono podstawowe parametry mikroprocesorowegoukładu do sterowania temperaturą mikroreaktora chemicznego:• zakres regulacji temperatury 25...100°C,• czas grzania od T min (25 o C) do T max (100°C) 8 min,• czas chłodzenia od T max (100°C) do T min (25 o C) 15 min,• błąd bezwzględny regulacji temperatury 1°C,• max. prąd pobierany przez układ (I max) 450 mA,• napięcie zasilania układu regulatora (U In ) 15 V,• częstotliwość pracy PWM (f PWM ) 250 Hz,• napięcie wyjściowe sterujące grzaniem i chłodzeniem(U out ) 12 V.Charakterystykę dynamiczną regulatora zmierzono metodąbezstykową, za pomocą termoskanera IR (z detektoremHgCdTe). Przed pomiarem, powierzchnię mikroreaktora pokrytowarstwą czarnego lakieru, w celu ujednolicenia jej emisyjności.Przebieg otrzymanej charakterystyki przedstawionona rys. 6. Na podstawie uzyskanych wyników stwierdzono, żeczas potrzebny do uzyskania temperatury 40 º C wynosi około200 sekund, natomiast czas chłodzenia układu do temperaturypokojowej nie przekracza 90 sekund.a)b)Rys. 4. Krzywa kalibracyjna zależności temperatury w komorze mikroreaktoraw funkcji mocy dostarczanej do grzejnikaFig. 4. The characteristic of mikroreaktor chamber temperature vs.heater powerRys. 5. Przebiegi napięcia w funkcji czasu na: a) wentylatorze,b) grzejnikuFig. 5. Voltage vs. time characteristics: a) cooler, b) heaterELEKTRONIKA 3/<strong>2009</strong> 73


Błąd bezwzględny pomiaru temperatury był nie większy niż1°C, zaś maksymalny pobór prądu przez układ w takich warunkachwyniósł 450 mA. Wartości tych parametrów są zadawalające.Uzyskana dokładność i czas stabilizacji temperaturysą wystarczające do zastosowania przedstawionego układudo badań przebiegu reakcji enzymatycznych w mikroreaktorachceramicznych. Czas odpowiedzi można skrócić, optymalizująckod programu sterującego. Dodatkowo rozważaniateoretyczne wskazują, że zastąpienie układu scalonego czujnikatemperatury termistorem, umieszczonym we wnętrzu mikroreaktora,prowadzi do skrócenia czasu odpowiedzii polepszenia dokładności pomiaru.Rys. 6. Zmiany temperatury mikroreaktora sterowanego za pomocąregulatora w czasie, zmierzone za pomocą termoskanera IRFig. 6. Temperature changes as a function of time measured bythermography systemPodsumowanieModuł mikroreaktora do prowadzenia reakcji enzymatycznychz jednoczesną detekcją ich produktów wykonano w technologiiLTCC. Przykrycie mikroreaktora wykonano z poli(dimetylosiloksanu).Badania wykazały, że tak wykonany mikroreaktorcharakteryzuje się dobrą szczelnością. Maksymalny, sumarycznyprzepływ jaki uzyskano w prezentowanym mikroreaktorzewynosi 800 µl/min. W celu zapewnienia odpowiedniejaktywności (bio)katalizatorów, które stosowano jako wsad katalitycznyopisywanego mikroreaktora LTCC, opracowano i wykonanomikroprocesorowy układ stabilizacji temperatury. Układten umożliwia znaczną miniaturyzację obwodu pomiarowego.Ponadto, badania przeprowadzone za pomocą kamery termowizyjnejwykazały, że czas potrzebny do ogrzania układuod temperatury pokojowej do temperatury 40°C wynosi około200 sekund, a czas chłodzenia od 40°C do 25°C wynosi 90 s.Praca została sfinansowana ze środków Ministerstwa Naukii Szkolnictwa Wyższego (granty nr N N515 410534 i R0201702).Karol Malecha jest beneficjentem projektu „GRANT - wsparcieprac badawczych poprzez stypendia naukowe dla doktorantów”współfinansowanego przez Unię Europejską w ramach EuropejskiegoFunduszu Społecznego.Literatura[1] Manz A., Graber N., Widmer H. M.: Miniaturized total chemicalanalysis systems: a novel concept for chemical sensing, Sensorsand Anctuators B, 1, 1990, pp. 244-248.[2] Dziuban J. A.: Technologia i zastosowanie mikromechanicznychstruktur krzemowych i krzemowo szklanych w technice mikrosystemów.Oficyna Wydawnicza Politechniki Wrocławskiej,Wrocław 2002.[3] Golonka L.: Zastosowanie ceramiki LTCC w mikroelektronice.Oficyna Wydawnicza Politechniki Wrocławskiej, Wrocław 2001.[4] Gongora-Rubio M. R., Spinoza-Valleos P., Sola-Laguna L., SantiagoAviles J. J.: Overview of low temperature co-fired ceramicstape technology for meso-system technology (MsST). Sensorsand Actuators A, 89, 2001, pp. 222-241.[5] Torbicz W., Pijanowska D. G., Dawgul M.: Mikrosystemy w pomiarachbiologicznych. <strong>Elektronika</strong>, 6, 2008, ss. 27-34.[6] Malecha K., Golonka L. J.: Microchannel fabrication processin LTCC ceramics. Microelectronics Reliability, 48, 2008, pp.866-871.[7] Chudy M. i in.: Technika łączenia warstw polimerowych z ceramicznymielementami mikroukładów analitycznych. <strong>Elektronika</strong>,3, 2007, ss. 13-14.74 ELEKTRONIKA 3/<strong>2009</strong>


Wspomnienie o Profesorze dr inż. Macieju NałęczuProfesor Maciej Nałęcz, Członek Zwyczajny PAN, Członek Honorowy PTTS, zmarł 6.02.<strong>2009</strong> w Warszawie.Był uczonym zasłużonym dla rozwoju techniki sensorowej i pionierem inżynierii biomedycznej w Polsce.Profesor Maciej Nałęczurodził się 27.04.1922 r. wWarszawie. Naukę w LiceumWładysława IV w Warszawie,którą przerwał w 1939 wybuchII Wojny Światowej, kontynuowałw ramach tajnegonauczania. Studia na WydzialeElektrycznym PolitechnikiWarszawskiej ukończyłw 1949 r. Po ukończeniu studiówbył asystentem na WydzialeElektrycznym PW,gdzie prowadził wykładyz miernictwa magnetycznego.Od 1954 r. pracował w PolskiejAkademii Nauk jako: zastępca(1954-1957) i kierownik (1957-1962) Zakładu ElektrotechnikiPAN; a następnie jako organizatori dyrektor <strong>Instytut</strong>u Automatyki PAN (1962-1972), <strong>Instytut</strong>uBiocybernetyki i Inżynierii Biomedycznej PAN (1975-1993) i MiędzynarodowegoCentrum Biocybernetyki w Instytucie Biocybernetykii Inżynierii Biomedycznej PAN (1988-6.02.<strong>2009</strong>).Był członkiem rad naukowych IA PAN, IBIB PAN i MiędzynarodowejRady MCB. Stopień doktora nauk technicznych uzyskałw 1960 r. (promotor Prof. Paweł Jan Nowacki), tytuł profesora nadzwyczajnego- w 1962 r., profesora zwyczajnego - w 1972 r., członkiemkorespondentem PAN został w 1967 r., a członkiem rzeczywistym- w 1973 r. Wypromował ośmiu doktorów nauk.Na ugruntowanie wiedzy naukowej Prof. Nałęcza miały dużywpływ Jego cztery roczne pobyty w USA:1. Case Institute of Technology, Engineering Design Center, Cleveland,Ohio (post-doc 1961);2. Brooklyn Polytechnic, N.Y. (Vis. Prof. 1967/68);3. Ohio State Univ., Columbus, (distinguished Vis. Prof. 1979/80);4. National Institute of Health, Bethesda, Maryland (w ramach prestiżowegoprogramu „Scholar in Residence” 1991/92).Prof. Nałęcz został wyróżniony członkostwem honorowymnastępujących Polskich Towarzystw Naukowych:• Elektrotechniki Teoretycznej i Stosowanej - 1988,• Informatyki Medycznej - 1994,• Techniki Sensorowej - 1997,• Inżynierii Biomedycznej - 2001.Prof. Nałęcz pełnił wiele funkcji w organach i strukturach korporacyjnychPAN, jako: członek Prezydium PAN (1972-1980, 1984-1989); zastępca sekretarza naukowego PAN (1981-1983); sekretarzWydziału IV Nauk Technicznych PAN (1972-1980).Prof. Nałęcz miał istotny wpływ na powstanie i rozwój nowejdyscypliny w Polsce - biocybernetyki i inżynierii biomedycznej.Najważniejszymi wyróżnikami tej działalności było:- utworzenie z Jego inicjatywy i przewodzenie Komitetowi Biocybernetykii Inżynierii Biomedycznej PAN (1972-2007);- udział w koordynacji prac naukowo-badawczych jako kierownikogólnopolskich programów w zakresie inżynierii biomedycznejw latach 1976-1990;- przewodzenie Komitetowi Naukowemu Krajowych KonferencjiBiocybernetyka i Inżynieria Biomedyczna (15 konferencji w latach1976-2007);- zorganizowanie, w latach 1988-2008, 102 Seminariów MCB,w których wzięło udział ok. 5000 uczestników, w tym 1440 zagranicznychz 44 krajów.Był inicjatorem i opiekunem budowy 11 000 m 2 gmachów przyul. Księcia Trojdena 4, z laboratoriami badawczymi, salami konferencyjnymii zapleczem hotelowym.Prof. Nałęcz aktywnie uczestniczył w międzynarodowym życiunaukowym w ramach:• International Federation of Automatic Control IFAC (we władzachw latach 1962-1988);• European Society for Engineering and Medicine ESEM(współtwórca i wiceprezes);• International Federation for Medical and Biological Engineering(IFMBE Honorary Life Member, w Administrative Council,1988-1994);• PUGWASH Conferences on Science and World Affairs (przewodniczącyMiędzynarodowej Rady Pugwash, 1974-1997).W 1995 r. Ruch Pugwash otrzymał wraz z Prof. J. RotblatemPokojową Nagrodę Nobla.Prof. Nałęcz był członkiem zagranicznych akademii nauk: Rosyjskiej,Gruzińskiej, Akademii Szkół Wyższych Ukrainy; InternationalAcademy of Biomedical Engineering oraz Honorary Member ofthe World Organization of General Systems and Cybernetics.Działalność naukowa Prof. Nałęcza leżała w obszarze kilku dziedzinnaukowych. W latach 1949-1972 prowadził badania w zakresiepomiarów elektrycznych i magnetycznych. Dotyczyły one szczególnie:transformatorowych przekładników prądowych; wzmacniaczy magnetycznychdrugiej harmonicznej, służących do pomiaru słabych pól magnetycznych;zjawiska Halla i jego wykorzystania do pomiarów stałychi zmiennych pól magnetycznych, mierników mocy w zakresie częstotliwościprzemysłowych i akustycznych, przemieszczeń mechanicznychi małych drgań (sejsmografy). Następnie, już w ramach <strong>Instytut</strong>u Biocybernetykii Inżynierii Biomedycznej PAN, swoje zainteresowaniaProf. Nałęcz skierował na wykorzystanie techniki w medycynie.Współuczestniczył w badaniach mających na celu opracowanie narzędzii pomiar: pola magnetycznego towarzyszącego aktywności elektrycznejorganizmu (serca i mózgu) i aktywności mechanicznej sercapoprzez pomiar ruchu obszaru klatki piersiowej w okolicy koniuszkaserca (apekskardiografia). Był On jednym z głównych inicjatorów i twórców,którzy podjęli w Polsce prace nad sztucznymi narządami wewnętrznymi:nerką, trzustką i wspomaganiem pracy serca. Przy Jegowspółpracy został opracowany pierwszy w Polsce system do sterowaniai optymalizacji procesu hemodializy, w którym były monitorowane:przepływ i upływność krwi, pojawianie się pęcherzykówpowietrza we krwi, ciśnienia i temperatury w systemie dializacyjnym(krwi i dializatu). System był przez wiele lat produkowany i stosowanyw lecznictwie. Prace dotyczące sztucznej trzustki obejmowały opracowanieamperometrycznych czujników glukozy oraz sterowanychprogramowo mikropomp do podawania insuliny.Prof. Nałęcz był autorem lub współautorem wielu publikacji,w tym 7. książek. Największym przedsięwzięciem w tym zakresiebyło opracowanie dwóch monografii nt. biocybernetyki i inżynieriibiomedycznej - sześciotomowej (1990-1991) i dziewięciotomowej(2000-2005), których był współautorem i współkoordynatorem. Byłinicjatorem i redaktorem naczelnym czasopisma naukowego „Biocyberneticsand Biomedical Engineering” (od 1981 r. do śmierci).Bogata działalność naukowa Prof. Macieja Nałęcza w wielu obszarachznalazła uznanie w postaci licznych nagród i odznaczeń.W Polsce do najważniejszych należą: Zespołowa Nagroda PaństwowaII st. (1972), Medal PAN im. Mikołaja Kopernika (1987), NagrodaPrezesa Rady Ministrów (2000), Krzyż Komandorski z Gwiazdą(1986), Krzyż Wielki Orderu Odrodzenia Polski (2002), a za granicą:Medal Zasługi Szwedzkiej Akademii Nauk Technicznych (1957),złoty Medal im. Krizika Czechosłowackiej Akademii Nauk (1988),Medal National Institutes of Health - Johna Fogarty, USA (2002).Prezes PTTSByły Prezes PTTSProf. dr hab. Tadeusz Pisarkiewicz Prof. dr hab. Władysław TorbiczELEKTRONIKA 3/<strong>2009</strong> 75


Wybrane problemy kompresji i syntezy sygnałówradarowychdr hab. inż. ADAM KAWALEC 1 , dr inż. CZESŁAW LEŚNIK 1 , dr inż. JAN SOŁOWICZ 1 ,prof. dr hab. EDWARD SĘDEK 2 , mgr inż. MARIUSZ ŁUSZCZYK 21 Wojskowa Akademia Techniczna, <strong>Instytut</strong> Radioelektroniki, Warszawa2 Przemysłowy <strong>Instytut</strong> Telekomunikacji S. A., WarszawaU podstaw rozwoju nowoczesnych radarów stosujących sygnałyzłożone i kompresję impulsów leży twierdzenie Woodwardao tym, iż rozdzielczość w odległości uzależniona jest nietyle od czasu trwania impulsu, co od szerokości widma sygnału[2]. Jest to przyczyna, dla której sygnały sondujące majązłożoną strukturę wewnętrzną. Poszerzenie widma sygnału,niezależnie od czasu trwania impulsu, realizowane jest przezmodulację lub kodowanie wewnątrzimpulsowe [1,3]. Kompresjaimpulsów stanowi rozwiązanie problemu zapewnienia pożądanejrozdzielczości w odległości przy jednoczesnej koniecznościzachowania niezbędnej (zgodnie z kryterium założonego zasięguradaru) energii sygnału. Kompresja sygnału wpływa takżena zwiększenie odporności na zakłócenia [1].Kompresja impulsówW radiolokacji rozwiązaniem problemu filtracji optymalnejw sensie maksymalizacji stosunku sygnału do szumu jest filtrdopasowany. Układy realizujące filtrację dopasowaną dlaklasy sygnałów złożonych nazywane są filtrami kompresji.Układ takiego filtru transformuje użyteczny sygnał wejściowy(odebrany), występujący na tle addytywnego szumu białego,w sygnał wyjściowy zgodnie z transmitancją filtru, przy którejw pewnym określonym momencie stosunek wartości szczytowejsygnału do skutecznej wartości szumów na wyjściu filtruosiąga wartość maksymalną (rys. 1). Brak przy tymwymagań związanych z zachowaniem kształtu sygnału.Sygnał użyteczny na wyjściu filtru można przedstawićw postaci [12]:gdzie: H(ω) - charakterystyka częstotliwościowa (transmitancjaczęstotliwościowa) filtru, |H(ω)| - charakterystyka amplitudowo-częstotliwościowafiltru, φ K (ω) - charakterystykafazowo-częstotliwościowa filtru.Dla czasu t = t 0 tj., gdy napięcie na wyjściu filtru osiągniewartość maksymalną, sygnał wyjściowy opisywany jest zależnością:Gęstość widmowa mocy szumów na wyjściu filtru jestrówna [12]:gdzie: N - gęstość widmowa mocy szumów na wejściu filtru.Średnia moc szumów na wyjściu filtru jest równa wariancjiszumów (przy założeniu zerowej wartości średniej szumu) [12]:(2)(3)(4)(5)Rys. 1. Model filtracji dopasowanejFig. 1. Matched filter model definitionStosunek modułu wartości szczytowej sygnału do wartościskutecznej szumów w momencie t = t 0 można wyrazić w następującysposób [12]:Widmo składowej użytecznej sygnału wejściowego s we (t)można zapisać w postaci:(1)(6)gdzie: φ s (ω) - widmo fazowe sygnału, G(ω) - widmo amplitudowesygnału.76 ELEKTRONIKA 3/<strong>2009</strong>


Wykorzystując nierówność Buniakowskiego-Schwarzamożna wykazać, że współczynnik q wy osiąga wartość maksymalną,jeżeli spełniony jest następujący warunek:Warunek można przedstawić w postaci dwóch równań równoważnychopisujących charakterystykę amplitudowo-częstotliwościowąoraz charakterystykę fazowo-częstotliwościową filtruoptymalnego (dopasowanego):Charakterystyka amplitudowa filtru dopasowanego, określonaz warunku uzyskania maksymalnego stosunku sygnałudo szumu, jest proporcjonalna do modułu widma sygnału.Charakterystyka fazowa filtru dopasowanego ma postać zapewniającąkompensację widma fazowego wejściowego sygnałuużytecznego, co zapewnia algebraiczne sumowaniewszystkich składowych jego widma w ściśle określonym momencieczasu t = t 0 .Pomiędzy transmitancją częstotliwościową filtru, a jegoodpowiedzią impulsową istnieje ścisły i jednoznaczny związekokreślony parą transformat Fouriera:(7)(8)(9)Stosując nową zmienną całkowania t’ = t - τ otrzymuje się:(12)Wyrażenie całkowe (12) przedstawia funkcję autokorelacjisygnału wejściowego, co prowadzi do zapisu [1]:(13)Czasowa postać sygnału na wyjściu filtru dopasowanego jestwięc proporcjonalna do funkcji autokorelacji sygnału wejściowego.Dla τ = 0, czyli w chwili t = t 0 :(14)zatem, maksymalna wartość sygnału użytecznego na wyjściufiltru dopasowanego jest proporcjonalna do energii wejściowegosygnału użytecznego E.Dla określenia stosunku sygnału do szumu na wyjściu filtrudopasowanego, należy określić wartość skuteczną szumuna jego wyjściu. Gęstość widmowa mocy szumów na wyjściufiltru określona jest wyrażeniem (4):Funkcja autokorelacji szumu na wyjściu filtru:(10)Dla filtru dopasowanego:Dla filtru dopasowanego:Zatem odpowiedź filtru dopasowanego przedstawia zależność:(11)zatem, wykorzystując związek pomiędzy funkcją autokorelacji,a widmem energii sygnału zdeterminowanego otrzymujemy:Odpowiedź impulsową filtru dopasowanego jest więc proporcjonalnado czasowej postaci wejściowego sygnału użytecznegodla argumentu równego t 0 - t, jest więc jegozwierciadlanym odbiciem względem prostej t = t 0 /2.Czasową postać sygnału na wyjściu filtru dopasowanegookreśla operacja splotu odpowiedzi impulsowej filtru i sygnałuwejściowego [1]:Wariancja szumów wyjściowych (przy założeniu zerowej wartościoczekiwanej) na podstawie (14):Zatem, stosunek maksymalnej wartości sygnału do wartościskutecznej szumów wynosi:ELEKTRONIKA 3/<strong>2009</strong> 77


Stosunek sygnału do szumu na wyjściu filtru optymalnego zależyod energii sygnału i gęstości widmowej mocy szumu nawejściu filtru, nie zależy natomiast od kształtu sygnału i jegostruktury czasowo-częstotliwościowej.Analogowy filtr kompresjiPodstawą do niedawna stosowanych rozwiązań w dziedziniekompresji impulsów oraz syntezy sygnałów złożonych jest technikalinii dyspersyjnych SAW (ang. Surface Acoustic Wave). Alternatywnymsposobem kompresji oraz syntezy sygnałów jesttechnika cyfrowego przetwarzania sygnału. Technika linii dyspersyjnychz powierzchniową falą akustyczną jest technologią,która obecnie nie jest dalej rozwijana. Ograniczenie wynikaz braku możliwości odwzorowania coraz bardziej złożonychstruktur wewnątrzimpulsowych sygnałów sondujących. Praktycznietylko sygnały z liniową i nieliniową modulacją częstotliwościoraz sygnały z kodowaniem bifazowym stosowane sąw aplikacjach wykorzystujących linie dyspersyjne.Kolejnym bardzo istotnym ograniczeniem jest brak możliwościuzyskiwania sygnałów o długim czasie trwania, cozwiązane jest z technologicznymi warunkami wytwarzaniapodłoża filtrów o odpowiednich wymiarach geometrycznych.Pojedyncza linia dyspersyjna realizuje stałe opóźnienie, któreprzekłada się na czas trwania impulsu. Stwarza to koniecznośćstosowania tylu linii dyspersyjnych nadawczych i odbiorczych,ile jest przewidzianych do wykorzystania w danymurządzeniu radarowym impulsów o różnym czasie trwania.Zazwyczaj stosuje się trzy lub cztery impulsy o czasach trwaniaod kilku do kilkudziesięciu mikrosekund. Stąd koniecznośćstosowania znacznej liczby linii dyspersyjnych, co znaczniekomplikuje układ technicznie i zwiększa jego koszty.Innym istotnym mankamentem jest duże tłumienie wprowadzaneprzez linie dyspersyjne oraz konieczność kompensacjistrat sygnału o wartościach rzędu kilkudziesięciudecybeli. Ponadto linie wykazują silne niedopasowanie do impedancjitoru transmisyjnego. Niedopasowanie to musi byćskompensowane przez zastosowanie układów dopasowujących.Filtry dyspersyjne wykazują też wrażliwość parametrówna temperaturę. Syntetyczne ujęcie podstawowychcech układów typu SAW przedstawione jest w tabeli 1.Tab. 1. Właściwości analogowych filtrów kompresjiTabl. 1. Analogue pulse compression filter main featuresZaletyAnalogowy filtr kompresji- opanowana technologia,- małe rozmiary,- duża szerokość względna pasma,- stabilność i niezawodność,- niska cena.(15)Powyższe ograniczenia linii dyspersyjnych spowodowałykonieczność poszukiwania nowych technik pozbawionychwspomnianych wyżej niedogodności.Algorytmy cyfrowej filtracji dopasowanejZasada pracy cyfrowego filtru kompresji polega na obliczaniusplotu w dziedzinie czasu ciągu próbek sygnału echa,z ciągiem próbek odpowiedzi impulsowej filtru. Odpowiedź impulsowafiltru określana jest przez postać czasową sygnałusondującego. W przypadku konieczności redukcji poziomuczasowych listków bocznych sygnału po kompresji odpowiedźimpulsowa filtru modyfikowana jest funkcją ważącą. Dobór takiejfunkcji wpływa na ukształtowanie bryły niejednoznacznościzarówno w aspekcie poziomu listków bocznych, jaki szerokości listka głównego (pogorszenie rozróżnialności odległościowej).Zastosowanie obróbki wagowej wprowadzadodatkowe niedopasowanie do sygnału sondującego, co powodujepogorszenie stosunku sygnału do szumu na wyjściufiltru kompresji.Zasada pracy cyfrowego filtru kompresji przedstawionajest na rys. 2. Jest to klasyczna struktura filtru cyfrowegoo skończonej odpowiedzi impulsowej FIR (ang. Finite ImpulseResponse). Ciąg próbek sygnału wyjściowego s wy (n) wyznaczasuma splotowa:Symbole zamieszczone na rys. 2. oznaczają odpowiednio:T- opóźnienie sygnału o okres próbkowania oraz h(n) ciągpróbek odpowiedzi impulsowej filtru.Rys. 2. Bezpośrednie wyznaczanie sumy splotowejFig. 2 Direct convolution for pulse compression(16)Struktura filtru przedstawiona na rys. 2. dla realnych wartościparametrów sygnałów radarowych oraz wymagania pracyw czasie rzeczywistym, jest trudna do realizacji ze względu nazłożoność obliczeniową. Problem ten można rozwiązać przezzastosowanie algorytmu szybkiego splotu (rys. 3).Teoretycznie operacja splotu w dziedzinie czasu jest równoważnaoperacji mnożenia w dziedzinie częstotliwości:Wady- duże tłumienie sygnału,- ograniczony czas trwania sygnału,- ograniczona dokładność wykonania linii dyspersyjnych,- ograniczone możliwości zmian rodzajów i parametrówsygnału.(17)Ciąg próbek sygnału wejściowego s we (n) poddawany jest dyskretnemuprzekształceniu Fouriera (ang. Discrete FourierTransform). Podobnie przetwarzany jest ciąg próbek odpo-78 ELEKTRONIKA 3/<strong>2009</strong>


Przestawione algorytmy cyfrowej kompresji sygnałów zostałyporównane ze względu na liczbę operacji zmiennoprzecinkowychniezbędnych do ich realizacji w rzeczywistych układachprzetwarzania. Punktem odniesienia było przetwarzanieprzykładowego sygnału złożonego o czasie trwania impulsut 1 = 40 µs (baza sygnału wynosi 250). Wyniki porównania prezentowanesą w tab. 3.Rys. 3. Algorytm szybkiego splotuFig. 3. Fast convolution algorithmwiedzi impulsowej h(n). Obydwa ciągi są wymnażane w dziedzinieczęstotliwości i poddawane odwrotnemu dyskretnemuprzekształceniu Fouriera w celu wyznaczenia ciągu próbeksygnału wyjściowego s wy (n).Wykorzystując do obliczeń prostej i odwrotnej dyskretnejtransformaty Fouriera szybkie algorytmy FFT uzyskuje sięznaczną redukcję liczbę obliczeń, a tym samym czasu niezbędnegona ich przeprowadzenie. W rzeczywistych warunkachkonieczność splatania skończonego ciągu odpowiedziimpulsowej filtru z wielokrotnie dłuższym ciągiem próbek sygnałuecha (akwizycja sygnału w czasie trwania podstawyczasu radaru) wymaga zgromadzenia danych z całej podstawyczasu, co powoduje konieczność realizacji FFT o bardzodużym rozmiarze oraz wprowadza znaczne opóźnienieinformacji. Rozwiązaniem jest podział wejściowego ciągu próbekna segmenty o stałej długości K. Segmenty te splatane sąz ciągiem próbek odpowiedzi impulsowej filtru o długości M.Algorytm realizowany jest z wykorzystaniem dyskretnej transformatyFouriera o wymiarze K + M - 1 punktów.Podstawowe zalety i wady cyfrowej kompresji sygnałówradarowych przedstawione są w tab. 2.Rys. 4. Blokowy algorytm szybkiego splotuFig. 4. Digital filtering by fast convolution with signal segmentationTab. 2. Właściwości cyfrowych filtrów kompresjiTabl. 2. Digital pulse compression filter main featuresZaletyWadyCyfrowy filtr kompresji- dowolna struktura i parametry sygnału,- dowolnie długie czasy trwania impulsu,- łatwość zmiany typu i parametrów sygnału,- niski poziom listków bocznych,- niewrażliwość na zewnętrzne czynniki destabilizujące,- brak problemu powtarzalności parametrów.- ograniczona szerokość widma sygnału,- wysokie koszty.Tab. 3. Porównanie algorytmów cyfrowej kompresjiTabl. 3. Comparison of digital filtering algorithmsAlgorytmBezpośrednie wyznaczanie sumysplotowejAlgorytm szybkiego splotuBlokowy algorytm szybkiego splotuAlgorytm syntezy sygnałówmodulowanych w częstotliwościZłożoność obliczeniowa32 GFLOPS1,1 GFLOPS1,44 GFLOPSDostępność technik cyfrowego przetwarzania sygnałóww aspekcie ich generacji stwarza możliwości elastycznegokształtowania parametrów czasowo-częstotliwościowych sygnałówsondujących. W dobie rozważań nad ideą radaru programowegoSDR (ang. Software Defined Radar) istniejekonieczność rozwoju algorytmów umożliwiających syntezęsygnałów o właściwościach uzależnionych od przeznaczeniaurządzenia radarowego oraz warunków pracy. W dalszejczęści artykułu prezentowane jest podejścieumożliwiające syntezę sygnałów złożonychz modulacją częstotliwości [11]. Zagadnieniasyntezy sygnałów przedstawiane są z wykorzystaniemanalizy funkcjonalnej.W przestrzeni sygnałów dany jest zbiór Xsygnałów x(t) realizowalnych w pewnych warunkach(zbiór sygnałów dopuszczalnych).Jednocześnie istnieje niepokrywający sięz nim zbiór Y sygnałów y(t), z których każdycharakteryzuje się pewnymi pożądanymiwłaściwościami, np. realizuje zadaną funkcjęautokorelacji. Sygnały y(t) mogą być nierealizowalnelub trudno realizowalne. Zadaniem syntezy jest przybliżeniedo zadanej funkcji autokorelacji R(τ). Funkcja tajednoznacznie określa widmo amplitudowe α(ω), które jestzwiązane następującą zależnością z widmem sygnału y ~ (ω),realizującym zadaną funkcję autokorelacji:(18)Widmo fazowe α(ω) sygnału y(t) może być dowolne. Sygnałyy(t) należące do zbioru Y sygnałów pożądanych różnią się jedyniewidmem fazowym.Zbiór X obejmuje dopuszczalne sygnały o skończonymczasie trwania, modulowane w częstotliwości, które wyrażanesą następująco:ELEKTRONIKA 3/<strong>2009</strong> 79


(19)gdzie: φ(t) - funkcja modulacji fazy. Obwiednia B(t) jest prostokątnai wyrażana jest następująco:(20)Miarą odległości między zbiorem Y(t) i sygnałem x(t) jestwspółczynnik podobieństwa C(x,Y). Współczynnik ten maksymalizujesię również względem sygnałów x(t) ∈ X. Przemieszczającsię w zbiorze X, wybiera się funkcję modulacjifazy φ(t) (ω c (t)), aby współczynnik podobieństwa C(X,Y) byłmaksymalny. Problem ten można zapisać w następującejpostaci [11]:(25)Przedmiotem syntezy jest funkcja modulacji częstotliwościω c (t), realizująca optymalne przybliżenie do pożądanego sygnałuy(t). Sygnały x(t) ∈ X różnią się jedynie postacią funkcji φ(t).Elementy zbioru Y sygnałów pożądanych mają następującąpostać:(21)gdzie: b x (ω) wyraża się następująco:(26)gdzie: A(t) - obwiednia sygnału, φ(t) - funkcja fazowa sygnału.Widma sygnałów pożądanych opisywane są zależnością(18), zaś widma sygnałów dopuszczalnych przedstawiane sąnastępująco:(22)gdzie: b x (ω) - widmo amplitudowe, β x (ω) - widmo fazowe sygnałux(t).Wynikiem syntezy powinien być sygnał x(t) ∈ X, który realizujeminimalną odległość między zbiorami X i Y. Z warunkówsformułowanego zagadnienia wynika, że zadane sądodatnie funkcje α(ω) i B(t). Syntetyzuje się funkcję fazowąφ(t) (lub β x (ω)), która przy zadanych α(ω) i B(t) minimalizujeodległość między zbiorami X i Y. Miarą odległości między tymizbiorami jest współczynnik podobieństwa C(X,Y). Minimumodległości między zbiorami X i Y odpowiada maksimumwspółczynnika podobieństwa. Współczynnik podobieństwaC(X,Y) maksymalizowany jest ze względu na φ(t) (lub β x (ω))i ze względu na φ(t) (lub α(ω)). Tak sformułowane zagadnieniemożna rozwiązać dwoma sposobami.W pierwszej kolejności ustalany jest pewien dopuszczalnysygnał x(t) ∈ X. Następnie wyznacza się sygnał y(t) ∈Y, realizujący minimalną odległość od sygnału x(t) do zbioruY. Aby uzyskać sygnał y(t) minimalizujący odległość odzbioru Y do sygnału x(t) należy widmo fazowe β x (ω) sygnałux(t) przyporządkować do widma amplitudowego α(ω), tzn.przyjmuje się, że [11]:(23)W wyniku tej operacji tworzy się widmo y ~ (ω) poszukiwanegosygnału pomocniczego y(t). Następnie przechodzi się w dziedzinęczasu, wykonując odwrotne przekształcenie Fourierawzględem sygnału:(24)Należy wyznaczyć funkcję modulacji fazy φ(t) taką, aby przezb x (ω) współczynnik podobieństwa (25) osiągnął wartość maksymalną.Funkcja φ(t), która spełnia powyższe wymaganiajest syntetyzowaną funkcją modulacji częstotliwości.Do rozwiązania powyższego zagadnienia można wykorzystaćrównież inny algorytm. Najpierw ustalany jest dowolnysygnał y(t) ∈ Y i wyznacza się sygnał x(t), realizujący minimalnąodległość od zbioru X do sygnału y(t). W tym celu obwiedniB(t) przyporządkowuje się funkcję fazową Φ(t)ustalonego sygnału y(t), tzn., że przyjmuje się [11]:Następnie współczynnik podobieństwa C(X,y) maksymalizujesię względem y(t) [11]:gdzie:(27)(28)(29)W tym przypadku wyznaczane jest widmo fazowe α(ω), któreprzez obwiednię A(t) maksymalizuje wartość współczynnikapodobieństwa (28). Tak wyznaczone widmo fazowe jest widmemoptymalnym α(ω) = α opt (ω), natomiast widmo optymalnegosygnału pomocniczego ma wtedy następującą postać:(30)Następnym krokiem jest wyznaczanie optymalnego sygnałupomocniczego y opt (t), wykorzystując do tego odwrotne przekształcenieFouriera. Optymalny sygnał pomocniczy ma następującąpostać:80 ELEKTRONIKA 3/<strong>2009</strong>


(31)W kolejnym kroku optymalna funkcja fazowa Φ opt (t) przyporządkowanajest obwiedni B(t). W ten sposób uzyskuje się poszukiwanysygnał zmodulowany częstotliwościowo:(32)Z powyższego wynika, że obie metody syntezy prowadzą dopodobnych zagadnień wariacyjnych. Warunki (25) i (26) oraz(28) i (29) różnią się tylko tym, że zależności czasowe i częstotliwościowezamieniają się miejscami.Należy stwierdzić, że nie ma bezpośrednich metod analitycznych,umożliwiających rozwiązanie powyższych zadańwariacyjnych. Zagadnienie to zostało rozwiązane dla sygnałówzmodulowanych częstotliwościowo o dużym współczynnikukompresji i monotonicznej zmianie częstotliwości. Do rozwiązaniawykorzystuje się metodę fazy stacjonarnej, która dajewyniki przybliżone, przy czym obarczone błędem odwrotnieproporcjonalnym do współczynnika kompresji.Stosując pierwszą z przedstawionych procedur, w celu wyznaczeniafunkcji modulacji częstotliwości, należy w pierwszejkolejności wyznaczyć widmo X ~ (ω) ustalonego sygnału x(t),a następnie moduł b x (ω) tego widma.Widmo sygnału x(t) wyraża się następująco:(33)Wykorzystując metodę stacjonarnej fazy otrzymamy następującerozwiązanie powyższej całki [11]:(36)Należy wyznaczyć funkcję modulacji częstotliwości, maksymalizującejwspółczynnik podobieństw (35). Do wyznaczeniamaksimum wyrażenia (35) wykorzystuje się nierówność Buniakowskiego-Schwarza.Optymalną funkcję modulacji częstotliwości, maksymalizującąwspółczynnik podobieństw (35), określa następującerównanie różniczkowe [11]:(37)Jest ono podstawą syntezy sygnałów modulowanych w częstotliwości.Przedstawiona metoda syntezy jest najważniejsząmetodą syntezy wykorzystującą kryterium podobieństw.Faza chwilowa sygnału opisywana jest zależnością:(38)W następnym krokiem jest wyznaczane widmo fazowe sygnałuz modulacją częstotliwości, który maksymalizuje współczynnikpodobieństwa:(39)Wykorzystuje się przy tym zależność t od ω 0 (lub też t 0 od ω),wyrażoną wzorem:(40)gdzie: t 0 - punkt stacjonarnej fazy wyznaczony z równania:φ‘(t 0 ) - ω = 0, czyli ω c (t 0 ) = ωModuł widma sygnału x(t) wyraża się następująco:Podstawiając (34) do (25) otrzymamy:(34)(35)gdzie: -Ω i Ω - graniczne wartości częstotliwości chwilowejsygnału x(t).Wykorzystując zależność t 0 od ω oraz zakładając, że funkcjamodulacji częstotliwości jest rosnąca, wyrażenie (35)można przedstawić następująco:Aby otrzymać sygnał y opt (t) najbliższy do sygnału x opt (t), należywyznaczone widmo fazowe przyporządkować dowidma amplitudowego α(ω). Uzyskuje się w ten sposóbwidmo y ~ (ω) sygnału najbliższego do sygnału x opt (t). Takwięc β x (ω) jest zarówno widmem fazowym sygnału x opt (t),jak i sygnału y opt (t). Sygnał y opt (t) uzyskuje się, wyznaczającodwrotne przekształcenie Fouriera funkcji widmowejy ~ opt (t). Syntezę sygnału można właściwie zakończyć na wyznaczeniux opt (t).Należy jednak mieć na uwadze, że uzyskane rozwiązaniepostawionego problemu jest rozwiązaniem przybliżonym,a jego dokładność wynika z metody stacjonarnej fazy [4]. Dootrzymania bardziej dokładnych wyników syntezy można zbudowaćprocedurę iteracyjną. Sygnał x opt (t) uzyskany metodąfazy stacjonarnej traktuje się jako sygnał zerowego przybliżeniai oznacza się przez x (o) (t). W pierwszym kroku proceduryiteracyjnej należy wyznaczyć najbliższy do niego sygnały (1) (t) ∈ Y. W tym celu wyznaczone uprzednio widmo fazoweβ x (ω) sygnału x opt (t) = x (o) (t) należy przyporządkować dowidma amplitudowego α(ω). Uzyskuje się w ten sposóbwidmo y ~ (1) (ω) pomocniczego sygnału pierwszego przy-ELEKTRONIKA 3/<strong>2009</strong> 81


liżenia. Aby wyznaczyć sygnał y 1 (t) pierwszego przybliżenia,należy zastosować odwrotne przekształcenie Fouriera względemwidma y ~ (1) (ω), to jest:(41)W kolejnym kroku procedury iteracyjnej należy wyznaczyćsygnał x (1) (t), realizujący minimalną odległość do sygnałuy (1) (t). Aby uzyskać sygnał x (1) (t) najbliższy do sygnału y (1) (t),należy zadanej obwiedni B(t) przyporządkować fazę φ 1 (t) sygnałuy (1) (t). Uzyskuje się w ten sposób sygnał x (1) (t) o następującejpostaci:(42)Do wykonania kolejnego kroku procedury iteracyjnej niezbędnajest znajomość widma fazowego β x (1) (ω). Widmo towyznacza się stosując przekształcenie Fouriera względemsygnału x 1 (t) i można je zapisać następująco:(43)d 0 ≥ d 1 ≥ d 2 …≥ d min .Jeśli minimum odległości jest jedyne, to powyższy ciąg jestzbieżny do d min i proces iteracyjny nieuchronnie doprowadzido minimalizacji odległości między zbiorami X i Y.Technika realizacyjna układu filtracjii syntezy sygnałówTechnika cyfrowego przetwarzania sygnału - zarównow aspekcie syntezy, jak i kompresji impulsów - jest alternatywnymrozwiązaniem w stosunku do filtrów typu SAW. Użyciemetod cyfrowego przetwarzania sygnału możliwe jest dziękirozwojowi tej grupy elementów, zarówno jeżeli chodzi o szybkośćdziałania, jak i o skalę integracji. Szczególnie na uwagęzasługują układy programowalnych matryc bloków logicznychFPGA (Field Programmable Gate Array), które umożliwiająopracowanie uniwersalnych struktur pozwalających syntetyzowaćoraz poddawać filtracji sygnały o dowolnej strukturzeczasowo-częstotliwościowej. Projekt układu kompresji orazTab. 4. Zestawienie modułów oraz ich parametrów technicznych(Sundance MT Ltd.])Tabl. 4. Products by Sundance MT Ltd. breakdown used in projectW każdym kolejnym kroku iteracji wyznacza się odległośćlub współczynnik podobieństwa między odpowiednimi sygnałamix(t) i y(t). Odległość między sygnałami x (1) (t) i y (1) (t) oznaczamyjako d 1 . W następnym kroku iteracji wyznacza się sygnał y (2) (t)∈ Y, który jest najbliższy do sygnału x (1) (t). Aby uzyskać sygnały (2) (t) najbliższy do sygnału x (1) (t) widmo fazowe tego sygnałunależy przyporządkować do widma amplitudowego α(ω). Uzyskanewidmo y ~ (2) (ω) sygnału y (2) (t) ma następującą postać:(44)Odległość między sygnałami x (1) (t) i y (2) (t) oznaczamy przezd 2 . Następnie wyznaczamy sygnał y (2) (t), wykonując odwrotneprzekształcenie Fouriera względem y ~ (2) (ω), a uzyskany sygnałmożna wyrazić następująco:(45)W następnym kroku wyznaczamy sygnał x (2) (t) najbliższydo sygnału y (2) (t). Wykonywana operacja sprowadza się doprzyporządkowania fazy φ (2)) (t) do obwiedni B(t). Uzyskanysygnał ma następującą postać:(46)Nazwa modułuSMT310Q- karta nośna PCISMT148FX- karta nośnaSMT350- moduł ADC/DACSMT 351- moduł FPGAPodstawowe parametry modułu- do czterech modułów standardu TIM (TexasInstruments Module) programowa,- rekonfigurowana tablica połączeń,- 1 MB pamięci SRAM,- pamięć konfiguracyjna flash ROM: 512 KB,- wbudowany w kartę kontroler JTAG.- do czterech modułów standardu TIM,- wbudowane kontrolery:• RS232, JTAG, SATA, RS485, USB2,• Ethernet 10/100/1000 wysokostabilne -źródło sygnału zegarowego.- standard SLB,- dwa przetworniki ADC 14 b/125 MHz,- podwójny przetwornik DAC 16 b/500 MHz,- wysokostabilne źródło sygnału zegarowego.- FPGA Xilinx Virtex-5 SX95T,- możliwość rozszerzenia o dodatkowe modułystandardu SLB,- 4 szybkie porty szeregowe RSL,- pamięć DDRII RAM: 2 GB,- pamięć konfiguracyjna flash ROM: 64 MB.Następnie wyznacza się widmo tego sygnału i widmo fazoweprzyporządkowuje się do widma amplitudowego. Uzyskanewidmo y ~(2) (ω) sygnału y (2) (t), realizuje najkrótsząodległość do sygnałów x (2) (t). Odległość między tymi sygnałamioznaczana jest przez d 3 . Kolejne iteracje wykonuje sięanalogicznie. Odległości między wyznaczonymi sygnałamitworzą ciąg malejący:SMT 362- moduł DSP/FPGA- TMS320C6455 - 1 GHz 2 MB Cache L2,- FPGA Xilinx Virtex 4 FX60,- dwa porty komunikacyjne SHB do 400 MB/s,- cztery porty komunikacyjne do 20 MB/s,- 12 szybkich portów szeregowych RSL,- pamięć SDRAM: 512 MB,- pamięć flash ROM: 4 MB.82 ELEKTRONIKA 3/<strong>2009</strong>


Rys. 5. Układ cyfrowej kompresji sygnałów złożonychFig. 5. Digital system for radar pulse compressionsyntezy sygnałów złożonych, który jest częścią Projektu BadawczegoZamawianego PBZ-MNiSW-DBO-04/I/2007 wykorzystujenastępujące założenia:• brak ograniczeń na wewnątrzimpulsową strukturę sygnałui jego czas trwania,• układy konwersji analogowo-cyfrowej na p.cz.,• cyfrowa kwadraturowa konwersja widma,• filtr kompresji realizowany za pomocą blokowego algorytmuszybkiego splotu, w paśmie podstawowym,• implementacja układów syntezy oraz kompresji w układachFPGA (układy VIRTEX 4 i VIRTEX 5 firmy Xilinx),• projekt w języku VHDL.W tabeli 4 prezentowane są wybrane parametry modułówfirmy Sundance Multiprocessor Technology Ltd., przy wykorzystaniuktórego realizowane są układy kompresji i syntezysygnałów. Blokowy algorytm szybkiego splotu jest podstawąfunkcjonalnych rozwiązań układu cyfrowej kompresji.W strukturze układu (rys. 5) oprócz elementów realizującychblokowy algorytm szybkiego splotu znajduje sięukład kwadraturowy konwersji widma sygnału echa do pasmapodstawowego. Sygnały pomocnicze wykorzystywane wukładzie konwersji generowane są w układzie oscylatora cyfrowegoNCO (ang. Numerically Controlled Oscillator).Kolejną operacją w opisywanym układzie jest filtracja dolnoprzepustowarealizowana w cyfrowym filtrze decymacyjnym.Operacja decymacji pozwala zredukować częstotliwośćpróbek sygnału na wejściu układu podziału na bloki.PodsumowanieCelem artykułu jest omówienie wybranych problemów kompresjii syntezy sygnałów złożonych stosowanych w techniceradiolokacyjnej. Na podstawie analizy efektywności różnychalgorytmów cyfrowej kompresji wykazano, że zastosowanieblokowego algorytmu szybkiego splotu jest rozwiązaniemmożliwym do zastosowania w rzeczywistych układach kompresji.Zaprezentowano także strukturę takiego układuz układem konwersji widma sygnału echa do pasma podstawowegooraz filtrem decymacyjnym. Przedstawiono możliwościtechnicznej realizacji układu kompresji wykorzystującukłady programowalne FPGA. W artykule przedstawionotakże opis algorytmu syntezy sygnałów modulowanychw częstotliwości z wykorzystaniem analizy funkcjonalnej.Praca naukowa finansowana przez narodowe Centrum Badańi Rozwoju w latach 2007-2010 jako Projekt Badawczy ZamawianyPBZ-MNiSW-DBO-04/I/2007Literatura[1] Kroszczyński J.: Kompresja impulsu w radiolokacji. Prace PIT nr58, 1967.[2] Woodward P. M.: Probability and Information Theory, with Applicationto Radar. Pergamon Press, Oxford, 1953.[3] Levanon N., Mozeson E.: Radar Signals. John Wiley&Sons, Inc.,Hoboken, New Jersey, 2004.[4] Cook C. E., Bernfeld M.: Radar Signals, An Introduction to theoryand Application. Academic Press, New York, 1967.[5] Fowl E. N.: The design of FM Pulse Compression Signal. IEEETrans. on Information Theory.Jan. 1964.[6] Arthur J. W.: Modern SAW-based pulse compression systemsfor radar applications- practical systems, Electronics &CommunicationEngineering Journal, April 1996, pp. 57-78.[7] www.analog.com/dds.[8] Rihaczek A. W.: Radar Waveform Selection - A Simplified Approach,IEEE Transactions on Aerospace And Electronic Systems,November 1971, pp.1078-1086.[9] Levanon N.: Multifrequency signal structure for radar systems,U.S. Patent No. 6392588; May, 2002.[10] Sundance Multiprocessor Technology Ltd. strona internetowa (zdnia 1.11.2008r): www.sundance.com/web/files/SMT310Q.[11] Wakman D. J., Siedleckij R. M.: Woprosy sinteza radiołokacyonnychsignałow, Moskwa, Sowietskoje Radio, 1973.[12] Sołowicz J.: Przetwarzanie sygnałów radiolokacyjnych cz. I. Podstawyteorii i przetwarzania sygnałów stochastycznych. WojskowaAkademia Techniczna, Warszawa 1998.[13] Lyons R. G.: Wprowadzenie do cyfrowego przetwarzania sygnałów.Wydawnictwo Komunikacji i Łączności, Warszawa 1999.Przypominamy o prenumeracie miesięcznika <strong>Elektronika</strong> na <strong>2009</strong> r.ELEKTRONIKA 3/<strong>2009</strong> 83


Szkło dla fotoniki. Część 7.Szkło optyczne gradientowedr hab. inż. RYSZARD ROMANIUK prof. PWPolitechnika Warszawska, <strong>Instytut</strong> Systemów <strong>Elektronicznych</strong>W klasycznym szkle optycznym gradient refrakcji nie występujeani w objętościowych próbkach takiego szkła, ani w zrobionychz niego przyrządach optycznych. Odpowiednieoptyczne właściwości funkcjonalne elementu wykonanego zeszkła optycznego otrzymuje się poprzez kształtowanie jegogeometrii. W różnych częściach elementu optycznego promieńświatła ma do pokonania różną długość drogi optycznej. Promienieo różnych długościach fali podlegają prawu dyspersjii każdy z nich pokonuje inną drogę optyczną w elemencie.Gradientowym szkłem optycznym nazywa się taki rodzajszkła, uformowany w postaci elementu optycznego lub preformytakiego elementu, w którym występuje ściśle założony,funkcjonalny gradient refrakcji. Używanie gradientowego szkłaoptycznego w postaci objętościowej nie ma większego sensupraktycznego (za wyjątkiem, gdy elementy optyczne wycinasię z objętościowego bloku szkła w taki sposób, że zachowanajest funkcja gradientu refrakcji i jest ona odpowiedniozorientowana względem osi funkcjonalnego, gradientowegoelementu optycznego).W każdym przypadku założony gradient refrakcji w szklejest współmierny i skorelowany z wymiarem geometrycznymelementu optycznego. Przykładowo, można sobie wyobrazićelement optyczny w postaci prostopadłościennej płytki szklanejlub krótkiego pręta spełniający funkcję klasycznej soczewkiszklanej. Zamiast zmiennych cylindrycznych wymiarów, jakw klasycznej soczewce, funkcję zmiany długości drogi optycznejw takim elemencie pełni osiowo symetryczna, np. paraboliczna,zmiana refrakcji wewnętrznej. Takie szkło i elementyz niego wykonane nazywane są gradientowymi. Szkła, a raczejszklane elementy optyczne mogą mieć różne stopnie symetriiprzestrzennej wewnętrznego gradientu refrakcji [1]:• izolowane, jednozmienne, zależne od jednej współrzędnejprzestrzennej r, φ, z, gradienty refrakcji, takie jak osiowy,radialny i sferyczny, a oprócz tego monotoniczny, niemonotoniczny,okresowy i nieuporządkowany oraz• wielozmienne gradienty refrakcji, które są połączeniemgradientów jednozmiennych.Przykładem elementu optycznego z periodycznym gradientemrefrakcji jest szklane braggowskie włókno optyczne.Jest to jednak element optyczny z objętościowym ograniczeniemkwantowym, a nie optyczny element objętościowy. Prawiewszystkie szklane włókna światłowodowe są na ogółelementami gradientowymi o radialnym układzie gradientu refrakcji,z pomijalnymi residualnymi zmianami tego gradientuwzdłuż włókna szklanego. Włókno szklane jest specyficznymrodzajem falowodowego elementu optycznego o wymiarachczęści efektywnie prowadzącej promienie współmiernychz długością fali świetlnej, a więc takim w którym fala podlegaobjętościowemu ograniczeniu kwantowemu.Klasyczne szklane elementy optyczne nie nakładają tegotypu ograniczeń i są tradycyjnie nazywane elementami objętościowymi(dużymi). Przedmiotem rozważań będą gradientowe,szklane elementy optyczne objętościowe, w większościprzypadków o znacznie większych wymiarach od długości faliświatła. Niektóre z tych szklanych elementów gradientowychmają relatywnie niewielkie rozmiary, ponieważ są używanew technice światłowodowej jako elementy optyczne współpracującebezpośrednio ze szklanymi włóknami optycznymi, np.światłowodowe soczewki gradientowe określane w literaturzesymbolem GRIN (ang. Gradient Index).W szklanym elemencie o radialnym gradiencie refrakcjazmienia się wyłącznie jako funkcja odległości od osi optycznejelementu n(r), mierzona w płaszczyźnie prostopadłej do tejosi. Nie występuje gradient refrakcyjny wzdłużny, przynajmniejw granicach idealności technologicznego wykonania szklanegoelementu optycznego. Elementy o gradiencie radialnymsą najczęściej dostępne w postaci szklanych soczewek gradientowychGRIN, także nazywanych soczewkami pręcikowymilub soczewkami światłowodowymi ze względu napodobieństwo do włókna optycznego. Wyglądem przypominająodcinek bardzo grubego włókna optycznego o średnicyw granicach 1...kilka mm i podobnej długości.Monotonicznie malejąca refrakcja od osi do obwodu dajesoczewki skupiające, a monotonicznie wzrastająca - soczewkirozpraszające. Sferyczność, czy asferyczność soczewki jestokreślana kształtem profilu refrakcyjnego. Poprzez wybórkształtu funkcji profilu refrakcji, podobnie jak w światłowodziewielomodowym gradientowym, można w soczewce GRINkompensować różnego rodzaju optyczne zniekształcenia zobrazowania.Długość soczewki GRIN określa jej ogniskową.Dla dłuższych soczewek niektóre ogniska znajdują się w jejwnętrzu i o efektywnej ogniskowej, dla danej długości transmitowanejfali świetlnej, decyduje ta część długości ostatniegofragmentu soczewki, która jest większa, np. od Np/4, gdzie:p jest okresem soczewki, a N - liczbą naturalną. Równoległawiązka promieni, wchodząca do soczewki GRIN o odpowiednimprofilu refrakcyjnym i równolegle do jej osi, podlega okresowymskupieniom w ognisku wewnątrz soczewki.Praktycznie całe zastosowania szkła gradientowego obecnieograniczają się do elementów GRIN. Zastosowania te rozszerzająsię nie tylko do elementów dyskretnych, ale i doukładów takich elementów w matrycach. Za pomocą gradientowychmatryc szklanych można zastępować w niektórychwypadkach duże objętościowe szklane elementy optyczne,jak np. soczewki objętościowe i soczewki Fresnela. Są to zastosowaniaw technikach kserograficznych, skanerowych i fotograficznych.W optycznych elementach szklanych z osiowym układemgradientu refrakcja jest monotonicznie zmienna wzdłuż ichosi optycznej. Takie elementy są stosowane jako zamiennikistandardowej optyki asferycznej w systemach monochromatorowychoraz kolimatorach dla wiązek promieniowanialaserowego. Są one w pewnym zakresie analogiem soczewkiGRIN, którą uformowano w stożek, choć w tym przypadkumogą być połączone dwa gradienty refrakcji:podłużny i poprzeczny.W elemencie szklanym o sferycznym gradiencie refrakcjiwystępuje symetria refrakcji względem punktu. Pełne realizacjepraktyczne takich elementów 3D są dość trudne i najprawdopodobniejniepraktyczne, ale ich częściowa realizacja84 ELEKTRONIKA 3/<strong>2009</strong>


planarna 2D znajduje zastosowania praktyczne. Dwuwymiarowaszklana matryca mikrosoczewek z półsferycznym gradientemrefrakcji jest elementem podlegającym intensywnymbadaniom aplikacyjnym. Wykonywane są różne wersje technologicznetakich matryc, częściowo równoważne pod względemoptycznym. Oprócz mikroobiektów gradientowychstosowane są mikroobiekty geodezyjne, tworzące relief naszkle równoważny w pewnym zakresie gradientowi refrakcji.Zastosowanie szkła gradientowegoZastosowania elementów optycznych ze szkła gradientowegodzieli się na dwa podstawowe obszary: ogniskowanie i obrazowanie.Zaletą zastosowań w układach optycznych ogniskującychi obrazujących jest płaska powierzchnia soczewkigradientowej z obu stron. Pozwala to na bezpośrednie stykowesprzęganie z innymi elementami optycznymi. W niektórychukładach obrazowania pozwala to na pracę w trybiestykowym z obrazowanym obiektem, bez stosowania dodatkowychelementów optycznych. W układach optycznych ogniskowaniasoczewki GRIN są stosowane w telekomunikacjiświatłowodowej, systemach optycznego przetwarzania sygnałów,w urządzeniach mikrooptycznych dla techniki CDi DVD, jako kolimatory wiązki lasera półprzewodnikowego.W soczewce GRIN o odpowiednio dobranym profilu refrakcji,promień światła biegnie ścieżką sinusoidalną wzdłużosi elementu. Soczewka w postaci cylindrycznego prętao niewielkiej średnicy o płaskich czołach i o odpowiedniejdługości jest idealnym kolimatorem wiązki lub może wiązkęskupić w ognisku, zupełnie analogicznie do soczewki wypukłej.Takie soczewki są idealnym partnerem wąskowiązkowychtakich źródeł światła, jak światłowody, diody laserowe,itp. Służą do sprzęgania światłowodów między sobą, źródłalaserowego ze światłowodem. Większość mikrooptycznychelementów światłowodowych, jak np.: konektory, tłumikioptyczne, sprzęgacze kierunkowe, przełączniki, izolatoryoptyczne, multipleksery WDM, zawiera soczewki GRINw swojej konstrukcjiNajszerszym zastosowaniem szkła gradientowegow postaci liniowych lub prostokątnych matryc soczewek GRINsą kserokopiarki, faksy i skanery oraz urządzenia wielofunkcyjnez drukarkami. Zastąpiły one obiektyw w klasycznychrozwiązaniach kserokopiarek. Matryca soczewek zawiera dwalub trzy rzędy pojedynczych elementów o długości 1 cmiośrednicy 1 mm. Matryca tworzy obraz na zasadzie analogicznejdo segmentowego oka muchy, poprzez nakładaniecząstkowych obrazów z indywidualnych soczewek. Zastosowanie600...2000 soczewek GRIN pozwala obrazować taśmępapieru o formacie A0. Największą zaletą zastosowania soczewekGRIN jest skrócenie drogi obrazowania w kserografiez około 1 metra do kilku centymetrów. Są one stosowane jakowyłączne rozwiązanie w kserokopiarkach kompaktowych.Nowoczesne rozwiązania obiektywów fotograficznych,a także lornetek stosują połączenie soczewek klasycznychz gradientowymi, co pozwala na zmniejszenie liczby koniecznychsoczewek, zmniejsza wagę i wymiary oraz koszty obiektywów.Warunkiem takich zastosowań jest opanowanietechnologii wytwarzania szklanych elementów gradientowycho znacznych rozmiarach rzędu kilku centymetrów średnicy.Dobranie odpowiedniego profilu refrakcyjnego minimalizujezniekształcenia optyczne, takie jak: aberracja sferyczna trzeciegorzędu, koma, astygmatyzm, krzywizna pola, do wartościmniejszej niż 1 µm. Można także korygować aberrację chromatyczną.W obiektywach o zmiennej ogniskowej soczewkiGRIN prowadzą do znacznej redukcji długości obiektywu.Projektowanie profilu refrakcji w szklegradientowym radialnieSoczewka gradientowa GRIN różni się od wielomodowego gradientowegowłókna szklanego wymiarem poprzecznym obszaruszkła efektywnie prowadzącego falę świetlną. W szklanymwłóknie wielomodowym o standardzie telekomunikacyjnym wymiarobszaru rdzeniowego szkła wynosi 50 lub 62,5 µm, cowprowadza słabe objętościowe ograniczenie kwantowe dla promieniświatła. W soczewce gradientowej GRIN wymiar poprzecznywynosi od minimum kilkuset µm do maksimum kilku cm.Obszar rdzeniowy szklanej soczewki GRIN nie jest ograniczonytypowym płaszczem optycznym, lecz monotonicznie zmiennygradient refrakcji dochodzi do samego brzegu pręta szklanego,z którego skonstruowana jest soczewka.Peryferyjna powierzchnia zewnętrzna soczewki jest przygotowanado umieszczenia w uchwycie mechanicznym.W układzie optycznym takiej soczewki występuje dodatkowoograniczenie aperturowe, jak w klasycznych obiektywach tak,aby promienie światła nie dochodziły nigdy do jej brzegu, comogłoby prowadzić do interferencji. Szklana soczewka GRINjest elementem optycznym bez objętościowego ograniczeniakwantowego, z klasycznym zewnętrznym ograniczeniemaperturowym mniejszym od maksymalnej apertury soczewki.Pomiędzy szklaną soczewką GRIN, a wielomodowymszklanym włóknem światłowodowym występuje jednak wielepodobieństw. W obu elementach rozprzestrzeniają się podobnerodzaje promieni świetlnych - południkowe i skośne, z tąjednak różnicą, że w soczewce rozkład promieni jest ciągłyawświatłowodzie dyskretny. Konsekwencją tego podobieństwasą zbliżone zasady projektowania profilu refrakcyjnegodla obu elementów. Mogą one być analizowane i opisywane zapomocą metod optyki geometrycznej, w tym za pomocą wygodnegoprzybliżenia przyosiowego (w odróżnieniu od włóknaszklanego jednomodowego, gdzie obowiązuje silne objętościoweograniczenie kwantowe fali świetlnej i metody optykigeometrycznej stają się nieprzydatne). Gdy promień światławchodzi dokładnie w osi optycznej soczewki i jest równoległydo tej osi, to kierunek jego rozprzestrzeniania się jest zgodnyz osią. Gdy natomiast promień równoległy do osi soczewkiwchodzi w pewnej odległości od tej osi, a profil refrakcyjny jestmonotonicznie malejący, to ulega refrakcji w kierunku osi iprzecina ją w pewnej odległości w głębi soczewki.Zobrazowanie szklanej soczewki GRIN będzie idealne, jeślitaki sam promień wchodzący do soczewki, ale dla innej odległościod osi (te dwa promienie tworzą wiązkę promieni równoległych)także przetnie oś w tym samym miejscu, co promieńpoprzedni. Taki rodzaj promieni, zawsze przecinających ośoptyczną soczewki, nazywany jest południkowym. Odległośćod powierzchni soczewki do wewnętrznego punktu zogniskowaniarównoległych promieni światła nazywana jest okresemsoczewki p = 2π/g. Wiązka równoległych promieni światła podlegaw soczewce okresowej konwergencji i dywergencji.Dla południkowych promieni światła znane jest dokładnerozwiązanie zagadnienia dla uzyskania optymalnego profilurefrakcji szkła soczewki w postaci:n 2 (r) = n o2·sech(gr) = n o 2 [1-(gr) 2 +h 4 (gr) 4 +h 6 (gr) 6 +...],gdzie: n o jest refrakcją osiową, r - jest współrzędną radialną,g = const - jest siłą skupiającą soczewki, h 4 = 2/3, h 6 = 17/45są stałymi parametrami bezwymiarowymi przy wyrazachwyższego rzędu w potęgowym rozwinięciu funkcji sekans hiperboliczny.ELEKTRONIKA 3/<strong>2009</strong> 85


Gradient profilu refrakcyjnego jest otrzymywany przez gradientprofilu koncentracji jonów modyfikatorów refrakcji. Kształtprofilu koncentracji jest uzyskiwany metodą dyfuzji jonowej.Odpowiednie do tego celu jony modyfikatory powinny wykazywaćsię silną zmianą refrakcji szkła oraz dużą mobilnościądyfuzyjną (współczynnikiem dyfuzji) w szkle w podwyższonejtemperaturze. Dla cylindrycznego układu geometrycznegow pręcie szklanym i dyfuzji jednego jonu o początkowymrozkładzie równomiernym znane są dokładne rozwiązania klasycznegorównania dyfuzji.Rozwiązanie to jest iloczynem funkcji exponencjalnej z parametrudyfuzji oraz stosunku funkcji Bessela pierwszego rodzajurzędu zerowego i pierwszego. Parametrami rozwiązaniarównania dyfuzji jonu modyfikatora refrakcji w szkle gradientowymsą: T f = Dt/r o 2 - parametr dyfuzji, D - współczynnik dyfuzji,t - czas dyfuzji, r - droga dyfuzji, r o - maksymalna drogadyfuzji, C(r,t) - rozkład koncentracji dyfundującego jonu, C 1i C 2 = const - warunki początkowe dyfuzji. Dla kilku dyfundującychjonów rozwiązanie jest sumą prostą rozwiązań dlaposzczególnych jonów. Jeśli współczynnik załamania szkłazależy liniowo od koncentracji jonu modyfikatora, to przeliczeniekoncentracji na refrakcję jest liniowe. Na rys. przedstawionokilka krzywych dyfuzji jonów modyfikatorów refrakcji,jako rozwiązanie równania dyfuzji.Dobierając odpowiednie parametry procesu dyfuzji jonumodyfikatora refrakcji w szkle można doprowadzić do utworzeniaprofilu parabolicznego. Proces doboru tych paramet-Drugim rodzajem promieni światła w szklanej soczewcen 2 (r) = n 2 o [1 - (gr) 2 ],GRIN są promienie skośne lub helikalne, nigdy nie przecinającejej osi optycznej i poruszające się po torach cylindrycznych(cylindryczne-helikalne) lub elipsoidalnychn(r) = n oo + n o1 r 2 + n o2 r 4 + ...n(r) = n o [1 - (gr) 2 /2],(elipsoidalne helikalne) wzdłuż soczewki wokół jej osi. Dla promienicylindrycznych helikalnych również znane jest dokładnerozwiązanie zagadnienia na optymalny profil refrakcji szkłasoczewki w postaci:n 2 (r) = n 2 o [1 + (gr) 2 ] -1 = n 2 o [1 - (gr) 2 + (gr) 4 - (gr) 6 + ...].Nie istnieje ogólny gradient refrakcji, który jest optymalny dlawszystkich promieni światła w szklanej soczewce gradientowej. Wartość n ooBardzo użytecznym przybliżeniem, często stosowanymw optyce geometrycznej i upraszczającym wiele zależnościanalizy rozprzestrzeniania się promieni światła w elementachoptycznych, także takich jak szklana soczewka gradientowa,jest tzw. przybliżenie paraosiowe (przyosiowe, paraksjalne).Przyosiowym promieniem światła w elemencie optycznym nazywasię taki promień, który zawsze tworzy z osią elementuoptycznego mały kąt θ. W takich warunkach spełnione sąNA = nz dużym przybliżeniem następujące relacje: sin(θ) ≈ θ,o gr otan(θ)≈θ, cos(θ) ≈ 1. Przybliżenie przyosiowe jest stosowanew metodzie analizy elementów i układów optycznych, nazywanejmacierzową metodą śledzenia promieni (także metodąmacierzy ABCD).Metoda śledzenia promieni pierwszego rzędu stosujewyłącznie przybliżenie przyosiowe. Metoda śledzenia promienidrugiego rzędu stosuje drugie wyrazy w rozwinięciufunkcji trygonometrycznych w szereg Taylora. Stosowanajest także metoda pośrednia, nazwijmy ją umownie rzędu1,5, w której funkcje sinus i tangens reprezentują pierwszewyrazy, a funkcję cosinus dwa wyrazy, tzn. cos(θ)≈1-θ 2 /2.Przybliżenie przyosiowe jest dość dokładne dla wielkościkąta promienia światła z osią elementu θ≈0…10 o , ale staje(nsię bardzo szybko niedokładne dla większych kątów. Istnieją2 - 1)(n 2 + 2) = (4π/3)ΣN i α imetody rozszerzenia przybliżenia przyosiowego na niecoszerszy zakres kątów θ, ale wówczas konieczne jest osobnetraktowanie różnych klas promieni światła: południkowych iskośnych.Przybliżenie przyosiowe jest w optyce światłowodowej,obejmującej także szklane soczewki GRIN, często spełnionew sposób naturalny ze względu na niewielkie wymiary elementów,niewielkie apertury numeryczne i małe wartości refrakcjiróżnicowej bezwzględnej ∆n = n max - n min i względnej∆ szkła. Mała wartość refrakcji różnicowej w szkle gradientowympozwala na zastosowanie powszechnego przybliżeniamałorefrakcyjnego (nazywanego przybliżeniem słabej propagacji),dotyczącego względnej refrakcji różnicowej, stosowanegow technice światłowodowej i obowiązującego, takżew odniesieniu do soczewek gradientowych:∆ = (n 2 o - n 2 min )/2n 2 o ≈ (n o - n min )/n oPołączenie przybliżeń przyosiowego z małorefrakcyjnym(małą wartością refrakcji różnicowej) pozwala na znalezienieoptymalnego profilu refrakcyjnego szkła radialnie gradientowegodla wszystkich promieni światła. Tym profilem jest profilparaboliczny lub quasi-paraboliczny (parzystopotęgowy),stosowany również z tego względu w szklanych wielomodowychwłóknach optycznych. Profil refrakcji szkła radialnie gradientowegojest przedstawiany w kilku równoważnychpostaciach, np. w dwóch subtraktywnych i jednej addytywnej:Zależności subtraktywne bazują na maksymalnej osiowejrefrakcji szkła n(r) gradientowego n o = n(r = 0). Ostatniazależność, odmiennie ujęta od dwóch pierwszych,traktuje gradient refakcji szkła jako dodatkową refrakcję,zbudowaną na piedestale refrakcyjnym o wartościn oo = n(r = a). Zależność ta jest stosowana między innymido analizy aberracji chromatycznej szkła gradientowego.jest nazywana bazowym (piedestałowym)współczynnikiem załamania i służy do wyznaczenia liczbyAbbego szkła gradientowego. Wzór pozwala na wyznaczeniełącznej dyspersji pochodzącej od kształtu elementuszklanego i gradientu refrakcji. Apertura numeryczna szklanejsoczewki gradientowej jest definiowana analogicznie jakdla szklanej soczewki objętościowej:gdzie: n o - maksymalna wartość refrakcji na osi, g - siła skupiającasoczewki, r o - średnica soczewki.Parametry szkła gradientowego radialnieProfil refrakcyjny n(r) jest najważniejszym parametremoptycznego szkła gradientowego. Zgodnie z regułą Lorentza-Lorencarefrakcja szkła wieloskładnikowego jestzwiązana z liczbą jonów szkłotwórczych N i oraz z ich polaryzowalnościąα i :86 ELEKTRONIKA 3/<strong>2009</strong>


Dyspersja chromatyczna decyduje o jakości odwzorowaniaoptycznego w zakresie widzialnym przy pomocy elementuoptycznego ze szkła gradientowego. Należy do grupy najważniejszychparametrów szkła gradientowego. W wysokiejjakości szkle gradientowym dyspersja chromatyczna powinnabyć jak najmniejsza, przy jak największej dokładności odwzorowaniaparabolicznego profilu refrakcji i jak największejwartości refrakcji różnicowej. Mierzona jest standardowąróżnicą refrakcji dla linii Fraunhoffera n F -n C lub częściejliczbą Abbego V =(n D - 1)/(n F - n C ).Liczba Abbego, inaczej nazywana optyczną zdolnościązbierającą szkła jest jedną z tzw. liczb podobieństwa, pozwalającychna znaczne ułatwienie klasyfikacji szkieł pod względemdyspersji chromatycznej. Dla innych długości fal (pozawidzialnymi) i dokładnych rezultatów, szczególnie w techniceświatłowodowej, miarą jest nie liczba Abbego, a dyspersjaprędkości grupowej. W szklanej soczewce GRIN, którą częstostosuje się w zakresie światła widzialnego liczba Abbego,określająca poziom dyspersji chromatycznej, zmienia się czasamidość znacznie wzdłuż radialnych zmian koncentracjijonu modyfikatora refrakcji.Dla szkła gradientowego radialnie o gradiencie:n(r) = n oo + n o1 r 2 + n o2 r 4 + ...Zmiana znormalizowanego profilu koncentracji jonu modyfikatorarefrakcji w szkle w funkcji parametru dyfuzji T f = Dt/r o 2 , w zakresieT f = 0,01…0,2. D - współczynnik dyfuzji, r o - średnica pręta szklanego,t - czas dyfuzji. Przy liniowej zależności koncentracji jonui refrakcji wykres przedstawia również obliczone numerycznie, zrównania dyfuzji, znormalizowane profile refrakcji szkła gradientowego[1]Changes of normalized concentration profile of ion modifying refractionin glass as a function of diffusion parameter T f = Dt/r o 2 , forthe range T f = 0.01…0.2, D - diffusion coefficient, r o - diameter ofglass rod, t - diffusion time. When the ion concentration is boundvia a linear dependence with the change in glass refraction, thenthe curves show normalized refraction profiles of the gradientglass [1]rów polega m.in. na minimalizacji odchylenia standardowego(dopasowanie metodą najmniejszych kwadratów) pomiędzyprofilami dyfuzyjnym i parabolicznym, głównie poprzez dobórwartości parametru dyfuzji. Wynikiem jest np. wartość stałejogniskowania soczewki g w funkcji parametru dyfuzji T f . Z tejfunkcji otrzymywana jest optymalna wartość parametru T f , np.dla profilu parabolicznego.Maksymalna różnica refrakcji ∆n (bezwzględnej) pomiędzyosią, a obwodem jest również bardzo ważnym parametremoptycznego szkła gradientowego, ponieważ dość trudno jestotrzymać za pomocą procesów dyfuzji w szkle jej dużą wartość.Wartość ∆n jest związana z innymi parametrami refrakcjiróżnicowej szkła gradientowego, jak: n o - refrakcja na osioptycznej, stała skupiania soczewki g, r o - wymiar soczewki,apertura numeryczna soczewki NA = n o gr o .Możliwości uzyskania dużej wartości ∆n są związane z polaryzowalnościąi ruchliwością/dyfuzyjnością w szkle jonu modyfikatorarefrakcji powyżej temperatury odprężania T a szkła.O dyfuzyjności jonu w szkle decydują: promień jonowy, relatywniedo innych jonów w osnowie szklanej, polaryzowalnośćelektronowa jonu, współczynnik załamania jonu modyfikatora.Typowymi jonami, stosowanymi do tworzenia gradientu refrakcjiw szkłach wieloskładnikowych są: Tl, Cs, Ag, orazw niektórych szkłach także Pb, Ge, Ti. Mają one znaczną polaryzowalnośći ruchliwość w szkle.definiuje się miarę aberracji chromatycznej w postaci różnicydyspersji koloru osiowego i przyosiowego, tzw. krzywej przesunięciakoloru. W ogólnym przypadku aberracja jest zależnaod gradientu refrakcji i kształtu powierzchni elementu szklanego,co pozwala na kompensację aberracji chromatycznejw jednym elemencie gradientowym. Taki element jest dubletemsoczewek z układu szkieł kron-flint: skupiającej o niskiejrefrakcji i dużej dyspersji oraz rozpraszającej o wysokiej refrakcjii małej dyspersji.Układ ten spełnia warunek:f 1 V 1 + f 2 V 2 = 0, f -1 = f 1 -1 + f 2-1gdzie: f i jest ogniskową a V i liczbą Abbego. Ponieważ liczbyAbbego są wyłącznie dodatnie, to z tego wzoru wynika, żejedna z soczewek musi mieć ujemną ogniskową, aby uzyskaćachromat dla dwóch długości fali - linii C i F Fraunhoffera.Dla innych długości fali występuje redukcja ale nie całkowitakompensacja. Ulepszoną wersją szklanego elementu optycznegoachromatycznego (zerowanie dyspersji dla dwóchdługości fali - czerwonej i niebieskiej) jest element apochromatyczny(apo), dla którego kompensacja aberracji chromatycznejzachodzi dla trzech długości fali (np. czerwień, zieleń,niebieski). Apochromat szklany jest typowo skompensowanychromatycznie w zakresie długości fal λ≈0,42…0,85 µm.Charakterystyka kompensacji dyspersji chromatycznej apochromatujest krzywą trzeciego stopnia.Element szklany z korekcją aberracji chromatycznej dlaczterech długości fali jest nazywany superachromatem i jestwykonywany z zastosowaniem anomalnie dyspersyjnych szkiełfluorkowych. Superachromat szklany jest zazwyczaj standardowoskompensowany chromatycznie w zakresie długości falλ≈0,4…0,9 µm lub nawet nieco przekraczającym ten zakres.Warunek kompensacji jest określany następująco: przyrostdługości ogniskowej elementu szklanego ∆f nie powinien przekraczaćw całym paśmie korekcji długości fal, np. wartości∆f = ±0,05 mm. Korekcja na takim poziomie dokładności jestmożliwa jedynie w apochromatach i superachromatach. Achromaty,z powodu korekcji jedynie dwupunktowej reprezentowanejkrzywą drugiego stopnia, są skompensowane typowow paśmie λ≈0,48…0,5 µm z dokładnością ∆f = ±0,1 mm.ELEKTRONIKA 3/<strong>2009</strong> 87


Wszystkie powyższe metody korekcji dotyczą takżeszkieł gradientowych i wykonanych z niego elementówoptycznych. W soczewce szklanej GRIN, „pseudo-dublet”jest tworzony przez gradient refrakcji i powierzchnię elementu.Jest to, jak gdyby połączenie dwóch soczewek, klasyczneji gradientowej. Analogiczny warunek kompensacjidyspersji chromatycznej dla soczewki ze szkła gradientowegoprzyjmuje postać:Ф p /V = -Ф g /V ggdzie: Ф p - siła skupiająca powierzchni soczewki, V =(n ood -1)/(n ooF - n ooC ) - liczba Abbego szkła osnowy dla tzw. bazowegowspółczynnika załamania n oo , Ф g - siła skupiającagradientu refrakcji soczewki, V o1 = n o1d /(n o1F - n o1C ) -współczynnik dyspersji dla współczynnika załamania n o1 .Połączenie dwóch szklanych pseudo-dubletów gradientowycho odpowiednio odmiennych charakterystykach refrakcyjno-dyspersyjnychdaje cztery stopnie swobody wprojektowaniu elementu optycznego, a więc umożliwia wykonanieze szkła gradientowego apochromatów i superachromatówz dwukrotnie mniejszej ilości elementów składowych.Odrębnym trudnym zagadnieniem technicznym jest kompensacjadyspersji chromatycznej w mikrosoczewkach GRIN,współpracujących z pojedynczymi pikselami detektorów CCDw kamerach video. Mikrosoczewki są stosowane w celuzwiększenia ilości światła zbieranego przez pojedynczy pikseli są optymalizowane dla skupiania jednej długości fali (zielony).W przypadku małych rozmiarów pikseli kompensacjamoże być wykonana na drodze numerycznej.Parametry optyczne szkła gradientowego radialnie (soczewkiGRIN) są analogiczne do szklanych soczewek klasycznych.Rozdzielczość kątowa spełnia kryterium Rayleigha,określone przez ograniczenie dyfrakcyjne. Empiryczny limitdyfrakcyjny wynosi: sinθ =1,220λ/D, gdzie: θ - rozdzielczośćkątowa, λ - długość fali światła, D - średnica soczewki, apertura.Czynnik 1,22 wynika z obliczeń położenia pierwszegociemnego pierścienia otaczającego centralny dysk Airyego wewzorze dyfrakcyjnym. Dla soczewki idealnej o długości ogniskowejf, kryterium Rayleigha daje minimalną wartość rozdzielczościprzestrzennej ∆l = 1,220fλ/D. Dla małej wartościθ za rozdzielczość kątową przyjmuje się θ=λ/D [rad]. W przypadkumatrycy soczewek i odpowiednich warunków odwzorowania,rozdzielczość może być zwiększona. Inne parametryto długość ogniskowa, okres soczewki (parametr nie występującyw soczewkach klasycznych), liczba f będąca stosunkiemogniskowej do apertury, siła zbierająca.Szkło gradientowe uformowane w postaci soczewki wykazujepodobne zniekształcenia jak dla soczewek klasycznych.Wynikają one z nieskompensowania chromatycznegooraz nieidealności gradientu refrakcji: aberracja chromatycznapodłużna i porzeczna (omówiona powyżej) - podłużna i poprzecznaróżnica ogniskowych dla promieni o różnych długościachfali oraz pięć aberracji Seidela, tj.: aberracja sferyczna- różnica ogniskowych pomiędzy promieniem brzegowymi przyosiowym, koma - asymetria zobrazowania, astygmatyzm- eliptyczność punktu ogniska, krzywizna pola (krzywizna Petzvala)- zakrzywienie powierzchni obrazowej, dystorsja -zniekształcenie radialne beczkowe lub poduszkowe.Naprężenia mechaniczne zamrożone wewnątrz optycznegoszkła gradientowego są związane z istnieniem gradientu koncentracjijonów modyfikatorów refrakcji. Gradient koncentracjijonów zmienia gęstość szkła a także lokalną objętość, indukującnaprężenia. Naprężenia, poprzez zjawiska fotoelastyczności,prowadzą do dwójłomności optycznego szkłagradientowego. Jedną z metod uniknięcia zbyt dużego poziomunaprężeń mechanicznych w szkle gradientowym jesttzw. proces interdyfuzji. Prowadzone są w szkle gradientowymjednocześnie dwa procesy dyfuzji jonów. Jeden proces,w sposób symetryczny osiowo, zmniejsza w pewnych regionachszkła koncentrację jonów modyfikatorów refrakcji. Drugiproces wzbogaca jednocześnie ten region w dodatkowe jonykompensujące ubytek gęstości szkła. Różnica w gęstościszkła gradientowego pomiędzy częścią osiową i peryferyjnąjest w ten sposób znacznie skompensowana.Za powstawanie naprężeń w optycznym szkle gradientowymodpowiedzialne są dwa główne czynniki: niedopasowaniepromieni dyfundujących jonów oraz niedopasowanie rozszerzalnościtermicznej tworzonych przez dyfuzję szkieł o innymskładzie chemicznym. Jeśli temperatura procesu interdyfuzjijest znacznie mniejsza od temperatury relaksacji naprężeńw szkle, albo gdy lepkość szkła jest bardzo duża (taka sytuacjazachodzi w szkłach bezalkalicznych wysokokrzemionkowych),wówczas powierzchnia szkła nie może swobodnierozszerzyć się pod wpływem naprężenia i niedopasowaniepromieni jonowych prowadzi do naprężeń ściskających, alborozrywających na obwodzie pręta szklanego.W większości przypadków temperatura procesu interdyfuzjijest bliska temperatury relaksacji naprężeń szkła.W takim przypadku szkło „akceptuje” oba dyfundujące jonyi nie powstają znaczące naprężenia z tego powodu. Pozostajedruga przyczyna, czyli gradientowa zmiana rozszerzalnościtermicznej szkła od osi pręta do części obwodowej.Naprężenia powstają w czasie chłodzenia gradientowegopręta szklanego od temperatury procesu interdyfuzji do temperaturypokojowej. W większości przypadków naprężeniamają charakter kompresyjny na obwodzie, a więc korzystnyz punktu widzenia wytrzymałości szkła. Poziom tych naprężeńjest niewielki w porównaniu z wytrzymałością szkła.Rodzaje szkieł gradientowych radialniei metody wytwarzaniaWymiana jonowa pomiędzy K + -Cs + daje szkło o mniejszejaberracji chromatycznej niż dla pary jonów K + -Tl + . Inną korzystnąparą wymiany jonowej jest Li + -Na + . Metoda daje szkłogradientowe o parametrach: średnica pręta 2r o = 1…4 mm,stała skupiająca g ≈ 0,43 mm -1 , maksymalna refrakcjan o ≈ 1,66, apertura numeryczna NA ≈ 0,60. Metoda wymianyjonowej ma ograniczenia co do średnicy pręta szklanego,z powodu małej wartości współczynnika dyfuzji jonów modyfikatorówrefrakcji w tym procesie. Dla prętów o większej średnicyznacznie wzrasta czas procesu.Impregnacja jonowa jest techniką, która omija niektóre ograniczeniatechniki wymiany jonowej. Wzrost temperatury procesuwymiany jonowej w szkle powyżej temperatury T g dajemożliwość wytwarzania szkła gradientowego o średnicy powyżej2r o = 20 mm, co jest konieczne do zastosowańw optyce mikroskopowej. Stosowana jest para jonów Ag + -Na + .Dopasowanie wymiarów jonowych tej pary jest lepsze niżNa + -K + . Czas dyfuzji w szkle gradientowym o tak dużych wymiarachjest rzędu t d = 10 3 h i jest kilkakrotnie mniejszy, niżw przypadku pary wymienianych jonów K + -Tl + .Ograniczeniem wymiany jonowej z udziałem Ag +w szkłach jest ograniczona możliwość koncentracji domieszkiAg 2 O w szkłach krzemionkowych i koloidalne wytrącenia88 ELEKTRONIKA 3/<strong>2009</strong>


Porównanie metod wytwarzania i właściwości szkła gradientowego radialnie [1] Comparison between manufacturing methods of radially gradient optical glassMetoda Główna zaleta Główna wada Szkło osnowyJondomieszkiMaksymalnaśrednica r o[mm]Czas tworzeniagradientu n(r)refrakcji t o [h],Współczynnikdyfuzji D[cm 2 /s]Parametryoptyczne∆n [%] NAZastosowaniaNiskotemperaturowawymiana jonowaT < T*)gDokładna kontrola gradientun(r)Długi czaswytwarzaniaBorokrzemionkialkaliczneTl + , Cs + 4,0250,10 -9 ÷ 10 -10 0,1 0,6Matryce soczewek do xero, soczewki doCD, konektory światłowodoweWysokotemperaturowawymiana jonowaT > T*)gDokładna kontrola gradientun(r)Długi czas wytwarzaniaBorokrzemionkialkaliczneAg + , Tl + , 20 > 400, 10 -8 0,1 0,6 Optyka gradientowa fotograficznaImpregnacja jonowaSzybkie formowanien(r)Fosforowe Ag + 161200,10 -8 0,06 0,6 Fotograficzna optyka gradientowaImpregnacjamolekularnaOdporność chemicznai termiczna, szybkieformowanie n(r)SkomplikowanakilkuetapowatechnologiaSkomplikowana kilkuetapowatechnologiaWysokokrzemionkoweTl + , Cs + 5 1 0,025 0,3Soczewki dla telekomunikacjiświatłowodowejProces zol-żelSzybkie formowanien(r)KurczenieKrzemionkowei wysokokrzemionkoweGe 4+ , Ti 4+ 7 20 0,02 0,2Sprzęgacze dla telekomunikacjiświatłowodowejInterdyfuzjaSzybkie formowanien(r), kontrola dyspersjiprzez wybór jonuKurczenie w czasiewytwarzania elementuszklanegoOłowiowo-borokrzemionkowePb 2+ 1310,10 -6 ÷ 10 -7 0,1 0,6Soczewki do obietywów zoom, kamerykompaktowe i videoProces CVD Prosty proces Niegładki profil n(r) Szkło krzemionkowe Ge 4+ 2 2 1 Sprzęgacze światłowodowe* T g - temperatura transformacji szkłaELEKTRONIKA 3/<strong>2009</strong> 89


srebra. Rozwiązaniem tego ograniczenia jest zastosowaniedwuetapowego procesu, składającego się równomiernej impregnacjiwysokosodowego szkła osnowy jonem Ag + przezkąpiel w AgNO 3 i następnie deimpregnacja szkła osnowy.Współczynnik dyfuzji jonów Ag + jest rzędu D = 10 -7 cm 2 /s i jestznacznie większy niż w klasycznej wymianie jonowej.Impregnacja molekularna wytwarzania szkła gradientowegopolega na umieszczeniu równomiernego depozytu domieszkimodyfikującej refrakcję we wnętrzu porowatego szkłaosnowy, a następnie usunięciu części depozytu w rozpuszczalnikutak, aby stworzyć gradient koncentracji impregnatu.Impregnatami są np. CsNO 3 , TlNO 3 . Zaletą procesu jestdobra kontrola rozkładu impregnatu i wynikłej z tego refrakcjioraz znacznie większe współczynniki dyfuzji jonowej w tymprocesie D = 10 -5 cm 2 /s. Po procesie deimpregnacji szkło porowatejest konsolidowane termicznie.Technika zol-żel jest stosowana do wytwarzana szkła gradientowegow dwóch odmianach: częściowego ługowania kationówmodyfikujących refrakcję z mokrej pochodnej alkoksyżelu oraz interdyfuzji kationów modyfikujących refrakcjęw ciekłym impregnacie wypełniającym mikropory żelu, uformowanegoz użyciem wodnego roztworu soli metalu będącejźródłem kationów. Interdyfuzyjna technika zol-żel jest jedynąmetodą wytwarzania szkła gradientowego z jednoczesną dyfuzjądwóch (kilku) wielowartościowych jonów modyfikatorówrefrakcji. To daje możliwość bezpośredniego wytwarzaniaszkła achromatycznego w czasie pojedynczego (jednak dośćzłożonego) procesu.Wynikowy paraboliczny profil refrakcyjny jest tworzonywspólnie przez dyfundujące dwa jony: wypukła dystrybucjakoncentracji i refrakcji przez jony o małej dyspersji, jak Ba 2+oraz wklęsły rozkład koncentracji i refrakcji przez jony o dużejdyspersji Ti 4+ . Wykonując z takiego szkła element optycznyo złożonym kształcie pozwala na kształtowanie wynikowejapochromatycznej lub nawet superchromatycznej charakterystykidyspersyjnej.PodsumowanieW tabeli zebrano parametry szkła gradientowego wytwarzanegoróżnymi metodami. Zastosowania praktyczne jak dotądznalazły szkła gradientowe radialnie (w elementach dyskretnychi planarnych) i szkła gradientowe półsferycznie (w optycezintegrowanej). Jak dotąd optyczne szkło gradientowe jestprodukowane na skalę laboratoryjną i półprzemysłową.Szczególnie dotyczy to szklanych soczewek gradientowychGRIN o relatywnie niewielkich średnicach zewnętrznych, odok. 1 mm dla elementów sprzęgających w technice światłowodowejdla telekomunikacji, poprzez kilka mm w optyceświatłowodowej i dla techniki kserograficznej, do ok.15…20 mm w optyce mikroskopowej. Istotny przełom, oznaczającykonieczność szerokiej i taniej produkcji przemysłowej,mogą stanowić zastosowania w dwóch dziedzinach:• szklanych optycznych elementów gradientowych apochromatycznycho znacznych wymiarach w optyce fotograficznej(rzędu 50 mm i więcej) i do systemów wideo (rzędu kilkucm), zastępujące optykę klasyczną sferyczną i asferyczną,• gradientowe szkło optyczne o znacznych rozmiarach(rzędu kilku, a w pewnych rozwiązaniach nawet kilkunastucm) o konstrukcji planarnej i refrakcji periodycznej -w dwóch rozwiązaniach: dużych efektywnych soczewekFresnela oraz matryc mikrosoczewek.Literatura[1] Yamane M., Asahara Y.: Glasses for photonics. Cambridge UniversityPress, 2000.[2] Agraval G. P.: Nonlinear fiber optics. Academic Press, Boston1989.[3] Fournier J., Snitzer E.: The nonlinear refractive index of glasses.IEEE J. on Quantum Electronics, May 1974, vol. 10, issue 5, pp.473-475.[4] Weber M. J.: Handbook of optical materials. CRC Press, NewYork, 2003.[5] Musikant S., Thompson B. J.: Optical materials, A series of advances,vol. 1, Marcel Dekker, New York, 1999.[6] Szwedowski A.: Materiałoznawstwo optyczne i optoelektroniczne,WNT, Warszawa, 1996.Systemy identyfikacji radiowej -technologiczna globalizacja*inż. JAN BOGUCKI<strong>Instytut</strong> Łączności, WarszawaFale radiowe zostały po raz pierwszy wykorzystane do identyfikacjiobiektów podczas II Wojny Światowej. Radar miałza zadanie nie tylko wykrywać, ale również identyfikowaćswoje i obce samoloty. W celu umożliwienia takiej identyfikacjiobiekty, które mają być wyróżnione, powinny miećurządzenia odzewowe. Dzięki temu, pod wpływem impulsusondującego nie tylko dają one sygnał echa, lecz równieżnadają odpowiednio zakodowane sygnały identyfikujące,które umożliwiają rozpoznanie wyróżnionego obiektu napodstawie jego zobrazowania na ekranie wskaźnika radarowego.Obecnie miniaturowe, odczytywane za pomocą fal radiowychmikrochipy do identyfikacji obiektów są powszechniewykorzystywane w życiu codziennym. Znaczniki identyfikacjiradiowej RFID (Radio Frequency IDentification) są wykorzystywanew handlu - w magazynach, logistyce - do identyfikacjiprzepływu towarów, obiektów, produktów detalicznych orazw innych dziedzinach życia. Wypierają one skutecznie podobnetechniki, np. kody kreskowe, gdyż mogą przekazywaćinformacje na odległość, co nie wymaga skanowania każdegoobiektu. Umożliwiają one monitorowanie danego obiektu,a także proces jego przemieszczania bez udziału człowieka.*Wynagrodzenia autorskie zostały sfinansowane przez Stowarzyszenie Zbiorowego Zarządzania Prawami Autorskimi Twórców Dzieł Naukowychi Technicznych KOPIPOL w Kielcach, z opłat uzyskanych na podstawie art. 20 ustawy o prawie autorskim i prawach pokrewnych90 ELEKTRONIKA 3/<strong>2009</strong>


O popularności systemów RFID świadczy fakt, że do2007 r. na świecie sprzedano łącznie ponad 3,7 mld takichznaczników. W Europie odsetek ten nie jest tak duży, z powodubardziej restrykcyjnego prawa ochrony danych osobowych.Identyfikacja radiowaW skład podstawowego schematu blokowego systemu RFID(przedstawionego na rys. 1) wchodzą trzy podstawowe zespoły:1. mikrochip - składający się z identyfikatora, zwanego teżz języka angielskiego tagiem oraz anteny,2. czytnik,3. oprogramowanie komunikacyjne i użytkowe.Mikrochip jest układem elektronicznym z pamięcią orazminiaturową anteną, zapewniającą transmisję radiową. Identyfikatoryw nim zawarte mogą być aktywne, mające własneźródło zasilania lub pasywne, znacznie tańsze i bardziej niezawodne.Nie mają one baterii, a ich wzbudzenie wywołujefala elektromagnetyczna czytnika. Tag jest często zatopionywraz z anteną w plastykowej lub szklanej kapsułce. Chociażczęsto jego kształt zależy od konkretnego rozwiązania, przyjmującnp. postać etykiety. Na rys. 2 przedstawiono identyfikatortyp 113003 firmy GAO FRID Inc. [9]. Pracuje on naczęstotliwości 13,56 MHz, ma pojemność od 512 bitów do10 kbitów, wymiary 82 x 49 mm i wagę 0,5 g.Układ scalony czytnika przez antenę wysyła sygnał „zapytanie”do mikrochipa. Odbierany przez czytnik sygnał zawierażądane dane identyfikacyjne, nazwę towaru, jegopołożenie, adres klienta dla którego jest przeznaczony, itp.Przykładowo, czytnik RFID typ 236007 firmy GAO FRID Inc.[9] pracuje w zakresie częstotliwości 860...960 MHz, ma interfejsEthernet i RS 232. Antena o zysku 7 dBi jest wbudowanaw środku urządzenia. Urządzenie ma wymiary140 x 110 x 30 mm i wagę 500 g.Transmisja danych pomiędzy identyfikatorem i czytnikiemodbywa się drogą radiową, w wolnej przestrzeni oddzielającejdwie anteny tych urządzeń.Rys. 1. Schemat blokowy systemu RFIDFig. 1. Block diagram of RFID systemRys. 2. Identyfikator RFID Fig. 2. RFID TagPierwsze systemy RFID pracowały w dość niskim zakresieczęstotliwości, poniżej 500 kHz. Zapewniały one małąprzepływność transmisji, ale znakomicie spełniały swoją funkcjęprzy rejestracji dokumentów i innych obiektów niemetalowych.Szybszą transmisje zapewniały systemy pracującew zakresie 10...15 MHz, natomiast zupełnie inne możliwościdają systemy RFID pracujące w zakresie fal decymetrowych,tzn. 900 i 2400 MHz, gdyż wówczas szerokie pasmo radiowezapewnia bardzo dużą szybkość transmisji. Umożliwia to wykorzystaniesystemów RFID do identyfikacji produktów na paletach,śledzenia całych kontenerów i to w czasierzeczywistym. Systemy RFID w tych zakresach częstotliwościcechują się też większą rozdzielczością, dzięki temu mogąbyć identyfikowane nie tylko całe palety, ale również poszczególneelementy znajdujące się na nich.Oprogramowanie zapewnia właściwą transmisję danychoraz zapis w arkuszu bazy. Standard EPC Gen 2 zapewniaodczyt danych z identyfikatora RFID i w zasadzie jest jedynym,światowym protokołem komunikacyjnym. Standard EPCGen 2 został zaprojektowany w celu optymalizacji działaniaw różnych środowiskach regulacyjnych na całym świecie.Rynek systemów RFIDJak wspomniano, systemy RFID są powszechnie stosowanew transporcie i handlu, ale planuje się również inne ich użycie.Przykładowo dowody osobiste już wkrótce będą zawierałyidentyfikatory RFID. Około miliard obywateli naszego globubędzie posługiwało się takimi dokumentami. Rząd chiński,wprowadzając dowody osobiste z identyfikacją radiową, przeznaczyłna tą operację 6 mld dolarów. W Stanach Zjednoczonychidentyfikatory wprowadzane są także do prawa jazdy.Choć posiadanie ich jest dobrowolne, już kilkadziesiąt tysięcyamerykańskich obywateli wystąpiło o takie dokumenty. Wiążesię to ze znacznymi ułatwieniami, np. przy przekraczaniu granicy- system RFID umożliwia odczytywanie dokumentu bezwyjmowania go z kieszeni czy portfela, z odległości nawet10 m. W punkcie kontroli granicznej numer identyfikacyjny jestzdalnie odczytany i trafia do bazy danych służb granicznych.Gdy kierowca wjedzie na punkt graniczny, oficer ma jego zdjęcieoraz dane osobowe, nazwisko, adres zamieszkania itd.,co znacznie ułatwia kontrolę graniczną i skraca do minimumczas jej przekraczania. Warto dodać, że również paszportyzgodnie z zaleceniem Międzynarodowej Agencji Lotnictwa CywilnegoICAO (International Civil Aviation Organization), będąposiadały identyfikatory RFID.Przewiduje się przy tym, że wraz ze wzrostem popularnościznaczników RFID, zmaleje ich cena, a tym samym będąone stosowane również przez małe przedsiębiorstwa.Globalna inwigilacja?Radiowa identyfikacja produktów i przepływu przedmiotów niebudzi większych zastrzeżeń, natomiast paszporty lub dowodyz identyfikatorami RFID budzą duże wątpliwości, co doochrony prywatności i bezpieczeństwa. Przykładowo, na festyniew parku będzie kilkaset osób - nie będzie najmniejszegoproblemu z identyfikacją każdej osoby biorącej udziałw tej imprezie.Innym problemem jest to, że identyfikatory RFID praktycznienie mają żadnych zabezpieczeń, a tym samymkażda osoba mająca czytnik będzie miała dostęp do wieludanych, gdyż ich źródłem będą identyfikatory z paszportów,praw jazdy, kart płatniczych, biletów, elektronicznych kluczy,odzieży, itp.ELEKTRONIKA 3/<strong>2009</strong> 91


Warto nadmienić, że w Stanach Zjednoczonych identyfikatoryRFID stosowane w prawach jazdy wykorzystują standardEPC Gen 2, który zapewnia łatwość odczytu danychi jest wykorzystywany głównie do monitorowana zapasóww magazynach lub przepływu produktów w sieciach hipermarketów,zaś dla identyfikatorów dokumentów opracowanonormę ISO 14443, która określa pewne mechanizmy szyfrowania.Pomimo tego istnieje obawa całkowitej inwigilacjispołeczeństwa.Rozwój czytników RFID pod względem technicznym zmierzado tego, aby mogły pracować w sieci, a ich węzły centralnemogły być połączone z Internetem. Możliwa więc jestzdalna kontrola np. przepływu towarów na danym obszarzew czasie rzeczywistym, co wiąże się z przyśpieszeniemi całkowitą automatyzacją wszelkich procesów logistycznych.Ostatnio konsorcjum GSM wezwało przedsiębiorstwa doopracowania technologii RFID w telefonach komórkowych tak,aby od połowy <strong>2009</strong> r. oferować płatność w ruchomej telefonii.Ciągle nierozwiązanym problemem pozostaje zagadnieniezwiązane z ochroną prywatności i bezpieczeństwa, jednaknie spowalnia to tempa wprowadzania identyfikatorówradiowych, zaś gremia ustawodawcze nie chcą zbyt ingerowaćw rozwój tej gałęzi nauki, dostrzegając jedynie zalety ekonomiczne,ignorując zaś zagrożenia.Literatura[1] CEPT/ERC Rec. 70-03: Relating to the use of Short Range Devices(SRD), 2008.[2] Choi G.-Y., Choi W., Kim J.-S.:UHF RFID tag antenna using twoPIF-As embedded in metallic objects. Electronics Letters, 20,2008.[3] ETSI EN 300 220-1 V2.1.1 Electromagnetic compatibility andRadio spectrum Matters (ERM); Short Range Devices (SRD);Radio equipment to be used in the 25 MHz to 1 000 MHz frequencyrange with power levels ranging up to 500 mW; Part 1:Technical characteristics and test methods. 2006.[4] ETSI EN 302 208-1 V1.1.2 Electromagnetic compatibility andRadio spectrum Matters (ERM); Radio Frequency IdentificationEquipment operating in the band 865 MHz to 868 MHz withpower levels up to 2 W; Part 1: Technical requirements and methodsof measurement, 2006.[5] Fakler O., Hall R., Hecht Ch., Keller H., Klijnhout J., Mauro V.,McDonald M.,Spence A.: Intelligent Transport Systems In Europe.Opportunities for Future Research. World Scientific PrintersCo., Singapore, 2006.[6] ISO 14443: Identification cards - Contactless integrated circuitcards, 2008[7] Mazurek G.: Systemy radiowej identyfikacji obiektów z wielodostępemkodowym. KKRRiT, Gdańsk, 2007.[8] Son H.-W.: Design of RFID Tag antenna for metallic surfaceusing lossy substrate. Electronics Letters, 12, 2008.[9] www. gaorfid.com[10] www.rfidjournal.com/article/view/2481/1/1Wpływ szumów mikrofonowania na stanowiskodo pomiaru szumów fazowych generatorówmikrofalowych pracujących w paśmie X*mgr inż. BARTOSZ IDŹKOWSKI, mgr inż. ARKADIUSZ UTKOPolitechnika Wrocławska, <strong>Instytut</strong> Telekomunikacji, Teleinformatyki i AkustykiZe względu na ciągłą konieczność zwiększania pojemnościróżnych systemów, np. komórkowych, rosną wymagania dotycząceczystości widma generowanych sygnałów. Widmotakie powinno charakteryzować się małą wartością szumówamplitudowych i fazowych, których maksymalny, dopuszczalnypoziom jest często zawarty w zaleceniach konstrukcyjnychdla generatorów obsługujących wybrany system.Sygnał wyjściowy rzeczywistego generatora ma postać:V r (t) = [A(t) + B]cos[ω 0 t + φ 0 + φ(t)] (1)gdzie: V r (t)-przebieg wyjściowy sygnału z rzeczywistego generatoramikrofalowego, B - amplituda fali nośnej, φ 0 - fazapoczątkowa sygnału, ω 0 - pulsacja sygnału, ω 0 t =2π.Sygnał rzeczywisty zawiera również pasożytniczą modulacjęamplitudy A(t) i fazy φ(t). Modulacje te powodują, żewidmo rzeczywistego generatora ma skończoną i niezerowąszerokość, co skutkuje pogorszeniem jakości sygnału, zależnymod poziomu pasożytniczej modulacji fazy i amplitudy.To z kolei może prowadzić do całkowitego braku możliwościodtworzenia nadawanej informacji. W przypadku generatorówniskoszumnych pasożytnicza modulacja fazy jest przejawemwąskopasmowej modulacji częstotliwości wyrażonej wzorem:f 0 - częstotliwość środkowa nośnej.Z praktycznego i ekonomicznego punktu widzenia pasożytniczamodulacja fazy jest znacznie ważniejszym parametrem,branym pod uwagę w ocenie jakości wykonaniadanego generatora, gdyż to ona ogranicza w sposób zdecydowanypojemność całego systemu, a co za tym idzie - liczbęabonentów sieci. Amerykańskie instytucje telekomunikacyjnewyliczyły wpływ pogorszenia parametrów szumowych na stratyfinansowe poniesione z tego tytułu na przykładzie satelitarnegosystemu telekomunikacyjnego [1]. Oceniły one, że pogorszeniejakości systemu o zaledwie 0,1 dB powoduje 10 mlndolarów strat związanych ze zmniejszeniem pojemnościcałego systemu. Wynika z tego, że problem odpowiedniegopomiaru szumów fazowych używanych generatorów jest bezwzględnąkoniecznością oraz zagadnieniem niezwykle wymagającymz punktu widzenia dokładności takich pomiarów.Obecnie znanych jest wiele metod pomiarów szumów fazowych,zarówno w dziedzinie czasu, jak i częstotliwości niema jednak jednej uniwersalnej, która pozwalałaby w sposóbobiektywny i nieskomplikowany dokonać takich pomiarów dla(2)*Wynagrodzenia autorskie zostały sfinansowane przez Stowarzyszenie Zbiorowego Zarządzania Prawami Autorskimi Twórców Dzieł Naukowychi Technicznych KOPIPOL w Kielcach, z opłat uzyskanych na podstawie art. 20 ustawy o prawie autorskim i prawach pokrewnych92 ELEKTRONIKA 3/<strong>2009</strong>


Rys. 1. Schemat autokorelacyjnego układu do pomiarów szumów fazowych generatorów mikrofalowych w wersji jednotorowej: BG - badanygenerator, IZ - izolator mikrofalowy, E-H - rozgałęzienie E-H (magiczne T), WNS - wzmacniacz niskoszumny, A/C - przetwornik analog/cyfra,MAW- mikrofalowy analizator widma, SK - sprzęgacz kierunkowy, ZR - zwieracz regulowany, DET 1, DET 2 - diody mieszające, PC- komputerFig. 1. Autocorrelation phase noise measurement system scheme using delay line discriminatorróżnych typów generatorów. Skutkuje to tym, że znane metodysą dostosowywane do specyficznych potrzeb i rodzajubadanego generatora (inne w przypadku zegarów atomowych,inne w przypadku silnie szumiących generatorów w.cz.).W pomiarach generatorów pracujących w paśmie mikrofalowymX (8...12 GHz), wybraliśmy metodę autokorelacyjną(w dziedzinie częstotliwości), która najbardziej nadaje się dopomiarów generatorów silnie szumiących. Metodą tą możnarównież z powodzeniem zmierzyć szumy fazowe generatorówwykorzystywanych w spektroskopii EPR. Dodatkowymzałożeniem projektu było skonstruowanie takiego systemu pomiarowego,który jest prosty w obsłudze i kalibracji, jak równieżzawiera niewielką liczbę elementów, które są potencjalnymźródłem szumów własnych systemu, ograniczającym dynamikępomiaru. Schemat układu autokorelacyjnego w wersji jednotorowejprzedstawiono na rys. 1. Praktyczną realizację tego stanowiskaprzedstawia rys. 2.Na jakość uzyskiwanych wyników, we wszystkich metodachpomiarowych, mają wpływ wszelkiego typu zakłóceniawewnątrzsystemowe, takie jak np. jakość i rodzaj użytych elementów,liczba elementów (co wpływa na wypadkowywspółczynnik szumów liczony z użyciem wzoru Friisa) i pozasystemowe,jak np. zakłócenia pochodzące z sieci zasilania,zakłócenia przenoszone drogą radiową oraz będące wynikiemwszelkiego rodzaju drgań, tzw. szumy mikrofonowania.W pierwszym etapie pracy skupiliśmy się na eliminacjiwszelkiego rodzaju zakłóceń mechanicznych, mających wpływna pasożytniczą modulację fazy. Jedną z głównych przyczynRys. 2. Praktyczne wykonanie układu do pomiaru szumów fazowychFig. 2. Practical design of the phase noise measurement systemtego rodzaju zakłóceń, są tzw. szumy mikrofonowania, polegającena niepożądanych drganiach mechanicznych elementówprzenoszących energię elektromagnetyczną (kable,falowody). Skutki oddziaływań tych drgań na układ mogą byćtrwałe (gdy drgania są na tyle silne, że powodują trwałą zmianęparametrów medium transmisyjnego, np. zmianę pojemnościkabla ∂C/C. Skutki mogą być również chwilowe i objawiać siępasożytniczą modulacją fazy badanego sygnału.W tym przypadku mamy do czynienia tylko z czynnikamichwilowymi, gdyż elementy transmisyjne składają sięwyłącznie z falowodów WR90 i mikrofalowych kabli półsztywnych,a amplituda drgań jest niewielka. Drgania mechanicznestanowiska powstają głównie na skutek drgań elementówchłodzących (wentylatorów) aparatury pomiarowej, takich jakanalizator widma mikrofalowego i analizator m.cz. Podatnośći wpływ szumów mikrofonowania na stanowisko pomiarowezostał określony na podstawie badań.W tym celu dokonaliśmy wielu pomiarów akcelerometrycznychelementów najbardziej narażonych na drgania mechaniczne.Pomiary zostały wykonane za pomocą młotka doanalizy modalnej z przetwornikiem siły PCB 208C02. Przyrządten składa się z masywnej części uderzającej, która mawymienne końcówki udarowe. Na elemencie badanymumieszczono akcelerometr, którego zadaniem jest detekcjawygenerowanego impulsu mechanicznego oraz zamiana jegoprzebiegu czasowego na wielkość elektryczną. Szerokość impulsu,a co za tym idzie - szerokość pasma pomiarowego, regulowanabyła za pomocą wymiennych końcówek o różnejtwardości (im mniejsza sprężystość tym krótszy czas trwaniaimpulsu). Udało się uzyskać maksymalne pasmo pomiaroweo szerokości 6 kHz. Przebieg sygnału pomiarowego rejestrowanybył za pomocą komputera oraz programu WinPomi, autorstwadr Piotra Pruchnickiego z Politechniki Wrocławskiej.Impuls pochodzący z młotka wyzwalał cykl pomiarowy. Odpowiedźmechaniczna układu, zbierana za pomocą akcelerometruB&K 4336 podłączonego do przedwzmacniaczaładunkowego B&K 2626, jest przedstawiona na rys. 3.Sygnał elektryczny był rejestrowany na komputerze za pomocąkarty muzycznej. Schemat układu pomiarowego zamieszczonona rys. 4.Elementem najbardziej podatnym na drgania mechaniczneokazała się linia opóźniająca, służąca do dekorelowania sygnałupochodzącego z badanego generatora z sygnałem bezpośredniodocierającym do dyskryminatora częstotliwości.Linia ta jest wykonana z falowodu prostokątnego WR 90 i madługość 6 m. Konstrukcja mechaniczna linii ma kształtELEKTRONIKA 3/<strong>2009</strong> 93


I 0II 0I 1II 1I 2Rys. 3. Odpowiedź mechaniczna układu zawężona do pasma 0...300 Hz, uwzględniająca sygnały niepożądane i ich harmoniczne z sieci zasilania(II 0 ,II 1 ) oraz drgań mechanicznych (I 0 ,I 1 ,I 2 )Fig. 3. Mechanical respond of the system shortened to the 0 to 300 Hz bandwidth, including spurious signals and harmonics from powersupply (II 0 ,II 1 ) and mechanical oscillations (I 0 ,I 1 ,I 2 )Rys. 4. Schemat pomiarowy układu do badania drgań mechanicznychFig. 4. Mechanical oscillations measurement system schemefazazakresRys. 5. Przesunięcie fazy wynikające z obecności zakłócającego sygnału mikrofonowaniaFig. 5. Phase shift related to the presence of spurious microphonic noise94 ELEKTRONIKA 3/<strong>2009</strong>


sprężyny. Pomiary akcelerometryczne zostały przeprowadzonew płaszczyźnie szerszej i węższej krawędzi falowodu(jak przedstawiono schematycznie na rys. 4).Wyniki badań pokazały, że częstotliwość drgań własnychlinii opóźniającej, której drgania, można aproksymować równaniemoscylatora tłumionego:gdzie: k - stała sprężystości, m - masa obiektu, b - stałatłumienia, wynosi około 30 Hz i występuje tylko w płaszczyźnieprostopadłej do szerszej krawędzi falowodu, czyli znajdujesię w obszarze częstotliwości, gdzie na jakość pomiarów największywpływ ma oprócz szumu mikrofonowania, szum migotania1/f. Wpływ sygnału zakłócającego S(t) zmiennegow czasie, który może być przedstawiony jako wektor:gdzie: S s (t) jest składową stacjonarną sygnału zakłócenia,a S t (t) składową transmisyjną sygnału zakłócenia, można wyrazićza pomocą funkcji ISF (Impuls Sensivity Function) [2].Ponieważ sygnał zakłócający występuje tylko w jednej płaszczyźnie,należy przyjąć, że S s (t) =0. Przy takim założeniufunkcja S s (t) =S(t) reprezentuje przesunięcie fazy badanegosygnału zakłóconego x – 0 (t) względem sygnału niezakłóconegox 0 (t), które wyraża się wzorem:(3)S(t) = S s (t) + S t (t) (4)(5)W celu eliminacji szumu mikrofonowania, który powodowałybypasożytniczą modulację fazy badanego sygnału na niskichczęstotliwościach, postaci:V(t) = Bcos[ω 0 t + φ 0 + Msin(ω 1 t +φ)] (6)gdzie: V(t) - przebieg wyjściowy sygnału z generatora mikrofalowegozmodulowanego fazowo, M - amplituda sygnału modulującego,ω 1 - pulsacja sygnału modulującego, φ - fazasygnału modulującego, linię opóźniająca umieszczono na specjalnejramie amortyzującej oraz podporach tłumiących, cospowodowało znaczną eliminację jej drgań mechanicznych.PodsumowanieZjawisko eliminacji wibracji mechanicznych dla różnego typugeneratorów jest zagadnieniem coraz częściej dostrzeganymi eliminowanym w urządzeniach elektronicznych, szczególniew takich jak telefonia bezprzewodowa, gdzie nawet fakt poruszaniasię osoby i związane z tym drgania mogą powodowaćpogorszenie wartości szumu fazowego (szczególniew pobliżu fali nośnej), a co za tym idzie pojemności systemu.Współczesne techniki wykorzystują tzw. systemy izolacji wibracjiVIS (Vibration Isolation Systems) oraz aktywną kompensacjęwibracji przy użyciu akcelerometrów.Uzyskane wyniki pomiarów akcelerometrycznych pozwoliłyzidentyfikować częstotliwości, na których mogłyby występowaćpotencjalne zakłócenia mające charakter chwilowy. Zakłóceniate mają wpływ na ostateczny wynik pomiarów, dlategodołożono wszelkich starań, aby je wyeliminować, konstruującramę i podpory kompensujące, na których zawieszona jest falowodowalinia opóźniająca. Rozwiązanie to pozwoli zredukowaćdrgania do poziomów niezauważalnych przy pomiarach.LiteraturaFluktuacje fazy badanego sygnału szumowego wynikającez obecności sygnału zakłócającego na częstotliwości30 Hz przedstawiono na rys. 5.[1] Robins W.: Phase noise In Signal sources. Peter Peregrinus Ltd.,1991.[2] Falk T., Schwarz W.: Impulse sensivity functions of oscillators.Technical University Dresden, Germany.State-of-the-art bolometers -principles, devices, applications*(Nowoczesne bolometry - zasady działania, konstrukcje, zastosowania)dr inż. PAWEŁ WIERZBAPolitechnika Gdańska, Wydział Optoelektroniki i Systemów <strong>Elektronicznych</strong>Thermal detectors play an important role in many scientificand industrial applications requiring detection of infrared (IR)and terahertz (THz) radiation, in spite of the continuousprogress in the field of photon detectors. Advances in micromechanics,material science and electronics have resulted innew design of both individual detectors and detector arrays.Often capable of room-temperature (i.e. uncooled) operation,these detectors yield inexpensive, compact and power-efficientmeasurement and imaging solutions.Principles of operationBolometer is a thermal detector that consists of an absorber,thermal mass and a thermometer (usually a resistor) thatmeasures radiation-induced temperature change. Operationof a bolometer is best described using Fig. 1. Radiation incidenton the bolometer is absorbed by the absorber (usuallyan absorptive coating - e.g. carbon soot) resulting in an increasein the temperature T of the thermal mass of the de-*Wynagrodzenia autorskie zostały sfinansowane przez Stowarzyszenie Zbiorowego Zarządzania Prawami Autorskimi Twórców Dzieł Naukowychi Technicznych KOPIPOL w Kielcach, z opłat uzyskanych na podstawie art. 20 ustawy o prawie autorskim i prawach pokrewnychELEKTRONIKA 3/<strong>2009</strong> 95


tector. This increase depends on the power P of absorbed radiation,thermal mass m of the detector, its thermal capacitanceC th as well as on the thermal conductivity G th from thethermal mass m to the surrounding environment. The increasein temperature T is measured, usually by a resistive layerwhose resistance R B depends on the temperature. In mostcases, the thermal mass m is the combined mass of the absorberand the resistive layer.Fig. 1. Thermal equivalent circuit of a bolometerRys. 1. Termiczny model zastępczy bolometruExchange of energy between the bolometer and its environmenttakes place through conduction, absorption and radiation.These phenomena and their quantitative description,have been studied for several decades and are discussed e.g.in [1-3]. In most cases the bolometer is described using a simplemodel consisting of the thermal conductance G th and thermalcapacitance C th :where ∆T - temperature difference between the bolometerand the environment, ε - emissivity of the absorber layer,Φ - radiation flux incident on the bolometer.The quantity τ th , defined as:is known as the thermal time constant of a detector, which,like an RC constant in electronic circuits, is related to thebandwidth of the detector. In some bolometers, where severalconduction and radiation paths are present, the response cancontain transient components having different time constants.The change ∆R of resistance R B induced by the radiationincident on the bolometer is converted into an electrical signal(voltage or current) by biasing the bolometer from a currentor voltage source, as shown in Fig. 2.a) b)Fig. 2. Biasing circuit for bolometer: a) with current source I B ,b) with voltage source U B , R B - bolometer, ∆R - resistance changeof the bolometerRys. 2. Układ polaryzacji bolometru: a) ze źródłem prądowym I B ,b) ze źródłem napięciowym U B , R B - bolometr ∆R - zmiana rezystancjibolometruThe electrical power P E dissipated by the bolometer changeswith ∆R. In a bolometer biased by a current source I B(Fig. 2a), its change ∆P E can be expressed as:(1)(2)while in a bolometer biased by a voltage source U B (Fig. 2b)it becomes:where: R B - resistance of the bolometer. In both cases the∆P E results in a further change of the temperature of thebolometer, which, in turn changes ∆P E . This process is referredto as electrothermal feedback. Electrothermal feedbackcan be both negative and positive, as shown in Table, and istaken into account by replacing thermal conductance G of thebolometer by an effective thermal conductance G’, that canbe calculated knowing bolometer resistance R B , its TemperatureCoefficient of Resistance (TCR) and operating point.Type of electrothermal feedback (ETF) as a function of TCR and thebiasing sourceZależność rodzaju sprzężenia elektrotermicznego (ETF) of temperaturowegowspółczynnika rezystancji (TWR) bolometru i rodzaju źródłapolaryzującegoETFCurrentBias sourceVoltageTCR < 0 negative positiveTCR > 0 positive negativeWhen positive electrothermal feedback exists in the biasedbolometer, care must be taken to avoid thermal runawaycondition, in which self-sustaining rise in the dissipated powerleads to the catastrophic damage to the bolometer.Sensitivity S of a bolometer to incident radiation is defined[3] using the circuit from Fig. 2a as the ratio of the voltagechange ∆U to the power P of incident radiation:where ∆R - resistance change of the bolometer. I B - bias current.Ability of a bolometer to detect weak signals is limited byits noise. Signal-to-noise ratio SNR, which is a measure of thisability, can be written using (5) as:where U N - noise voltage at the output of the circuit fromFig. 2a. From (6) follows that improvement in SNR can beachieved either by increasing S, or by reducing U N .Performance of detectors is often compared using a figureof merit, known as detectivity D*, defined as:where: A - surface area of the detector, ∆f - frequency bandwidthof interest, U N - noise voltage of the detector, S - sensitivity,SNR - signal-to-noise ratio, Φ - incident radiation flux.Better detectors have higher values of D*.(3)(4)(5)(6)(7)96 ELEKTRONIKA 3/<strong>2009</strong>


Noise of bolometersAs seen from the preceding section, noise is an important parameterof a detector, often limiting its performance. Noise of thebolometer consists of four main components: a) photon noise,b) temperature noise, c) Johnson noise, d) 1/f noise. The firsttwo components are independent of the temperature sensingmaterial, while the last two depend on the choice of material.Photon noise is a consequence of the quantum nature oflight and the statistical character of the process of light emissionand absorption. As a result the number of photons absorbedin the detector per time unit varies, fluctuating aroundthe average. If the photon energy hν is much greater than kT,Poisson statistics can be used to describe this process. Otherwise,Bose-Einstein statistics must be employed. Photonnoise defines the fundamental noise limit that exists even ifa detector were noiseless.Temperature noise results from the statistical character ofheat exchange processes both inside the detector and betweenthe detector and the environment. In most bolometersit is not the dominant source of noise.Johnson noise, also known as Johnson-Nyquist noise resultsfrom the thermal fluctuations of velocity of the free carriers(i.e. electrons and holes) in the material. This noise isalways present in every resistive material, even if it is not polarizedby a current or voltage, and it cannot be eliminated.As a result, Johnson noise sets the ultimate lowest limit onthe noise of a resistive detector.1/f noise is believed to be caused by electrical phenomenapresent at the interfaces of dissimilar materials or crystallinedomains, surface leakage, the potential barriers in thematerial and other phenomena. The exact origins of 1/f noisein several materials remain unknown, despite the research effortdirected toward the explanation of its nature. 1/f noise isoften the dominant component of the bolometer.Temperature sensing materialsProperties of a bolometer, such as sensitivity and noise, dependto a great extent on the properties of the material usedin the temperature sensing layer of this detector. This materialcan be a:• metallic thin film,• semiconductor,• thermistor material,• superconductor.Behaviour metals is well understood. They exhibit TemperatureCoefficient of Resistance (TCR) of about 0.3%/K.Typically, the layer thickness is 10...50 nm, which correspondsto the resistance in the range 1...5 MΩ for single-element detectorsand 10...500 kΩ for small bolometer arrays.Semiconductor materials, such as germanium (Ge) and silicon(Si), are mostly used in cryogenic bolometers operating at0.1...10 K, offering performance close to the theoretical limits andcomparable to that of photon detectors. Vanadium oxides, suchas V 2 O 3 and VO 2 , can operate at room temperature, where theyhave high TCR, often exceeding 4%/K, due to a temperature-inducedcrystallographic transformation that is accompanied by areversible semiconductor (low-temperature) to metal (high-temperature)phase transition [4] at about 50...70°C. The noise levelof these materials is low, not exceeding much the Johnson noiselevel and has only small 1/f noise component. This combinationof high TCR, low noise and compatibility with standard silicon integratedcircuit process makes these materials a preferredchoice, especially for manufacturing of microbolometer arrays.Thermistor materials are ceramics made from mixtures ofmetal oxide powders. Composition of manganese (Mn), cobalt(Co) and nickel (Ni) oxides yield negative TCR in the range of2...4%/K. Since these materials often exhibit noise that is10...100 times higher than their Johnson noise, the performancethey deliver is not significantly better that that of vanadiumoxides.Superconductors used in bolometers can be both low-temperaturesuperconductors (LTSC) such as aluminium (Al) orniobium nitride (NbN) and high-temperature superconductors(HTSC), such as YBaCuO. These materials exhibit the transitionfrom semiconductor to superconductor in a range oftemperatures which spans from 1 mK to few K above criticaltemperature T c .Two operation principles of superconducting bolometersare possible. In the first one, the operating temperature of thebolometer is chosen inside the transition temperature range,on the steeply rising part of R B (T), where the value of dR/dTis the highest. Since such superconducting bolometers areoften referred to as Transition Edge Sensors (TES) or transition-edgebolometers.Another operation principle is used in superconducting HotElectron Bolometers. A thin (few nm) and narrow (0.1...0.5 µm)layer of superconducting material is kept just below its criticaltemperature and is biased with a constant current. The valueof that current is chosen to yield current density in the layerthat is close to its critical current density I c (i.e. to the currentdensity above which the material is no longer in the superconductingstate). When no radiation is incident on the layer, voltagedrop along it is zero (Fig. 3a). A photon absorbed by thelayer increases locally its temperature, thus creating a non-superconducting(i.e. resistive) spot in it (Fig. 3b). As a result thecurrent density in the area around the spot exceeds the criticalcurrent density, and the resistive spot extends to a section ofthe layer. The voltage which develops along this section candetected by measuring voltage drop on the layer (Fig. 3c). Finally,the resistive spot is cooled and the bolometer returns toits original state (Fig. 3a).New materials for superconducting bolometers are devised.One of them is magnesium diboride (MgB 2 ), which hascritical temperature T c = 39K and a very sharp transition be-a) b)c)Fig. 3. Hot Electron Bolometer: a) operation point, b) resistive spotafter photon absorption, c) resistive spot extending to a section ofthe sensing layerRys. 3. Bolometr z gorącymi elektronami: a) struktura niepobudzona,b) obszar rezystywny po absorpcji fotonu, c) obszar rezystywnyobejmujący część warstwyELEKTRONIKA 3/<strong>2009</strong> 97


tween superconducting and resistive state. Bolometers madefrom MgB 2 do not have to operate with liquid helium coolingand can offer relatively high sensitivity compared to bolometersusing HTSC materials [5].Lanthanum-strontium-iron oxides (LSFO) are another promisinggroup of materials. Typically, they have negative TCR inthe range of 2...4%/K [6]. Since their technology is at an earlystage of development, they exhibit noise almost two orders ofmagnitude higher than their Johnson noise, as well as a substantialamount of 1/f noise.Manufacturing and deposition technology of temperaturesensitivematerials is another area of continuing research. Suchwork has been undertaken on well-known vanadium oxide(VO x ) [7]. Nanopolycrystalline VO 2 thin films have been fabricatedusing a reactive ion beam sputtering on a silicon substratecoated with Si 3 N 4 buffer layer at a temperature of 300°C.The layer had phase transition temperature of 35°C and TCRof -7%/K, which compares favourably to the conventional polycrystallineVO 2 thin film having TCR of around -2%/K.Types of bolometersFrom several types of bolometers described in the recent scientificliterature, a few types of detectors were chosen to providea representative selection of the state-of-the-art devices.These devices have demonstrated high performance, or havea substantial application potential.High-temperature superconductor bolometersThe high-temperature superconducting bolometers are mademostly from YBaCuO. Being transition-edge sensors, thesebolometers operate at the transition temperature i.e. 80...90K.Detectivity D* of these bolometers ranges from 10 7 to3•10 8 cm√Hz/W. Research currently conducted on thesebolometers is mostly targeted at optimizing them for operationin a given wavelength range by using new structures ofthese detectors and new absorbing materials.Hot Electron Bolometers for detection of THz radiationA Hot Electron Bolometer (HEB) for THz detection typicallyconsists of an ultra-thin (i.e. a few tens nm thick) superconductingmicro-bridge coupled with a planar antenna. The outputelectrical bandwidth of a HEB can reach several tens ofgigahertz and is limited only by the electron-phonon scatteringrate, which is about 1.5 to 5 ps at 80...90K in YBCO.Therefore, the HEB can be employed for detection of THz radiationusing heterodyne detection technique discussed in theApplications section of this paper.HEB can also be made from room-temperature narrowgapsemiconductors (e.g., Hg 1−x Cd x Te or InSb) in which theincident radiation heats only the electron gas without heatingthe semiconductor lattice [8]. In spite of having parametersworse than those of superconducting HEB, these room-temperatureHEB are much more convenient to use.Bolometers for single photon detectionSingle photon detection can be performed by Hot ElectronBolometers as well as by superconducting Transition EdgeSensors (TES). According to [9] HEB operating at 4K can detectIR radiation (λ =1.55 µm) with quantum efficiency of 0.1,showing 18 ps timing jitter and dark count rate (DCR) of0.1 cps (counts per second). Their maximum count rate isFig. 4. NbN HEB meander pixel (500 × 500 µm 2 ) and its coplanar microwavereadout circuit (left), transmission optical microscopy pictureof the meander (10 × 10 µm 2 ) (right) [9]Rys. 4. Bolometr HEB wykonany w postaci meandra z warstwyNbN (500 × 500 µm 2 ) wraz z koplanarnym układem odczytu(z lewej), obraz meandra w technice optycznej mikroskopii transmisyjnej(10 × 10 µm 2 ) (z prawej) [9]around 10 9 cps. Superconducting TES operating at 0.1K candetect IR radiation (λ =0.2 - 1.8 µm) with quantum efficiencyof 0.2, while having 350 ps timing jitter and dark count rate(DCR) close to zero. Their maximum count rate is around2•10 4 cps. An example NbN HEB is shown in Fig. 4. It consistsof a meander made from NbN thin (5 nm) film connectedto a coplanar microwave line.These detectors can be used in optical quantum cryptography(e.g. in quantum key distribution) [9]. Quantum efficiency,which can reach 0.5, low DCR and high maximumcount rate make them an almost perfect choice for this application.However, in the long term, the need for cryogenic coolingmay hamper widespread adoptionQuantum well thermistorQuantum well thermistor, described in [10], is based ona multi-layer structure of very thin Si/SiGe single crystal epitaxiallayers, in which quantum wells are formed. These quantumwell structures restrict the movement of electrons to twodimensions, creating in turn discrete energy levels known asenergy subbands. The quantum wells function as the thermistormaterial, changing its resistance as the temperaturevaries. The temperature coefficient of resistivity TCR can becalculated and expressed in terms of quantum well’s barrierlevel V and Fermi energy level E f by:where: k B - Boltzmann’s constant, T - temperature. By varyingthe germanium content, the barrier height V can be changed.The Fermi level E f can be controlled by the quantum wellwidth and the doping level of the well. In this way the materialcan be tailored to maximize the TCR. For maximum feasiblegermanium content of about 40% a TCR of 3,5%/K has beenpredicted and experimental structures with 35% germaniumcontent exhibit a TCR of 3,3%/K, which is in good accordancewith the theoretical model. These materials have also lownoise (especially 1/f noise) and good uniformity of materialproperties due to single crystal structure and high dimensionaluniformity of epitaxial layers.Bolometers for x-ray detectionBolometers can also be used for detection of x-ray radiation.An example room-temperature detector, discussed in [11] andshown in Fig. 5, is a thin-film bolometer whose absorber and(8)98 ELEKTRONIKA 3/<strong>2009</strong>


In order to increase the absorption, a λ/4 Fabry-Perot cavitycan be created in the bolometer structure [15], as shown inFig. 7. Most designs use the structure from Fig. 7a as it allowsfor thinner bolometer membranes to be used. Both generationsof microbolometer arrays use mostly VO 2 bolometers,with amorphous silicon making some inroads.a)Fig. 5. A thin-film bolometer for soft x-ray detection [11]Rys. 5. Bolometr cienkowarstwowy do detekcji miękkiego promieniowaniax [11]sensing resistor are made from thin Au layers. Operating insidea vacuum chamber (5•10 −5 Torr), and detecting lasergeneratedshort x-ray this bolometer showed sensitivity of1.12 V/J and thermal time constant of around 6 s.b)Imaging foil bolometersImaging foil bolometer, whose example implementation is describedin [12], consists of a 1 µm gold foil mounted ona frame. This foil stops photons with energies up to 6 keV(λ > 0.2 nm), converting their energy into heat. The front sideof the foil faces the monitored plasma through a square aperturewhile the back side, blackened with graphite to increasethe IR emissivity, is viewed by an IR camera that measurestemperature distribution on the foil. Distribution of the powerincident on the foil is calculated using the measured temperaturedistribution. The use of other materials, such as tantalum,has also been reported [13].Detector arraysMicrobolometer arrays have been developed by Honeywellsince early 1980 s. These detector arrays do not require coolingand can be inexpensively manufactured with standard siliconprocess equipment. First generation detectors are madeas 320 x 240 (QVGA resolution) focal plane arrays capable ofoperating at the frame rate of 30 Hz, and achieving NoiseEquivalent Temperature Difference (NETD) of less than 0.05°C(at 30 Hz frame rate, with F/1.0 optics) [14]. Microbolometerarrays are optimized for wavelength range 8...14 µm and employthin VO 2 films to detect IR radiation. The pixel fill ratio isabout 50...70%. Their example pixel structure is shown inFig. 6a. Being mass-produced in a only slightly modified siliconIC process, these detectors quickly became inexpensive,opening up new application areas in search and rescue, firefighting,commerical security and thermography.The immense success of microbolometer arrays promptedfurther work in this field. As a result, second generation ofmicrobolometer arrays has been developed. The second generationdevices, available from companies worldwide (c.f.Table in [15]), feature improved resolution, typically 640 x480pixels (VGA) and frame rate of 30...60 Hz. Absorber is separatedfrom the sensing layer and extends over the whole pixel,i.e. the sensing resistor, its contacts and supports (legs), asshown in Figure 6b, increasing the amount of collected radiation.Thermal contact from the absorber to the sensing resistoris provided by a short stub. This two-level ‘umbrella’ pixelstructure has pixel fill ratio of around 90%. The NETD down to0.035°C can be attained; alternatively, the pixel size can be reduced,down to 17 µm, while keeping the NETD at 0.05°C.Fig. 6. Example microbolometer designs: a) first generationsingle level pixel [15], b) second generation two-level ’umbrella’design [16]Rys. 6. Przykładowe konstrukcje mikrobolometrów: a) jednopoziomowypiksel pierwszej generacji [15], b) dwupoziomowy pikseldrugiej generacji [16]a)b)Fig. 7. Cross-section of bolometers employing resonant Fabry-Perot cavity for increasing absorption of detected radiation [15]:a) cavity formed between the membrane and the substrate, b) cavityformed around the membrane. ROIC - Read-Out Integrated CircuitRys. 7. Przekrój konstrukcji bolometrów, w których zastosowanownękę rezonansową Fabry-Perota w celu zwiększenia absorpcjipromieniowania [15]: a) wnęka utworzona pomiędzy membranąi podłożem, b) wnęka obejmująca jedynie membranę. ROIC - scalonyukład odczytuELEKTRONIKA 3/<strong>2009</strong> 99


ApplicationsApplications presented in this section cover both well-establishedand innovative application areas and illustrate broadrange of existing and developed solutions.a)Passive optical probing of silicon CMOSintegrated circuitsSuperconducting hot electron bolometers have been used todetect light emission from silicon CMOS integrated circuits.An NbN superconducting hot electron bolometer cooled to4.2K was used to detect single photon infrared pulses emittedby a CMOS IC made in 0.13 µm technology [17]. The detectorhas dark count rate (DCR) below 50 cps (counts per second),timing jitter below 40 ps and Quantum Efficiency (QE) of0.02%. Authors show that its QE can be improved to 5% byoptimizing the layout of the detector and adjusting its operatingpoint. Moreover, improving the uniformity of the superconductinglayer should lower the DCR to about 1 cps.b)Detection of THz radiationDetection of THz radiation can be performed using superconductinghot-electron bolometers (HEB), operating as heterodynemixer. Principle of the detection is the same as intraditional heterodyne detection (Fig. 8a), where detected signal,at the frequency f RF is multiplied by the signal from thelocal oscillator LO (frequency f LO ) yielding intermediate frequency(IF) at the difference frequency (f IF =|f RF - f LO |). In thecase of THz detection (Fig. 8b), the HEB is illuminated withdetected signal (frequency f DET ) and the radiation from theLO (frequency f LO ), similarly yielding the IF signal at the differencefrequency (f IF =|f DET - f LO |).Based on the review presented in [18] it should be notedthat state-of-the-art bolometers operating in the 0.3-10 THzrange achieve performance about 10 times worse than thequantum limit for these detectors, i.e. one order of magnitudebetter than solutions using Schottky diode mixers. Moreover,they use about two orders of magnitude lower LO power thanthe Schottky diode mixers.a)Fig. 9. Microbolometer array: a) modified pixel cross-section,b) normalized intensity profile of the beam produced by a QuantumCascade Laser operating at 3.1 THz [19]Rys. 9. Matryca mikrobolometrów: a) przekrój zmodyfikowanegopiksela, b) znormalizowany profil natężenia wiązki lasera z kaskadąkwantową pracującego na częstotliwości 3.1 THz [19]Detection of THz radiation can be also performed usingVO 2 microbolometer arrays. In an experiment [19] selectedVO 2 microbolometer arrays detected THz radiation in the frequencyrange around 3 THz attaining Noise Equivalent Power(NEP) from 220 pW to 280 pW operating at the frame rate of60 Hz. Arrays modified by applying a thin metallic film, servingas a THz absorption layer (Fig. 9a), had NEP from 36 pWto 50 pW. Using them authors of [19] measured intensity distributionof radiation from a Quantum Cascade Laser operatingat 3.1 THz with average output power of around 8...10 µW(Fig. 9b). By averaging subsequent frames (which is equivalentto reduction of the measurement bandwidth), they furtherreduced the NEP down to 4.1-6.7 pW, thereby demonstratingthat the measurement is not limited by 1/f noise.Traffic safety improvementb)Fig. 8. Heterodyne detection of: a) RF signals b) THz radiationusing a HEBRys. 8. Detekcja heterodynowa: a) sygnałów radiowych b) promieniowaniaterahercowego za pomocą bolometru z gorącymielektronamiTraffic safety improvement is an application receiving an increasingattention. Research programmes aimed at increasingsafety by:• early detection of obstacles (e.g. abandoned vehicles, animals),• detection of vulnerable road users (i.e. pedestrians and cyclists)in traffic,• activation of collision mitigation measures (e.g. pre-impact brakingassistance or protection device deployment) providing driver assistancein case of an inevitable collision [10], are well underway,prompted by customer demand and proposed safetyregulations of the EU.Currently, driver-assistance systems employing infraredcameras are already offered in the high-end luxury car segment[20]. Reduction of their cost and improvement in theirreliability extend the scope of the use of these systems to lessexpensive cars, trucks, lorries and rail vehicles [21].100 ELEKTRONIKA 3/<strong>2009</strong>


Work on detection of vulnerable road users and collisionmitigation system is at a relatively early stage, conducted bya multinational consortium [10]. Based on their studies followingrequirements on the collision mitigation system wereformulated:• observation distance: 15 m,• field of view: 55°,• pixel resolution: min. 80 x 30,• NETD: better than 150 mK,• lifetime: over 10 years,• cost target: below €100 for the sensor system.Assumed cost target, operating temperature range andsystem lifetime severely limit available technological choices,making the project challenging. It can be expected however,that its goals will be attained using a microbolometer array.Industrial process control and inspectionMicrobolometer cameras start to play an increasingly importantrole in process control and product inspection, supplementingexisting machine vision systems while extending thescope of inspection. Applications of this technique include inspectionof protective coating quality on metal fuel tanks, integrityof high density polyethylene (HDPE) joints used inautomotive fuel tanks [22].a)b)Building inspection and preventive maintenanceRising energy costs prompt the conservation efforts in the fieldof building construction. Thermography techniques, oftenusing microbolometer array cameras, are employed in the researchon new, more energy-efficient buildings, in the qualityassurance of new buildings [23] as well as for periodic checkingof the thermal insulation of buildings.Similarly, thermography techniques are used in preventivemaintenance of electric equipment (e.g. motors, transformers)and rotating machinery (e.g. belt conveyors, gears). The useof these techniques is well-documented and the equipmentfor this purpose is available from several vendors, such asFluke or Chauvin-Arnoux. Thanks to its simplicity, good integrationwith reporting software, the preventive maintenancetasks can be carried out by a trained technician, without theneed for an external consultant.Surveillance, security and battlefield applicationsSurveillance using thermal infrared cameras is a well-establishedapplication. Their key advantage in this application istheir ability to image a scene without any illumination. In suchconditions systems based on image intensifiers are unable toresolve key elements of the scene (Fig. 10a), while infraredcameras provide full view of the scene (Fig. 10b). Offeringgood resolution at low cost, the microbolometer array infraredcameras are increasingly employed in surveillanceand security systems.These cameras are also employed in systems monitoringborder areas, military bases, airports and other critical facilities,such as oil refineries. Often, these systems are equippedwith image processing and classification, making them capableof distinguishing the bona-fide staff from intruders and alertthe operator only if suspicious activity has been detected.Bolometer detectors increase also the scope of their militaryapplications. They are predominantly employed in thermalweapon sights as well as observation and ranging devicesfor individual soldiers, providing so-called situation awarenessFig. 10. Low-light scene imaged by: a) image-intensified camera,b) microbolometer infrared cameraRys. 10. Obraz uzyskany przy słabym oświetleniu przez: a) kameręze wzmacniaczem obrazu, b) kamerę pracującą w podczerwieniwykorzystującą mikrobolometrycapabilities. Systems using microbolometer arrays are employedonly for shorter observation distances, i.e. below300 m, for close and urban combat [Breiter 2007]. Currently,optimum performance for observation ranges over 300 m isstill offered by cooled mercury cadmium telluride (MCT) detectorsor Quantum-Well Infrared Photodetectors (QWIP).Microbolometer arrays are also being used in systemsprotecting armored vehicles (e.g. tanks, troop carriers). Thesesystems must detect threats, such as Anti-Tank Guided Munitions(ATGMs) and Rocket-Propelled Grenades (RPGs), determinewhether they are aimed at the protected vehicle, anddeploy countermeasures, such as flares or smoke screen.An example system, presented in [Horowitz 2007], detectsthese threats using three sensor heads providing continuousfield of view (FOV) around the protected vehicle. Each sensorhead provides FOV of 140º in azimuth by 100º in elevationand contains a microbolometer array detector (320x240 pixels)sensitive to the 8...14 µm IR, having NETD below 60 mKand operating at 60 Hz,. Signal from the detectors isprocessed by a dedicated computer system. Further work isaimed at increasing resolution to 640 x 480 pixels and framerate to 120 Hz.It is expected that scope of applications of devices usingmicrobolometer arrays will increase, mostly due to improvementsin the performance of these arrays and growing importanceof close and urban combat in military operations.ELEKTRONIKA 3/<strong>2009</strong> 101


ConclusionsBolometers are a diversified class of detectors finding use inbasic and applied research, industry, security and securecommunication. Their highest level of performance is attainedat cryogenic temperatures. The research underway is targetedmostly at improving room-temperature performance ofbolometers, e.g. by devising new materials and structures ofbolometers or exploiting quantum mechanical principles inbolometer design. Past examples, such as the success of VO 2microbolometer arrays, demonstrate that room-temperaturedetectors having widespread applications can be developed.In the future we can expect other successful detectors anddetector arrays, possibly using innovative structures, such asquantum-wells, or nanomaterials. These products will only besuccessful if the premium functionality they provide comes atthe price that is acceptable to the customer, and when theycan be easily interfaced to systems existing in their target applications(in cars, industrial equipment or health care).Therefore, it is reasonable to expect that the number ofapplications of bolometers and bolometer arrays will increase.While these detectors will be easy to integrate with other componentsof electronic systems, understanding of their operationprinciples, characteristics and limitations will be crucial forattaining optimum performance of these detectors.References[1] Dereniak E. L., Boreman G. D.: Infrared detectors and systems.New York, Willey, 1996.[2] Putley E. H.: Optical and infrared detectors (ed. E. J. Keyes).Berlin, Springer 1977, pp. 71-100.[3] Wolfe W. L., Zissis G. J.: The Infrared Handbook. EnvironmentalResearch Institute of Michigan, 1985.[4] Jeromine H., et. al.: 64x64, 128x128 and 240x320 pixel uncooledIR bolometric detector arrays. Proceedings of SPIE, vol. 3061(1997), pp. 236-247.[5] Portesi C., Taralli E., Introzzi R., Rajteri M., Monticone E.: Fabricationand characterization of an MgB2 bolometer. SuperconductorScience and Technology, vol. 20 (2007), pp. S403-S407.[6] Lozinski A., Wierzba P., Rydzewska S.: Optimization of workingconditions of thick-film LSFO bolometers. Proceedings of theSPIE, vol. 6348 (2007), pp. 63480B-1 - 63480B-7.[7] He S., Wang X., Dai J., Huang Y., Lai J., Yi X.: Characterizationof Microbolometer Based on Nanopolycrystal VO2Thin Films. Proceedings of the 7th IEEE International Conferenceon Nanotechnology, August 2 - 5, 2007, Hong Kong,pp.1269-1272.[8] Dobrovolsky V., Sizov F.: A room temperature, or moderatelycooled, fast THz semiconductor hot electron bolometer. SemiconductorScience and Technology, vol. 22 (2007), pp.103-106.[9] Romestain R., Delaet B., Renaud-Goud P., Wang I., Jorel C., VillegierJ.-C., Poizat J.-Ph.: Fabrication of a superconducting niobiumnitride hot electron bolometer for single-photon counting.New Journal of Physics vol. 6 (2004) 129.[10] Vieider Ch. et. al.: Low-cost far infrared bolometer camera forautomotive use. Proceedings of the SPIE vol. 6542 (2007),65421L-1 - 65421L-10.[11] Mahadevan S.: Design, fabrication and characterization of an x-ray bolometer for pulsed plasma x-ray sources. MeasurementScience and Technology, vol. 16 (2005), pp. 2287-2291.[12] Peterson B. J. et. al.: Bolometer diagnostics for one- and two-dimensionalmeasurements of radiated power on the Large HelicalDevice. Plasma Physics and Controlled Fusion vol. 45(2003), pp. 1167-1182.[13] Parchamya H. et. al.: Comparison of the Au and Ta foil parametersfrom laser calibration of Imaging Bolometer Foils. 22nd IEEESymposium on Fusion Engineering, SOFE 2007. pp. 1-4.[14] Wood R. A.: Uncooled thermal imaging with monolithic siliconfocal planes. Proceedings of SPIE, vol. 2020 (1993), pp. 322-329.[15] Niklaus F., Vieider Ch., Jakobsen H.: MEMS-Based Uncooled InfraredBolometer Arrays - A Review. Proceedings of the SPIE,vol. 6836 (2007), 68360D-1 - 68360D-12.[16] Li C., et. al.: Recent development of ultra small pixel uncooledfocal plane array at DRS. Proceedings of the SPIE vol.6542(2007), pp. 65421Y.1 - 65421Y.12.[17] Somani S. et. al.: New photon detector for device analysis: Superconductingsingle-photon detector based on a hot electron effect.Journal of Vacuum Science and Technology B, vol. 19, no.6, (Nov/Dec 2001), pp. 2766-2769.[18] Aurino M., Kreisler A. J., Villégier J.-C., Dégardin1 A. F.: Newtechnology of high Tc superconducting hot electron bolometerfor terahertz mixing. 8th European Conference on Applied Superconductivity(EUCAS2007), Journal of Physics: ConferenceSeries vol. 97 (2008) p. 012075.[19] Odaa N. et. al.: Detection of terahertz radiation from quantumcascade laser using vanadium oxide microbolometer focal planearrays. Proceedings of the SPIE, vol. 6940 (2008), pp. 69402Y-1 - 69402Y-12.[20] FLIR Commercial vision systems B.V., BMW incorporates thermalimaging cameras in its cars. Application Bulletin, FLIR CommercialVision Systems B.V., Breda, The Netherlands, 2007.[21] FLIR Systems, Inc. PathFindIR Driver’s Vision EnhancementThermal Camera. OEM product flyer, FLIR Systems, Inc, Goleta,USA, 3/2008.[22] Omar M. A., Zhoua Y., Liub J.: Automated applications of the infraredimagers in the automotive assembly lines: products andprocess control. Proceedings of the SPIE, vol. 6541 (2007), pp.65410E-1 - 65410E -8.[23] Kauppinen T.: Building Thermography as a tool in Energy Auditsand Building Commissioning Procedure. Proceedings of SPIE,vol. 6541 (2007), 65410P-1 - 65410P-11.[24] Horovitz-Limor Z., Zahler M.: TANDIR - projectile warning systemusing uncooled bolometric technology. Proceedings of theSPIE, vol. 6542 (2007), pp. 654238-1 - 654238-7.[25] Breiter R., Ihle T., Mauk K.-H., Münzberg M., Rode W.: Longrange thermal weapon sights for the German Future Infantrymanprogram IdZ. Proceedings of the SPIE, vol. 6542 (2007), pp.65422U-1 - 65422U-9.102 ELEKTRONIKA 3/<strong>2009</strong>


Analiza wpływu samonagrzewaniana charakterystyki liniowego stabilizatora napięciaz tranzystorem MOS*dr hab. inż. KRZYSZTOF GÓRECKI, prof. dr hab. inż. JANUSZ ZARĘBSKIW układach zasilających wykorzystuje się stabilizatory impulsowelub stabilizatory o działaniu ciągłym [1-3]. Co prawda,stabilizatory impulsowe cechują się wyższą sprawnościąenergetyczną, ale jednocześnie są one źródłem zakłóceńelektromagnetycznych [4]. Dlatego nadal chętnie stosowanesą stabilizatory liniowe charakteryzujące się krótkim czasemodpowiedzi na zakłócenie impulsowe oraz niskim poziomemtętnień napięcia wyjściowego [2,5,6].W stabilizatorach liniowych elementem regulacyjnym jesttranzystor bipolarny lub tranzystor MOS. W rozważanej klasieukładów tranzystor MOS pracuje w zakresie nasycenia, a wartośćnapięcia dren-źródło stanowi różnicę między napięciemwejściowym a wyjściowym stabilizatora.Element regulacyjny jest elementem mocy, na któregowłaściwości silnie wpływa zjawisko samonagrzewania. Zjawiskoto jest spowodowane zamianą energii elektrycznej wydzielanejw elemencie na ciepło przy nieidealnym chłodzeniutego elementu, a skutkiem tego zjawiska jest wzrost temperaturyjego wnętrza.W niniejszej pracy, stanowiącej rozszerzoną wersję [7],rozważane są liniowe stabilizatory napięcia z tranzystoremregulacyjnym MOS. Przeprowadzono ocenę wpływu zjawiskasamonagrzewania w tranzystorze regulacyjnym nacharakterystyki rozważanych stabilizatorów. Ocenę tę przeprowadzonoprzy wykorzystaniu komputerowej analizy elektrotermicznejw programie SPICE,wykorzystując wynikipomiarów rozważanych układów i uwzględniając różne warunkichłodzenia tranzystora regulacyjnego.Badane układyAkademia Morska w Gdyni, Katedra Elektroniki MorskiejRys. 2. Stabilizator z układem scalonym µA723Fig. 2. The voltage regulator with the monolithic regulator µA723W pracy rozważane są stabilizatory liniowe, których schematypokazano na rys. 1 i 2.Układ z rys. 1. zawiera tranzystor M1 pełniący rolę elementuregulacyjnego, diodę Zenera D1 będącą źródłem napięciaodniesienia i rezystor RS polaryzujący tę diodę.Stabilizator zasilany jest ze źródła napięciowego U we , a jegoobciążenie stanowi rezystor R 0 .Z kolei, układ z rys. 2. wykorzystuje do regulacji napięciawyjściowego U wy układ scalony µA723. Rezystory R1, R2,R3, R4, R5 oraz kondensator C1 stanowią elementy układuaplikacyjnego tego układu scalonego [8]. Zastosowanie tranzystoraM1 umożliwia rozszerzenie zakresu prądowego rozważanegostabilizatora. Stabilizator ten jest zasilany napięciemU we , a jego obciążenie stanowi rezystor R 0 .W badanych układach wykorzystano tranzystor MOSmocy typu IRFR024N, diodę Zenera BZX56C10 oraz elementybierne o następujących wartościach: RS = 10 kΩ, R1 =1,1 kΩ, R2 = 1 Ω, R3 = 200 Ω, R4 = 1,1 kΩ, R5 = 3,9 kΩ,C1 = 470 pF.Wyniki badańPrzeprowadzono symulacje komputerowe i pomiary charakterystykstabilizatorów opisanych w poprzednim rozdziale przyróżnych warunkach chłodzenia tranzystora regulacyjnego.W pomiarach rozważono dwa przypadki: pracę tranzystora regulacyjnegobez radiatora oraz pracę tego elementu na radiatorzealuminiowym wykonanym z kształtki A-4291o długości 190 mm. Symulacje wykonano za pomocą programuSPICE przy wykorzystaniu elektrotermicznego hybrydowegomodelu tranzystora IRFR024N [9,10], któregoreprezentację obwodową pokazano na rys. 3, i wbudowanychw programie SPICE izotermicznych modeli elementów biernychi diody p-n oraz makromodelu układu µA723 zaczerpniętegoz biblioteki LINEAR.LIB [11]. Obliczenia wykonano dlawarunków chłodzenia, odpowiadającym wykonanym pomiaromoraz dodatkowo dla idealnego chłodzenia tranzystora.Na rysunku 3. element WMS oznacza izotermiczny modeltranzystora MOSFET wbudowany w programie SPICE[12,13], sterowane źródło napięciowe E RD modeluje zależnośćrezystancji szeregowej drenu od temperatury, a sterowaneźródło napięciowe E G modeluje zależność napięciaprogowego tranzystora od temperatury.Wydajność źródła E RD wyrażona jest wzorem:(1)Rys. 1. Stabilizator z diodą ZeneraFig. 1. The voltage regulator with the Zener diodegdzie: RD oznacza wartość rezystancji szeregowej drenu wtemperaturze odniesienia T 0 , natomiast α RD jest temperaturowymwspółczynnikiem względnych zmian tej rezystancji.*Wynagrodzenia autorskie zostały sfinansowane przez Stowarzyszenie Zbiorowego Zarządzania Prawami Autorskimi Twórców Dzieł Naukowychi Technicznych KOPIPOL w Kielcach, z opłat uzyskanych na podstawie art. 20 ustawy o prawie autorskim i prawach pokrewnychELEKTRONIKA 3/<strong>2009</strong> 103


Z kolei, wydajność źródła E G wyrażona jest wzorem:gdzie: α u jest temperaturowym współczynnikiem zmian napięciaprogowego.Wartość temperatury wnętrza tranzystora T j wyliczana jestze wzoru:gdzie: T a oznacza temperaturę otoczenia, R th - rezystancjętermiczną tranzystora między jego wnętrzem a otoczeniem,natomiast prąd i D oraz napięcie u DS oznaczono na rys. 3.(2)(3)Rys. 3. Reprezentacja obwodowa elektrotermicznego hybrydowegomodelu tranzystora MOSFETFig. 3. The network representation of the electrothermal hybridmodel of the MOSFET transistorW obliczeniach wykorzystano następujące wartości parametrówmodelu tranzystora MOS, uzyskane przy wykorzystaniu wynikówodpowiednich pomiarów: VTO = 3.2 V, KP = 30 µA/V 2 , w =0.6 m, l = 2 µm, RD = 75 mΩ, α RD = 10 -2 K -1 ,α U = -3 mV/K. Wartośćrezystancji termicznej między wnętrzem tranzystora a otoczeniemwynosi 8 K/W dla tranzystora umieszczonego na radiatorzeoraz 65 K/W dla tranzystora pracującego bez radiatora.Na rysunkach 4-5 przedstawiono obliczone i zmierzonecharakterystyki statyczne stabilizatora z rys. 1, natomiast narys. 6-7 przedstawiono charakterystyki stabilizatora z rys. 2.Na rysunkach tych linią ciągłą oznaczono wyniki analizelektrotermicznych, a punktami - wyniki pomiarów. W celu zilustrowaniawpływu samonagrzewania na pracę rozważanychstabilizatorów dodatkowo pokazano charakterystyki izotermiczneoznaczone linią kreskową.Na rysunku 4 zilustrowano zależność napięcia wyjściowego(rys. 4a) oraz temperatury obudowy T C oraz temperaturywnętrza T j tranzystora MOS (rys. 4b) od napięciawejściowego dla tranzystora pracującego bez radiatora.Jak widać na rys. 4a, napięcie wyjściowe stabilizatora jestpraktycznie równe zeru, gdy napięcie wejściowe nie przekraczawartości napięcia progowego tranzystora VTO = 3,2 V.Stabilizacja napięcia wyjściowego na poziomie około 7 V jestwidoczna dla napięć wejściowych wyższych od 10 V. W odróżnieniuod charakterystyk izotermicznych, które w zakresiestabilizacji są liniami poziomymi, charakterystyki nieizotermicznewykazują skończone nachylenie, zależne od wartościrezystancji obciążenia R 0 . Obserwowane nachylenie charakterystykiwynika ze wzrostu temperatury wnętrza tranzystorana skutek samonagrzewania i zależności napięcia progowegotranzystora od temperatury.Z kolei z rys. 4b wynika, że temperatura obudowy tranzystoraT C , a wraz z nią temperatura wnętrza T j , są rosnącymifunkcjami napięcia wejściowego. Nachylenie rozważanychcharakterystyk rośnie wraz ze spadkiem wartości rezystancjiRys. 4. Zależności napięcia wyjściowego (a) oraz temperatury obudowyi wnętrza tranzystora (b) od napięcia wejściowego dla układuz rys. 1Fig. 4. Dependences of the output voltage (a), the case temperatureand the inner temperature of the transistor (b) on the input voltagefor the regulator from Fig. 1Rys. 5. Zależności napięcia wyjściowego stabilizatora (a) i temperaturyobudowy tranzystora (b) od rezystancji obciążenia dla układuz rys. 1Fig. 5. Dependences of the output voltage (a), the case temperatureand the inner temperature of the transistor (b) on the load resistancefor the regulator from Fig. 1104 ELEKTRONIKA 3/<strong>2009</strong>


obciążenia R 0 . Dla najmniejszej z rozważanych wartości R 0praca rozważanego stabilizatora w zakresie stabilizacji nie jestmożliwa ze względu na przekroczenie dopuszczalnej wartościtemperatury wnętrza tranzystora MOS równej 175 o C [14].Na rysunku 5. zilustrowano wpływ warunków chłodzeniatranzystora MOS na zależności napięcia wyjściowego rozważanegostabilizatora (rys. 5a) oraz temperatury obudowyi wnętrza tranzystora (rys. 5b) od rezystancji obciążenia.Jak można zauważyć na rys. 5a, zjawisko samonagrzewaniapowoduje nie tylko zmianę wartości napięcia wyjściowegostabilizatora, ale również wpływa na zmianę charakteru zależnościU wy (R 0 ). Zależność ta w warunkach izotermicznychjest rosnącą funkcją rezystancji obciążenia. Przy uwzględnieniusamonagrzewania, w zakresie małych wartości rezystancji R 0obserwuje się wzrost napięcia wyjściowego stabilizatora przymalejącej rezystancji R 0 . Zjawisko to jest tym silniej widoczne,im warunki chłodzenia tranzystora są mniej korzystne.Spadek temperatury obudowy i wnętrza tranzystora wrazze wzrostem rezystancji obciążenia można zaobserwować narys. 5b. Oczywiście, temperatura obudowy tranzystora umieszczonegona radiatorze jest znacznie niższa (nawet o ponad100 o C) niż temperatura tranzystora pracującego bez radiatora.Warto zauważyć również, że dla tranzystora pracującego bezradiatora temperatura jego wnętrza jest praktycznie równatemperaturze obudowy, natomiast dla tranzystora umieszczonegona radiatorze różnice między tymi temperaturami przyustalonej wartości rezystancji R 0 dochodzą nawet do 50 o C.Na rysunku 6. przedstawiono obliczone i zmierzone zależnościnapięcia wyjściowego (rys. 6a) oraz temperatury obudowyT C i wnętrza T j tranzystora regulacyjnego od rezystancjiobciążenia stabilizatora z rys. 2.Jak widać z rys. 6a dla tranzystora umieszczonego na radiatorzewartości napięcia wyjściowego stabilizatora uzyskanez analizy izotermicznej i elektrotermicznej oraz z pomiarówpozostają w dobrej zgodności w całym rozważanym zakresiezmian rezystancji R 0 . Obserwowany na wykresie spadek wartościtego napięcia w zakresie małych rezystancji obciążeniawynika z zadziałania układu zabezpieczenia nadprądowegow stabilizatorze µA723.Z kolei z rysunku 6b wynika, że temperatury T C oraz T jtranzystora maleją wraz ze wzrostem rezystancji R 0 orazrosną ze wzrostem napięcia wejściowego. Ze względu naumieszczenie tranzystora regulacyjnego na radiatorze, temperaturawnętrza tego tranzystora przewyższa temperaturęjego obudowy nawet o 60 0 C.Na rysunku 7. przedstawiono zależność napięcia wyjściowego(rys. 7a) oraz temperatury obudowy tranzystora regulacyjnego(rys. 7b) stabilizatora z rys. 2 od napięciawejściowego dla tranzystora pracującego bez radiatora.Jak można zauważyć na rys. 7a, po przekroczeniu przeznapięcie wejściowe wartości 10 V, napięcie wyjściowe przyjmujestałą wartość równą około 5,5 V. Obliczona wartość tegonapięcia jest o około 0,5 V niższa od wartości zmierzonej.Różnica między obliczoną a zmierzoną wartością napięciawyjściowego wynika z faktu, że napięcie odniesienia wytwarzaneprzez układ µA723 może przyjmować wartości z przedziału6,8...7,5 V [8]. Tymczasem, w modelu tego układuprzedstawionym w pracy [11] nie uwzględniono tego faktu.Na rys. 7b widać, że po przekroczeniu przez napięciewejściowe wartości napięcia progowego tranzystora regulacyjnegotemperatura obudowy tego tranzystora rośnie prawieliniowo w funkcji napięcia wejściowego. Oczywiście,wraz ze zmniejszaniem rezystancji obciążenia temperaturaT C rośnie, ograniczając dopuszczalny zakres zmian napięciawejściowego.Rys. 6. Zależności napięcia wyjściowego (a) i temperatury wnętrza iobudowy tranzystora (b) od rezystancji obciążenia dla stabilizatoraz rys. 2Fig. 6. Dependences of the output voltage (a), the case temperatureand the inner temperature of the transistor (b) on the load resistancefor the regulator from Fig. 2Rys. 7. Zależności napięcia wyjściowego (a) oraz temperatury obudowytranzystora (b) od napięcia wejściowego dla układu z rys. 2Fig. 7. Dependences of the output voltage (a) and the case temperatureof the transistor (b) on the input voltage for the regulatorfrom Fig. 2ELEKTRONIKA 3/<strong>2009</strong> 105


Warto zauważyć, że pomimo znacznego przyrostu temperaturywnętrza tranzystora ponad temperaturę otoczenia,wpływ zjawiska samonagrzewania na pokazaną na rys. 7acharakterystykę U wy (R 0 ) jest kompensowany przez działaniestabilizatora µA723. Jednak zastosowanie elektrotermicznegomodelu tranzystora MOS w analizach rozważanego stabilizatoraumożliwia wyznaczanie temperatury wnętrza tranzystoraregulacyjnego, wpływającej w decydujący sposób na niezawodnośćstabilizatora.Przy obliczeniach układu z rys. 2 konieczne było wprowadzeniedodatkowego rezystora o rezystancji 1 MΩ, włączonegomiędzy bramkę, a źródło tranzystora regulacyjnego. Brak tego rezystorauniemożliwiał uzyskanie stabilizacji napięcia wyjściowego.PodsumowanieW pracy przeanalizowano wpływ zjawiska samonagrzewaniaw tranzystorze MOS mocy na właściwości liniowych stabilizatorównapięcia. Wykazano, że na skutek omawianegozjawiska istotnie wzrasta wartość temperatury wnętrza tranzystoraregulacyjnego.W stabilizatorze z rys. 1 wzrost temperatury wnętrza tegotranzystora powoduje wzrost wartości napięcia wyjściowegostabilizatora przy wzroście napięcia wejściowego lub przyspadku rezystancji obciążenia. Uzyskane różnice między wartościaminapięcia wyjściowego obliczonego z analizy izotermicznejoraz z analizy elektrotermicznej dochodzą nawet dokilkunastu procent.Z kolei, w stabilizatorze z rys. 2 nie zaobserwowano istotnegowpływu zjawiska samonagrzewania na napięcie wyjściowe,natomiast wzrost temperatury tego tranzystoraogranicza zakres dopuszczalnych wartości rezystancji obciążeniaoraz napięcia wejściowego stabilizatora. Zastosowaniew obliczeniach hybrydowego elektrotermicznego modelutranzystora MOS oraz wbudowanych w programie SPICE izotermicznychmodeli pozostałych elementów, umożliwiło uzyskaniedobrej zgodności między wynikami obliczeń i pomiarów.Praca naukowa finansowana ze środków na naukę w latach2007-2008 jako projekt badawczy Nr N N510 3425 33.Literatura[1] Tietze U., Schenk Ch.: Układy półprzewodnikowe. WNT, Warszawa,1996.[2] Borkowski A.: Zasilanie urządzeń elektronicznych. WKiŁ, Warszawa,1990.[3] Ferenczi Ö.: Zasilanie układów elektronicznych. Zasilacze zestabilizatorami o pracy ciągłej. Przetwornice DC-DC. WNT, Warszawa,1988.[4] Mohan N., Undeland T.M., Robbins W.P.: Power Electronics:Converters, Applications, and Design. New York, John Wiley&Sons, 1995.[5] Kulka Z., Nadachowski M.: Analogowe układy scalone. WKŁ,Warszawa, 1985.[6] Zarębski J., Górecki K.: The Electrothermal Macromodel ofMA7800 Monolithic Positive Voltage Regulators Family. InternationalJournal of Numerical Modelling: Electronic Networks,Devices and Fields, Wiley, vol.19, no.4, 2006, pp.331-343.[7] Górecki K., Zarębski J.: Analysis of the influence of selfheatingon the characteristics of the linear voltage regulator includingMOS power transistor. Artykuł zgłoszony naIC-SPETO <strong>2009</strong>.[8] Rudnicki C.: Układy scalene w sprzęcie elektroakustycznym.Wydawnictwo NOT-Sigma, Warszawa, 1987.[9] Górecki K., Zarębski J.: Modeling Nonisothermal Characteristicsof Switch-Mode Voltage Regulators. IEEE Transactions onPower Electronics, vol. 23, no. 4, 2008, pp. 1848 - 1858.[10] Górecki K.: Modelowanie i analiza obcowzbudnych stabilizatorówimpulsowych zawierających dławikowe przetwornice dc-dc zuwzględnieniem samonagrzewania. Prace Naukowe AkademiiMorskiej w Gdyni, Gdynia, 2007.[11] SPICE library LINEAR.LIB, Microsim, 1992.[12] Izydorczyk J.: PSpice komputerowa symulacja układów elektronicznych.Helion, Gliwice, 1993.[13] Wilamowski B. M., Jaeger R. C.: Computerized circuit AnalysisUsing SPICE Programs. McGraw-Hill, New York, 1997.[14] IRFR/U024N - Karta katalogowa, International Rectifier,www.irf.com.The advantages of homodyne single line phase noisemeasurement system for microwave oscillators*(Zalety homodynowego, jednotorowego stanowiska do pomiarów szumówfazowych generatorów mikrofalowych)mgr inż. BARTOSZ IDŹKOWSKI, dr hab. inż. ANDRZEJ FRANCIKWrocław University of TechnologyPhase noise is a random and unwanted variation in phase ofan oscillator output signal which causes the broadening ofthe spectrum and worsens the quality of the oscillator. Theother type of noise, amplitude noise, isn’t worth consideringsince it is about 20 dB less than phase noise [1] and can easilybe eliminated using amplitude limiters. Phase noise of anoscillator is often described by L(f) index, where f is the offsetfrequency from the carrier and has 1 Hz bandwidth, whichgives information about single sideband phase noise, expressedin dBc/Hz and can be derived from the equationL(f) =10log[P SSB /P s ]. The interpretation of this equation isshown in Fig. 1.The result of phase noise measurement identifies also thespurious signals and its harmonics which may occur duringmeasurement. Those spurious signals can be divided intotwo groups: the inner (shot noise, flicker noise, thermal noise,burst noise) and outer (microphonic noise, supply noise, radiotransmitted noise).*Wynagrodzenia autorskie zostały sfinansowane przez Stowarzyszenie Zbiorowego Zarządzania Prawami Autorskimi Twórców Dzieł Naukowychi Technicznych KOPIPOL w Kielcach, z opłat uzyskanych na podstawie art. 20 ustawy o prawie autorskim i prawach pokrewnych106 ELEKTRONIKA 3/<strong>2009</strong>


a)It is worth remembering that Leeson’s basic equation is validb)Fig. 1. Method of expressing the phase noise of an oscillator (a)and the result of the measurement (b)Rys. 1. Interpretacja fizyczna szumu fazowego (a) oraz przykładowywynik pomiaru (b)As can be seen in Fig. 1. phase noise spectrum revealsregions of different shapes. Those shapes are described byLeeson’s noise model of the feedback oscillator. This model isvery important for engineers because it identifies differentnoise components in an oscillator. Furthermore, this is the onlylinear and analytical model that exists (except for a few numericalapproximations). Unfortunately, identifying what differentnoise causes (especially those nonlinear) is still notsolved. Generalized, Leeson’s equation can be expressed as:where: S φ - spectral density of phase noise, a, b, c, d, e - arethe weighting coefficients and f -n - corner frequency,n = 0,1,2,3,4, that represents regions of different origins ofnoise. Those origins can be seen on Figure 2.under the following conditions:• the offset frequency from the carrier is greater than flickercorner frequency,• the noise factor at the operating power is known,• The device operations are linear,• Q includes component losses,• single resonator is used in oscillator.F - noise factor, k - Boltzmann’s constant, T - temperature,P out - oscillator output power, Q - quality factor,f c - carrier frequency, f - offset frequency from the carrier.There is a wide variety of methods for phase noise measurement.The most common methods are those in frequencydomain because they give direct view about the spectrumtraits. Choosing the proper measurement method isn’t aneasy task. Under consideration are time, accuracy, dynamicrange, sensitivity and whether one wants to conduct veryexact close-to-the-carrier or far-from-the-carrier measurements.The most popular methods, from the engineering pointof view are discussed in [2]. The most commonly used methodof phase noise measurement is the one using Phase-Locked-Loop. This method is very precise as it comes to close-to-thecarriermeasurements, especially of very stable crystaloscillators. The PLL method has several disadvantages becauseit requires at least a 10 dB better noise performancereference oscillator than from the one being measured, putsrestrictions on the PLL bandwidth according to the offset frequencyto which one wants to measure, and suppresses thenoise within the bandwidth of the PLL. It also takes time consumingcalibration and deals with problems of the injectionlocking. When measuring noisy microwave oscillators theother methods are more useful. We decided that the most suitablemethod for noisy microwave oscillators will be the onepresented by Easdale using delay line discriminator [3].The main advantage of this method is its simplicity becauseit uses only the most necessary and common microwavecomponents, which reduces the total system noisefloor, in accordance to Friis’ formula. This method can also befully automated so that the measurement doesn’t take longand is very accurate. The key element of this method that enablesit to use only a single line is the hybrid tee, described bythe S matrix:Fig. 2. Noise components and their characteristics derived from thegeneralized form of Leeson’s equationRys. 2. Składowe szumowe oraz ich charakterystyki wynikającez uogólnionego równania LeesonaThe main disadvantage of the measurement system presentedby Easdale is the poor sensitivity in close-to-thecarriermeasurement which is the result of the finite length ofthe delay line (which has to guarantee that the discriminatorwill operate in a linear area) and flicker noise. To overcome thisproblem, we decided to use the homodyne detection method.The homodyne detection method is a well known method thatuses different kinds of modulations, such as, amplitude modulation(DSBSC, SSBSC) and rectangular phase modulationELEKTRONIKA 3/<strong>2009</strong> 107


(0°/180°). The homodyne modulator is being operated bya modulating generator, whose output signal is of a single kilohertz.This operation allows transfer of the phase noise spectrumbeing measured into the homodyne frequency area,which finally results in better dynamic range and better sensitivityof the system in close-to-the-carrier measurement, sincethe whole spectrum is less dependent upon the flicker noise.The solution presented by us combines features of the singleline discriminator method and homodyne detection methodand also utilizes digital techniques for analyzing the resultantphase noise spectrum in real time, on the computer. The Homodynemodulator is constructed on a mechanically regulatedshort circuit which is installed inside the delay line. This solutionallows us to keep all the advantages and simplicity of themethod presented by Easdale, as well as enabling us to makebetter and more sensitive measurements. The scheme of themeasurement system is presented in Fig. 3.The output signal from the generator under test enters thesystem through the ferrite isolator and regulated attenuator,where it can be precisely set to the necessary amounts ofpower. Then, the signal approaches co-linear port 1 in a speciallydesigned hybrid tee where it is divided into three subsignals.One of the subsignals enters port E and the other portH - they are called direct signals. The remaining subsignalgoes to co-linear port 2 and goes through the delay line constructedfrom the waveguide so that the losses of the signalare very little. At the end of the delay line, the subsignalreaches a regulated circuit which is operated by the homodynemodulation generator. This regulated circuit realizes oneof the common homodyne modulation (amplitude or phase),which modulates and offsets the subsignal to the homodynefrequency. After the reflection from the regulated circuit thesubsignal is decorrelated and goes back to co-linear port 2,splits, and enters ports E and H, where it interferes with directsignals. After going through microwave detectors DM1 andDM2 the output signal becomes amplified in a low noise amplifierand reaches port R of the homodyne phase detector.Meanwhile, port L of this detector is being fed by a direct signalfrom the homodyne modulation generator. The demodulated,output signal is being digitized and analyzed on thecomputer, where finally, it can be plotted as a phase noisespectrum. Calibrating generator CG as well as modulatinggenerator MG is used only in the calibration process in orderto be able to measure the absolute physical amount of phasenoise. Installing the homodyne modulator inside the regulatedcircuit makes this solution better than the classic homodynedetection, because it doesn’t complicate the structure of thewhole system (we don’t need any extra elements like powerdividers, separate microwave modulators etc.) and also doesnot worsen the system’s noise floor.The heart of such homodyne system is it’s, special construction,phase modulator. To fulfil the conditions of the homodynedetection we can use other modulations schemes(DSBWC, DSBSC, SSBSC) but only the phase modulationenables to suppress the spurious amplitude part of the signalto the minimum. This is because of the artefact carrier signalwhich causes amplitude and phase errors in the measurement.The analysis of different modulation schemes are derivedin [1]. The other conditions for the spurious amplitudesuppression are: the usage of balanced mixers and loweringa)Coupling loopb)Fig. 3. Homodyne single line phase noise measurement systemscheme for microwave oscillators; G - microwave generator undertest, CG - calibrating generator (only for calibration), MG - modulatinggenerator (only for calibration), IZL - isolator, RA - regulated attenuator,E-H - hybrid tee with S parameters given above, LNA - lownoise amplifier, PD - phase detector, OSC - oscilloscope, A/C - analog/digitalconverter, PC - personal computer, PLOT- plotter, DL -delay line, RC - mechanically regulated circuit, HMG - homodynemodulation generator, DM1, DM2 - microwave detectorsRys. 3. Schemat jednotorowego, homodynowego systemu do pomiarówszumów fazowych generatorów mikrofalowychFig. 4. The construction of the contacting part of the waveguideshort circuit with the microwave tuning varactor diode (a), (with itstypical performance (b) [4]), coupled with the electric field by thecoupling loop inside the waveguideRys. 4. Konstrukcja kontaktowej części modulatora fazy, zbudowanegoz wykorzystaniem zwieracza falowodowego z umieszczonymwaraktorem (a), (którego typowa charakterystyka przedstawionazostała po prawej stronie [4]), w sposób zapewniający maksymalnesprzężenie z polem elektrycznym wewnątrz falowodu108 ELEKTRONIKA 3/<strong>2009</strong>


a)b)of the overall system noise floor (which means better detectionof weaker signals). The construction of such phase modulatorbased on a contacting, waveguide short circuit is shownin the Fig. 4.To get the best phase modulating conditions (Γ =1 andΓ=-1) we feed the modulating signal, from the modulatinggenerator, directly to the diode. The parameters of the diodehave to be chosen correctly, so that the reflection of the signalfrom the short plane is 0° with the positive slope of themodulating signal and 180° with the negative slope of themodulating signal. This will sufficiently eliminate the spuriousartefact amplitude part of the measured signal .The results of the measurement of the phase noise usingthe single line discriminator system with BAV 46 detectiondiodes are shown in Fig. 5.ConclusionsWe presented the advantages of the new method for phasenoise measurement for microwave oscillators. This methodcombines the best traits of delay line discriminator, homodyneand digital methods. Furthermore, it gives simplicity in constructionof the system (uses only single line) and can be fullyautomated. In the near future we expect to have very good resultsof the measured signal especially near the carrier frequency(10...100 Hz), which is the main advantage of suchsystem combined with its simplicity.ReferencesFig. 5. Gunn generator’s phase noise working at f 0 = 9.5 GHz(a),measured on the practical system (b). Dashed line representsexpected results when the homodyne method is implementedRys. 5. Wynik pomiaru szumu fazowego generatora Gunna pracującegona częstotliwości f 0 = 9,5 GHz (a), zmierzonego w układzie (b).Linia przerywana przedstawia spodziewane wyniki w przypadku użyciahomodynowej metody pomiaru[1] Galwas B.: Miernictwo mikrofalowe. WKiŁ, Warszawa 1985.[2] Owen D.: Good practice guide to phase noise measurement. NationaPhysical Labolatory, UK 2004.[3] Esdale D., Dyer G., Howes M., Pollard R.: Automate oscillatorFM noise measurements. MSN, 1981.[4] Micrometrics - http://www.micrometrics.com/Electrical and thermal conductivities of nanoandmicrocrystalline copperand composite thin-layer electrodeposits*(Elektryczne i termiczne konduktywności cienkich warstw z miedzi i kompozytówo strukturze nano- i mikrokrystalicznej wytwarzanych elektrochemicznie)eThe recent increasing information technology requirementshave yielded a strong demand for faster logic circuits andhigher-density memory chips. The operating voltage, power,and frequency for high-performance microprocessors werepredicted by ITRS to be 0.7 V, 1900 W, 4…5 GHz in 2008 and0.6 V, 210 W, 5…8 GHz in 2010 [4]. Microprocessors are designedwith lower voltage requirements in order to reduceoverall power dissipation. Lower voltages require power supplieswith much higher current capabilities, up to three timesthat of previous microprocessors, with correspondingly higherprof. dr hab. MARIA TRZASKAPolitechnika Warszawska, Wydział Inżynierii Materiałowejload-change transients. The growing integration of electronic,optoelectronic and optical devices together with high frequenciesand high power have the result that effective heatremoval from the devices becomes critical for their operation.These facts are reflected in a growing interest in thin layer materialswith high electrical and thermal conductivities.As is well known, successful applications of a material requirenot only that the material should have desirable propertiesbut also that these properties should be controllable. Inother words, the material must be amenable to certain tech-*Wynagrodzenia autorskie zostały sfinansowane przez Stowarzyszenie Zbiorowego Zarządzania Prawami Autorskimi Twórców Dzieł Naukowychi Technicznych KOPIPOL w Kielcach, z opłat uzyskanych na podstawie art. 20 ustawy o prawie autorskim i prawach pokrewnychELEKTRONIKA 3/<strong>2009</strong> 109


nological processes [6-9,11]. This is particularly important fortransistors in Silicon-on-Insulator circuitry, where the deviceis separated from the substrate by a low thermal conductivityburied silicon dioxide layer as well as copper interconnectsthat are surrounded by low thermal conductivity dielectric materials.Clearly, the micro/nanoscale heat transfer effects inthe silicon and copper interconnect layers of thin films havea huge impact on the thermal engineering of the deep submicronSOI, strained-Si transistors, and copper-dielectric networkas well as on the thermal analyses of the micro- andnanoscale structures. Test-structure metrology applicationscan be classified into two groups:• selection of materials for developing fabrication processesfor new interconnect systems that comply with always increasingdevice density needs and maintaining thoseprocesses in wafer production,• parameter extraction for modeling and predicting the performanceof interconnect systems for particular fabricationimplementations.At present, thin layers of different materials have many practicalapplications. Thin dielectric films of SiO 2 and SiN x are commonlyused in microelectronics as interconductor dielectricsand passivity layers. A continuous rise of switching speed andcircuit densities causes heat transport in these layers to becomecritical for device operation. The same situation takesplace for the optical coatings using in the power laser systems.Thin films are an essential component of all advancedelectronic devices. Physical properties of thin layer materialsare usually different from the properties of their bulk counterparts.This is due the planar geometry and reduced thicknessof such layers, their unique crystalline structure and adhesionto the substrate. The actual properties of the thin layers largelydepend on their fabrication method. Numerous research activitiesrelated to thin layers carried out in various laboratoriesfocus on establishing clear linkages between thin layer’s propertiesand their chemical composition and structure as well asthe ensemble of technological factors and physical phenomenawithin their production process [3].Copper-based chips are semiconductor integrated circuits,usually microprocessors, which use copper for interconnections.Since copper is a better conductor than aluminum, chipsusing this technology can have smaller metal components, anduse less energy to pass electricity through them. Together,these effects lead to higher-performance processors. As thename implies, a barrier metal must limit copper diffusivity sufficientlyto chemically isolate the copper conductor from the siliconbelow, yet have high electrical conductivity in order tomaintain a good electronic contact. The combination of a modestincrease in conductivity along with this improvement inelectromigration resistance was to prove highly attractive. Theoverall benefits derived from these performance improvementswere ultimately enough to drive full-scale investment in copper-basedtechnologies and fabrication methods for high performancesemiconductor devices, and copper-basedprocesses continue to be the state of the art for the semiconductorindustry today. The overall goal is to make essentialcontributions to a test-structure infrastructure that is responsiveto state-of-the-art interconnect-system fabrication needs.Characterization of thin-layerelectrodepositsa)b) c)d) e) f)Fig. 1. Scheme of thin layer electrodepositions: a) experimental appliances,b), c), d), e) and f) various waveforms of supplying currentsRys. 1. Schemat układu do wytwarzania warstw elektrochemicznych:a) zestaw urządzeń, b), c), d), e) i f) różne przebiegi prądówzasilaniaElectrodeposition of Cu thin layers from acidic sulphate solutionshas experienced renewed interest in the last decade,owing to expanding applications in the miniaturized fabricationof semiconductor devices. Electrochemical depositionprocesses are realized in multicomponent aqueous solutions(Fig. 1a). In the case of metallic layers the fundamental componentof these solutions is the salt of the deposited metal. Innon-metallic layers chemical compounds whose anions reactwith the metallic substrate (e.g. appropriate acid, acid salt oracid anhydrite) are the important elements. Besides the abovefundamental components the solutions used contain additionalcomponents that play different roles such as controllingthe appropriate pH level, deposition speed, solution conductivity,etc. [1,2,5,10].The low electrical resistivity of copper and the ability ofelectrodeposition to “superconformally” fill high aspect ratiofeatures has made electrodeposited copper as the inter-connectmaterial of choice in silicon technology. The electrodepositionis a versatile technique for producing nano- andmicro-crystalline materials. From both fundamental and appliedviewpoints the electrocrystallization processes occurringat electrochemical solid-liquid interfaces have important influenceson resulting properties of produced layer materials. Theelectrocrystallization represents not only an interesting case ofphase formation and crystal growth but is also a powerfulmethod for various technological applications because thedriving force of the process can be easily controlled by thecurrent density and the electrode potential as well as appropriatecomposition of an electrodeposition bath. Its additionaltechnological advantages over the other deposition techniquesconsist in the high selectivity and the relatively low processingtemperature. The low temperature is important forsystems in which undesirable interdiffusion between adjacentlayers or structures can occur, whereas the high selectivity ofelectrocrystallization processes allows uniform modification ofsurfaces and structures with complicated profiles [12-17].The morphology and composition of the electrodepositsvary significantly, and depend on:• current density,• the nature of the anions or cations in the solution,• bath composition and temperature,110 ELEKTRONIKA 3/<strong>2009</strong>


• solution concentration,• power supply current waveform,• the presence of impurities,• physical and chemical nature of the substrate surface.a)b)The crystalline structure formed as a result of electro-depositiondepends on a competition between rates of new crystallineformation and existing crystal growth. Several factors inplating process influence the crystal structure and grain sizeof the copper composite electrodeposits (Fig. 2).Nucleation rate of the deposit strongly depends on currentdensity. Use of high average density J av pulses can producedeposits with reduced porosity, and finer grains through thedesorption of impurities and renucleation of deposits with theformation of new, smaller crystal grains. The grain size dependson the duty cycle and the bath’s composition. Thisgives an opportunity to new advances and allows the designerto comprehensively solve a number of long-standing problemsin analysis and control, modeling and simulation, structuraloptimization and virtual prototyping, packaging and fabrication,as well as implementation and deployment of novel copperand composite thin-layer deposits.Potential possibilities for structure shaping of Cu thin layersproduced by electrochemical method with changes of thechemical composition of the used electrolyte are illustrated inFig. 2a, b and c. It is easy seen that by suitable control of theelectrolyte composition it is possible to produce the layers withdiversified grain dimension or the layers with homogeneousgrains but of great dimensions as well as the layers withnanocrystalline structures.Figure 3 shows crystalline structures in the cross-sectionof Cu layers produced by periodic pulse and periodic reversepulse currents with density of 50 mAּ cm -2 . In the polycrystallinestructures grains are characterized by a regular spatial distri-a)2 µme)b)Fig. 2. Surface morphologies and structures of Cu thin-layer directcurrent electrodeposits: a) nanocrystalline - surface; b) nanocrystalline- cross section; c) microcrystalline - CuSO 4 , H 2 SO 4 bath;d) microcrystalline - CuSO 4 , H 2 SO 4 and HCl bath; e) nanocrystalline- CuSO 4 and additive D1 bathRys. 2. Morfologie powierzchni i struktury cienkich warstw Cu wytworzonychelektrochemicznie prądem stałym: a) nanokrystaliczna -powierzchnia; b) nanokrystaliczna - przekrój poprzeczny; c) mikrokrystaliczna- powierzchnia, kąpiel: CuSO 4 i H 2 SO 4 ; d) mikrokrystaliczna- powierzchnia, kąpiel: CuSO 4 , H 2 SO 4 i HCl;e) nanokrystaliczna - powierzchnia, kąpiel: CuSO 4 i dodatek D12 µmFig. 3. Structures in cross-sections of Cu layers: a) microcrystalline;b) nanocrystallineRys. 3. Struktura warstw Cu w przekroju poprzecznym: a) mikrokrystaliczna;b) nanokrystalicznaELEKTRONIKA 3/<strong>2009</strong> 111


ution of atoms. Boundaries are the regions of a few atomicdistances in thickness that isolate grains of different orientations.In the boundary regions the spatial distribution of atomsis different from that of the crystalline structure and is lessdense. Atoms located in the grain boundary regions havehigher energies. These regions are also prone to easier diffusionand segregation of foreign atoms and impurities. At thesame time they form a barrier for free electron migration andexhibit local variations of charge densities.Influence of the current density on the structure of the copperdeposits in the solutions containing CuSO 4 , H 2 SO 4 andadditive D1 and in the case of solution CuSO 4 , H 2 SO 4 , HClwith additive D2 are illustrated in Fig. 4a, b, c, and Fig. 4d, e,f, respectively.Successful process integration will require close control ofthe surface chemistry of the barrier and consideration of the terminaleffect (potential drop associated with highly resistiveseed-layer) and the consequences of potential-dependent morphologicalevolution during copper electroplating. Interconnectstructures built up on ULSI microchips consist of 10 thin-film layersnow, and will soon reach 12 layers (International TechnologyRoadmap for Semiconductors, 2004, Interconnect, Table 81a).These structures are fabricated using adjacent layers of materialswith very different thermal expansion coefficients, exoticmaterials such as nanoporous low-κ dielectric, and operate atever higher temperatures. Both experimental measurementsand modeling and simulation of material behavior are needed,and these efforts need to be complementary.a) b)c) d)e) f)Fig. 4. Surface morphologies of Cu thin layer electrodeposits producedwith appropriate direct current densities in different baths:a) microcrystalline in CuSO 4 ; b) microcrystalline in CuSO 4 andH 2 SO 4 ; c) microcrystalline in CuSO 4 and additive D1; d) nanocrystallinein CuSO 4 and additive D1; e) nanocrystalline in CuSO 4 ,H 2 SO 4 and additive D2; f) nanocrystalline in CuSO 4 , HCl and additiveD2Rys. 4. Morfologie powierzchni cienkich warstw Cu elektrochemicznychwytworzonych odpowiednimi prądami stałymi w różnychkąpielach: a) mikrokrystaliczna w CuSO 4 ; b) mikrokrystaliczna wCuSO 4 i H 2 SO 4 ; c) mikrokrystaliczna w CuSO 4 i dodatku D1; d) nanokrystalicznaw CuSO 4 i dodatku D1; e) nanokrystaliczna wCuSO 4 i H 2 SO 4 oraz dodatku D2; f) nanokrystaliczna w CuSO 4 i HCloraz dodatku D2Thin films are built of small crystallites, often separated byregions of noncrystalline material. It leads to very low thermalconductivity of thin polycrystalline films, sometimes even lowerthan the thermal conductivity of amorphous films. Consideringpossible applications of thin films in heat management, oneshould also remember that there is an interfacial layer betweenthe film and the substrate with a high concentration ofdefects. This layer is an additional barrier for the heat flowfrom the substrate to the film. As a result, experimentally determinedeffective thermal conductivity of a thin film in the directionperpendicular to the films may be very low.Radically different materials and material technologies areunder considerations for future ULSI devices, as the furtherdevelopment of leading edge lithography increases in costand complexity. An example of a radically new material is thecarbon nanotube. Recently, thermal properties of nanowire/nanotube nanocomposites such as thermoelectric nanowiresand carbon nanotubes (CNTs) in alumina or polymer matrixhave attracted a great interest due to their possible applicationsin high efficiency thermoelectric energy conversion andthermal management. A promising stage of a new materialtechnology is self-assembly. Effective use of these new materialssystems will require significant extension of the reliabilitymetrology and analysis toolset, to understand andaddress new kinds of reliability issues.Electrical and thermal propertiesof copper and composite thin-layersFundamental properties of copper and composite thin-layerscannot be adjusted/changed from the corresponding coarserbulk material by only reducing the size of the particles, with nochange in substance. The inner structure of the copper thinlayersis the most probable reason for alteration of their thermalproperties in comparison with the bulk material. Defectsof crystalline structure influence thermal properties of the copperthin-layers. Moreover, in layers of thickness comparable orsmaller than the characteristic lengths of carriers, new physicalphenomena occur and in this case theoretical models describinga copper layer as a continuum medium cannot beused for description of its thermal properties. The transitionfrom ideally ordered monocrystals through partially disorderedpolycrystals to completely disordered amorphous solids is connectedwith a radical change of physical properties. Thischange is also apparent for the thermal conductivity.Knowledge of the thermal transport properties in copper andcomposite thin-layers and nanostructures is critical for a widerange of applications in microelectronics, photonics, micro-electro-mechanical-systems,and thermoelectrics. Despite significantdevelopments and advances seen in the course of the last20 years the characterization of the thermal transport propertiesin low-dimensional systems remains a challenging task. This iswhy understanding electrical and thermal properties of copperand composite thin-layers are very important. On the other handthe thermal properties of copper and composite thin-layers arevery sensitive to the inner structure of a material, so theoreticalprediction of these properties is a difficult task.Copper thin-layers are built of small crystallites, often separatedby regions of non-crystalline material. The texture ofelectrodeposited copper is important for various device applications.It is well known that electromigration depends on texturein copper thin-layers. A copper thin-layer structure isstrongly dependent on the deposition method applied andeven on its particular parameters. Addition of some componentsin the copper electrolyte has become quite usual to ob-112 ELEKTRONIKA 3/<strong>2009</strong>


tain a uniform deposit with a high throwing power and a weakroughness. The most common species added to obtain abright copper deposit are: dextrin, gelatin, urea, chloride ions,sulfur containing compounds or other organic molecules. Althoughit has been established that these substances lead tohigh changes in the morphology of the deposit, the knowledgein the mechanism of action of these additives is very poor.Thus it is currently indispensable to investigate the unusualconductivity of nanosized copper and composite electrodepositsthat show promising properties for significantlyimproving the mechanical properties of copper-based conductorswithout sacrificing conductivity. It is also essential todevelop a material processing technique for producing nanostructuralmaterials based on a copper matrix at various dimensionsfrom a few to a few thousand of nanometers at anaffordable cost so that mass production of such materials forsubmicroelectronic applications is viable.Models of heat transport across a copper thin layer can beestablished by taking into account the idea that in metals conductionelectrons are mainly responsible for heat conduction.The existing phonon mechanism of heat transport can be neglectedbecause it constitutes less than 1% in the whole process.Accordingly to the law of heat conduction, also known asFourier’s law, states that the time rate of heat transfer througha material is proportional to the negative gradient in the temperatureand to the area at right angles, to that gradient,through which the heat is flowing:where: Q is the amount of heat transferred, t is the time taken,k is the material’s conductivity, S is the surface through whichthe heat is flowing, and T is the temperature.Simplifying the description to a linear situation, where uniformtemperature across equally sized end surfaces and perfectlyinsulated sides exist, gives the heat flow rate betweenthe end surfaces as:where: A is the cross-sectional surface area, ∆T is the temperaturedifference between the ends, ∆x is the distance betweenthe ends.Writing:where: U is the thermal conductance we can present (2) asfollows:If the temperature distribution within the copper thin layerchanges with time then a transient heat transfers occur. Thefundamental quantity that enters into transient heat transfer isthe thermal diffusivity. It is related to the steady-state thermalconductivity through the equation:(1)(2)(3)(4)(5)where: γ is the thermal diffusivity, k is the thermal conductivity,ρ is the mass density, and c p is the specific heat. The diffusivityis a measure of how quickly a body can change itstemperature; it increases with the ability of a body to conductheat and it decreases with the amount of heat needed tochange the temperature of a body. All three quantities on theright hand side of (5), as well as the thermal diffusivity, can befunctions of temperature.Thermal properties of materials are measured by experimentallyestablishing a heat flow boundary value problem, solvingthe theoretical equations, and then measuring thenecessary temperatures or heat fluxes to determine the thermalproperty by matching to the theoretical solution. Thus the easiesttheoretical way to measure the thermal conductivity is toset up a steady-state, linear flow of heat through the materialand apply Fourier’s equation. The flash methods of measuringthermal diffusivity remove the steady-state condition at the expenseof measuring temperature as a varying function of time.There are many problems connected with the measurementof the thermal conductivity of thin films deposited onthick substrates. The extreme variety of types of the films produced,however, as well as the variety and different quality ofsubstrates onto which they are deposited and then investigated,results in an enormous amount of new data becomingavailable each year on this matter. Such an approach mustbe adopted especially with regard to fine-grained materials,i.e. materials composed of nanodimensional crystallites characterizedby a large area to volume ratio. The interface of suchmaterials with a substrate cannot be perceived in the sameway as the contact of two “particularly mono” crystalline orpolycrystalline and amorphous materials.Nanocrystallinity of films, i.e. the presence in their structureof small size crystallites (1…10 nm in diameter) was the reasonthat until recently they were basically considered to be amorphous.The development of structure research techniques andespecially the substitution of X-ray diffraction with electron diffractionspectroscopy allowed shifting the lower crystalline rangedown to the level of nanometers. In numerous references, thereis an opinion that many of the layers commonly referred to asamorphous actually have a nanocrystalline structure.The measurement of the thermal diffusivity of a thin layermaterial is usually carried out by rapidly heating one side ofa sample and measuring the temperature rise curve on theopposite side (Fig. 5a). The time that it takes for the heat totravel through the sample and cause the temperature to riseon the rear face can be used to measure the through-planediffusivity and calculate the through-plane thermal conductivityif the specific heat and density are known.The method is based on a simple principle. The front samplesurface is heated by a short light pulse and the temperatureevolution of the back surface in time is registered. Thecharacteristic time of this process is directly connected withthe thermal diffusivity of the sample. A pulsed laser beam, focusedon the sample surface, heats an annular-shaped areaand the surface temperature is monitored at the center of theannulus. The thermal diffusivity of the sample is determinedfrom the temperature dependence on time. The main benefitof this method is the increase of the signal-to-noise ratio,thanks to the focusing effect of the annulus. With a little modificationonly it is possible to create the thermal grating at thesample surface by the absorption of light of two interferingpulsed laser beams. The decay time of the grating can beused to calculate the thermal diffusivity. This method allowsgood accuracy and high spatial resolution. The transient thermalgrating method is especially useful in investigations ofELEKTRONIKA 3/<strong>2009</strong> 113


a)very thin layers. Recently, we have been working to demonstratethe applicability of these techniques to materials recentlyintroduced in the microelectronics industry, specificallycopper, in the form of both sputtered thin films and thick electrodeposits.The obtained results are shown in Fig. 5b. Theyindicate that such material properties as grain-size distributionand the films’ thicknesses make major contributions to thecorrect interpretation of the thermal measurements of the narrowfeatures described above. It means that, in the case ofpolycrystalline solids, the material should consist of largegrains and grain boundaries should be smooth - without microcracks,voids or inclusions of impurities. Thin films are builtof small crystallites, often separated by regions of non-crystallinematerial. It leads to very low thermal conductivity of thinpolycrystalline films, sometimes even lower than the thermalconductivity of amorphous films.Electrical properties of Cu and composite layers of differentthickness were examined. The dependence of an electricalconductivity upon the temperature was examined. Theinfluence of the crystalline structure and the thickness of thelayers on their electrical characteristics were identified. Differencesin their electrical resistivities are shown in Fig. 6a.We have observed significant growth of nanocrystalline Cuand composite Cu/W layers versus the temperature with additionaleffects involved by spontaneous recrystallization ofthe material structure (Fig. 6b). This fact is responsible for theincrease of conductivity in the large vicinity of the temperatureat 650K. On the contrary, in the case of Cu/W nanocompositethe electrical conductivity decreases importantly in quitesimilar range of the temperature.The electric resistivity ρ = σ -1 of electrodeposited Cu andCu/W composite layers as a function of deposition thicknesswas studied. Deviations up to 200 times from the standard resistivity(ρ ∞ (Cu) = 1.7 µΩcm) below 100 nm deposition thicknessreported in other papers are confirmed. A comparativeanalysis shows different reasons for the higher resistivity ofthin electrochemical layers and amorphous ones. Thin layersare built of small crystallites, often separated by regions ofnon-crystalline material. It leads to very low electrical conductivityof thin polycrystalline layers, sometimes even lowerthan the electrical conductivity of amorphous layers. As is wellknown in electrodeposition processes, certain complexingagents in the plating bath lead to significant changes in theproperties and aspect of the deposit. The bath compositionmodifies a change in the structure of the deposit and even thepreferred orientation of crystallites. It means that, in the caseof nanocrystalline layers, the material should consist of smallgrains and grain boundaries should be nonsmooth - with microcracks,voids or inclusions of impurities. Thus copper andcomposite nanocrystalline thin layers are characterized bya)b)b)Fig. 5. Thermal conductivities of thin layers: a) schematic diagramof measuring system; b) results of investigationsRys. 5. Termiczne konduktywności cienkich warstw: a) schematukładu pomiarowego; b) wyniki pomiarówFig. 6. Electrical resistivities of thin electrodeposits: a) Cu andCu/W composite layers; b) differences in resistivity of nano Cu thinlayer caused by recrystalizationRys. 6. Rezystywność elektryczna cienkich warstw elektrochemicznych:a) warstwy Cu oraz kompozytowa Cu/W; b) różnica w rezystywnościnanokrystalicznej cienkiej warstwy Cu spowodowanarekrystalizacją114 ELEKTRONIKA 3/<strong>2009</strong>


much more higher electrical resistivity and exhibit evidentlyvisible departure from a Wiedeman-Franz law of proportionalincrease of resistivity with an increase of the material temperature,namely:where: L denotes the so-called Lorenz constant depending onthe temperature T.Important increase in the conductivity of the nanocrystallinelayers appears in the temperature range of 450…850K inthat a growth of crystallites and an annihilation of grains withthe most higher energies take place.Summary and ConclusionsA related facet of this work is the measurement of the sheetelectrical and thermal conductivities of planar thin layers ofpreferred interconnect metals, such as copper, having thicknessesin the 160...300 µm range. For comparison purposessheets made of technical copper were also examined by sameapproaches. Because interconnects are becoming the principalfactor that determines the maximum performance that canbe attained with emerging generations of gigascale chips thenfuture advances in the performance of ULSI devices will begoverned increasingly by the advances in interconnect technology,rather than by advances in active devices. In particular,the so-called size effect can reduce the thermalconductivity of a nanostructure by nearly an order of magnitude.Whereas there is no simple global solution to the challengeat this time, it is certain that advances in metrologyscience applied to process and materials management, suchas those being pursued by this study, will play a central role inassuring maximum performance from copper-based interconnectionsystems until such time that innovations, such asoptical inter-connects, will be introduced.The information so provided is suitable to modeling theperformance of features that are replicated with two or moremetals and is designed to aid in the verification of dimensionalparameter extraction for process-control purposes. It is worthto mention that this approach appears as a major contributionto the correct interpretation of the electrical and thermal measurementsof the narrow features described above.(6)References[1] Bard A. J., Faulkner L. R.: Electrochemical Methods; Fundamentalsand Applications. New York, Wiley Interscience Publications2000.[2] Yeager E., Bockris J.O’M., Conway B.E., Sarangapani S.: ComprehensiveTreatise of Electrochemistry; Volume 9 Electrodics: ExperimentalTechniques. Chapter 4, in “AC Techniques”, M.Sluyters-Rehbach, J.H. Sluyters, Eds., New York, Plenum Press, 1984.[3] Trzaska M.: Chemically and electrochemically deposited thinlayermaterials. Annales de Chimie- Science des Matériaux, vol.32, no.4, pp. 354-344, July-August 2007.[4] The International Technology Roadmap for Semiconductors (ITRS),2004 Update. www.itrs.net/common/2004update/2004update.htm[5] Dressel M., Grüner G.: Electrodynamics of Solids. Berlin: Springer-Verlag,2004.[6] Trzaska M.: Structure and hardness of Ni, Cu and Co surface layersproduced by electrochemical method. Material Engineering(in Polish), vol.147, no. 5, pp, 698-700, May 2005.[7] Trzaska M., Lisowski W.: Corrosion characteristics of Cu/W compositelayers, Corrosion Protection, vol. 48, pp.112-117, 2005.[8] Quemper J.-M., Dufour-Gergam E., Frantz-Rodriguez N., GillesJ.-P., Grandchamp J.-P., Bosseboeuf A.: Effects of direct andpulse current on copper electrodeposition through photoresistmolds. J. Micromech. Microeng, vol.10, pp. 116–119, 2000.[9] Trzaska M.: Electromagnetic properties of nanocrystalline copperconductors. Proc. XIII Intern. Symp. Theor. Electrical Engr., Lviv(Ukraine), pp. 101-102, July 4-7, 2007.[10] Cha C. S.: Introduction to Kinetics of Electrode Processes. 3rded., Bejing: Science Press, 2002.[11] Klamka J.: Heterozłączowe przyrządy półprzewodnikowe nazakres mikrofal i fal milimetrowych. (In Polish), Warszawa, AL-TAIR, 2002.[12] Nelissen G., Weyns G., Maciel P., Deconinck J., Vande Vyver O.,Deconinck H.: Numerical study of the influence of the anode positionand the electrolyte flow on the deposition of copper on awire. Electroch. Acta , vol. 52, pp. 6584–6591, 2007.[13] Trzaska M., Trzaska Z.: Straightforward energetic approach tostudies of the corrosion behavior of nano-copper thin-layers coatings.Journal of Applied Electrochemistry, vol. 37-, pp.1009-1014, September 2007.[14] Trzaska M., Trzaska Z.: Control of Copper Thin-layer Coatingswith Electrochemical Impedance Spectroscopy. Proc. ACC’07,New York, pp. 2837-2843, 2007.[15] Yang M., Mao D., Yu C., Dukovic J., Xi M.: Sub-100 nm Inter-connectsUsing Multi-Step Plating. Solid State Tech., October 2003.[16] Bratin P., Chalyt G., Pavlov M., Sandor R.: Automated On-LineControl of Plating Bath Additives Increases Wafer Yield. SemiconductorFabtech, Summer 2001, 14th ed.[17] Hallez L., De Petris-Wery M., Assoul M., Feki M., Ayedi H. F.:Multicriteria optimization of mechanical and morphological propertiesof chromium electrodeposits under reverse pulse plating.J. Appl.ied Electrochem , vol. 37, pp. 843–852, 2007.Przypominamy o prenumeracie miesięcznika <strong>Elektronika</strong> na <strong>2009</strong> r.ELEKTRONIKA 3/<strong>2009</strong> 115


XXIII Sympozjum IEEE-SPIE Fotoniki i Inżynierii Sieci Internet30-31 stycznia <strong>2009</strong>, Warszawa, WEiTI PW30-31 stycznia <strong>2009</strong> r. na terenie Wydziału Elektroniki i TechnikInformacyjnych Politechniki Warszawskiej odbyło się kolejneXXIII Sympozjum Zastosowań Zaawansowanych Systemów Fotonicznychi <strong>Elektronicznych</strong>. W Sympozjum wzięło udział 50młodych uczonych z kraju oraz z współpracujących instytucjiDESY, CERN i <strong>Instytut</strong>u Maxa Plancka. Wygłoszono 40 referatów.Sympozjum jest organizowane pod patronatem organizacjikrajowych: Polskiego Stowarzyszenia Fotonicznego, KomitetuElektroniki i Telekomunikacji Polskiej Akademii Nauk, WEiTI PWi międzynarodowych: IEEE-R8 oraz SPIE-Europe. Sympozjumorganizowane jest dwa razy w roku już od kilkunastu lat. MateriałySympozjum są publikowane w USA w serii wydawniczejProc. SPIE oraz w kraju w miesięczniku naukowo-technicznym„<strong>Elektronika</strong> - konstrukcje, technologie, zastosowania” i KwartalnikuElektroniki i Telekomunikacji PAN.Przedmiotem cyklicznych Sympozjów WILGA, organizowanychprzez Zespół Badawczy PERG - ELHEP z <strong>Instytut</strong>u Systemów<strong>Elektronicznych</strong>, są zaawansowane zastosowania dużych,rozproszonych systemów pomiarowych i kontrolnych w badaniachnaukowych w zakresie fizyki wysokich energii, astrofizykicząstek elementarnych, nadprzewodzącej techniki akceleratoroweji techniki laserowej FEL. Uczestnicy sympozjum na ogół biorąudział w różnych wielkich eksperymentach badawczych na całymświecie, jak: LHC i CMS, E-XFEL i FLASH, ILC i CLIC, Augeri Chandrayaan, ALBA, GSI, FAIR i CBM, BESSY, PITZ i in., orazdwa razy w roku spotykają się także w kraju, aby omówić postępyprac. Najlepsi z młodszych kolegów, którzy pokażą umiejętnośćsprawnej pracy zespołowej i ponadprzeciętne zdolności badawcze,mają duże szanse na wykonywanie pracy magisterskieji doktorskiej za granicą przy wymienionych eksperymentach.Znaczna część studentów Laboratorium PERG/ELHEP spędzalato studiując i ucząc się w czasie programów wakacyjnych organizowanychprzez takie wielkie europejskie ośrodki badawczejak DESY w Hamburgu, CERN w Genewie, Fermilab. Zdobytetam doświadczenia są zupełnie unikalne.Międzynarodowe Konsorcjum Badawcze „Pi-of-the-Sky”(z udziałem zespołu PERG/ELHEP z ISE) odkryło w marcu 2008wyjątkowo masywny rozbłysk gamma i towarzyszący mu rozbłyskoptyczny, oznaczony symbolem 080319. Rozbłysk był prawdopodobnieznakiem uformowania się super-masywnej czarnejdziury. Ocenia się odległość od zjawiska na ok. 7,5 mld lat świetlnych,czyli na ok. połowę wieku naszego wszechświata. Rozbłyskbył widoczny gołym okiem przez ok. jedną minutę. Obserwacji dokonanoza pomocą zbudowanego także przez naszych studentówi doktorantów, systemu ultraczułych szerokokątnych kamerUczestnicy jednej z sesji 23 Sympozjum IEEE-SPIE Fotonikii Inżynierii Internetu, WEiTI PW, 31.01.<strong>2009</strong>, przed popiersiemprof. J. Groszkowskiego, patrona gmachu Wydziału EiTI PW. Odlewej siedzą: dr Tomasz Czarski, dr Maciej Linczuk, prof. TadeuszMorawski - invited speaker, prof. Ryszard Romaniuk - przewodniczącysympozjum, dr Krzysztof Poźniak, mgr Arkadiusz Kalickiumieszczonych na terenie Europejskiego Południowego ObserwatoriumAstronomicznego ESO w Chile. Odkrycie opublikowanowe wrześniowym numerze czasopisma Nature, nr 455, 2008.Międzynarodowe Konsorcjum Badawcze CMS - KompaktowySolenoid Mionowy (z udziałem zespołu PERG/ELHEP.ISE) zakończyłow listopadzie 2008 budowę trygera mionowego dla eksperymentuCMS w CERNie. Pomiary rozpoczęły się w drugimkwartale 2008 r. Opublikowano 300- stronicową książkę pt. „TheCMS”, w wydawnictwie IOP/SISSA w październiku 2008 r.Znaczna grupa osób z Laboratorium ELHEP bierze udział w budowiei planowanej już rozbudowie wielkiego kompleksu LHC.Prace są prowadzone nad Liniakiem 4, nad akceleratorem SPS- boosterem do LHC, a także nad nową cyfrową generacją systemówbezpieczeństwa, tzw. Lock-In, dla LHC.Międzynarodowe Konsorcjum Badawcze (z udziałem doktorantówPERG/ELHEP z ISE) zorganizowane wokół indyjskiegosatelity Księżyca Chandraayan-1, koordynowane przez <strong>Instytut</strong>Maksa Plancka Badań Słońca, zakończyło prace nad wyposażeniemsatelity. Satelita został umieszczony na orbicieokołoksiężycowej w grudniu 2008 r. i rozpoczął pomiary. DoktoranciISE brali udział w konstrukcji urządzenia SIR-1 - spektroskopubliskiej podczerwieni. SIR-1 obecnie zbiera danepomiarowe z powierzchni Srebrnego Globu.Laboratorium ELHEP tradycyjnie blisko współpracuje z wielomainstytucjami w kraju biorącymi udział w dużych eksperymentachbadawczych. Jest to <strong>Instytut</strong> Problemów Jądrowychw Świerku/Otwocku oraz <strong>Instytut</strong> Fizyki Doświadczalnej UniwersytetuWarszawskiego. Młodzi uczeni z tych instytucji, także aktywniebiorą udział w Sympozjum. Niektórzy doktoranci PW sązatrudniani w IPJ, tak aby móc kontynuować prace badawcze orazuzupełnić skromne krajowe stypendium doktoranckie. Na szczęściepodczas wyjazdów do eksperymentu warunki stypendialne sązupełnie inne.Sympozja WILGA, zimowe - skromniejsze i bardziej we własnymgronie, ale także często międzynarodowe oraz majowe -znacznie szersze międzynarodowe, spełniają w warunkach krajowychzupełnie niezwykłą, wręcz unikalną rolę. W najlepszychlatach sympozja majowe gromadzą ponad 300 uczestników,głównie doktorantów z kraju i z zagranicy. Są to unikalne spotkaniamłodych uczonych, całkowicie pozbawione otoczki formalneji ideologicznej, a poświęcone wyłącznie nauce, badaniom i warunkompracy badawczej. W czasie kilkunastu lat ich organizacjizgromadziły łącznie już kilka tysięcy młodych ludzi. Wyniki ichprac opublikowano w kilkunastu tomach Proc. SPIE dostępnychw skali globalnej poprzez internetowe bazy danych American Instituteof Physics, Scitopia, SPIE Digital Library, Amazon, Scopusi inne. Młodych ludzi, którzy przeszli przez szkołę WILGI, możnaspotkać dosłownie na całym świecie, w wielkich eksperymentachw: Hiszpanii, Włoszech, Anglii, Szwajcarii i Francji, Argentynie,Niemczech, USA, a także w Indiach.Organizatorzy mają nadzieję, że cykl Sympozjów WILGA będziedalej kontynuowany z sukcesem. Następne XXIV Sympozjumjest przewidziane w dniach 25-31 maja <strong>2009</strong> jak zwykle,tradycyjnie w Wildze nad Wisłą pod Warszawą, w Ośrodku PracyTwórczej Politechniki Warszawskiej. Organizatorzy serdeczniezapraszają doktorantów, magistrantów, młodych uczonych i ichopiekunów naukowych do WILGI. Sympozjum jest prawie bezkosztowe- bez opłaty konferencyjnej. Tanie noclegi i znakomitewyżywienie oferuje letni ośrodek PW. Specjalnością naukowo-gastronomicznąWILGI są unikalne nocne sesje naukowe połączonez grillem. Więcej informacji o Sympozjum WILGA jest na witrynieinternetowej www.wilga.ise.pw.edu.pl.prof dr hab. Ryszard Romaniuk,Politechnika Warszawska,<strong>Instytut</strong> Systemów Elektronicnychprzewodniczący Sympozjum WILGA116 ELEKTRONIKA 3/<strong>2009</strong>


Wojciech Kabaciński, Mariusz Żal: Sieci telekomunikacyjne.Wydawnictwa Komunikacji i Łączności, wyd. 1. Warszawa 2008W podręczniku przedstawionopodstawy budowyi funkcjonowania współczesnychsieci telekomunikacyjnych,począwszy od siecitelefonii analogowej PSTNi cyfrowych ISDN i DSL, poprzezInternet IP, sieci bezprzewodoweGSM, UMTS,wireless LAN aż do sieci inteligentnychi optycznychWDM, DWDM i ASON. Pominiętosieci i protokoły, którejuż wyszły z użycia (m.in.sieci telegraficzne, protokołyCCITT nr 2).Książka została podzielonana 7 części. Pierwszastanowi wprowadzenie do tematyki.Przedstawiono krótki rys historyczny rozwoju sieci telekomunikacyjnycha także zasady standaryzacji i organizacje zajmujące siętymi zagadnieniami. Część druga dotyczy sieci usługowych: tradycyjnejsieci telefonicznej analogowej PSTN i cyfrowej ISDN, sieci komórkowychdrugiej (GSM) i trzeciej (UMTS) generacji, sieci IP oraztechniki ATM. Omówiono architekturę sieci, stosowane protokoły komunikacyjnei realizowane usługi specyficzne dla danego rodzaju sieci.Część trzecią poświęcono sieciom dostępowym. Scharakteryzowanołącza DSL, które budowane są z wykorzystaniem infrastrukturysieci PSTN, problematykę dostępowych sieci optycznych i bezprzewodowych,a także standardy DECT, Bluetooth oraz WiFi i WiMAX.Część czwarta podręcznika omawia sieci transportowe, zapewniająceprzesył informacji pomiędzy węzłami sieci. Przedstawiono sieci PDHi SDH - ich budowę, zasady zwielokrotniania a także funkcjonowaniasieci pierścieniowych i kratowych, metody realizacji zabezpieczeńprzed błędami transmisji. Omówiono podstawowe elementy strukturysieci optycznych ze zwielokrotnieniem falowym WDM i DWDM orazkomutowanych ASON.Część piąta przybliża czytelnikowi zagadnienia sygnalizacji i sterowania.Scharakteryzowano podstawowe funkcje, rodzaje i metodysygnalizacji, zarówno w dostępie abonenckim, jak i w komutacji międzycentralowej.Część szósta jest poświęcona budowie węzłów komutacyjnych,w tym współczesnych central telefonicznych PSTNi ISDN oraz radiokomunikacyjnych GSM. Omówiono także architekturęprzełączników ATM oraz węzłów optycznych, stosowanych w telekomunikacyjnychsieciach optycznych. Scharakteryzowano zasadyzarządzania tablicami routingu w routerach IP.Ostatnia część książki omawia zarządzanie zasobami sieciowymi.Zostały zdefiniowano protokoły zarządzania siecią w systemiesygnalizacji nr 7 wraz ze zmianami w kolejnych wersjach protokołu.Scharakteryzowano standardy zarządzania w systemach OSI i TMN.Książka jest podręcznikiem akademickim, przeznaczonym dlastudentów wydziałów elektroniki i telekomunikacji. Każdy rozdziałpodręcznika jest zakończony zestawem pytań kontrolnych. Zwracająuwagę b. obszerny wykaz literatury, zawierający 397 pozycji orazskrótów stosowanych w podręczniku w wersji angielsko-polskiej.

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!