Bachelorafhandling til civilingeniøruddannelsen Fysik & Teknologi Akustisk beamforming med mikrofon-array 16. juni, 2014 Syddansk Universitet, Teknisk Fakultet Mærsk Mc-Kinney Møller Instituttet (MMMI) Lasse Christner M˚ ansson Fysik & Teknologi & Simon Holst Traberg-Larsen Fysik & Teknologi Vejleder: Peter Møller Juhl M.Sc. EE, Ph.D. Abstract Acoustic beamforming is a principle that utilizes arrays, consisting of either microphones or loudspeakers, to achieve a desired directivity pattern. Typical applications are sound source localization and loudspeaker racks. One particular type of beamforming is delay-and-sum beamforming, which takes advantage of the time delays between adjacant transducers. By properly delaying each transducer signal, in reference to one reference transducer in the array, signals to or from a specific direction is amplified while leaving signals to or from other directions attenuated. A system’s beamforming response is refered to as its beampattern. This paper deals with localization of sound sources and how to apply it in a conference system. Studies include different array geometries, localization accuracy as a function of various parameters, noise reduction, sensitivity, as well as robustness to correlated and uncorrelated noise. Comparisons are made between analytically derived, simulated and measured beampatterns. Simulations are carried out using MATLAB. Generally, a beamformer’s localization accuracy is mostly dependent of the individual transducer separation (and thus the total size of the array). Furthermore, when increasing the number of microphones the amount and the level of sidelobes decrease. The intrinsic microphone phase errors are studied, and are found to interfere mostly at high frequencies. Correlated noise, like reflections, tend to disturb the beamformer’s AOAE (Angle Of Arrival Estimation), while uncorrelated noise have little to no impact. Using a fixed lookout direction, it is shown how the beamformer successfully amplifies sound coming from this direction while it attenuates sound arriving from elsewhere. 1 Indhold Indhold 1 Forord 4 2 Indledning 5 3 Beamforming 3.1 Delay-and-sum beamforming . . . . . . 3.2 Beamforming i hhv. fjernfelt og nærfelt . 3.3 Beamforming for plane bølger . . . . . . 3.4 Beamforming for sfæriske bølger . . . . 6 6 7 7 8 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4 Mikrofon-array 4.1 Mikrofontyper . . . . . . . . . . . . . . . . . . . . . . . . 4.1.1 Fasefejl og amplitudefejl . . . . . . . . . . . . . . 4.1.2 Følsomhedskarakteristik for ideelle og ikke-ideelle 4.2 Teori vedr. mikrofon-array . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . mikrofoner . . . . . . . . . . . . . . . . . . . . . . . . . . . 9 . 9 . 9 . 9 . 10 5 Menneskelig tale 11 6 Analytisk beamforming med simpelt, lineært array 12 6.1 Akustisk udstr˚ aling fra monopoler og dipoler . . . . . . . . . . . . . . . . . . . 12 6.2 Retningskarakteristik for linje-array . . . . . . . . . . . . . . . . . . . . . . . . 15 7 Simulering af delay-and-sum beamforming i MATLAB 7.1 Algoritmens funktionalitet . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7.2 Konfigurering af array-geometri . . . . . . . . . . . . . . . . . . . . . . . . . 7.3 Simulering af individuelt tidsforsinkede signaler . . . . . . . . . . . . . . . . 7.4 Beregning af og multiplikation med komplekse faser . . . . . . . . . . . . . . 7.5 Simulering af hhv. beampattern og følsomhedskarakteristik . . . . . . . . . 7.6 Avanceret funktionalitet . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7.6.1 Simulering af mikrofoners fase- og amplitudefejl . . . . . . . . . . . . 7.6.2 Rumakustiske fænomener, inkl. refleksioner og støj . . . . . . . . . . 7.6.3 Akustisk dæmpning i luft mellem lydkilde og array . . . . . . . . . . 7.7 Simuleringsresultater . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7.7.1 Array-geometriens indflydelse p˚ a array’ets beampattern . . . . . . . 7.7.2 Lokaliseringsnøjagtighed som funktion af indbyrdes mikrofonafstand 7.7.3 Lokaliseringsnøjagtighed som funktion af antal mikrofoner . . . . . . 7.7.4 Sidelobe-niveauer som funktion af antal mikrofoner . . . . . . . . . . 7.7.5 Kildepositionens indflydelse p˚ a array’ets beampattern . . . . . . . . 7.7.6 Effekten af mikrofonernes immanente fasefejl . . . . . . . . . . . . . 7.7.7 Effekten af 1. ordens refleksioner pga. rummets beskaffenhed . . . . 7.7.8 Effekten af tilstedeværelse af ikke-korreleret støj . . . . . . . . . . . 7.7.9 Simulering af array’ets følsomhed med og uden støj . . . . . . . . . . 7.8 Delkonklusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8 Laboratoriepraksis 8.1 M˚ alekonstruktion . . . . . . . . . . . . . 8.2 Apparater og udstyr . . . . . . . . . . . 8.3 Synkronisering af afspilning og optagelse 8.4 Fremgangsm˚ ade . . . . . . . . . . . . . . 2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17 17 17 21 21 24 24 24 26 27 28 29 40 42 46 47 48 49 52 53 57 . . . . 60 60 61 61 61 Indhold 9 Undersøgelse af array’ets beampattern og følsomhed 9.1 Undersøgelse af rektangulære geometrier . . . . . . . . . . 9.2 Undersøgelse af cirkulære geometrier . . . . . . . . . . . . 9.2.1 Effekten af mikrofonantal og array-radius . . . . . 9.3 Effekten af kildens afstand og retning i forhold til array’et 9.4 Robusthed over for refleksioner . . . . . . . . . . . . . . . 9.5 Undersøgelse af lavfrekvent respons . . . . . . . . . . . . . 9.6 Undersøgelse af array’ets beampattern i mødelokale . . . . 9.7 Undersøgelse af array’ets følsomhed . . . . . . . . . . . . . 9.8 Delkonklusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63 63 66 70 71 74 77 78 82 84 10 Vurdering af resultater og forslag til fremtidigt arbejde 86 11 Konklusion 87 12 Ordforklaring 88 13 Symboler 91 14 Figurer 94 15 Tabeller 99 16 Kode 100 17 Litteraturliste 101 3 Forord 1 Forord Denne bachelorafhandling er forfattet af Lasse Christner M˚ ansson og Simon Holst TrabergLarsen, bachelorstuderende i Fysik og Teknologi p˚ a Teknisk Fakultet, Syddansk Universitet i Odense. Afhandlingen er skrevet i perioden 16. februar 2014 - 16. juni 2014, og afsluttet ved mundtligt forsvar d. 20 juni 2014. Afhandlingen er opbygget p˚ a kronologisk vis“, dvs. at kapitlerne fremkommer i den ræk” kefølge, som de i praksis er blevet afviklet i og som ifølge os giver den bedste forst˚ aelse. Der indledes med teoretiske grundbegreber, relevant matematik og fysik og definitioner, der anlægger et fundament til forst˚ aelsen af resten af afhandlingen. Umiddelbart efter følger vores simuleringsresultater, og efter disse følger dokumentationen fra de praktiske undersøgelser. Afhandlingen afsluttes med en diskussion af det udførte arbejde, muligheder for fremtidigt arbejde og en konklusion. Kildehenvisninger vil st˚ a skrevet som et indeks i firkantparanteser, f.eks. ... ifølge kil” de[2], er der ingen tegn p˚ a...“. Indekset korresponderer til en litteratur i litteraturlisten, som følger formen 1) Forfatter eller udgiver 2) Titel 3) Forlag, ˚ ar for udgivelse 4) evt. ISBN. En kildehenvisning kan ogs˚ a indeholde specifikke sidetal eller lignende, f.eks. ...kilde[8, s. 4]...“ ” betyder kilde nr. 8, side 4. Figurer, ligninger, tabeller og kodeeksempler er nummeret efter overordnede kapitler igennem afhandlingen, f.eks. henviser Ligning 7.2“ til ligning nummer 2 i kapitel 7. Det tilsvarende ” gør sig gældende for figurer, tabeller og kodeeksempler. Til sidst i afhandlingen forefindes en ord- og symbolforklaring, hvor alle specielle fagtermer, forkortelser, engelske udtryk, matematiske og fysiske symboler er forklaret. Ord bliver forklaret og evt. markeret med kursiv font den første gang de optræder, og fremadrettet vil de st˚ a skrevet som almindelig tekst. Symboler forklares efter behov. Alle forsøg er foretaget p˚ a Teknisk Fakultet, Syddansk Universitet i det lyddøde rum og i tilknyttede undervisningslokaler. Vi er taknemmelige for at have haft adgang til b˚ ade laboratorier og udstyr ifm. vores praktiske undersøgelser. En stor tak skal g˚ a til vores vejleder, M.Sc. EE og PhD Peter Møller Juhl, der med positiv indstilling har besvaret vores faglige spørgsm˚ al og motiveret os til yderligere arbejde igennem hele projektperioden. Odense, Danmark, 10. juni 2014 Lasse Christner M˚ ansson Simon Holst Traberg-Larsen 4 Indledning 2 Indledning Array acoustics er et felt inden for akustik, der opererer med akustisk udstr˚ aling eller m˚ aling med flere simultane transducere (højtalere eller mikrofoner). Et array skal ikke nødvendigvis oversættes direkte til række“, men snarere forst˚ as som en konfiguration af transducere, der ” kan arrangeres i mange forskellige geometrier - inklusiv række-arrays naturligvis. Den store styrke i akustiske arrays ligger i deres evne til at producere en retningskarakteristik, der kan justeres til en specifik applikation. Eksempler er højtaler-racks ifm. koncerter og sceneoptrædener og mikrofon-arrays ifm. lydlokalisering af f.eks. mekaniske vibrationer i dieselmotorer og rumlig filtrering. Denne rapport beskæftiger sig primært med sidstnævnte applikation, nanvlig mikrofon-arrays til lokalisering og filtrering ifm. konferencesystemer. Et traditionelt princip inden for spatial lokalisering og filtrering er beamforming, der - som navnet hentyder - p˚ a mange m˚ ader udfører en str˚ aledannelse af lydfeltet p˚ a samme m˚ ade som en lommelygte beamer lys. Signalteknisk eksisterer der en række metoder til at udføre beamforming, der afviger fra hinanden i b˚ andbredde, adaptive evner, retningsbestemthed, sidelobeniveauer (fejlestimater af lydkilde) m.m. delay-and-sum er en traditionel beamforming-teknik, der drager nytte af fysiske fasedrejninger mellem signaler fra forskellige transducere i array’et. Delay-and-sum er det primære beskæftigelsesomr˚ ade i denne rapport. Teknologien skal forestilles anvendt i et konferencesystem, hvor et mikrofon-array skal være i stand til at undertrykke lyd fra alle andre retninger end ´en bestemt vha. den omtalte beamforming. Systemet skal s˚ aledes kunne b˚ ade lokalisere den p˚ agældende lydkilde (taler) og herefter l˚ ase fast p˚ a denne retning, s˚ aledes at lyd fra andre retninger (betragtet som støj) filtreres. I praksis kan man nemt forestille sig, at en beamforming-algoritme arbejder tæt sammen med anden (digital) signalbehandling, f.eks. FIR filtre, for at forbedre taleforst˚ aelsen, leveret af systemet. Dette projekt opererer imidlertid udelukkende med resultater produceret af beamforming-teknikker. Eventuelle signaltekniske moduler kan s˚ aledes suppleres, hvis det findes nødvendigt. Nærværende rapport dokumenterer den bagvedliggende teori, undersøger delay-and-sum beamforming-teknikken vha. MATLAB-simuleringer, afprøver teknikken i praksis i b˚ ade lyddødt og ikke-lyddødt rum og forsøger at kvantificere og forklare mange af de observerede fænomener i brugen af akustiske arrays. Der vil primært blive lagt fokus p˚ a lokalisering af lydkilder og tilhørende beampatterns, mens følsomhedskarakteristikker blot nævnes kort. Relevante kvalitetsbedømmelser for systemet omfatter f.eks. lokaliseringsnøjagtighed (ofte benævnt mainlobe-bredde), sidelobe-niveau, robusthed overfor støj (korreleret s˚ avel som ikkekorreleret), støjreduktion (SNR før og efter beamforming) og effektivitet (ydeevne1 ift. antal transducere). Det er ogs˚ a ønskværdigt at bestemme indflydelsen af de benyttede transducers iboende (engelsk: intrinsic) fasefejl, eftersom disse kan for˚ arsage fejllokaliseringer og store sidelobes. Analogt med fasefejl er det ogs˚ a væsentligt at vurdere systemets robusthed overfor menneskelige eller mekaniske positioneringsfejl af array-transducerne. F.eks., hvilken fasefejl giver en forskydning p˚ a et par centimeter anledning til? Som kontrollant for b˚ ade simuleringer og efterfølgende m˚ alinger udføres en analytisk udledning af en beamforming-procedure for et uniformt, lineært array (ULA). 1 Ydeevne: lokaliseringnøjagtighed, sidelobe-niveau og støjreduktion 5 Beamforming 3 Beamforming Navnet beamforming er givet til mange forskellige array-behandlingsalgoritmer (array processing algorithms), der fokuserer array’ets følsomhed og evne til at opfange eller udstr˚ ale et signal fra eller i en bestemt retning. Navnet er baseret p˚ a analogien fra en lommelygte, og derfor kaldes hoveddelen af array’ets retningsmønster for en str˚ ale, der kommer af det engelske ord beam. 3.1 Delay-and-sum beamforming En lydkilde p˚ a positionen ~r0 , der udsender et tidsvarierende signal, p(t), ønskes lokaliseret. Dette signal m˚ ales vha. et array, der best˚ ar af M mikrofoner lokaliseret ved positionsvektorer ~rm , m = 0, 1, ..., M − 1. Mikrofonlokationerne i array’et defineres ud fra afstanden til en referencemikrofon, som kan vælges vilk˚ arligt; f.eks. i et hjørne af array’et eller i array’ets centrum. ~rm er vektorer fra de enkelte mikrofoner til referencemikrofonen, og pm (t) er lydsignalet fra kilden m˚ alt af den m’ te mikrofon. Delay-and-sum beamforming best˚ ar i at p˚ aføre en tidsforsinkelse (delay) ∆m og evt. en amplitudevægtning wm til hvert mikrofonsignal, hvorefter de resulterende signaler summeres. Amplitudevægtningen kan bruges som kompensation for store akustiske energitab, hvis transducere er separeret med store afstande. Udgangssignalet, z(t), fra delay-and-sum beamforming defineres i tidsdomænet som[6] z(t) = M −1 X wm pm (t − ∆m ). (3.1) m=0 P˚ a figur 3.1 er delay-and-sum teknikken vist signalteknisk. Figur 3.1: Signalteknisk diagram for delay-and-sum beamforming. Illustration venligst l˚ ant af Dr. Andrew Greensted[17]. Forsinkelsen til mikrofonsignalerne kan ogs˚ a p˚ aføres i frekvensdomænet. Her p˚ aføres en faseforskydning i stedet for en tidsforsinkelse, og det gøres ved at gange signalet med en kompleks fase e−jω∆m [10] z(ω) = M −1 X wm pm (ω)e −jω∆m m=0 = M −1 X ~ wm pm (ω)ej k·~rm , (3.2) m=0 hvor ~k = −κ~u er bølgevektoren for en plan bølge, der udbredes fra retningen ~u, κ er en konstant, ω er vinkelfrekvens, og pm (ω) er den Fouriertransformerede af pm (t). 6 Beamforming 3.2 Beamforming i hhv. fjernfelt og nærfelt Kilden, der ønskes lokaliseret, kan opfattes af systemet p˚ a forskellige m˚ ader alt efter, hvor langt fra systemet den befinder sig. Hvis dens afstand til systemet er sammenlignelig med systemets dimensioner, befinder den sig i nærfeltet, og dens signal kan betragtes som sfæriske bølger. N˚ ar der er tale om sfæriske bølger, kan man i teorien bestemme b˚ ade retningen og afstanden til kilden, da retningsvektorerne, der rammer de enkelte mikrofoner, oprinder fra en fælles kilde[6]. Hvis kilden befinder sig langt fra systemet i forhold til systemets dimensioner, kan den antages at befinde sig i fjernfeltet, og dens signal m˚ a derfor betragtes som plane bølger. I s˚ adanne tilfælde kan det bestemmes hvilken retning kilden befinder sig i, mens afstanden til en kilde med ukendt styrke ikke kan bestemmes. Dette skyldes, at signalet antages at være plane bølger, som ikke har retningsvektorer fra et fælles udbredelsespunkt. 3.3 Beamforming for plane bølger Faseforskydninger, der p˚ aføres de enkelte mikrofonsignaler i delay-and-sum beamforming, giver array’et mulighed for at søge“ efter signalet i en bestemt retning. Ved at justere fasefor” skydningerne kan retningen, som array’et søger i, blive styret hen imod kilden. Der defineres en formodet udbredelsesretning vha. enhedsvektoren ~u. I ligning (3.2) bestemmes udgangssignalet fra delay-and-sum beamforming i frekvensdomænet ved at gange lydtrykket fra mikrofonsignalerne med en kompleks fase e−jω∆m . Hvis det vælges, at ~rm · ~u ∆m = , (3.3) c hvor c er lydens hastighed, kompenserer faseforskydningen i signalbehandlingen for udbredelsesforsinkelsen, som mikrofonerne i array’et udsættes for. Det betyder, at alle signaler fra retningen ~u er i fase, og de vil derfor forstærke hinanden, n˚ ar de summeres. Signaler fra andre retninger vil ikke være i fase, og derfor vil de have tendens til at annullere hinanden. Dermed er array’et blevet følsomt i en bestemt retning og har f˚ aet en retningskarakteristik, der inderholder et s˚ akaldt mainlobe. Et s˚ adant mainlobe fremg˚ ar af figur 3.2, hvor det ses, at det p˚ agældende array er følsomt i retningen 90◦ . P˚ a figuren ses ogs˚ a et sidelobe, der er den lille str˚ ale i retningen 270◦ , og som repræsenterer en fejlestimering af lydkilden. Figur 3.2: Mainlobe i retningen 90◦ og sidelobe i retningen 270◦ . De tilfælde, hvor faseforskydningerne bringer mikrofonsignalerne i fase, kaldes stacking, og udgangssignalet, z(t), fra delay-and-sum beamforming kan skrives som "M −1 # X z(t) = p(t) wm , (3.4) m=0 Udgangssignalet er alts˚ a lig med signalet, der udbredes fra kilden, ganget med en konstant i form af amplitudevægtningen for hver mikrofon. 7 Beamforming Hvis den formodede udbredelsesretning, ~u, er forkert og ikke er den retning, kilden befinder sig i, bliver udgangssignalet en forringet version af signalet, og det kaldes mismatch. En plan bølge med bølgevektoren ~k0 , som er forskellig fra den faktiske ~k = −κ~u, resulterer i mikrofonsignalerne, pm (ω) ~ pm (ω) = ps e−j k0 ·~rm , (3.5) hvor ps er amplituden af lydtrykket. Ved at sammenligne dette udtryk med ligning (3.2) ses det, at udgangssignalet, z(ω), bliver z(ω) = ps M −1 X ~ ~ wm ej(k−k0 )·~rm = ps W (~k − ~k0 ), (3.6) m=0 hvor funktionen W er det s˚ akaldte array-mønster[10], der beskriver array’ets følsomhed. W er givet ved M −1 X ~ ~ = W (K) wm ej K·~rm , (3.7) m=0 ~ = ~k − ~k0 . hvor K 3.4 Beamforming for sfæriske bølger Hvis array’et befinder sig i kildens nærfelt, antages det, at kilden udsender et signal, p(t), der udbredes sfærisk. Ses der p˚ a frekvensdomænet m˚ aler den m0 te mikrofon signalet ~ pm (ω) = pss e−j k0 ·~rm , Rm (3.8) hvor pss er amplituden af lydtrykket, ~k0 er bølgevektoren for det m˚ alte signal, og Rm er afstanden mellem kilden og mikrofonen. Ved igen at vælge en tidsforsinkelse til ∆m = ~rm · ~u c (3.9) kan alle M mikrofonsignaler, der kommer fra kildens retning, stackes og forstærke hinanden. I dette tilfælde gælder det, at ~k0 = ~k, og udgangssignalet, z(ω), fra beamformingen for en sfærisk udbredende bølge bliver dermed z(ω) = M −1 X wm pm (ω)e−jω∆m = M −1 X ~ wm pm (ω)ej k·~rm , (3.10) m=0 m=0 hvor k = −κ~u. I tilfælde af mismatch, hvor ~k0 6= ~k, vil delay-and-sum beamformingens udgangssignal blive "M −1 # ~ ~ X ej(k−k0 )·~rm z(ω) = pss wm = pss W (~k − ~k0 ). (3.11) Rm m=0 Her er funktionen W igen array-mønstret givet ved ~ = W (K) M −1 X m=0 ~ = ~k − ~k0 . hvor K 8 ~ wm ej K·~rm , (3.12) Mikrofon-array 4 Mikrofon-array 4.1 Mikrofontyper Generelt findes der tre typer akustiske lydfelter, nemlig free field, pressure field og diffuse field. Mikrofoner er designet til at have et fladt frekvensrespons i et af disse lydfelter, hvilket kaldes det optimerede respons[2], og anvendes en mikrofon i et andet lydfelt, end d´er hvor den er beregnet til at m˚ ale, vil dens frekvensrespons ikke være fladt. Forskellene p˚ a de enkelte mikrofoners respons forekommer typisk ved høje frekvenser. Hvor høje frekvenser, der er tale om, afhænger af størrelsen p˚ a mikrofonen, da lydfeltet først f˚ ar betydning, n˚ ar lydens bølgelængde bliver sammenlignelig med mikrofonens membranstørrelse. I dette projekt begrænses frekvensomr˚ adet til det, der er væsentligt for menneskelig tale, og det bliver derfor ikke aktuelt at vurdere hvilket lydfelt, der er tale om. Det har dermed ingen betydning, om der vælges free field- eller pressure field-mikrofoner. Der findes en type af mikrofoner, der hedder array-mikrofoner. Disse array-mikrofoner er designet, s˚ a de minder mest muligt om hinanden og er derfor er velegnede til systemer, der kræver et større antal mikrofoner. 4.1.1 Fasefejl og amplitudefejl Mikrofoner, der anvendes til reelle m˚ alinger, er ikke ideelle, og brug af forskellige mikrofoner kan dermed give forskellige resultater pga. de enkelte mikrofoners fase- og amplitudefejl. Fasefejl kan vise sig at have stor betydning, n˚ ar der laves beamforming med delay-and-sum metoden, hvor de enkelte mikrofoner i et mikrofon-array p˚ aføres en faseforskydning. Hvis mikrofonerne har forskellige indre fasefejl, kan det give anledning til lokaliseringsfejl. De p˚ aførte faseforskydninger skal lægges sammen med mikrofonernes fasefejl, og den p˚ aførte faseforskydning bliver dermed en anden end den ønskede. Amplitudefejl kan p˚ avirke den destruktive interferens, der er nødvendig for undertrykkelsen (filtreringen) af uønsket lyd, men er ikke af lige s˚ a stor betydning som fasefejlene, n˚ ar der tales om delay-and-sum beamforming. Metoden har fokus p˚ a mikrofonernes faseforskelle, og amplituderne anvendes derfor ikke til at lokalisere retningen, lydkilden kommer fra. Hvis form˚ alet med m˚ alingerne ogs˚ a er at bestemme afstanden til lydkilden, kan amplitudefejlene dog vise sig at f˚ a betydning. I array-mikrofoner er den relative fase- og amplitudefejl minimeret, s˚ a mikrofonerne minder mest muligt om hinanden. Dette er væsentligt, n˚ ar der laves beamforming, da sm˚ a faseændringer kan have stor betydning - især ved høje frekvenser. 4.1.2 Følsomhedskarakteristik for ideelle og ikke-ideelle mikrofoner N˚ ar følsomheden af mikrofon-array’et simuleres, antages det, at mikrofonerne er lige følsomme ved alle indfaldsvinkler og alle frekvenser. Figur 4.1 viser indfaldsvinklen p˚ a en mikrofon. Hvis mikrofon-array’et placeres p˚ a en bordplade (f.eks. ifm. et konferencesystem), skal der kun tages hensyn til indfaldsvinkler fra -90◦ til 90◦ . Figur 4.1: Indfaldsvinkel p˚ a en mikrofons membran. Figur venligst l˚ ant fra [2]. 9 Mikrofon-array I praksis er mikrofonerne dog ikke lige følsomme ved alle indfaldsvinkler og frekvenser. Ved lave frekvenser er mikrofonerne næsten omnidirektionelle, og der vil derfor næsten ikke være nogen forskel p˚ a indfaldende lyd ved 0◦ og 90◦ . Ved høje frekvenser er mikrofonerne mest følsomme ved en indfaldsvinkel p˚ a 0◦ , og følsomheden bliver mindre n˚ ar indfaldsvinklen øges, da højere frekvenser er mere retningsbestemte[16]. Figur 4.2 viser følsomhedskarakteristikker for en pressure field-mikrofon[2] ved forskellige indfaldsvinkler og frekvenser fra 5 til 25 kHz. (a) Følsomhedskarakteristik for frekvenser fra 5 kHz til 12,5 kHz. (b) Følsomhedskarakteristik for frekvenser fra 16 kHz til 25 kHz. Figur 4.2: Følsomhedskarakteristik for en pressure field-mikrofon som funktion af indfaldsvinkel.[2] 4.2 Teori vedr. mikrofon-array Udover den bagvedliggende signalbehandling, som er ansvarlig for styringen af mikrofonarray’ets følsomhed, har selve udformingen af array’et en betydning for array’ets b˚ andbredde2 . De to vigtigste parametre er array’ets fysiske størrelse og de indbyrdes mikrofonafstande, begge m˚ alt i bølgelængder. Jo større array’et fysisk er, jo større tidsforskelle opst˚ ar der mellem forskellige mikrofoner, hvilket er til fordel for det lavfrekvente beampattern. De indbyrdes mikrofonafstande har dog betydning for de højere frekvenser og skal konfigureres til en specifik applikation. Et fejldimensioneret array kan f.eks. udvise et fænomen, man inden for en signalteknisk begrebsverden kan kalde for rumlig aliasing (spatial aliasing), som opst˚ ar n˚ ar mikrofonafstandene bliver mindre end en halv bølgelængde[9]. Mikrofonafstandene kan s˚ aledes sammenlignes med en rumlig sampling, ligesom MATLAB-algoritmen sampler mikrofonsignalerne i tid. I teorien kan man opn˚ a et frekvensinvariant beampattern for et kontinuert frekvensspektrum, hvis man anvender et array med en kontinuert fordeling af mikrofoner. I praksis m˚ a man nøjes med et endeligt antal diskrete mikrofoner. Opgaven ligger hermed i finjusteringen af mikrofonplaceringer, s˚ a der f˚ as et ønsket beampattern. Beamforming ved hjælp af mikrofon-array kan i princippet forbedre et signals SNR, fordi systemet fungerer som et filter. Udgangspunktet i dette projekt er et konferencesystem. Der findes en række elektronik- og akustikvirksomheder b˚ ade i Danmark og udenlands, der beskæftiger sig med akustisk beamforming. Som eksempler kan nævnes: Br¨ uel & Kjær[12]: bruger bl.a. spiralformede array’s til pass-by støjlokalisering. ClearOne[13]: bruger et tre-rækkers lineært array til samtalebrug ved møder. Acoustic Camera[11]: bruger forskelligartede cirkulære array’s til støjlokalisering i f.eks. forbrændingsmotorer. 2 B˚ andbredde: angiver størrelsen af det frekvensspektrum, hvor array’et er i stand til at lokalisere lydkilden 10 Menneskelig tale 5 Menneskelig tale Den menneskelige tale produceres af stemmeorganerne, der omfatter lungerne, luftrøret, strubehovedet (inklusiv stemmeb˚ and), halsen, svælget, nasale hulrum (næse) og munden.[15]. Stemmeb˚ andets størrelse og ˚ abning kan regulere luftstrømmen, der kommer fra lungerne. Det er n˚ ar stemmeb˚ andet ˚ abner og lukker ved frekvenser i omr˚ adet 50 - 500 Hz, at der produceres akustisk energi. Resten af stemmeorganerne (fra hals og op) kan beskrives med en akustisk overføringsfunktion, der indeholder s˚ akaldte formanter“, hvis rolle er at fremhæve specifikke ” overtoner, herunder f.eks. konsonanter. En overvejende del af den akustiske energi bruges til lavfrekvent vokaldannelse og en lille resterende energi bruges til højfrekvent konsonantudtale; dette p˚ a trods af, at den primære taleforst˚ aelse udgøres af konsonanterne. Det er almindelig anerkendt, at konsonanter (taleforst˚ aelse) groft set befinder sig i frekvensomr˚ adet 1 kHz - 4 kHz, se f.eks. figur 5.1, der viser frekvensindholdet af sætningen I can see you“. ” Analog telefoni før i tiden b˚ andpasfiltrerede mennesketale mellem 500 Hz og 3,4 kHz, og mere nutidig internettelefoni (VoIP) opererer med et større spektrum fra 300 Hz til 8 kHz. Den menneskelige tale kan ogs˚ a i høj grad moduleres af et rums akustiske egenskaber, f.eks. efterklang. Der vil i de kommende simuleringer og m˚ alinger tages udgangspunkt i frekvensomr˚ adet 1 kHz - 4 kHz, som en grov repræsentation af mennesketale. Figur 5.1: Frekvensindhold i sætningen I can see you“. Billede er venligst l˚ ant af Brian Moore - An Intro” ” duction to the Psychology of Hearing[15] 11 Analytisk beamforming med simpelt, lineært array 6 Analytisk beamforming med simpelt, lineært array Igennem rapporten bliver det dokumenteret, hvorledes forskellige array-geometrier (f.eks. rektangulære og cirkulære) udfører akustisk beamforming. De fysiske m˚ alinger understøttes af relevante MATLAB-simuleringer, og for at bekræfte validiteten af simuleringerne er det ønskværdigt at undersøge et teoretisk tilfælde, som kan udledes analytisk. Det nemmeste tilfælde er et uniformt, lineært array (ULA) med et lille antal mikrofoner, f.eks. 4, placeret med regelmæssig, indbyrdes afstand p˚ a en ret linje. Udledningen tager udgangspunkt i en række principper og antagelser[5]: Reciprocitet mellem lydgiver og lydmodtager. Lydgiver betragtes som punktkilde (monopol) og lydmodtager som punktmodtager. Lydmodtager opholder sig i lydgiverens fjernfelt. Reciprocitetsprincippet er vigtigt i denne sammenhæng, fordi udledningen tager udgangspunkt i retningskarakteristikken for et ULA best˚ aende af lydgivere, og ikke lydmodtagere. Vha. reciprociteten ses det imidlertid, at retningskarakteristikken for en lydgiver er identisk med lydmodtagerens[16]. Derfor kan resultatet fra udledningen overføres direkte til et mikrofon-array. Den simpleste form for lydkilde er en lille, pulserende kugle, ofte benævnt monopol, punktkilde eller 0’te-ordens kilde. Det antages i denne analyse at lydgiver opfører sig som en ideel monopol, mens lydmodtager opfører sig som en ideel punktmodtager. I analysen af et ULA skal der bruges mindst to monopoler. Den mindste konstruktion er s˚ aledes en dipol, dvs. to monopoler med fastholdt indbyrdes afstand. Det kan vises matematisk, at n˚ ar man befinder sig i nærfeltet af en dipols akustiske lydfelt, opst˚ ar der særlige nulpunkter, hvor de to monopoler i dipolen interfererer destruktivt med hinanden. Af denne grund betragtes kun tilfældet, hvor lydmodtageren opholder sig i ULA’ets fjernfelt. 6.1 Akustisk udstr˚ aling fra monopoler og dipoler En frit anbragt monopol, som kan matematisk indskrænkes til et punkt, vil udstr˚ ale et sfærisk lydfelt i fjernfeltet, f.eks. et radialfelt, hvor lydtrykssvingninger er ens overalt i enhver given afstand fra kildens centrum. Et s˚ adant felts bølgefronter er koncentriske kugleflader med centrum i kildens centrum. I et sfærisk koordinatsystem kan bølgeligningen skrives ∇2 Φ + k 2 Φ = 1 ∂ 2 ∂Φ (r ) + k 2 Φ = 0, r2 ∂r ∂r (6.1) hvor ∇2 er Laplaceoperatoren, Φ er hastighedspotentialet3 , k er bølgetallet og r er afstand. Denne har den fuldstændige matematiske løsning A jk(ct−r) B jk(ct+r) e + e , (6.2) 4πr 4πr hvor A og B er arbitrære konstanter, som bestemmes vha. rand- og begyndelsesbetingelser. De to led repræsenterer hhv. udad-propagerende (divergerende) og indad-propagerende (konvergerende) bølgefronter. Konvergerende bølgefronter er refleksioner af lydgiveren i en h˚ ard, uendelig stor væg uendeligt langt væk. I denne udledning er lydgiveren anbragt i et frit felt, og derfor er B = 0 (ingen refleksioner). S˚ aledes f˚ as hastighedspotentialet, Φ, partikelhastigheden, ur , og lydtrykket, p, for en monopol til Φ= Φ= 3 A jk(ct−r) e 4πr partikelhastighed = −∇Φ 12 (6.3) Analytisk beamforming med simpelt, lineært array ∂Φ 1 A jk(ct−r) = ( + jk) e (6.4) ∂r r 4πr A jk(ct−r) ∂Φ = jkρc e (6.5) p=ρ ∂t 4πr Tæt p˚ a kilden, dvs. n˚ ar r → 0, er partikelhastigheden, ur , og lydtrykket, p, tilnærmelsesvist 90◦ faseforskudt, hvilket gør lydfeltet overvejende reaktivt. I fjernfeltet er feltet overvejende aktivt. Hvis monopolens radius er ra , og dens radielle overfladehastighed sættes til u0 ejωt , hvor u0 er en amplitudekonstant, f˚ as fra ligning 6.4 ur = − (ur )r=ra = u0 ejωt = ( 1 A j(ωt−kra ) + jk) e ra 4πra (6.6) S˚ aledes er kildestyrken, A, i r = ra lig med kildens volumenhastighed: A= u0 ejkra 4πra2 → u0 4πra2 1 + jkra for kra 1 (6.7) N˚ ar en monopol anbringes foran en uendelig stor4 , plan, h˚ ard væg med en afstand, h, der er sammenlignelig med eller større end bølgelængden, kan man i et punkt, P , vælge at opfatte denne konfiguration som to korrelerede monopoler, hvor monopol nr. to er en imaginær kilde for˚ arsaget af den første monopols refleksion i væggen, se figur 6.1a. Effektivt opst˚ ar der alts˚ a en dipol, som har interessante egenskaber i b˚ ade fjern- og nærfeltet. Ved forskellige frekvenser vil der opst˚ a omr˚ ader, der er domineret af destruktiv interferens mellem to de monopoler En dipol skabes ogs˚ a ved simpelt at placere to monopoler ved siden af hinanden med en fastholdt indbyrdes afstand 2h, se figur 6.1b. Det resulterende hastighedspotentiale, Φ, i et vilk˚ arligt punkt er A1 jk(ct−r1 ) A2 jk(ct−r2 ) Φ= e + e (6.8) 4πr1 4πr2 (a) Monopol S placeret foran uendelig stor, h˚ ard væg med afstand h, og lydmodtager placeret i punkt P . Refleksionen af S i væg medfører virtuel lydgiver S 0 . (b) To monopoler separeret med afstand 2h skaber en dipol med respektive afstande til lydmodtager, P , r1 og r2 . Figur 6.1: Konfigurationer af ´en eller to monopoler kan effektivt forst˚ as som dipoler. Illustrationer venligst l˚ ant fra Knud Rasmussen - Lydfelter“ [5] ” Det ses fra figuren, at r1 = r − h · cos(ϕ) og r2 = r + h · cos(ϕ). N˚ ar man opholder sig i fjernfeltet, dvs. r 2h, og de to monopoler udstr˚ aler med samme styrke, A1 = A2 = A, og 4 Uendelig stor kan i praksis forst˚ as som meget større end bølgelængden og kildens afstand til væggen. 13 Analytisk beamforming med simpelt, lineært array fase, kan feltet approksimeres med A · 2 cos (kh cos (ϕ)) · ejk(ct−r) , (6.9) 4πr hvor ϕ er vinklen mellem den vektor, der forbinder centrum af dipolen med P og den vektor, der gennemløber begge monopoler, og det antages at r = r1 = r2 i nævneren. Hvis punktet P ligger p˚ a væggens overflade, ϕ = 90◦ , bliver lydtrykket det dobbelte overalt p˚ a en linje, der svarer til en normal fra dipolens centrum sammenlignet med en enkelt frit anbragt monopol. N˚ ar ϕ = 0◦ opst˚ ar der konstruktiv interferens, n˚ ar monopolafstanden 2h er et helt antal bølgelængder. Destruktiv interferens forekommer, n˚ ar afstanden er et ulige antal halve bølgelængder. Faktoren 2 cos(kh cos(ϕ)) angiver s˚ aledes ændringen af lydtrykskarakteristikken sammenlignet med en enkelt kilde, n˚ ar man befinder sig i fjernfeltet. Nulpunkterne, dvs. omr˚ ader med total destruktiv interferens, findes vha. Φ≈ kh cos(ϕ) = (2n + 1) · π/2 (6.10) eller formuleret i forhold til frekvenser f= 2n + 1 c , 4 h cos(ϕ) (6.11) hvor n = 1, 2, 3, · · · . Faktoren cos(kh cos(ϕ)) kan ogs˚ a forst˚ as som forholdet mellem det faktiske lydtryk i en given retning produceret af dipolen og det lydtryk, der ville have eksisteret, hvis dipolen erstattedes med en enkelt monopol med samme styrke, 2A, som dipolen. Faktoren benævnes R(f ), og er en definition p˚ a dipolens retningskarakteristik. Af figur 6.2 fremg˚ ar retningskarakteristikken for en dipol for forskellige monopol-monopol afstande, 2h, i forhold til bølgelængden, λ, ved f = 1000 Hz. (a) 2h/λ = 0, 25 (b) 2h/λ = 0, 50 (c) 2h/λ = 1, 00 (d) 2h/λ = 2, 00 Figur 6.2: Dipol-retningskarakteristik for forskellige 2h/λ-forhold ved f = 1000 Hz. 14 Analytisk beamforming med simpelt, lineært array 6.2 Retningskarakteristik for linje-array Et ULA kan i det mest simple tilfælde modelleres som en række af N monopoler, der svinger med samme styrke. Hvis alle N lydgivere spiller i fase er det resulterende lydfelt, Φres , i et fjernt punkt P givet ved en superposition Φres = N X Φi ejϕi , (6.12) i=1 hvor Φi er lydfeltet produceret af den i’te lydgiver, og ϕi er den faseforskel, der er mellem den i’te kilde og kilde nummer 1. Hvis alle lydgivere pulserer med en indbyrdes faseforskel ϕ0i bliver feltet i stedet N X 0 Φres = Φi ej(ϕi +ϕi ) (6.13) i=1 P a et systems Det teoretisk maksimale lydtryk f˚ as n˚ ar Φres = N i=1 Φi . Ifølge definitionen p˚ retningskarakteristik, udviklet i forrige afsnit, f˚ as derfor den resulterende retningskarakteristik Rres (f ), P N Φ ej(ϕi +ϕ0i ) i=1 i (6.14) Rres (f ) = PN Φ i i=1 N˚ ar alle kilder svinger med samme styrke, dvs. Φi = Φ0 , f˚ as det reducerede udtryk N 1 X j(ϕi +ϕ0 ) i , Rres (f ) = e N (6.15) i=1 som er rotationssymmetrisk omkring ULA’ets længdeakse. Dette skyldes array’ets symmetriske konstruktion. Figur 6.3: N monopoler p˚ a række med styringsretning θ i forhold til normal p˚ a ULA’ets længdeakse. Illustration venligst l˚ ant fra Knud Rasmussen - Lydfelter“ [5] ” P˚ a figur 6.3 ses et linje-array med N monopoler, alle med indbyrdes afstand a. Udstr˚ alingen er vist fra hver monopol som rette linjer, der danner en vinkel θ med normalen til array’ets længdeakse. Den indbyrdes faseforskydning mellem den i0 te og den første (i = 1) monopol bestemmes geometrisk til ϕi = 2π ti 2πa sin(θ)(i − 1)f = 2πti · f = = ka sin(θ)(i − 1), T c (6.16) hvor ti er den tidsforsinkelse, der er i mellem lydudstr˚ alingen fra hhv. den i0 te og den første 0 kilde, og T er periodetiden for lydsignalet. Hvis ϕi = 0 f˚ as der fra ligning 6.15 N 1 X j(i−1)ka sin(θ) Rres (f ) = e (6.17) N i=1 15 Analytisk beamforming med simpelt, lineært array Ved at substituere β = ka sin(θ) og bruge at PN −1 n=0 rn = 1−rN 1−r f˚ ar man 1 − ejN β 1 − (cos(N β) + j sin(N β)) 1 1 − ejβ = N 1 − (cos(β) + j sin(β)) 1 1 − cos(N β) 1/2 1 sin(N β/2) = = N 1 − cos(β) N sin(β/2) 1 Rres (f ) = N N˚ ar β = ka sin(θ) erstattes bliver retningskarakteristikken derfor sin(N π λa sin(θ)) Rres (f ) = N sin(N λa sin(θ)) (6.18) (6.19) N˚ ar ϕ0i 6= 0 i ligning 6.15, dvs. at der indføres en faseforskel mellem hver nabolydgiver som supplement til vejlængdefaseforskellen, kan ligning 6.19 udvides til sin(N π λa sin(θ) + sin(θ0 )) , Rres (f ) = (6.20) N sin(N λa sin(θ) + sin(θ0 )) hvor ϕ0i = ka sin(θ0 )(i − 1), og θ0 er en fast vinkel, der medfører en ekstra fasedrejning mellem den i’te og første monopol (styringsretning). P˚ a figur 6.4 ses det analytiske beampattern for et ULA med N = 4 monopoler, a = 3, 9 cm og θ0 = π/2 rad. I dette tilfælde er lydgiverne placeret parallelt med θ = 90◦ p˚ a figur 6.3, og der er tillagt en ekstra fase mellem hver nabolydgiver ved at sætte θ0 = −π/2, se figur 6.4. Figur 6.4: Analytisk beampattern for ULA med N = 4 monopoler, a = 3, 9 cm og θ0 = π/2. Et lignende array kan relativt nemt b˚ ade simuleres og undersøges i praksis, læs nærmere om dette i kapitel 7 og 9. Lydgiverne er stadig placeret langs θ = 90◦ , mens θ0 = 0. Der f˚ as nu et anderledes beampattern, der i høj grad understreger, at ULA’ets beamforming-evne er afhængig af den valgte retning, se figur 6.5. I denne situation f˚ as der større sidelobes, men mainlobe-bredden er forbedret ift. forrige situation p˚ a figur 6.4. Figur 6.5: Analytisk beampattern for ULA med N = 4 monopoler, a = 3, 9 cm og θ0 = 0. 16 Simulering af delay-and-sum beamforming i MATLAB 7 Simulering af delay-and-sum beamforming i MATLAB 7.1 Algoritmens funktionalitet Den samlede simulering af delay-and-sum beamforming er udført i de to MATLAB-scripts ArrayConfiguration.m”samt Beamforming FFT.m“. I ArrayConfiguration.m“ foretages al ” ” ” opsætning af mikrofon-array’et, herunder dimensioner, geometri, lydkildens position samt valgfrie, avancerede tillægsfunktioner (f.eks. mikrofonfasefejl og refleksioner i rummet). Derudover kan det ogs˚ a angives hvilket frekvensomr˚ ade, der ønskes undersøgt. Scriptet eksporterer automatisk den valgte konfiguration til filen MicrophoneArray.mat“. MATLAB-algoritmen ” Beamforming FFT.m“ implementerer delay-and-sum beamforming i frekvensdomænet, som ” omtalt i kapitel 3. Simuleringen tager udgangspunkt i den prædefinerede array-geometri og har flere indbyggede funktioner: 1. Simulering af tidsforsinkede signaler for hver mikrofon i array’et. 2. Beregning af komplekse faser for en valgt styringsretning for alle mikrofoner. 3. Multiplikation med faser samt addering af alle mikrofonsignaler. 4. Polær afbildning af array’ets resulterende beampattern for udvalgte frekvenser. 5. 3D afbildning af array’ets beampatten som funktion af rumlig vinkel i xy-planen og frekvens. B˚ ade ArrayConfiguration.m“ og Beamforming FFT.m“ er vedhæftet p˚ a den medfølgende ” ” CD. Uddrag fra algoritmen vil blive omtalt i de følgende afsnit. 7.2 Konfigurering af array-geometri ArrayConfiguration.m“-scriptet h˚ andterer to overordnede geometrier: 2D rektangulære og ” 2D cirkulære. I tabel 7.1 fremg˚ ar de indbyggede geometrier. 17 Simulering af delay-and-sum beamforming i MATLAB Syntaks i MATLAB 'rect' Geometri Rektangulær 'circ' Cirkulær 'rand' Tilfældig 'logc' Logaritmisk 'equi' Ækvidistant Beskrivelse Konstruerer et m × n rektangulært array med mulighed for styring af indbyrdes mikrofonafstande. Konstruerer et cirkulært array med N mikrofoner i C koncentriske cirkler med maks. radius rmax . Konstruerer et pseudotilfældigt array med N mikrofoner, der alle ligger inden for en brugerdefineret radius rmax . Konstruerer et cirkulært array med N mikrofoner i C koncentriske cirkler, der er separeret radialt langs en logaritmisk akse. Konstruerer et cirkulært array med mikrofoner, der er ens separeret igennem hele geometrien. Tabel 7.1: Oversigt over indbyggede geometrier i ArrayConfiguration.m“. ” Af tabel 7.2 fremg˚ ar de indbyggede indstillingsmuligheder. Syntaks i MATLAB r v sourceFreq freqVector Input Reelt tal > 0 Reelt tal 1 × l vektor, [f1 f2 ... fl ] fi : R : ff numRows numCols micSpacingRow Heltal ≥ 0 Heltal ≥ 0 Reelt tal ≥ 0 micSpacingCol Reelt tal ≥ 0 numShells Heltal ≥ 0 numMics radiusCircArray Heltal ≥ 1 Reelt tal ≥ 0 logDegree Reelt tal ≥ 0 equiDist Reelt tal ≥ 0 centerMic enable Binært, 1/0 Binært, 1/0 micPhaseError micAmplitudeError Binært, 1/0 Binært, 1/0 roomDimension 1 × 3 vektor, [l b h] Beskrivelse Lydkildens afstand fra array’ets centrum i meter. Lydkildens retning ift. array’ets x-akse. Rækkevektor indeholdende frekvenser til beampatterns. Frekvensvektor til 3D-beampattern, fi og ff angiver hhv. mindste og største frekvens, R angiver opløsning. Antal rækker i rektangulært array. Antal kolonner i rektangulært array. Indbyrdes rækkeafstand i rektangulært array i meter. Indbyrdes kolonneafstand i rektangulært array i meter. Antal koncentriske cirkler i cirkulære geometrier. Antal mikrofoner i cirkulære geometrier. Maksimal radius for cirkulære geometrier i meter. Graden af logaritmisk radial akse i cirkulære geometrier. Afstand til brug i ækvidistant, cirkulært array i meter. 1 = anvend centermikron, 0 = anvend ej. 1 = aktiver avancerede funktioner, 0 = aktiver ikke. 1 = aktiver mikrofonfasefejl, 0 = aktiver ikke. 1 = aktiver mikrofonamplitudefejl, 0 = aktiver ikke. Rækkevektor, der angiver rummets dimensioner (længde × bredde × højde). 18 Simulering af delay-and-sum beamforming i MATLAB offsetX Reelt tal offsetY Reelt tal avgAbsorp Reelt tal ≥ 0 noiseSources reflectionSources mode Binært, 1/0 Binært, 1/0 Tekststreng, simulate' 'measure' sensitivity w Binært, 1/0 Reelt tal '←- eller Forskydning af array’ets centrum ift. rummets x-akse. Forskydning af array’ets centrum ift. rummets y-akse. Gennemsnitlig absorptionskoefficient i efterklangsrum. 1 = aktiver støjkilder, 0 = aktiver ikke. 1 = aktiver refleksion, 0 = aktiver ikke. Udfører beamforming p˚ a enten simulerede eller m˚ alte mikrofonsignaler. 1 = aktiver simulering følsomhedskarakteristik, 0 = aktiver ikke. Angiver fastholdt styringsretning følsomhedskarakteristik i grader. af i Tabel 7.2: Oversigt over indstillingsmuligheder i ArrayConfiguration.m“ og Beamforming FFT.m“. ” ” Den rektangulære geometri kan indstilles til forskellige antal rækker og kolonner, som tilsammen udgør en m × n mikrofonmatrix med et antal mikrofoner, N , svarende til N = m × n. (7.1) Endvidere kan afstandene mellem enkelte mikrofoner i hhv. række- og kolonneniveau indstilles. S˚ aledes bliver det rektangulære arrays dimensioner, længde × bredde (l × b): l = (m − 1) · sm b = (n − 1) · sn , (7.2) hvor sm og sn er mikrofonseparering i hhv. række- og kolonneplan. Bemærk, at MATLABalgoritmen genererer et array, hvor alle mikrofoner er separeret ens. Dvs. at det rektangulære array ikke kan konfigureres med individuelle afstande. Dette er eventuelt et emne, der kan undersøges nærmere[8, s. 12]. Den cirkulære geometri er knyttet til fire slags konfigurationer: en symmetrisk, lagdelt opsætning, hvor mikrofoner placeres regelmæssigt i veldefinerede koncentriske cirkler; en tilfældig opsætning, hvor mikrofoner placeres pseudotilfældigt inden for en brugerdefineret cirkelradius, rmax ; en logaritmisk opsætning, hvor de koncentriske cirkler har logaritmiske radier; og en ækvidistant opsætning, hvor alle koncentriske cirkler har samme afstand som afstanden mellem individuelle mikrofoner. Antallet af mikrofoner, N , bestemmes manuelt efter ønske. Endvidere kan der angives, hvor mange koncentriske cirkler de N mikrofoner skal fordeles regelmæssigt i.5 De cirkulære arrays kan ogs˚ a konfigureres med en centerplaceret mikrofon ved at sætte centerMic = 1. Det ækvidistante array kan styres med parameteren equiDist, som angiver den ønskede separation mellem transducere i arrayet i meter. Se illustrationer er de forskellige geometrier p˚ a figur 7.1. 5 OBS: Divisionen mellem antallet af mikrofoner og antal cirkler skal give et heltal. 19 Simulering af delay-and-sum beamforming i MATLAB (a) Eksempel p˚ a 4×4 rektangulært array, sm = sn = 5 cm (b) Eksempel p˚ a cirkulært array med rmax = 14, 5 cm, N = 30, C = 3 (d) Eksempel p˚ a logaritmisk cirkulært array med rmax = 14, 5 cm, N = 40, C = 4 (c) Eksempel p˚ a tilfældigt array med rmax = 14, 5 cm, N = 24 (e) Eksempel p˚ a ækvidistant cirkulært array med r = 11, 7 cm, N = 35 Figur 7.1: Eksempler p˚ a array-geometrier simuleret i MATLAB. Mikrofonernes placering er angivet i x1 ~ y1 Si = z1 en 3 × N matrix p˚ a formen x2 ... xN −1 xN y2 ... yN −1 yN , z2 ... zN −1 zN (7.3) hvor hver kolonne angiver et tredimensionelt koordinat for den i’te mikrofon. I beamformingscriptet er det imidlertid nødvendigt at udtrykke alle individuelle mikrofon-vektorer som re~1 = (x1 , y1 , z1 ). S˚ lative i forhold til en reference mikrofon, f.eks. S aledes bliver den relative positionsmatrix ~ri : 0 (x2 − x1 ) ... (xN −1 − x1 ) (xN − x1 ) ~i − S ~1 = 0 (y2 − y1 ) ... (yN −1 − y1 ) (yN − y1 ) , (7.4) ~ri = S 0 (z2 − z1 ) ... (zN −1 − z1 ) (zN − z1 ) P˚ a figur 7.2 fremg˚ ar ~ri for tre forskellige arrays. (a) Eksempel p˚ a 4×4 rektangulært array (b) Eksempel p˚ a cirkulært array med rmax = 14, 5 cm (c) Eksempel p˚ a tilfældigt array med rmax = 14, 5 cm Figur 7.2: Afbildning af relative vektorer simuleret i MATLAB. 20 Simulering af delay-and-sum beamforming i MATLAB 7.3 Simulering af individuelt tidsforsinkede signaler Hver mikrofon i array’et modtager det akustiske signal fra lydkilden p˚ a et forskudt tidspunkt. Tidsforsinkelsen for den i’te mikrofon udregnes vha. q ti = |~ri − ~rs |/c = (rix − rsx )2 + (riy − rsy )2 + (rriz − rsz )2 )/c, (7.5) hvor ti er tidsforsinkelsen mellem lydkilden og den i’te mikrofon, ~rs er lydkildens position og c ≈ 340 m/s er lydens hastighed i atmosfærisk luft. N˚ ar der ikke tages hensyn til den akustiske dæmpning i luft, kan de signaler, som mikrofonerne enkeltvist modtager, simuleres med kopier af det oprindelige signal fra lydkilden med en respektiv tidsforsinkelse, ti , se f.eks. figur 7.3. Figur 7.3: Eksempel p˚ a tidsforsinkelse mellem nærmeste og fjerneste mikrofon i forhold til lydkilden. f = 4000 Hz. I dette eksempel modtager den nærmeste mikrofon signalet ca. 5,5 ms efter lydkilden udsendte det, mens den fjerneste mikrofon er tidsforsinket med yderligere 1 ms. Det er netop denne fysiske egenskab ved de optagede signaler, som muliggør delay-and-sum beamforming. Simuleringen kan ogs˚ a udvides med tilføjelsen af støjkilder, som ønskes fjernet i den rumlige filtrering (beamforming). Der fokuseres p˚ a frekvensomr˚ adet 1000 Hz - 4000 Hz (menneskelig taleforst˚ aelse), se afsnit 5. Dette svarer til akustiske bølgelængder i intervallet λ ∈ [8.5 cm ; 34 cm], og det m˚ a forventes, at array’ets ydeevne kan relateres til disse størrelser. Læs mere om disse overvejelser i afsnit 4.2. 7.4 Beregning af og multiplikation med komplekse faser I delay-and-sum algoritmen skal alle mikrofonsignaler tildeles et unikt delay (tidsdomæne) eller en unik fase (frekvensdomæne), der afhænger af styringsretningen og mikrofonernes relative positioner (~ri ), og herefter lægges sammen. po = N X pi · ϕi = i=1 N X i=1 21 pi · ejω∆i , (7.6) Simulering af delay-and-sum beamforming i MATLAB hvor po er beamforming-outputtet, pi er det i’te komplekse mikrofonsignal, ω er vinkelfrekvens, ϕi er den i’te fasedrejning, og ∆i er den i’te tidsforsinkelse, der skal tillægges det i’te signal. Tidsforsinkelsen udregnes vha.[10] ~ri · ~u ∆i = , (7.7) c hvor ~u er en retningsvektor (|~u| = 1), der angiver array’ets styringsretning. I kode 1 fra MATLAB-scriptet Beamforming FFT.m“ beregnes de komplekse faser, og ” i kode 2 multipliceres faserne med de Fouriertransformerede mikrofonsignaler, dataFFT. For hver retning, der undersøges (fra 0◦ til 360◦ i valgfri opløsning, f.eks. angleStep = 1◦ ), summeres alle de kvadrerede beamforming-output. Kode 1: Beregning af komplekse faser. 1 2 % Phase d i f f e r e n c e f o r each mic . a t d i f f e r e n t a n g l e s phase = exp ( 1 j * beamDelay * sourceFreq ( mm ) * 2 * p i ) ; Kode 2: Mikrofonsignalerne dataFFT multipliceres med de tilhørende, komplekse faser. Resultatet konverteres til effekt. 1 2 3 4 f o r ii = 1 : a n g l e output ( ii , : ) = phase ( ii , : ) * dataFFT ; power ( ii ) = sum ( output ( ii , : ) . ˆ 2 ) ; power end % o ut pu t s i g n a l c o n v e r t e d t o ←- beamDelay er ∆i , phase er ϕi , og sourceFreq(mm) er frekvensen i Hz. N˚ ar disse udregninger er foretaget for alle mikrofoner i array’et og alle vinkeltrin i xyplanen, kan der afbildes et polært plot, der viser array’ets beampattern som funktion af vinkel, se f.eks. figur 7.4. Fremadrettet vil de viste beampatterns være normerede, og beamformingoutputtet er kvadreret for at undg˚ a negative værdier (modulus kan evt. ogs˚ a anvendes). Figur 7.4: Eksempel p˚ a polær plot af beampattern for frekvenser 1000 Hz, 2500 Hz og 4000 Hz. Lydkilden er placeret i ~rs = (x, y, z) = (−2, 2, 1) m, dvs. 135◦ . Eksemplet tager udgangspunkt i et 10 × 10 rektangulært array, sm = sn = 5 cm. Lydkildens position er valgt til ~rs = (−2, 2, 1) og svarer til en vinkel i xy-planen p˚ a 135◦ , hvilket er i overensstemmelse med en aflæsning af array’ets beampattern. Tilsvarende, n˚ ar der genereres ovenst˚ aende karakteristikker for alle frekvenser i intervallet f ∈ [1000; 4000] Hz, f˚ as en 3D afbildning, der har array’ets normerede beampattern i dB som funktion af xy-vinkel samt frekvens, se figur 7.5. 22 Simulering af delay-and-sum beamforming i MATLAB Figur 7.5: Eksempel p˚ a 3D afbildning af beampattern som funktion af xy-vinkel og frekvens (fra 1000 Hz til 4000 Hz). Eksemplet tager udgangspunkt i et 10 × 10 rektangulært array, sm = sn = 5 cm. Lydkilde placeret i 135◦ . 3D-afbildningen har samme information som de enkelte polære plot, men har fordelen, at den viser array’ets beampattern mere kontinuert i frekvens. For en mere kvalitativ udgave af figur 7.5, kan 3D-afbildningen anskues ovenfra, som vist p˚ a figur 7.6. Figur 7.6: Eksempel p˚ a 2D repræsentation af 3D afbildning af beampattern som funktion af xy-vinkel og frekvens (fra 1000 Hz til 4000 Hz). Eksemplet tager udgangspunkt i et 10 × 10 rektangulært array, sm = sn = 5 cm. Lydkilde placeret i 135◦ . 23 Simulering af delay-and-sum beamforming i MATLAB Vha. denne repræsentation er det overskueligt at vurdere, hvorfra lyden udbredes. I dette eksempel er det ved ca. 135◦ . S˚ akaldte sidelobes kan identificeres som de øvrige lokale maksima i array’ets beampattern (rød = høj styrke, bl˚ a = lav styrke). 7.5 Simulering af hhv. beampattern og følsomhedskarakteristik I forbindelse med array-teknologi skelnes der ofte mellem et systems følsomhedskarakteristik (sensitivity) og dets beampattern. I denne rapport henviser et systems beampattern til det akustiske respons, som f˚ as ved at lade systemet sekventielt evaluere alle vinkler i xy-planen (array’ets egen plan) og afbilde den resulterende polære akustiske effektfordeling. Dette betyder s˚ aledes, at hvis to lydkilder, placeret to forskellige steder i rummet, udsender lyd med samme effekt, vil det resulterende beampattern indikere begge lydkilder ved deres respektive placeringer. Ved et arrays følsomhedskarakteristik (eller bare følsomhed“) forst˚ as det respons, som ” f˚ as ved at lade systemet være følsomt i ´en valgt retning i xy-planen og optage lyd fra alle retninger. Det resulterende polære plot vil i s˚ adanne tilfælde vise følsomheden af array’et ved en given retningsstyring. Hvis en lydkilde udsender lyd fra den valgte retning, vil dette være synligt i afbildningen. Hvis lydkilden derimod udsender lyd fra en anden retning end den valgte, vil array’et undertrykke lyden, og det polære plot viser ideelt intet respons. 7.6 Avanceret funktionalitet Simuleringsalgoritmen kan konfigureres i yderligere to henseender: med ideelle vilk˚ ar eller med mere realistiske vilk˚ ar. Den ideelle situation er allerede gennemg˚ aet i de tidligere afsnit. I undersøgelsen af mikrofon-array’ets beampattern kan det ligeledes være interessant at identificere indflydelsen af realistiske effekter s˚ asom mikrofonernes fasefejl, refleksioner fra gulv, vægge og loft i anvendelsesmiljøet og akustisk dæmpning i luften. Lydkildens position i forhold til array’et kan ogs˚ a have en betydning s˚ avel som støjkilder. De avancerede parametre aktiveres i simuleringen ved at sætte enable = 1. 7.6.1 Simulering af mikrofoners fase- og amplitudefejl Under ideelle forhold er alle mikrofoner i array’et identiske og uden hverken fase- eller amplitudefejl. Man kan argumentere for, at amplitudefejl ikke er nogen betydelig hindring i delayand-sum beamforming. Amplitudefejl kan muligvis være en større bekymring i havakustik og lignende, hvor den akustiske dæmpning er langt større end i atmosfærisk luft. Mikrofonernes fasefejl er til gengæld et centralt emne hvad ang˚ ar dette projekts omfang. Med p˚ amindelsen om, at array’et skal anvendes som konferencesystem, er der ˚ abenlyse krav til dimensionerne af systemet. Denne pladsbegrænsning har direkte indflydelse p˚ a b˚ ade antallet af mikrofoner, der kan placeres i array’et, samt deres indbyrdes afstand. Afstanden mellem de p˚ agældende mikrofoner er proportional med den tid, lyden bruger p˚ a at propagere mellem dem. Dette er simpelt udtrykt ved ta,b = da,b /c, (7.8) hvor ta,b er forsinkelsen mellem mikrofon a og b og da,b er afstanden mellem mikrofon a og b. Eksempelvis vil to mikrofoner med en indbyrdes afstand p˚ a 5 cm være tidsforskudt med t1,2 = 0, 05 m/(340 m/s) ≈ 0, 15 ms. Hvis man antager at en mikrofon har en fasefejl p˚ a 20◦ = 0, 35 rad ved f = 4000 Hz, f˚ as en fejlforbunden tidsforsinkelse te = 0, 35 rad/(2 · π · 4000 Hz) ≈ 0, 015 ms. Dvs. te ≈ 1/10 · t1,2 , 24 (7.9) Simulering af delay-and-sum beamforming i MATLAB Fasefejlen kan alts˚ a bidrage betydeligt til den allerede eksisterende faseforskydning, der følger af mikrofonernes separation. Dette bidrag giver naturligvis anledning til fejl i systemets evne til at retningsbestemme lydkilden. For at systemets respons skal p˚ avirkes negativt af fasefejl, kræver det, at alle mikrofoner er uafhængige, hvad ang˚ ar deres individuelle fasefejl. Hvis alle mikrofoner har samme fejl, vil beamforming-outputtet være uændret. P˚ a figur 7.7 ses den polære karakteristik for 10×10 mikrofoner, der hver har f˚ aet tildelt en tilfældig fasefejl mellem 0 og 2π rad. Figur 7.7: Eksempel p˚ a 100 mikrofoner hver med en fasefejl, der er uniformt fordelt med 0 og 2π rad. Lydkilden er placeret i retning 135◦ . I praksis er det usandsynligt, at en mikrofon kan have en fasefejl i størrelsesordenen 2π, men ikke desto mindre understreger ovenst˚ aende eksempel alvorligheden af fasekorrektheden. I forbindelse med laboratorieundersøgelser kan det derfor være nødvendigt at kalibrere eller, i det mindste, størrelsesbestemme de p˚ agældende fasefejl. I praksis er det mere sandsynligt, at de anvendte mikrofoner har fasefejl, der er normalfordelt omkring 0◦ med en standardafvigelse p˚ a 3-5◦ .[3] I stedet for at anse fasefejl som en iboende egenskab ved mikrofonerne, kan de ogs˚ a være affødt af en usikkerhed vedrørende deres relative placering i array’et. I det forrige eksempel antages det, at to mikrofoner er separeret med 5 cm. Hvis denne afstand i virkeligheden er stokastisk omkring 5 cm med en usikkerhed p˚ a op til 10% (svarende til 0,5 cm), kan dette give anledning til en fejlbehæftet tidsforsinkelse mellem mikrofonerne, eller dvs. en fejlbehæftet fase. Denne udregnes vha.: ϕe = 2 · π · dx/λ, (7.10) hvor ϕe er fasefejlen for˚ arsaget af positionsusikkerhed, dx er usikkerheden i separation, og λ er bølgelængden for en given frekvens. Af figur 7.8 fremg˚ ar den resulterende fasedrejning (fasefejl) som følge af separationsusikkerheder mellem 0,1 cm og 0,5 cm. 25 Simulering af delay-and-sum beamforming i MATLAB Figur 7.8: Resulterende fasefejl for forskellige positionsusikkerheder, dx. Det ses at en positionsusikkerhed p˚ a dx = 0, 5 cm giver anledning til en fasedrejning p˚ a lidt over 20◦ ved 4000 Hz, hvilket verificerer det tidligere eksempel (ligning 7.9). Ved 1000 Hz er fasedrejningen i størrelsesordnen 5◦ . Disse tal har direkte anvendelighed i forbindelse med udviklingen af et mikrofon-array. Resultatet p˚ a figur 7.8 viser, at array’et er mere følsomt over for positionsusikkerheder ved de høje frekvenser end ved de lave, pga. den lineære sammenhæng mellem fasedrejningen og frekvens. Det betyder ogs˚ a, at det m˚ a forventes, at sm˚ a ændringer i array’ets dimensioner kan have stor betydning for det højfrekvente beampattern, mens det lavfrekvente er relativt urørt af sm˚ a ændringer. Simuleringer s˚ avel som den praktiske udførelse af array’et kan drage nytte af denne konklusion. 7.6.2 Rumakustiske fænomener, inkl. refleksioner og støj Mikrofon-array’ets ydeevne skal b˚ ade undersøges i et lyddødt rum og i virkelige omgivelser. Sidstnævnte undersøgelse skal især hjælpe med at afklare, hvor robust systemet er overfor b˚ ade korreleret og ikke-korreleret støj. Korreleret støj vil typisk være refleksioner af den egentlige lydkilde pga. rummets beskaffenhed (f.eks. gulv, vægge, loft, møbler), mens ikke-korreleret støj indebærer trakfikstøj, uønsket mennesketale, elektronikstøj (f.eks. blæsere, diskdrev) og lignende. I MATLAB-simuleringen er der mulighed for at definere et rektangulært rums dimensioner i de avancerede konfigurationsparametre. Programmet vil som standard placere array’ets centrum i midten af rummet i position (0, 0, 0), men der er mulighed for at forskyde placeringen i hhv. x- og y-retning. Udover at visualisere rummets størrelse i forhold til array’et og lydkilden, placerer programmet ogs˚ a punkter uden for rummet, der repræsenterer de akustiske billeder, som er en konsekvens af refleksioner i rummet. Se figur 7.9. 26 Simulering af delay-and-sum beamforming i MATLAB Figur 7.9: Eksempel p˚ a simulering af rektangulært rum med dimensionerne (l × b × h) = (6 × 4 × 3) m og lydkildeposition = (−2, 0, 1) m. Effekten af disse refleksioner simuleres ved at tidsforsinke den egentlige lydkildes signal for hver refleksionskilde med tiden, tri : tri = 2 · dri /c, (7.11) hvor dri er afstanden mellem lydkilden og den i’te refleksionskilde. Algoritmen simulerer kun 1. ordens refleksioner, dvs. den tillader kun refleksion med en overflade ´en gang, inden signalet dæmpes helt. Desuden skal hvert signal multipliceres med en absorptionskoefficient pga. akustisk effekttab ved refleksionerne. Absorptionskoefficienten kan konfigureres manuelt p˚ a baggrund af eventuelle m˚ alinger. MATLAB-algoritmen har mulighed for at anvende støj og refleksioner enkeltvist s˚ avel som samtidigt. Disse indstillinger styres ved at sætte hhv. noiseSources og reflectionSources til 1 eller 0. 7.6.3 Akustisk dæmpning i luft mellem lydkilde og array Ifølge Stokes akustiske dæmpningslov vil lyd, der propagerer i en Newtonsk væske (f.eks. luft eller vand), opleve en eksponentiel dæmpning pga. væskens viskositet. p0 (d) = p0 (0) · e−τ ·d , (7.12) hvor p0 (d) er lydfeltets amplitude efter at lyden har propageret en afstand d, p0 (0) er lydfeltets amplitude i position d = 0, og τ er dæmpningsraten givet ved τ= 2ηω 2 , 3ρc3 27 (7.13) Simulering af delay-and-sum beamforming i MATLAB hvor η er væskens dynamiske viskositet (≈ 1, 983 · 10−5 kg/m · s for luft), ω er vinkelfrekvens og ρ er væskens densitet (≈ 1, 225 kg/m3 for luft). τ har s˚ aledes SI-enheden m−1 . Denne funktionalitet bliver automatisk aktiv, n˚ ar enable = 1 i ArrayConfiguration.m“. ” 7.7 Simuleringsresultater I de følgende afsnit dokumenteres resultaterne for simuleringen af delay-and-sum beamforming med forskellige konfigurationer. Det er ønskværdigt at opn˚ a en indsigt i, hvorledes et mikrofon-arrays form og dimensioner p˚ avirker ydeevnen af delay-and-sum beamforming-metoden. De ydre s˚ avel som indre dimen6 sioner forventes at være koblede til gengivelsen af de akustiske bølgelængder, der er relevante for den givne applikation. Simuleringsresultaterne kvalitetsbedømmes vha. følgende m˚ albare størrelser: 3 dB mainlobe-bredde i grader. Maksimal sidelobe-niveau (normeret ift. mainlobe-niveau). Mainlobe-bredden ønskes s˚ a smal som mulig, s˚ afremt lokaliseringen er nøjagtig, hvilket hører under begrebet lokaliseringsnøjagtighed. Bredden m˚ ales mellem de to vinkler, som oplever 3 dB dæmpning i mainlobet. Som eksempel er 3 dB mainlobe-bredden for figur 7.10 ca. 37◦ . Figur 7.10: Eksempel p˚ a 3 dB mainlobe-bredde m˚ alt i grader samt sidelobe-niveau. I dette tilfælde er der et 180◦ sidelobe med et niveau (dB) p˚ a ca. 10 · log10 (0.125) ≈ −9 dB ift. mainlobe-niveau. Hvad ang˚ ar lydfeltets indfaldsvinkel skal følgende betragtninger nævnes. Konferencesystemet kan f.eks. være placeret p˚ a midten af et mødebord i højden ≈ 1,0 - 1,2 m. Brugeren af systemet, derimod, kan enten være siddende ved bordet eller st˚ aende nogle meter væk fra bordet (f.eks. i forbindelse med en st˚ aende præsentation). Baseret p˚ a gennemsnitlige højder for hhv. mænd og kvinder (samt gennemsnitlig længde af overkroppen)[1], vil lydkilden (talerens mund) være placeret ca. 50 cm over array’et i siddende tilfælde. 6 Ydre betegner array’ets overordnede længde, bredde og højde. Indre betegner interne afstande i systemet, f.eks. afstanden mellem to mikrofoner. 28 Simulering af delay-and-sum beamforming i MATLAB Figur 7.11: Illustration af situation, hvor lydkilde (taler) er siddende foran mikrofonsystemet. I installationen, afbildet p˚ a figur 7.11, antages det, at mikrofon-array’et er placeret i lydkildens akustiske nærfelt. Da de analytiske beregninger tager udgangspunkt i, at array’et befinder sig i lydkildens fjernfelt, kan situationer som den afbildede muligvis være i uoverensstemmelse med de analytiske resultater. Generelt vil der i de følgende afsnit være fokus p˚ a, i hvilken grad en bestemt geometri kan optimeres mht. antallet af mikrofoner. Med et økonomisk mind-set, er det s˚ aledes af central betydning at udvælge den mest effektive systemtype. Effektiv betyder i denne kontekst systemets evne til at udføre en tilstrækkelig nøjagtig rumlig filtrering med et minimum forbrug af transducere. 7.7.1 Array-geometriens indflydelse p˚ a array’ets beampattern I undersøgelsen af array-geometriens indflydelse p˚ a array’ets beampattern er der primært opmærksomhed p˚ a de parametre, der styrer hhv. lav-, mellem- og højfrekvent beampattern. I denne kontekst er de repræsenteret ved hhv. 1000 Hz, 2500 Hz og 4000 Hz. Rektangulært array Lydkilden er nu placeret som illustreret p˚ a figur 7.11 eller 7.12 med array’ets centrum placeret i O = (0; 0; 1) m og lydkilden placeret i Ss = (0; 0, 6; 1, 5) m, og mikrofon-array’et vil antage følgende dimensioner (m × n): 1 × 1 array. 2 × 1 array og 2 × 2 array. 4 × 2 array, 4 × 4 array og 4 × 6 array. 10 × 10 array. 29 Simulering af delay-and-sum beamforming i MATLAB Figur 7.12: Installation set oppefra. Ss er lydkildens position mens O er array’ets midtpunkt Der afprøves ogs˚ a forskellige mikrofon-til-mikrofonsepareringer til hver array-dimension. Situationen med m × n = 1 × 1 = 1 mikrofon kan anses som værende et specialtilfælde af et array, hvor antallet af rækker og kolonner er reduceret til ´en i hver retning. Dette giver en triviel array-størrelse p˚ a 0 × 0 m. Konsekvensen af kun at anvende ´en mikrofon i delayand-sum beamforming-algoritmen er, at resultatet er identisk med responset fra en enkelt mikrofon uden nogen form for beamforming DSP, se figur 7.13. Figur 7.13: Beampattern for 1 × 1 array for frekvenserne 1000, 2500 og 4000 Hz. Beampattern ligger langs med periferien af det polære plot. Det ses her, at systemet ikke kan retningsbestemme lydkilden i frekvensomr˚ adet 1000 Hz - 4000 Hz. Bemærk, at der i simuleringen opereres med ideelle, omnidirektionelle punktmodtagere (jf. afsnit 4.1.2). Allerede n˚ ar antallet af mikrofoner øges fra ´en til to i f.eks. et m × n = 2 × 1 array er array’et ikke længere omnidirektionelt i xy-planen (jf. afsnit 6.1), se figur 7.14. I dette tilfælde er mikrofonerne separeret med 5 cm. Figur 7.14: Beampattern for 2 × 1 array for frekvenserne 1000, 2500 og 4000 Hz. Mikrofonafstand sm = 5 cm. Lydkilden er placeret i 90◦ . 30 Simulering af delay-and-sum beamforming i MATLAB Vær opmærksom p˚ a, at lydkilden er placeret i retningen 90◦ . For de lave frekvenser er array’ets mainlobe-bredde stor, hvilket kan skyldes den relative lille samlede array-størrelse p˚ a l = (m − 1) · sm = (2 − 1) · 5 cm = 5 cm, som er langt under 1000 Hz-bølgelængden p˚ a ca. 34 cm. Det midterste frekvensomr˚ ade omkring 2500 Hz har en bedre lokaliseringsnøjagtighed med en mainlobe-bredde p˚ a ca. 140◦ , og et sidelobe forskudt nøjagtig 180◦ , der er ca. en faktor 10 lavere end mainlobe-niveauet. Bølgelængden svarende til 2500 Hz-lyd er ca. 13,6 cm. Dvs. at λ2500 Hz /2 = 6, 8 cm, hvilket er en anelse større end mikrofonsepareringen p˚ a 5 cm. P˚ a figur 7.15 er mikrofonafstanden øget fra 5 cm til 10 cm. Figur 7.15: Beampattern for 2 × 1 array for frekvenserne 1000, 2500 og 4000 Hz. Mikrofonafstand sm = 10 cm. Lydkilden er placeret i 90◦ . Array’ets beampattern for 1000 Hz er tydeligt forbedret i forhold til forrige simulering. En mikrofonseparering sm = 10 cm ligger nærmere p˚ a λ1000Hz /2 = 17 cm end tidligere, hvilket giver anledning til en hypotese om, at lydens halve bølgelængde er koblet til array’ets dimensioner. I dette tilfælde har beampattern for b˚ ade 2500 Hz og 4000 Hz større og flere sidelobes ift. det forrige beampattern. I et ækvidistant mikrofon-array med kun ´en række af mikrofoner, er det umuligt at opn˚ a god lokaliseringsnøjagtighed for alle frekvenser med et lille antal mikrofoner7 . Ved at g˚ a fra enkeltrække-arrays til multirække-arrays, kan der introduceres flere dimensioner i systemet. F.eks. et m × n = 2 × 2 array med rækkeseparering sm = 10 cm og kolonneseparering sn = 5 cm. Se figur 7.16. Figur 7.16: Beampattern for 2 × 2 array for frekvenserne 1000, 2500 og 4000 Hz, Mikrofonafstande sm = 10 cm og sn = 5 cm. Lydkilden er placeret i 90◦ . Array’et begynder nu at opn˚ a en bedre lokaliseringsnøjagtighed i et bredere frekvensomr˚ ade, men er stadig relativt fejlbehæftet med store sidelobes ved høje frekvenser. Ved at indføre flere rækker og kolonner opst˚ ar der generelt større indbyrdes faseforskydninger mellem mikrofoner, hvilket gør lokaliseringen mere sikker. P˚ a figur 7.17 fremg˚ ar beamforming-resultatet for tre forskellige rektangulære arrays med dimensioner p˚ a hhv. 4 × 2, 4 × 4 og 4 × 6 mikrofoner. Bemærk den gradvise forbedring i mainlobe-bredde. I alle arrays er sm = sn = 5 cm. 7 Det er muligt at opn˚ a stor lokaliseringsnøjagtighed, hvis der benyttes mange mikrofoner 31 Simulering af delay-and-sum beamforming i MATLAB (a) 4 × 2 rektangulært array (b) 4 × 4 rektangulært array (c) 4 × 6 rektangulært array Figur 7.17: Beampatterns for forskellige array-konfigurationer. Mikrofonafstande sm = sn = 5 cm. Lydkilden er placeret i 90◦ . Det ses ogs˚ a fra simuleringen, og generelt for alle simuleringer, at mainlobe-bredden falder, n˚ ar frekvensen stiger. Fænomenet skal forklares med en sammenligning af lydsignalets bølgelængde og indbyrdes mikrofonafstande. Det skal nævnes, at n˚ ar antallet af mikrofoner stiger i de rektangulære arrays, stiger den totale array-størrelse ogs˚ a. Derfor er det svært at konkludere, hvorvidt det er antallet af mikrofoner eller array-størrelsen, der primært bidrager til array’ets beampattern. Denne sammenhæng er undersøgt nærmere ifm. de cirkulære geometrier. Tages der udgangspunkt i det array, hvis beampattern er afbildet p˚ a figur 7.17c, kan array-dimensionerne optimeres for at f˚ a drejet det højfrekvente mainlobe 180◦ . Vælges f.eks. sm = 6 cm og sn = 4 cm, f˚ as resultatet p˚ a figur 7.18. 32 Simulering af delay-and-sum beamforming i MATLAB (a) Beampattern (b) 3D afbildning af beampattern som funktion af retning (◦ ) og frekvens (Hz). Figur 7.18: Optimeret 4 × 6 rektangulært array med mikrofonafstande sm = 6 cm og sn = 4 cm. Lydkilden er placeret i 90◦ . Resultatet er et array, der primært har sit mainlobe i 90◦ -retningen, men ved frekvenser mellem 2,9 kHz og 3,6 kHz har frekvensresponset et stort 180◦ sidelobe. Som et sidste eksempel kan et array med 10 × 10 mikrofoner studeres. Kolonne- og rækkesepareringerne har tidligere vist sig at levere beampatterns med gode lokaliseringsnøjagtigheder med indbyrdes mikrofonafstande omkring 5 cm, s˚ a dette tages der udgangspunkt i igen, se figur 7.19. H´er observeres der straks, at trods et drastisk øget antal mikrofoner er det højfrekvente beampattern af ringere kvalitet end tidligere. Dette kan have forbindelse til lydkildens position i forhold til array’et. Læs mere om dette i afsnit 7.7.5. 33 Simulering af delay-and-sum beamforming i MATLAB (a) Visualisering af array-geometri inkl. lydkilde (b) Beampattern. (c) 3D afbildning af beampattern som funktion af retning (◦ ) og frekvens (Hz). Figur 7.19: 10 × 10 rektangulært array med mikrofonafstande sm = 5 cm og sn = 5 cm. Lydkilden er placeret i 90◦ . Cirkulært array Det cirkulære array er i praksis nemmere at konstruere i laboratoriet vha. et drejebord og relativt f˚ a mikrofoner. Denne geometri er s˚ aledes særligt interessant at simulere pga. dens realis´erbarhed. I det følgende vil konsekvensen af at benytte forskellige 34 Simulering af delay-and-sum beamforming i MATLAB antal mikrofoner i det samlede system, størrelsen af systemet, antal koncentriske cirkler, m.m. blive undersøgt. P˚ a figur 7.20c ses beamforming-outputtet for et cirkulært array med fire og otte mikrofoner fordelt p˚ a hhv. en cirkel og to cirkler med radius r = 10 cm. (a) Visulalisering af 4 mikrofoner i 1 cirkel. (b) Visulalisering af 8 mikrofoner i 2 cirkler. (c) Beampattern for 4 mikrofoner i 1 cirkel. Lydkilden er placeret i 90◦ (d) Beampattern for 8 mikrofoner i 2 cirkler. Lydkilden er placeret i 90◦ Figur 7.20: Cirkulært array med 4 og 8 mikrofoner og radius r = 10 cm. I det lavfrekvente omr˚ ade er array’ets lokaliseringsevne bedre end i det højfrekvente omr˚ ade. Generelt vil det cirkulære array, ligesom det rektangulære, opn˚ a bedre lokaliseringsnøjagtighed, n˚ ar antallet af mikrofoner stiger, medmindre antallet bliver s˚ a stort i en given array-størrelse, at visse mikrofoner bliver presset for tæt sammen. P˚ a figur 7.20d er antallet af mikrofoner øget, men lokaliseringsnøjagtigheden er mindre. En mulig ˚ arsag er, at geometrien best˚ ar af to koncentriske cirkler i stedet for ´en. Til gengæld er sidelobe-undertrykkelsen større end figur 7.20c. I s˚ adanne tilfælde vil det høje frekvensomr˚ ade i de fleste tilfælde forringes. For at sammenligne det cirkulære og rektangulære array, anvendes nu 24 mikrofoner8 fordelt i hhv. 1, 2 og 3 koncentriske cirkler med største radius r = 12 cm9 , se figur 7.21. 8 9 Svarer til et 6 × 4-array Svarer til mikrofonseparering 4 × 6 cm 35 Simulering af delay-and-sum beamforming i MATLAB (a) Beampattern for 24 mikrofoner i 1 cirkel. (b) Beampattern for 24 mikrofoner i 2 cirkler. (c) Beampattern for 24 mikrofoner i 3 cirkler. Figur 7.21: Beampatterns for 24 mikrofoner med forskellige antal cirkler. Array-radius er 12 cm. Lydkilden er placeret i 90◦ . Figur 7.21 er endnu et eksemplet p˚ a, at antallet af mikrofoner har indflydelse p˚ a to arrayparametre p˚ a samme tid. Array’ets s˚ akaldte AOAE (Angle Of Arrival Estimation) stiger med antallet af mikrofoner, mens lokaliseringsnøjagtigheden falder. AOAE angiver array’ets evne til korrekt at retningsbestemme lydkilden. Et andet problem, som ikke er tydeligt p˚ a de polære afbildninger, er illustreret p˚ a figur 7.22. 36 Simulering af delay-and-sum beamforming i MATLAB Figur 7.22: 3D afbildning af beampattern (dB) for cirkulært array med 24 mikrofoner placeret i 3 cirkler med størst radius r = 12 cm. Lydkilden er placeret i 90◦ . H´er skal man være opmærksom p˚ a, at den overordnede styrke i mainlobet falder som funktion af frekvens i dette specifikke tilfælde. Dette fænomen er ikke blevet undersøgt nærmere, men constant beamformers kan evt. afhjælpe dette problem. Helt nøjagtigt er følsomheden reduceret med 10 dB for 4000 Hz i 90◦ -retningen i forhold til 1000 Hz i samme retning. Det rektangulære array udviser samme adfærd, men ikke lige s˚ a udtalt. Centerplaceret mikrofon Et interessant alternativ til geometrien best˚ aende af 24 mikrofoner i 3 cirkler er visualiseret p˚ a figur 7.23. Tilsyneladende kan næsten samme beampattern opn˚ as med tilnærmelsesvist halvt s˚ a mange mikrofoner i det cirkulære array, hvis den inderste ring erstattes med en enkelt mikrofon placeret i det absolutte centrum. Dette kan muligvis forklares ved, at mikrofonerne i den inderste ring er s˚ a tæt placerede, at de effektivt udfører samme funktion i array’et. S˚ aledes kan man spare 24 − 13 = 11 mikrofoner i dette specifikke tilfælde, hvilket er næsten halvdelen. 37 Simulering af delay-and-sum beamforming i MATLAB (a) Cirkulært array med 12 mikrofoner placeret i 2 cirkler samt 1 centerplaceret mikrofon. Maks. radius rmax = 12 cm. (b) Beampattern for 12 mikrofoner i 2 cirkler samt 1 centerplaceret mikrofon, rmax = 12 cm. Lydkilden er placeret i 90◦ . Figur 7.23: Effekt af at placere ´en mikrofon i midten af array’et som erstatning for den inderste ring. Logaritmisk array Helt generelt for alle arrays omtalt i dette kapitel, er mikrofonafstande mindre end ca. 5 cm uønskede pga. de negative effekter ved høje frekvenser. Derfor kan man med udgangspunkt i den ordinære cirkulære geometri ekspandere“ cirklen ved at benytte en ” logaritmisk radial afstand. S˚ aledes bliver de koncentriske cirkler ikke ligeligt fordelt mellem r = rmax og r = 0 cm, men i stedet presset udad. I MATLAB-algoritmen kan graden af forskydning styres med variablen logDegree i ArrayConfiguration.m“. P˚ a figur 7.24 sammenlignes den ” ordinære cirkulære geometri (med centerplaceret mikrofon) med det logaritmiske array med logDegree = 2 for 30 mikrofoner10 . 10 31 med den centerplacerede 38 Simulering af delay-and-sum beamforming i MATLAB (a) Eksempel p˚ a ordinær cirkulær geometri med 12(+1) mikrofoner. (b) Eksempel p˚ a logaritmisk geometri med 12(+1) mikrofoner, logDegree=2. Figur 7.24: Sammenligningen mellem ordinært og logaritmisk cirkulær geometri med rmax = 12 cm. Jo større logDegree gøres, jo mere presses mikrofonerne ud mod rmax . Man skal naturligvis være opmærksom p˚ a, om mikrofonerne presses for tæt sammen. Overordnet har det logaritmiske array meget lille afvigelse fra det ordinært cirkulære, især for array-dimensionerne i den størrelsesorden, der er behandlet i dette projekt. Tilfældigt array Det cirkulært tilfældige array medbringer mange af de samme akustiske egenskaber som det ordinært cirkulære array. Det ordinært cirkulære array har dog den ulempe, at alle mikrofoner er regelmæssigt placeret, hvilke giver gode beampatterns ved enkelte frekvenser, alt efter designerens ønsker. Ideelt set vil et cirkulært tilfældigt array have et større spektrum af indbyrdes mikrofonafstande, hvilket giver systemet en større b˚ andbredde, dvs. et større frekvensomr˚ ade, hvor systemet er i stand til at lokalisere lydkilden. Et tilfældigt array har alts˚ a potentialet for at opn˚ a et beampattern med større b˚ andbredde end det ordinært cirkulære array, men det er ikke uden ulemper. For det første skal der aktivt tages hensyn til at det tilfældige array kan placere mikrofoner meget tæt, og endda, oven i hinanden. Dette m˚ a forhindres b˚ ade af fysisk logiske grunde samt af grunde, der relaterer til det højfrekvente beampattern. For det andet er der ingen kontrol over udvælgelsen af mikrofonplaceringer (definitionen p˚ a det tilfældige array), hvilket i praksis betyder, at der m˚ a afprøves og undersøges mange forskellige arrays ´en ad gangen for at beslutte sig for et endeligt design, der opfylder de ønskede specifikationer. I mange tilfælde vil det tilfældige array udvise ringere lokaliseringsnøjagtighed end et tilsvarende ordinært cirkulært, pga. en uheldig placering af mikrofoner. Systemets mainlobe-bredde er up˚ avirket af, om den valgte geometri er ordinært cirkulær eller tilfældig, s˚ a længe antallet af mikrofoner er ens og cirklerne har samme radius rmax . Sidelobe-niveauer afhænger til gengæld af den specifikke geometri. Sagt med andre ord har det tilfældige array potentialet for at opn˚ a et bredspektret beampattern, men designet er forbundet med stor usikkerhed og lang tids undersøgelse. I forhold til dette projekts omfang er det uhensigtsmæssig at forsøge at undersøge et randomiseret array i praksis dels pga. de allerede nævnte ulemper, dels fordi det vil kræve et stort indgreb i m˚ alekonstruktionen (et drejebord med plads til mikrofoner, se afsnit 8.1. Som en eventuel approksimation p˚ a et tilfældigt array kan der afslutningsvis i forsøgsrækken udføres en m˚ aling med et mikrofon-array, der bruger et tilfældigt“ (udvalgt af forsøgsdeltagere) array ” med de allerede eksisterende mikrofonplaceringer. Ækvidistant, cirkulært array Det ækvidistante array giver, i modsætning til det ordinært cirkulære, mulighed for at fastsætte en konstant afstand mellem alle mikrofoner i et cirkulært 39 Simulering af delay-and-sum beamforming i MATLAB array. Ulempen ved automatiseringen i programmet er, at der er meget lidt kontrol over hvor mange mikrofoner, der medtages i arrayet og hvor stor radius, array’et f˚ ar. Derfor kan array’et ikke umiddelbart sammenlignes med tidligere cirkulære eller rektangulære arrays. Laves simuleringen med f.eks. 35 mikrofoner i 3 cirkler med en maksimal radius p˚ a 15 cm, f˚ as en indbyrdes, fast mikrofonafstand p˚ a 5 cm, hvilket giver et beampattern meget lig de tidligere viste for ordinært cirkulære. 7.7.2 Lokaliseringsnøjagtighed som funktion af indbyrdes mikrofonafstand P˚ a figur 7.25 og 7.26 ses det, hvordan et 1×4-arrays frekvensrespons (beampattern som funktion af frekvens og retning) varierer med varierende indbyrdes mikrofonafstand. Rød indikerer høj styrke, bl˚ a indikerer lav styrke. S˚ aledes er array’et tilnærmelsesvist omnidirektionelt ved 1 kHz ved sm˚ a mikrofonsepareringer, men opn˚ ar gradvist større selektivitet, n˚ ar separationen stiger. Tallet under hver figur angiver mikrofonsepareringen. Figur 7.25: Konturplot (frekvensrespons) for 1×4-array med varierende indbyrdes mikrofonafstande. Lydkilde placeret i retning 0◦ , 2 meter væk i samme plan som array’et. Abcissen angiver frekvens i Hz, mens ordinaten angiver retning i grader. 40 Simulering af delay-and-sum beamforming i MATLAB Figur 7.26: Konturplot (frekvensrespons) for 1×4-array med varierende indbyrdes mikrofonafstande. Lydkilde placeret i retning 0◦ , 2 meter væk i samme plan som array’et. Abcissen angiver frekvens i Hz, mens ordinaten angiver retning i grader. Til gengæld opst˚ ar der generelt ogs˚ a flere sidelobes, n˚ ar den indbyrdes mikrofonafstand stiger, særligt ved høje frekvenser n˚ ar mikrofonsepareringerne overstiger 4-4,5 cm. Figur 7.27a viser array’ets mainlobe-bredde (lokaliseringsnøjagtighed) som funktion af indbyrdes mikrofonafstand ved forskellige frekvenser og n˚ ar lydkilden er placeret i retning 0◦ , dvs. p˚ a array’ets længdeakse. P˚ a figur 7.27b er lydkilden placeret i retning 90◦ . 41 Simulering af delay-and-sum beamforming i MATLAB (a) Lydkilden er placeret i retning 0◦ , dvs. p˚ a array’ets længdeakse. (b) Lydkilden placeret i retning 90◦ , dvs. vinkelret p˚ a array’ets længdeakse. Figur 7.27: Mainlobe-bredde som funktion af indbyrdes mikrofonafstand for 1 × 4-array. Det skal nævnes, at selvom array’et tydeligvis har mindre mainlobe-bredde p˚ a figur 7.27b pga. indfaldsvinklen p˚ a 90◦ , har dette array altid store 180◦ -sidelobes (spøgelseskilder) med et niveau p˚ a 1 ift. mainlobet. 7.7.3 Lokaliseringsnøjagtighed som funktion af antal mikrofoner I de foreg˚ aende afsnit er det blevet vist, hvordan et mikrofon-arrays specifikke beampattern afhænger af b˚ ade antallet af mikrofoner og deres indbyrdes afstande. I dette afsnit opsummeres de konkrete forskelle mellem de forskellige undersøgte geometrier. P˚ a figur 7.28 til 7.30 sammenlignes mainlobe-bredder for hhv. rektangulære, cirkulære og tilfældige arrays for frekvenser 1 kHz, 2,5 kHz og 4 kHz. De rektangulære arrays er alle enkeltrække-arrays. De cirkulære og de tilfældige arrays har radier, der svarer til r = N/100, hvor N er antallet af mikrofoner for hver p˚ agældende simulering og tallet 100 er valgt af bekvemmelighed. Dette er nødvendigt for at sikre, at mikrofonafstandene er identiske i hver simulering. De cirkulære arrays best˚ ar alle kun af ´en cirkel. 42 Simulering af delay-and-sum beamforming i MATLAB Figur 7.28: 1000 Hz: Forskellige geometriers mainlobe-bredde som funktion af antal mikrofoner i systemet. Rektangulært array simuleret som enkeltrække, cirkulære arrays har radius N/100, hvor N er antal mikrofoner, s˚ a de indbyrdes afstande er identiske igennem simuleringerne. Lydkilde placeret i 0◦ . Figur 7.29: 2500 Hz: Forskellige geometriers mainlobe-bredde som funktion af antal mikrofoner i systemet. Rektangulært array simuleret som enkeltrække, cirkulære arrays har radius N/100, hvor N er antal mikrofoner, s˚ a de indbyrdes afstande er identiske igennem simuleringerne. Lydkilde placeret i 0◦ . 43 Simulering af delay-and-sum beamforming i MATLAB Figur 7.30: 4000 Hz: Forskellige geometriers mainlobe-bredde som funktion af antal mikrofoner i systemet. Rektangulært array simuleret som enkeltrække, cirkulære arrays har radius N/100, hvor N er antal mikrofoner, s˚ a de indbyrdes afstande er identiske igennem simuleringerne. Lydkilde placeret i 0◦ . Fælles for alle geometrier er, at med et stigende antal mikrofoner falder mainlobe-bredden (dvs. lokaliseringsnøjagtigheden stiger). N˚ ar antallet af mikrofoner øges, gøres hele array’et tilsvarende større, hvilket ogs˚ a kan have indflydelse p˚ a mainlobe-bredden. De rektangulære enkeltrække arrays er mindst nøjagtige i denne konkrete undersøgelse, men det kan liges˚ a vel skyldes de valgte parametre i simuleringen, f.eks. indbyrdes mikrofonafstande. For de cikulære arrays er det interessant at overskueliggøre effekten af forskellige antal koncentriske cirkler, se figurer 7.31 til 7.33, der viser sammenhængen for frekvenserne 1 kHz, 2,5 kHz og 4 kHz. Figur 7.31: 1000 Hz: Effekten af forskellige antal koncentriske cirkler i de ordinært cirkulære geometrier. De indbyrdes mikrofonafstande holdes konstant. Lydkilde placeret i 0◦ . 44 Simulering af delay-and-sum beamforming i MATLAB Figur 7.32: 2500 Hz: Effekten af forskellige antal koncentriske cirkler i de ordinært cirkulære geometrier. De indbyrdes mikrofonafstande holdes konstant. Lydkilde placeret i 0◦ . Figur 7.33: 4000 Hz: Effekten af forskellige antal koncentriske cirkler i de ordinært cirkulære geometrier. De indbyrdes mikrofonafstande holdes konstant. Lydkilde placeret i 0◦ . Ved ekstrapolering ses det fra disse figurer, at for et lille antal mikrofoner vil lokaliseringsnøjagtigheden blive stor n˚ ar antallet af koncentriske cirkler er stor (4 i dette tilfælde). N˚ ar antallet af mikrofoner stiger forventes det fra simuleringen, at lokaliseringsnøjagtigheden bliver bedre for arrays med et lille antal koncentriske cirkler og bedst for ´encirkel-array’et. Det bemærkes ogs˚ a, at sammenhængen mellem mainlobe-bredde og antal mikrofoner (eller array-størrelse) er ulineær og udviser en eksponentiel aftagning. 45 Simulering af delay-and-sum beamforming i MATLAB 7.7.4 Sidelobe-niveauer som funktion af antal mikrofoner Størrelsen og antallet af sidelobes i array’ets beampattern beskriver usikkerheden ifm. lokalisering af lydkilden. Store sidelobes giver anledning til stor usikkerhed. De kan for˚ arsages af uønsket lyd, f.eks. støj eller tilstedeværelsen af andre mennesker i lokalet. I array’ets følsomhedskarakteristik beskriver størrelsen og antallet af sidelobes array’ets evne til at undertrykke uønsket lyd (filtrering). P˚ a figur 7.34 til 7.36 sammenlignes sammenhængen mellem sidelobe-niveauer for forskellige geometrier som funktion af antallet af mikrofoner for tre forskellige frekvenser. Figur 7.34: 1000 Hz: Sidelobe-niveau som funktion af antallet af mikrofoner for forskellige geometrier. De indbyrdes mikrofonafstande holdes konstant. Lydkilde placeret i 0◦ . Figur 7.35: 2500 Hz: Sidelobe-niveau som funktion af antallet af mikrofoner for forskellige geometrier. De indbyrdes mikrofonafstande holdes konstant. Lydkilde placeret i 0◦ . 46 Simulering af delay-and-sum beamforming i MATLAB Figur 7.36: 4000 Hz: Sidelobe-niveau som funktion af antallet af mikrofoner for forskellige geometrier. De indbyrdes mikrofonafstande holdes konstant. Lydkilde placeret i 0◦ . Enkeltrække-array’et udmærker sig her ved at have lave meget lave sidelobe-niveauer, men til gengæld har array’et en ringere lokaliseringsnøjagtighed, som vist tidligere. For de cirkulære arrays lader der ikke til at være nogen ˚ abenlys sammenhæng mellem antallet af mikrofoner og sidelobe-niveau. Det meget varierende resultat m˚ a i stedet tilskrives enkeltst˚ aende fænomener, der træder i kraft for et givet antal mikrofoner i et givet array (med givne dimensioner). Generelt lader det til, at sidelobe-niveauet for ordinært cirkulære arrays er højt for et lille antal mikrofoner. 7.7.5 Kildepositionens indflydelse p˚ a array’ets beampattern I beamforming-algoritmen antages det, at mikrofon-array’et udsættes for sfæriske bølger, der har oprindelse i en punktkilde. N˚ ar lydkilden defineres p˚ a denne m˚ ade vil det have en vis signifikans, hvor mikrofon-array’et placeres i forhold til kilden. Dette er i modsætning til situationen, hvor array’et oplever plane bølger. Her er lydtrykket i fase langs en, i princippet, uendelig bølgefront. En s˚ adan antagelse kan kun gælde, hvis mikrofon-array’et er s˚ a langt væk fra lydkilden, at den lokale krumning af dens sfæriske bølgefront er 0. Fra geometriske overvejelser kan effekten af at ændre lydkildens position bestemmes. N˚ ar mikrofon-array’et er placeret i xy-planen og lydkilden liges˚ a, som vist p˚ a figur 7.37.(1), vil der kun være bidrag til tidsforsinkelser mellem mikrofonerne fra den sfæriske bølges xy-krumning. Hvis lydkilden derimod flyttes op til en z-koordinat større end 0, opst˚ ar der et yderligere bidrag til tidsforsinkelserne fra bølgefrontens krumning i xz-planen. I simuleringer viser det sig, at n˚ ar lydkilden ligger over (eller under, for den sags skyld) mikrofon-array’et i xy-planen, opst˚ ar der fejlbehæftede, dobbelte mainlobes, med en opsplitning i den eksakte kildeposition. Dette skyldes, at beamformeren udelukkende søger efter kilden i array’ets plan (xy-planen), hvilket medfører, at de p˚ aførte komplekse faser er ukorrekte. 47 Simulering af delay-and-sum beamforming i MATLAB Figur 7.37: Punktkilder placeret i hhv. (1) z = 0 og (2) z > 0. P˚ a figur 7.38a ses det resulterende beampattern, n˚ ar lydkilden er placeret i punkt (1) p˚ a figur 7.37, mens 7.38b viser resultatet n˚ ar lydkilden er placeret i punkt (2). (a) Beampattern for mikrofon-array med kilde placeret i position (1), z = 0 m. Lydkilden er 3 m fra array’et i 90◦ -retningen. (b) Beampattern for mikrofon-array med kilde placeret i position (2), z = 2 m. Lydkilden er 3 m fra array’et i 90◦ -retningen. Figur 7.38: Simulering af effekt ved at ændre lydkildens højde. Resultatet af flytningen er meget tydelig. Udover at alle mainlobes bliver bredere (dvs. ringere lokaliseringsnøjagtighed), n˚ ar kilden hæves fra z = 0 m til z = 2 m, sker der ogs˚ a en opsplitning i mainlobes ved 2,5 kHz og 4 kHz. Resultatet er, at systemet estimerer lydkilden til at være ca. 20 grader forskudt til hver side, hvilket naturligvis er uønsket. 7.7.6 Effekten af mikrofonernes immanente fasefejl Som diskuteret tidligere, giver mikrofonernes fasefejl anledning til usikkerhed i de fysiske m˚ alinger. P˚ a trods af at der benyttes særlige array-mikrofoner, som er konstrueret til form˚ alet, kan det ikke udelukkes, at der er en vis spredning i deres fasefejl. Det er tidligere vist, hvilke konsekvenser fasefejl kan have p˚ a et arrays beampattern, jf. afsnit 7.6.1. 48 Simulering af delay-and-sum beamforming i MATLAB I simuleringen tildeles hver mikrofon en normalfordelt, randomiseret fasefejl, hvis standardafvigelse kan indstilles. N˚ ar spredningen vælges til f.eks. 5◦ sker der ingen synlig ændring i forhold til simuleringen uden fasefejl. Dette gælder for alle tre stikprøvefrekvenser“ 1 kHz, ” 2,5 kHz og 4 kHz. Blot for at undersøge hvor stor en fasefejl der skal til, for at det resulterende beampattern varierer synligt, prøves med b˚ ade fasefejl p˚ a 20◦ og 50◦ , se figur 7.39. (a) Beampattern for 4×1 rektangulært array med indbyrdes mikrofonafstand 3,9 cm og normalfordelt fasefejl med standardafvigelse σ = 20◦ . (b) Beampattern for 4×1 rektangulært array med indbyrdes mikrofonafstand 3,9 cm og normalfordelt fasefejl med standardafvigelse σ = 50◦ . Figur 7.39: Undersøgelse af effekten af mikrofonernes fasefejl. Vær opmærksom p˚ a, at mikrofonernes fasefejl er stokastiske, og de resulterende beampatterns kan derfor variere mellem forskellige simuleringer. De i denne rapport afbildede resultater viser typiske konsekvenser ved mikrofonfasefejl. Jo færre mikrofoner, der benyttes i array’et, jo større effekt kan en given fasefejl have. Hvis ovenst˚ aende simulering s˚ aledes gentages med 10 mikrofoner i stedet for 4 vil der ofte opleves en mindre effekt af fasefejlene. Dette giver god statistisk mening, eftersom fasefejlene er centreret omkring ϕe = 0◦ . Som forventet vil fasefejl typisk p˚ aføre øvrige sidelobes for de højfrekvente beampatterns pga. deres relative store følsomhed overfor fasefejl, mens 1000 Hz og derunder i stedet kan opleve en forøgelse i mainlobe-bredde. Igen skal det understreges, at specifikke egenskaber ved en simulering i høj grad er afhængig af de tilfældigt generede fasefejl og derfor kan variere fra gang til gang. I praksis vil array-mikrofonerne have samme fasefejl ved hver m˚ aling og kun opleve almindelig elektrisk og termisk støj. 7.7.7 Effekten af 1. ordens refleksioner pga. rummets beskaffenhed Simuleringsalgoritmen giver mulighed for at undersøge indflydelsen af, at mikrofon-array’et befinder sig i et ikke-lyddødt rum. Refleksioner udgør et korreleret akustisk signal, der i teorien kan introducere fejl i systemets beampattern, fordi de reflekterede signaler kan interferere med det oprindelige signal. P˚ a figur 7.40 er et rektangulært 4×1 array placeret i midten af rum med dimensionerne l × b × h = 6 m × 6 m × 2.5 m. Array’et modtager lyd fra b˚ ade en lydkilde 49 Simulering af delay-and-sum beamforming i MATLAB samt refleksionskilder (grønne punkter). Absorptionskoefficienten α = 0. Figur 7.40: Visualisering af 4×1 rektangulært mikrofon-array (rød), lydkilde (bl˚ a) og refleksionskilder (grøn). Rummet har dimensionerne l × b × h = 6 m × 6 m × 2.5 m. Gennemsigtige bl˚ a overflader indikerer rummets vægge. Det resulterende beampattern fremg˚ ar af figur 7.41. (a) Simulering uden refleksioner (uden rum). (b) Simulering med refleksioner (med rum). Figur 7.41: Beampattern for 4×1 rektangulært array med indbyrdes mikrofonafstand 3,9 cm hhv. med og uden refleksioner, α = 0. Kilde placeret i retning 0◦ . Tilstedeværelsen af vægge, gulv og loft i et efterklangsrum har en stor effekt p˚ a array’ets 50 Simulering af delay-and-sum beamforming i MATLAB beampattern. Især ved 4 kHz, hvor sidelobes og mainlobes har byttet roller, og ved 2,5 kHz, hvor der sker en opsplitning i mainlobet. Alene ved at rotere kilden omkring array’ets midte 30 grader f˚ as et helt anderledes resultat, hvilket blot indikerer, at array’ets beampattern i et rum med lav absorption er meget følsomt overfor positionsændringer. Det skyldes f.eks. at en flytning af lydkilden ogs˚ a genererer en flytning af refleksionskilderne, som giver anledning til nye faseforskydninger af signalet i array’et, se figur 7.42. (a) Simulering uden refleksioner (uden rum). (b) Simulering med refleksioner (med rum). Figur 7.42: Beampattern for 4×1 rektangulært array med indbyrdes mikrofonafstand 3,9 cm hhv. med og uden refleksioner, α = 0. Kilde placeret i retning 30◦ . Lignende effekter opst˚ ar ogs˚ a n˚ ar kilden bevæges i andre dimensioner, f.eks. op/ned ad z-aksen, eller hvis rummets dimensioner ændres. Ved at ændre absorptionskoefficienten fra α = 0 til hhv. α = 0, 25, α = 0, 5, α = 0, 75 og α = 1, 0 f˚ as gradvist en mindre effekt af rummets tilstedeværelse, se figur 7.43. Array’ets beampattern for 1 kHz g˚ ar fra at være ellipseformet ved lave absorptionskoefficienter til sit oprindelige kardioidlignende beampattern. 2,5 kHz og 4 kHz oplever begge en forskydning af deres mainlobes p˚ a op til ca. 30◦ ved lave absorptionskoefficienter, men normaliseres n˚ ar α → 1, hvilket svarer til et ideelt lyddødt rum. P˚ a figur 7.43d er array’ets beampattern til det, der f˚ as, n˚ ar rummet ekskluderes fra simuleringen. 51 Simulering af delay-and-sum beamforming i MATLAB (a) α = 0, 25. (b) α = 0, 5. (c) α = 0, 75. (d) α = 1, 0. Figur 7.43: Undersøgelse af effekten af refleksioner i et rum med forskellige absorptionskoefficienter α. Kilden er placeret i 30◦ . 4×1 rektangulært array med indbyrdes mikrofonafstande 3,9 cm. 7.7.8 Effekten af tilstedeværelse af ikke-korreleret støj For at simulere tilstedeværelsen af støjkilder i nærheden af array’et, der udstr˚ aler lyd simultant, men ikke korreleret, med den egentlige lydkilde, vælges det at benytte samme placeringer som refleksionskilderne i forrige afsnit. Der simuleres hvid, Gaussisk støj til hver støjkildeposition, og alle støjsignaler ankommer ikke-korrelerede til array’et. Det viser sig ifølge simuleringen, at ikke-korreleret støj har lav eller ingen synlig effekt p˚ a de resulterende beampatterns. Eftersom støjkilderne er placeret symmetrisk omkring array’et, kan de have tendens til at udslukke hinanden vha. destruktiv interferens. Hvis der kun anvendes ´en støjkilde, kan den vise sig at f˚ a større, synlig indflydelse p˚ a array’ets beampattern. S˚ alænge støjkildens styrke er sammenlignelig med den primære lydkilde er der alts˚ a lav til ingen indflydelse. Men hvis støjkilden overdøver den primære lydkilde, vil denne blive lokaliseret i stedet for den primære kilde. 52 Simulering af delay-and-sum beamforming i MATLAB 7.7.9 Simulering af array’ets følsomhed med og uden støj Vha. de simulerede beampatterns, der har været fremtrædende indtil nu, kan man undersøge et givet array’s evne til at lokalisere en lydkilde under forskellige omstændigheder. Kvalitetsbedømmelsen har best˚ aet i bl.a. de m˚ albare parametre mainlobe-bredde og sidelobe-niveau. Udover lydlokalisering har mikrofon-array’et en anden væsentlig funktion, nemlig at undertrykke (filtrere) lyd, der kommer fra en anden retning end den valgte styringsretning. Beamformeren kan alts˚ a fungere som et rumligt (spatialt) filter. For at simulere denne funktion sættes sensitivity = 1 i Beamforming FFT.m“. Styringsretningen reguleres ved at indta” ste den ønskede retning til variablen w (f.eks. w = 90◦ ) og er s˚ aledes fastsat i modsætning til tidligere, hvor den roterede en hel omgang i enhedscirklen. Som den primære lydkilde, Sp , vælges en 1 kHz-sinustone. Lydkilden kan placeres valgfrit ved at angive en radial afstand fra array’ets centrum og en vinkel i forhold til array’ets længdeakse. I de følgende simuleringer er Sp placeret 4 meter fra array’ets centrum i en vinkel p˚ a 0◦ . Array’et er et 1 × 4 linje-array med indbyrdes mikrofonafstand 3,9 cm. Af figur 7.44 fremg˚ ar det simulerede lydkildesignal (1 kHz-sinustone) i hhv. tids- og fre11 kvensdomæne. Figur 7.44: Visualisering af lydkildesignal (f = 1000 Hz) i hhv. tids- og frekvensdomæne. N˚ ar styringsretningen vælges til netop den vinkel, hvori lydkilden er placeret (w= 0◦ , f˚ as et beamforming-output, der vidner om en forstærkning p˚ a 4 i forhold til lydkildens signal (4 svarer til antal mikrofoner), s˚ aledes er array’ets mainlobe nu centreret omkring lydkildens retning, se figur 7.45. 11 Bemærk, at frekvensspektrummet ogs˚ a indeholder komposanter lidt over og under grundfrekvensen, hvilket kan forklares ved at der bruges et relativt kort signal m˚ alt i bølgelængder, og at signalet stopper aperiodisk (dvs. ikke efter et helt antal bølgelængder). 53 Simulering af delay-and-sum beamforming i MATLAB Figur 7.45: Beamforming-output i tids- og frekvensdomæne med styringsretning w= 0◦ . Primær lydkilde (f = 1000 Hz) placeret i 0◦ . I tidsdomænet er signalet naturligvis et stykke tid om at n˚ a fra lydkilden til mikrofonarray’et. Derfor er signalet tidsforsinket med ca. 0,012 sekunder. 1 kHz-signalet er fordoblet i frekvensdomænet og firedoblet i tidsdomænet i forhold til input-signalet. Selve spektrets features er en anelse bredere end det oprindelige p˚ a figur 7.44. Dette kan evt. undersøges i fremtidigt arbejde. N˚ ar styringsretningen flyttes væk fra den primære lydkilde, f.eks. w= 180◦ , dæmpes input-signalet med en faktor ≈2,4 (fra 1 til 0,41). Den teoretisk maksimale forstærkning fra array’et er lig med antallet af mikrofoner (=4 i dette tilfælde). I retningen w= 180◦ er amplituden 0,41, hvilket giver en forstærkning p˚ a ca. 1/10, eller kvadreret 1/100, i forhold til ◦ retningen w= 0 . Dvs., at støjreduktionen kan bestemmes til AdB = 10 · log10 (1/100) = −20 dB, se figur 7.46. Dette er i overensstemmelse med de fundne beampatterns for det nærværende mikrofon-array. Figur 7.46: Beamforming-output i tids- og frekvensdomæne med styringsretning w= 180◦ . Primær lydkilde (f = 1000 Hz) placeret i 0◦ . Udover den primære lydkilde introduceres nu en støjkilde, placeret arbitrært ligesom den 54 Simulering af delay-and-sum beamforming i MATLAB primære lydkilde. I dette eksempel placeres støjkilden i retningen 250◦ i en afstand af 4 meter. Støjkilden producerer en 2,5 kHz sinustone med samme amplitude som den primære lydkilde. Det giver et input-SNR p˚ a SNRi = 0 dB. Det samlede signal, som mikrofon-array’et modtager er vist p˚ a figur 7.47a for mikrofon #1 og #4 (hhv. mest til venstre og højre i linje-array). (a) Mikrofonsignaler i tidsdomæne. (b) Frekvensindhold i ubehandlede mikrofonsignaler. Figur 7.47: Modtagede mikrofonsignaler n˚ ar b˚ ade primær lydkilde (1 kHz-sinustone) og støjkilde er til stede for mikrofon #1 og #4. Støjkilde: 2,5 kHz-sinustone. Lydkilde placeret i 0◦ , støjkilde placeret i 250◦ . N˚ ar styringsretningen vælges til w= 0◦ , dvs. mod den primære lydkilde, f˚ as et beamformingoutput, der er væsentligt mindre støjfyldt end indgangssignalet p˚ a figur 7.47a, se figur 7.48. 55 Simulering af delay-and-sum beamforming i MATLAB Figur 7.48: Beamforming-output i tids- og frekvensdomæne med styringsretning w= 0◦ . Primær lydkilde (1 kHz) placeret i 0◦ , støjkilde (2,5 kHz) placeret i 250◦ . Beamforming-outputtet leverer et output-SNR p˚ a SNRo = 20 · log10 (2 · 0, 2) = 20 dB. 2,5 kHz-sinustonen er næsten filtreret fra signalet, men der er stadig sm˚ a synlige effekter tilbage fra støjforureningen. N˚ ar støjkilden antages at være placeret tættere p˚ a den primære lydkilde, f.eks. i 20◦ , har array’et sværere ved at filtrere signalet, og resultatet bliver et mere støjfyldt beamforming-output, se figur 7.49. Figur 7.49: Beamforming-output i tids- og frekvensdomæne med styringsretning w= 0◦ . Primær lydkilde (1 kHz) placeret i 0◦ , støjkilde (2,5 kHz) placeret i 20◦ . Output-SNR er nu væsentligt lavere, mere præcist SNRo = 20 · log10 (2 · 1, 1) ≈ 5, 2 dB. Beamformingen er i dette tilfælde udført ved frekvensen f = 1 kHz, hvilket har betydning for array’ets selektivitet (mainlobe-bredde). Hvis den primære lydkildes frekvens ændres til f = 4 kHz, forventes det, at støjkilden undertrykkes i højere grad end i figur 7.49 pga. en større selektivitet ved denne frekvens. 56 Simulering af delay-and-sum beamforming i MATLAB Figur 7.50: Beamforming-output i tids- og frekvensdomæne med styringsretning w= 0◦ . Primær lydkilde placeret i 0◦ , støjkilde (2,5 kHz) placeret i 20◦ . Primær lydkilde: 4 kHz-sinustone. Resultatet p˚ a figur 7.50 bekræfter, at mainlobe-bredden er blevet mindre ved 4 kHz sammenlignet med 1 kHz foretaget i de forrige simuleringer. Der f˚ as nu et output-SNR p˚ a SNRo = 20 · log10 (2 · 0, 5) ≈ 12 dB. Det skal bemærkes, at følsomhedskarakteristikkerne i dette afsnit tager udgangspunkt i et 1×4-array, hvilket har en ringere lokaliseringsnøjagtighed end arrays med større antal mikrofoner og dimensioner. Styringsretning w=0◦ w=0◦ w=0◦ Kildeposition 0◦ 0◦ 0◦ Kildefrekvens 1000 Hz 1000 Hz 4000 Hz Støjposition 250◦ 20◦ 20◦ Støjfrekvens 2500 Hz 2500 Hz 2500 Hz SNRo 20 dB 5,2 dB 12 dB Tabel 7.3: SNR-resultater for 1×4-array. 7.8 Delkonklusion I de foreg˚ aende afsnit er forskellige array-typer blevet undersøgt i forbindelse med beamformingteknikken delay-and-sum. Afhængigt af mikrofon-array’ets form˚ al og applikationsomr˚ ade kan der med fordel anvendes forskellige array-geometrier, f.eks. rektangulære og cirkulære. Denne rapport dokumenterer overvejende undersøgelser for simple, todimensionelle, rektangulære geometrier og forskellige typer cirkulære geometrier, herunder ´encirkel, flercirkel, logaritmiske, ækvidistante og tilfældige arrays. Et specialtilfælde af de rektangulære arrays er et uniformt, lineært array (ULA), der konstrueres langs ´en længdeakse. Et s˚ adant array kan ogs˚ a undersøges analytisk, men det ◦ har den væsentlige ulempe, at det producerer store 180 -sidelobes (benævnt spøgelseskilder) ved særlige kildepositioner. Dette kan løses ved at indføre flere rækker og/eller kolonner, s˚ a array’et kan forst˚ as som en todimensionel matrice. Hvis systemets beampattern skal opn˚ a en stor b˚ andbredde (dvs. have god lokaliseringsnøjagtighed over et stort frekvensomr˚ ade), er det nødvendigt at finjustere de enkelte mikrofonafstande i det rektangulære array. Et rektangulært array, der opfylder dette krav, er eksempelvis et 4×6-array med indbyrdes mikrofonafstande p˚ a 6 cm i rækkeplan og 4 cm i kolonneplan. Det mest simple cirkulære array man kan forestille sig best˚ ar af et antal mikrofoner placeret p˚ a periferien af en cirkel med en given radius. I undersøgelserne af denne array-type 57 Simulering af delay-and-sum beamforming i MATLAB ses det ligeledes, at array’ets totale fysiske størrelse har indflydelse p˚ a array’ets lavfrekvente beampattern; generelt f˚ as en bedre lokaliseringsnøjagtighed, n˚ ar array’et gøres større. De højfrekvente egenskaber er dog stadig afhængige af de enkelte mikrofonafstande, hvilket hænger sammen med bølgelængden. For et tilsvarende antal mikrofoner som i de rektangulære, f˚ as et meget tilsvarende beampattern. Et cirkulært array kan ogs˚ a best˚ a af flere koncentriske cirkler enten med en mikrofonfordeling, der placerer lige mange mikrofoner i hver cirkel eller med en fordeling, der placerer alle mikrofoner med samme indbyrdes afstand (ækvidistant). Sidstnævnte har ikke vist sig at have en væsentlig bedre ydeevne end ordinært cirkulære, men ved at indføre flere koncentriske cirkler, kan b˚ andbredden af systemet øges. Det er blevet vist, at n˚ ar den indbyrdes mikrofonafstand stiger (med konstant antal mikrofoner), forbedres lokaliseringsnøjagtigheden. Sammenhængen er ikke lineær, snarere eksponentiel. Antallet af mikrofoner har ikke udvist nogen tydelig indflydelse p˚ a mainlobe-bredden, men har sandsynligvis en effekt p˚ a størrelsen af sidelobe-niveauer. Generelt er sidelobe-mængden og -niveauer i høj grad et produkt af en given applikation med givne parametre (kildeposition, frekvens, mikrofonafstande etc.). I simuleringerne reguleres array’ets styringsretning kun rundt i array’ets plan (xy-planen) og har derfor ikke et tredimensionelt beampattern. Dette kan evt. udvikles i fremtidigt arbejde. Selvom de forskellige arrays 3D-beampattern ikke er fastlagt, er det blevet konkluderet, at 2D-beampattern varierer med lydkildens højde. For at modellere mere realistiske forhold, er der bl.a. blevet undersøgt effekten af mikrofonernes iboende fasefejl, refleksioner fra vægge, gulv og loft i et rum samt ikke-korreleret støj. Mikrofonernes fasefejl viser sig at have lille betydning for det lavfrekvente (1000 Hz) beampattern og større betydning for det højfrekvente (4000 Hz) beampattern. Dette hænger sammen med, at en fasefejl kan sammenlignes med en lille randomiseret forskydning af mikrofonernes placeringer, hvilket har størst indvirkning for høje frekvenser (= lille bølgelængde). Generelt kræver det store fasefejl at levere en synlig negativ effekt p˚ a array’ets beampattern. Det er ogs˚ a vist, at en randomiseret fejlplacering af mikrofonerne kan give anledning til fasefejl. F.eks. vil en positionsusikkerhed p˚ a 0,5 cm for˚ arsage en fasedrejning p˚ a ca. 20◦ ved 4000 Hz, hvilket giver synlige effekter p˚ a det resulterende beampattern. Der er en forventning om, at refleksioner for˚ arsaget af et rums vægge, gulv og loft kunne give anledning til fejlbehæftede beampatterns. N˚ ar korreleret lyd ankommer p˚ a senere tidspunkter end det direkte lydfelt, kan array’et sandsynligvis styre imod refleksionen i stedet for den sande lydkildeposition. Simuleringer viser ogs˚ a, at der opst˚ ar store sidelobes, i retninger af refleksionskilderne. Array’ets eksakte beampattern afhænger naturligvis af b˚ ade array’ets og lydkildens position i rummet, rummets dimensioner samt rummets efterklangsegenskaber, f.eks. absorptionsgrad. Ifølge simuleringer har tilstedeværelsen af hvid Gaussisk støj ingen synlig effekt p˚ a array’ets beampattern s˚ afremt støjkildens styrke ikke er meget større end lydkildens, hvilket er i overensstemmelse med forventningerne. Slutteligt foretages simuleringer af følsomhedskarakteristikker med konkrete signaleksempler b˚ ade med og uden støj. Signalkvaliteten kan i begge tilfælde bevares, og med støj til stede kan der opn˚ as et output-SNR p˚ a ca. 20 dB. Fremtidige udvidelsesmuligheder, der kan indtænkes i simuleringsalgoritmen, omfatter f.eks. skyggeeffekter og diffraktion blandt mikrofoner, beamforming i 3D, implementering af 3D-arrays (f.eks. sfæriske) og m˚ aling af et systems opløsning (skelnen mellem to tætplacerede lydkilder). Derudover evt. indføring af m˚ albare ydeevneparametre som alternativ til 58 Simulering af delay-and-sum beamforming i MATLAB mainlobe-bredde og sidelobe-niveau. I simuleringen af det akustiske array og dets beampattern, er overholdelse af samplingsætningen (fs > 2fmax ) ikke et problem, fordi alle simulerede mikrofonsignaler kan genereres med en opløsning, der er langt større end den ofte anvendte fs = 44100 Hz inden for akustik. I m˚ alingerne, dokumenteret i kapitel 9, giver sampling-frekvensen heller ikke anledning til problemer, fordi der maksimalt samples p˚ a fire mikrofoner ad gangen med et USB-modul, der kan sample fire kanaler med hver 44100 Hz. Hvis der i praksis konstrueres et akustisk array med mange mikrofoner ( 4), er det pludseligt nødvendigt at have adgang til dataopsamplingsudstyr, der kan sample et stort antal mikrofoner p˚ a samme tid. Evt. skal det overvejes, hvorvidt sampling-frekvensen kan reduceres for at spare p˚ a processorressourcer. En s˚ adan undersøgelse kan være fokusomr˚ adet i fremtidige studier. 59 Laboratoriepraksis 8 Laboratoriepraksis 8.1 M˚ alekonstruktion Til m˚ aling af mikrofon-array’ets ydeevne i praksis, anvendes en træplade (MDF), hvor der er konstrueret et drejebord i pladens centrum som vist p˚ a figur 8.1. Figur 8.1: Træplade, der repræsenterer et mødebord, med et drejebord, hvor mikrofonerne placeres. Pladen skal repræsenterer et mødebord, og den m˚ aler 122 cm × 147 cm. Drejebordet i pladens centrum er en cirkel med en radius p˚ a 22 cm, og det er her mikrofonerne skal placeres. Form˚ alet med drejebordet er at kunne simulere et array med flere mikrofoner end det antal, der er tilgængelige, dvs. fire. Dette kan gøres ved at placere mikrofonerne p˚ a en lige linje radialt p˚ a drejebordet og rotere cirklen et bestemt antal grader afhængigt af antallet af mikrofoner i array’et. Figur 8.1 viser fire mikrofoner, der er placeret ækvidistant og radialt p˚ a drejebordet. P˚ a figuren ses det, at der ogs˚ a er lavet huller til et array, der indeholder tre ækvidistant og radialt placerede mikrofoner. M˚ alingerne foretages alts˚ a for ´en række mikrofoner ad gangen, og mikrofonsignalerne for hver position lagres. N˚ ar m˚ alingerne med det valgte antal mikrofoner er blevet udført, laves der delay-and-sum beamforming p˚ a alle mikrofonsignalerne for at opn˚ a beampattern for det valgte array. Hvis det ønskes at have en centermikrofon i array’et, skal denne mikrofon placeres som den eneste, mens hullerne til de andre mikrofoner i drejebordet er fyldt ud. Der laves ´en m˚ aling med denne centermikrofon, hvorefter den fjernes, og de andre mikrofoner placeres som nævnt ovenfor. Centermikrofonen ønskes ikke som en del af hver m˚ aling, da den teoretisk opn˚ ar samme resultat ved hver m˚ aling. Dette er muligvis ikke tilfældet i praksis, hvis drejebordets centrum ikke er fastholdt under rotation. Generelt skal alle huller i drejebordet fyldes ud, hvis de ikke anvendes til de p˚ agældende m˚ alinger. Fyldes hullerne ikke ud, er der risiko for, at de kan for˚ arsage afvigelser fra det ønskede lydfelt. Der kan opst˚ a refleksioner eller diffraktion, som kan p˚ avirke array’ets AOAE. Det kan ses p˚ a figur 8.1, at de ubenyttede huller i drejebordet er fyldt ud med klæbemasse. N˚ ar drejebordet roteres er det vigtigt, at det roteres omkring dets centrum, som ikke m˚ a flytte sig under rotationen. Centrum af drejebordet skal anvendes som reference, og denne position m˚ a ikke ændres, da det vides fra simuleringerne (jf. afsnit 7.6.1), at positionsændringer p˚ a f˚ a millimeter kan give array’et en helt anden følsomhed. Figur 8.2 viser opstillingen med bordplade, drejebord, mikrofoner og lydkilde i et lyddødt rum. Det er kun den øverste højtaler, der benyttes til m˚ alingerne. Den st˚ ar placeret oven p˚ a en gulvhøjtaler for at f˚ a den i niveau med mikrofon-arrayet. 60 Laboratoriepraksis Figur 8.2: Opstilling i et lyddødt rum med bordplade, drejebord, mikrofoner og lydkilde. 8.2 Apparater og udstyr Følgende udstyr og software benyttes til laboratoriem˚ alingerne: 4 stk. Br¨ uel & Kjær array-mikrofoner 1/4”, type 4958 [3] Digitalt 5-kanals signalopsamlingsmodul fra National Instruments, type USB-4431 [4] Data Acquisition Toolbox i MATLAB Drejebord til montering af mikrofoner Dali 2A højtaler. Impedans 8 Ω, effekt 10-60 W, følsomhed 89 dB/Wm Br¨ uel & Kjær Power Amplifier, type 2706 Array-mikrofonernes indre relatve fasefejl (phase-matching) er i producentens datablad[3] angivet som følgende: < ±3◦ fra 100 Hz til 3 kHz, < ±5◦ fra 50 Hz til 5 kHz og < ±10◦ fra 5 kHz til 10 kHz. 8.3 Synkronisering af afspilning og optagelse Det er vigtigt, at afspilningen af kildesignalet og optagelserne fra mikrofonerne er synkroniserede, s˚ a de starter p˚ a samme tid ved hver m˚ aling. Dette er vigtigt, da drejebordets funktion er at simulere et array med flere mikrofoner end det tilgængelige antal, og hver m˚ alinger skal derfor være synkroniseret, s˚ a det svarer til, at der kun er lavet ´en m˚ aling med et fuldt array. Er de ikke synkroniseret, kan det ikke vides, om kildesignalets fase er den samme ved hver m˚ aling, og det kan skabe problemer, n˚ ar der laves beamforming, som helt afhænger af faseforskelle mellem mikrofonerne. For at sikre denne synkronisering, sendes kildesignalet til højtaleren via USB-modulets udgang, da udgangen er synkroniseret med de fire indgange, som bruges til mikrofonerne. 8.4 Fremgangsm˚ ade Det ønskede antal array-mikrofoner monteres i drejebordets huller for den ønskede arraygeometri. Mikrofonerne fastgøres med klæbemasse p˚ a undersiden af drejebordet, som det vises p˚ a figur 8.3, hvor der ogs˚ a ses en fastmonteret aksel, der sørger for, at drejebordets centrum 61 Laboratoriepraksis fastholdes under rotationerne. Mikrofonerne placeres i hullerne s˚ aledes, at membranen og beskyttelsesgitteret er igennem hullerne og synlige p˚ a bordets overflade. Dette vises p˚ a figur 8.4. Figur 8.3: Montering af mikrofoner med klæbemasse p˚ a undersiden af drejebordet. Her ses ogs˚ a en fastmonteret aksel, der fastholder drejebordets centrum under rotation. Figur 8.4: Mikrofoner monteret i drejebord, s˚ a deres membraner og beskyttelsesgitre er synlige p˚ a oversiden. Hver mikrofon forbindes til sin hver sin indgang i USB-modulet fra National Instruments med et SMB-til-BNC-stik. Højtaleren, der anvendes som lydkilde, placeres p˚ a den ønskede position i forhold til array’et. I MATLAB-programmet ”ArrayConfiguration.m”opsættes den ønskede array-geometri, inkl. antallet af mikrofoner og lydkildens position. Herefter foretages en m˚ aling, og mikrofonsignalerne samples af USB-modulet. Vha. Data Acquisition Toolbox i MATLAB og MATLABprogrammet measure.m“ kan mikrofonsignalerne opsamles, og der kan laves beamforming ” vha. programmet Beamforming FFT.m“. Hvis array’et maksimalt indeholder fire mikrofo” ner, er det ikke nødvendigt at rotere drejebordet, og der skal kun foretages denne ene m˚ aling. Hvis array’et derimod indeholder mere end de fire tilgængelige mikrofoner, skal drejebordet roteres efter m˚ alingen. Efter rotationen foretages en ny m˚ aling, og dette fortsætter, indtil det ønskede antal mikrofoner er opn˚ aet. 62 Undersøgelse af array’ets beampattern og følsomhed 9 Undersøgelse af array’ets beampattern og følsomhed Det vil nu blive undersøgt, om de simulerede beampatterns er mulige at opn˚ a ved praktiske m˚ alinger, og dette undersøges ved at foretage m˚ alinger i et lyddødt rum. M˚ alinger i et lyddødt rum foreg˚ ar stort set uden efterklang (ned til ca. 100 Hz-omr˚ adet i det lyddøde rum p˚ a det Tekniske Fakultet, SDU). 9.1 Undersøgelse af rektangulære geometrier Et simpelt system med fire mikrofoner testes for at se, om kilden kan lokaliseres med s˚ a f˚ a mikrofoner og for at sammenligne med resultater fra simuleringer s˚ avel som den analytiske udledning. Figur 9.1 viser beampatterns for et 1×4 array, hvor mikrofonernes indbyrdes afstand er 3,9 cm. Kilden er placeret i 0◦ , hvilket betyder, at den er placeret p˚ a samme akse, som mikrofonerne ligger p˚ a, og den udsender hvid støj. Figur 9.1a viser simulerede beampatterns for det p˚ agældende array, mens figur 9.1b viser beampatterns, der er m˚ alt i praksis i et lyddødt rum. (a) Simuleret. (b) M˚ alt i lyddødt rum. Figur 9.1: Beampatterns for 1×4 array med indbyrdes mikrofonafstand p˚ a 3,9 cm. Kilden er placeret i 0◦ og udsender hvid støj. Som det kan ses p˚ a figur 9.1, ligner de simulerede og m˚ alte beampatterns til forveksling hinanden. Den største forskel mellem simulering og praksis findes ved 4000 Hz, hvor m˚ alingen viser et mindre sidelobe end simuleringen men et breddere mainlobe. Kildens afstand og retning i forhold til array’et undersøges nærmere i afsnit 9.3. 1×4 array’et, som er beskrevet ovenfor, er ogs˚ a testet med tre rene toner, 1000 Hz, 2500 Hz og 4000 Hz, og figur 9.2 viser de m˚ alte beampatterns for et kildesignal p˚ a 1000 Hz. Her er det m˚ alte beampattern for 1000 Hz helt magen til det, der ses p˚ a figur 9.1b for 1000 Hz, hvor kilden udsender hvid støj. 63 Undersøgelse af array’ets beampattern og følsomhed Figur 9.2: Beampatterns for 1×4 array med indbyrdes mikrofonafstand p˚ a 3,9 cm. Kilden er placeret i 0◦ og udsender en tone p˚ a 1000 Hz. M˚ alingerne er foretaget i lyddødt rum. De m˚ alte beampatterns p˚ a figur 9.2 for 2500 Hz og 4000 Hz ligner et mere tilfældigt respons, hvilket er som forventet, da beamformingen laves vha. FFT, hvor der udvælges ´en frekvens. Hvis denne ene frekvens ikke er repræsenteret i kildesignalet, bør array’ets beampattern for den frekvens være nul. Det output, der alligevel opst˚ ar ved disse to frekvenser, kan skyldes et urent signal, ekstern støj eller fejl knyttet til FFT-algoritmen. Ydermere er de polære plots normerede, s˚ a de altid har maksimumværdien 1, og dermed kan signalstyrkerne ved de forskellige ikke sammenlignes. Signalstyrken er højst sandsynligt lavere ved 2500 Hz og 4000 Hz end ved 1000 Hz. Ved at lade lydkilden udstr˚ ale hvid støj, f˚ as et signal, der indeholder alle frekvenser med lige stor energi, og derfor kan der laves beamforming i frekvensdomænet for flere frekvenser p˚ a samme signal. Fremadrettet vil der blive anvendt hvid støj i m˚ alingerne. Der ses igen p˚ a et 1×4 array med en indbyrdes mikrofonafstand p˚ a 3,9 cm. Nu er kilden dog placeret i 267◦12 , som betyder, at lydens indfaldsvinkel er tilnærmelsesvist vinkelret p˚ a mikrofonernes akse. Figur 9.3a viser de simulerede beampatterns, mens 9.3b viser beampatterns for de praktiske m˚ alinger. (a) Simuleret. (b) M˚ alt i lyddødt rum. Figur 9.3: Beampatterns for 1×4 array med indbyrdes mikrofonafstand p˚ a 3,9 cm. Kilden er placeret i 267◦ og udsender hvid støj. Da der kun er ´en række mikrofoner, kan beamformeren ikke bestemme, hvilken side af rækken lydkilden befinder sig p˚ a, og der opst˚ ar spøgelseskilder. Spøgelseskilderne optræder Højtaleren er placeret ved 270◦ ift. drejebordets centrum og array’ets længdeakse, men array’et er ikke centreret herom. Se figur 8.1 12 64 Undersøgelse af array’ets beampattern og følsomhed som en spejling i mikrofonrækken, og det skyldes, at der ikke er nogle bagvedliggende mikrofoner til at skabe destruktiv interferens. Mikrofonsignalerne vil have samme faseforskelle p˚ a begge sider af mikrofonrækken, og det ser derfor ud til, at der er en kilde p˚ a begge sider af rækken. Ved at anvende to mikrofonrækker kan disse spøgelseskilder elimineres, da den bagvedliggende række kan bidrage til destruktiv interferens. Afstanden mellem de to rækker er 10 cm, mens afstanden mellem kolonnerne stadig er 3,9 cm. Beampatterns for dette 2×4 array, hvor kilden er placeret i 270◦ , vises p˚ a figur 9.4. (a) Simuleret. (b) M˚ alt i lyddødt rum. Figur 9.4: Beampatterns for 2×4 array med kolonneafstand p˚ a 3,9 cm og en rækkeafstand p˚ a 10 cm. Kilden er placeret i 270◦ og udsender hvid støj. Her ses det, at spøgelseskilderne er forsvundet, og der er dermed næsten ikke nogle sidelobes. Der er kun et lille sidelobe i 90◦ ved 4000 Hz med et niveau p˚ a 0,2. N˚ ar kilden placeres i 0◦ , bliver de simulerede og m˚ alte beampatterns meget lig dem for 1×4 array’et, men mainlobet er blevet en del smallere, se tabel 9.1 Array 1×4 2×4 1000 Hz 131◦ 62◦ 2500 Hz 87◦ 25◦ 4000 Hz 71◦ 16◦ Tabel 9.1: Mainlobe-bredder for hhv. 1 × 4- og 2 × 4-array n˚ ar lydkilde er placeret i 0◦ . Ved 4000 Hz opst˚ ar der nogle sm˚ a sidelobes i 45◦ og 315◦ med et niveau p˚ a ca. 0,4. ◦ N˚ ar kilden placeres i 45 er der dog stadig nogle sidelobes, som minder om spøgelseskilderne fra 1×4 array’et. Dette vises p˚ a figur 9.5. Ved 2500 Hz eksisterer der et sidelobe ved ca. 315◦ med et niveau p˚ a 1, og ved 4000 Hz eksisterer to sidelobes med niveauer p˚ a hhv. 0,6 og 0,3. Disse sidelobes kan minimeres ved at indføre flere rækker af mikrofoner og justere p˚ a afstanden mellem rækkerne og kolonnerne. Der er ikke foretaget m˚ alinger af større rektangulære arrays pga. plads- og tidsbegrænsninger, men der henvises simuleringsresultaterne i afsnit 7.7.1. 65 Undersøgelse af array’ets beampattern og følsomhed (a) Simuleret. (b) M˚ alt i lyddødt rum. Figur 9.5: Beampatterns for 2×4 array med indbyrdes mikrofonafstand i hver række p˚ a 3,9 cm og afstand mellem rækkerne p˚ a 10 cm. Kilden er placeret i 45◦ og udsender hvid støj. 9.2 Undersøgelse af cirkulære geometrier Figur 9.6 viser simulerede og m˚ alte beampatterns for et cirkulært array med 8 mikrofoner i ´en cirkel, der har radius r = 3, 9 cm. Kilden befinder sig i 0◦ . Det ses, at de m˚ alte beampatterns p˚ a figur 9.6b næsten er identiske med de simulerede beampatterns p˚ a figur 9.6a. Der opst˚ ar kun sm˚ a sidelobes ved 2500 Hz og 4000 Hz. Ved 1000 Hz er mainlobet breddere og mere omnidirektionelt, hvilket kan skyldes array’ets relativt lille radius. Det m˚ alte beampattern har en fejlbehæftet AOAE, som kan tilskrives en menneskelig fejlplacering af lydkilden. (a) Simuleret. (b) M˚ alt i lyddødt rum. Figur 9.6: Beampatterns for cirkulært array med 8 mikrofoner i ´en cirkel og radius r = 3, 9 cm. Kilden er placeret i 0◦ og udsender hvid støj. Geometrier med radius p˚ a r = 7, 8 cm, r = 11, 7 cm og r = 15, 5 cm er ogs˚ a undersøgt, 66 Undersøgelse af array’ets beampattern og følsomhed men disse beampatterns indeholder b˚ ade flere og større sidelobes, der i flere tilfælde er næsten lige s˚ a store som mainlobet. Geometrierne er undersøgt med b˚ ade 4 og 8 mikrofoner, og det viser sig, at 8 mikrofoner med radius p˚ a r = 3, 9 cm giver de bedste beampatterns med henblik p˚ a at lokalisere kilden. Det undersøges nu, om 16 mikrofoner i ´en cirkel egner sig bedre til at lokalisere kilden end array’et med 8 mikrofoner. Her vurderes det, at en radius p˚ a r = 3, 9 cm er for lille, da det vil medføre indbyrdes mikrofonafstande p˚ a ca. 1,5 cm, hvilket i praksis er svært at konstruere og desuden kan give anledning til unøjagtige, højfrekvente beampatterns. En radius p˚ a r = 15, 5 cm vælges i stedet, da gode simuleringer er opn˚ aet med denne radius. Dette giver indbyrdes mikrofonafstande p˚ a ca. 6 cm. Figur 9.7 viser dette array med kilden placeret i 0◦ . (a) Simuleret. (b) M˚ alt i lyddødt rum. Figur 9.7: Beampatterns for cirkulært array med 16 mikrofoner i ´en cirkel og radius r = 15, 5 cm. Kilden er placeret i 0◦ og udsender hvid støj. Sammenlignet med det forrige array med 8 mikrofoner giver dette array væsentligt smallere mainlobes ved de forskellige frekvenser, og dette m˚ a bl.a. skyldes den forøgede array-radius, se tabel 9.2. Bemærk den særligt høje lokaliserigsnøjagtighed ved 4000 Hz for array’et med 16 mikrofoner. Ved 4000 Hz optræder desuden et sidelobe med et niveau p˚ a ca. 0,25 i 180◦ retningen. Cirkulært array 8 mikrofoner, r = 3, 9 cm 16 mikrofoner, r = 15, 5 cm 1000 Hz 121◦ 30◦ 2500 Hz 46◦ 14◦ 4000 Hz 29◦ 9◦ Tabel 9.2: Mainlobe-bredder for cirkulære arrays med ´en cirkel og hhv. 8 mikrofoner (r = 3, 9 cm) og 16 mikrofoner (r = 15, 5 cm). Lydkilde er placeret i 0◦ . Det undersøges, hvordan array’ets beampatterns bliver, n˚ ar der anvendes 16 mikrofoner i to cirkler. Figur 9.8 og 9.9 viser simulerede og m˚ alte beampatterns for s˚ adanne arrays, hvor den yderste cirkel har en radius p˚ a henholdsvis r = 15, 5 cm og r = 7, 8 cm. Kilden befinder sig i begge tilfælde i 0◦ . 67 Undersøgelse af array’ets beampattern og følsomhed (a) Simuleret. (b) M˚ alt i lyddødt rum. Figur 9.8: Beampatterns for cirkulært array med 16 mikrofoner i to cirkler og radius r = 15, 5 cm. Kilden er placeret i 0◦ og udsender hvid støj. (a) Simuleret. (b) M˚ alt i lyddødt rum. Figur 9.9: Beampatterns for cirkulært array med 16 mikrofoner i to cirkler og radius r = 7, 8 cm. Kilden er placeret i 0◦ og udsender hvid støj. Ved sammenligning af figur 9.8 og 9.9 ses det, at begge arrays lokaliserer kilden med maksimale sidelobe-niveauer p˚ a 0,25. Array’et med radius p˚ a r = 15, 5 cm har de smalleste mainlobes, men har til gengæld flere sidelobes ved 4000 Hz end array’et med radius r = 7, 8 cm. Det ser ud til, at mainlobe-bredden er afhængig af array’ets radius, og den bliver smallere, n˚ ar radius øges. Det m˚ a i det enkelte praktiske tilfælde være et kompromis mellem mainlobebredde og samlet array-størrelse. F.eks. har array’et en passende lille radius p˚ a r = 7, 8 cm til ◦ et konferencesystem og samtidig en mainlobe-bredde p˚ a 31 ved 2500 Hz. De 16 mikrofoner kan ogs˚ a fordeles i fire cirkler, og beampatterns for dette er vist p˚ a figur 9.8. Her har den yderste cirkel en radius p˚ a r = 15, 5 cm, og kilden befinder sig stadig i 0◦ . 68 Undersøgelse af array’ets beampattern og følsomhed (a) Simuleret. (b) M˚ alt i lyddødt rum. Figur 9.10: Beampatterns for cirkulært array med 16 mikrofoner i fire cirkler og radius r = 15, 5 cm. Kilden er placeret i 0◦ og udsender hvid støj. Der opst˚ ar sidelobes ved 4000 Hz i 180◦ -retningen, ligesom ved ´en cirkel, med et niveau p˚ a 0,25, mens de sidelobes, der eksisterede for det cirkulære array med to cirkler, er elimineret. Array’et giver, ligesom tidligere, smalle mainlobes (43◦ , 19◦ , 13◦ ), og sammenlignet med figur 9.8 er der ikke nævneværdige ændringer ved at benytte fire cirkler frem for to, n˚ ar radius fastholdes. Det er ikke de samme sidelobes, der optræder for de to arrays, men størrelserne af dem er næsten ens ligesom størrelserne af mainlobe-bredderne. Cirkulære arrays med 24 og 32 mikrofoner i fire cirkler med radius r = 15, 5 cm er ogs˚ a undersøgt, og det viser sig at give ens resultater. Beampatterns for array’et med 24 mikrofoner ses p˚ a figur 9.11, og kildens position er uændret. (a) Simuleret. (b) M˚ alt i lyddødt rum. Figur 9.11: Beampatterns for cirkulært array med 24 mikrofoner i fire cirkler og radius r = 15, 5 cm. Kilden er placeret i 0◦ og udsender hvid støj. 69 Undersøgelse af array’ets beampattern og følsomhed I forhold til array’et med 16 mikrofoner er der ikke nævneværdige fordele ved at bruge 24 mikrofoner. De sm˚ a sidelobes i 180◦ -retningen, der optr˚ adte for 16 mikrofoner, forsvinder her, men lokaliseringsnøjagtighederne er ens. Det ses derfor ikke, at det er nødvendigt at tilføre de ekstra 8 mikrofoner. 9.2.1 Effekten af mikrofonantal og array-radius Med udgangspunkt i et array best˚ aende af ´en cirkel undersøges det, hvordan mainlobe-bredden og størrelsen af sidelobes afhænger af antal mikrofoner samt array’ets radius. Størrelsen p˚ a et sidelobe kaldes her for et sidelobe-niveau, og et sidelobe-niveau p˚ a 1 betyder, at det er lige s˚ a stort som mainlobet. Figur 9.12 viser mainlobe-bredde og sidelobe-niveau for enkelte cirkler med radius r = 3, 9 cm, r = 7, 8 cm, r = 11, 7 cm og r = 15, 5 cm. Antallet af mikrofoner i den enkelte cirkel varieres fra 4 til 18. (a) Mainlobe-bredde for 1000 Hz. (b) Sidelobe-niveau for 1000 Hz. (c) Mainlobe-bredde for 2500 Hz. (d) Sidelobe-niveau for 2500 Hz. (e) Mainlobe-bredde for 4000 Hz. (f ) Sidelobe-niveau for 4000 Hz. Figur 9.12: Mainlobe-bredde og sidelobe-niveau som funktion af antal mikrofoner. M˚ alingerne er foretaget for fire forskellige cirkler med radius r = 3, 9 cm, r = 7, 8 cm, r = 11, 7 cm og r = 15, 5 cm. Ud fra de ovenst˚ aende figurer ser det ud til, at mainlobe-bredden ikke afhænger af antallet af mikrofoner, men af array’ets radius, som det er set p˚ a tidligere beampatterns. N˚ ar array’ets radius øges, mindskes mainlobe-bredden, hvilket er forventeligt, da en større radius giver større afstand mellem mikrofonerne og dermed ogs˚ a en større faseforskel mellem indbyrdes mikrofoner. En interessant observation er, at arrays, der har stor lokaliseringsnøjagtighed (f.eks. r = 15, 5 cm), har store sidelobe-niveauer. Der er tegn p˚ a, at disse to parametre er afhængige. S˚ aledes er udviklingen af et array typisk et kompromis mellem lokaliseringsnøjagtighed og eliminering af fejlestimeringer af lydkildens retning. Sidelobe-niveauerne mindskes, n˚ ar der anvendes flere mikrofoner. Generelt forekommer der store sidelobes, n˚ ar færre end ti mikrofoner anvendes, og generelt er de mindst ved 1000 Hz. Da bølgelængden ved 1000 Hz er længere end ved 2500 Hz og 4000 Hz er array’et mindre 70 Undersøgelse af array’ets beampattern og følsomhed følsomt over for sm˚ a ændringer i mikrofonernes placering, og der opst˚ ar færre og mindre sidelobes ved 1000 Hz (jf. afsnit 7.6.1). Ved højere frekvenser er array’et derfor mere afhængigt af nogle bestemte afstande mellem mikrofonerne for at mindske sidelobes. Ved lavere frekvenser har den indbyrdes mikrofonafstand ikke helt s˚ a stor betydning, og her er det nærmere hele array-størrelsen, der har betydning. 9.3 Effekten af kildens afstand og retning i forhold til array’et Figur 9.13 viser beampatterns for et rektangulært 1×4 array med en indbyrdes mikrofonafstand p˚ a 3,9 cm. Her er kilden placeret 26 cm fra drejebordets centrum (se figur 8.1) ved vinkel 0◦ . I simuleringen er kilden placeret 17 cm over array’et, da dette svarer til en gennemsnitlig højde for de to enheder i højtaleren. Figur 9.13b viser en voldsom opsplitning af mainlobet ved 4000 Hz, og det ses, at den er væsentligt større i praksis end i simuleringen p˚ a figur 9.13a. Denne større opsplitning, der forekommer i praksis, kan skyldes, at kilden ikke er en punktkilde. Det er en højtaler, der har en bas/mellemtone-enhed og en diskantenhed, hvor diskanten sidder 14 cm højere end bassen/mellemtonen. Der gøres opmærksom p˚ a, at højtalerens (Dali 2A)crossover -frekvens er 3000 Hz, hvilket betyder at 4000 Hz-signalet primært udstr˚ ales fra ˚ diskantenheden. Arsagen til opsplitningen, som ogs˚ a forekommer i simuleringen, kan være, at der kun tages højde for retninger i array’ets plan (xy-planen), n˚ ar der laves beamforming. Der ses ikke i retning af z-aksen, og beamformeren kan derfor ikke h˚ andtere en s˚ a stor højdeforskel, som forekommer, n˚ ar højtaleren er 26 cm fra drejebordets centrum. Figur 9.14 viser beampatterns for et tilsvarende 1×4 array, hvor kilden er rykket 50 cm længere væk og nu er placeret 76 cm fra drejebordets centrum. (a) Simuleret. (b) M˚ alt i lyddødt rum. Figur 9.13: Beampatterns for 1×4 array med indbyrdes mikrofonafstand p˚ a 3,9 cm. Kilden er placeret 26 cm fra drejebordets centrum ved vinkel 0◦ og udsender hvid støj. Figur 9.14b viser en mindre opsplitning ved den praktiske m˚ aling for 4000 Hz end ved den forrige m˚ aling, hvor kildens afstand til drejebordets centrum var 26 cm. Den tilsvarende simulering viser ikke nogen opsplitning, og det antages at være højdeforskellen mellem den simulerede kildeposition og den praktiske diskantenheds position, der for˚ arsager denne forskel. 71 Undersøgelse af array’ets beampattern og følsomhed (a) Simuleret. (b) M˚ alt i lyddødt rum. Figur 9.14: Beampatterns for 1×4 array med indbyrdes mikrofonafstand p˚ a 3,9 cm. Kilden er placeret 76 cm fra drejebordets centrum ved vinkel 0◦ og udsender hvid støj. Hvis kilden flyttes yderligere 50 cm væk fra drejebordets centrum, s˚ a afstanden nu er 1,26 m, opst˚ ar der en meget lille opsplitning ved 4000 Hz i den praktiske m˚ aling. Fuldstændigt samme beampattern opn˚ as ved en afstand p˚ a 1,76 m, og ved 2,26 m er opsplitningen helt væk, og de praktiske m˚ alinger ligner næsten til forveksling de simulerede beampatterns. De simulerede beampatterns for afstandene mellem 0,76 m og 2,26 m er helt identiske og ser ud som p˚ a figur 9.14a. Kilden flyttes, s˚ a den st˚ ar i 250◦ , og der foretages m˚ alinger og simuleringer for de samme afstande mellem 0,26 m og 2,26 m som ovenfor. N˚ ar kilden st˚ ar i denne vinkel har afstanden ingen indflydelse p˚ a array’ets beampattern, og alle beampatterns er magen til hinanden ved disse m˚ alinger. Disse beampatterns udviser alle samme mønster som p˚ a figur 9.3, hvor der optræder spøgelseskilder, men der er ingen nævneværdig forskel p˚ a m˚ alingerne. Dette er bemærkelsesværdigt og kan undersøges nærmere i fremtidige studier. Det undersøges ogs˚ a, om array’ets beampattern er afhængigt af udbredelsesretningen for kildesignalet. I undersøgelsen drejes højtaleren væk fra array’et i forskellige retninger. Disse m˚ alinger sammenlignes med en tidligere m˚ aling, hvor højtaleren vendte mod array’et, som det har været tilfældet ved alle andre m˚ alinger. Figur 9.15 viser beampatterns for et cirkulært array med 12 mikrofoner i tre cirkler, hvor radius er r = 12, 4 cm, og højtaleren er placeret i 0◦ . P˚ a figuren vises m˚ alinger, hvor kilden vender ind mod array’et, hvor den er drejet 90◦ væk fra array’et, og hvor den er drejet 180◦ væk fra array’et. 72 Undersøgelse af array’ets beampattern og følsomhed (a) Kilden vender ind mod array’et. (b) Kilden er drejet 90◦ væk fra array’et. (c) Kilden er drejet 180◦ væk fra array’et og vender ind mod væggen i det lyddøde rum. (d) Kilden er drejet 180◦ væk fra array’et og vender ind mod væggen i det lyddøde rum. Figur 9.15: Beampatterns for cirkulært array med 12 mikrofoner i tre cirkler og radius r = 12, 4 cm. Kilden er placeret i 0◦ og udsender hvid støj, og m˚ alingerne er foretaget i lyddødt rum. Ved at sammenligne figurerne 9.15b, 9.15c og 9.15d med figur 9.15a, hvor kilden er vendt mod array’et, ses det samme overordnede mønster, og array’et er stadig i stand til at lokalisere kilden, selvom lyden ikke udstr˚ aler direkte mod array’et13 . P˚ a figur 9.15b lokaliseres kilden til ◦ at være i 8 . Dette stemmer godt overens med den praktiske m˚ aling, da højtalerens membran ◦ ikke var ud for 0 efter højtaleren var drejet, men nærmere ved de 8◦ , se figur 9.16. 13 Der er i praksis et lille direkte lydfelt, eftersom højtalerens kabinet ikke er fuldstændigt akustisk tæt 73 Undersøgelse af array’ets beampattern og følsomhed Figur 9.16: Illustration af forsøgsopstilling, hvor højtaleren er drejet 90◦ væk fra array’et p˚ a drejebordet. Figurerne 9.15c og 9.15d viser to m˚ alinger, hvor højtaleren er drejet 180◦ og vender ind mod væggen i det lyddøde rum. Her er kilden lokaliseret til at befinde sig omkring 0◦ , men der opst˚ ar større sidelobes ved 2500 Hz og 4000 Hz i forhold til m˚ alingen p˚ a figur 9.15a. Dette kan skyldes, at mikrofonsignalerne er væsentligt svagere end ved de tidligere m˚ alinger, hvor mikrofonerne har modtaget de direkte signaler fra kilden, og array’et er dermed mere følsomt over for støj og refleksioner fra omgivelserne. N˚ ar det direkte lydfelt dæmpes, som i dette tilfælde, tydeliggør det de mindre usikkerheder, der eksisterer i og omkring systemet. Det kan konkluderes, at udbredelsesretningen for kildesignalet ikke har en væsentlig betydning for systemets evne til at lokalisere af kilden. 9.4 Robusthed over for refleksioner Indtil nu har de praktiske m˚ alinger af array’ets beampatterns ikke været p˚ avirket af refleksioner, da m˚ alingerne er foreg˚ aet i et lyddødt rum. Derfor er det nu interessant at undersøge, om systemet er i stand til at lokalisere kilden, hvis der indføres en reflekterende plade, som kan repræsentere en væg. Til dette form˚ al anvendes en finerplade, der m˚ aler 98 cm × 122 cm, og den har derfor samme bredde som bordpladen. Den anvendes p˚ a to forskellige positioner, som er placeret 23,5 cm og 64,5 cm fra drejebordets centrum, se figur 9.17, hvor pladen st˚ ar vinkelret p˚ a kildesignalets indfaldsvinkel. Figur 9.17: Illustration af forsøgsopstilling med en reflekterende finerplade p˚ a to forskellige positioner, som er vinkelrette p˚ a kildesignalets indfaldsvinkel. Figur 9.18a viser beampatterns for et 1×4 array med indbyrdes mikrofonafstand p˚ a 3,9 ◦ cm, kilden er placeret i 0 , og m˚ alingen er foretaget uden finerpladen. Figur 9.18b og 9.18c viser tilsvarende m˚ alinger, hvor finerpladen er indført hhv. 64,5 cm og 23,5 cm fra drejebordets centrum, og pladen st˚ ar i 180◦ , som det er vist p˚ a figuren ovenfor. 74 Undersøgelse af array’ets beampattern og følsomhed (a) M˚ alt i lyddødt rum uden reflekterende plade. (b) M˚ alt i lyddødt rum. En reflekterende plade er placeret i retning 180◦ vinkelret p˚ a kildesignalets indfaldsvinkel med en afstand p˚ a 64,5 cm til drejebordets centrum. (c) M˚ alt i lyddødt rum. En reflekterende plade er placeret i retning 180◦ vinkelret p˚ a kildesignalets indfaldsvinkel med en afstand p˚ a 23,5 cm til drejebordets centrum. Figur 9.18: Beampatterns for 1×4 array med indbyrdes mikrofonafstand p˚ a 3,9 cm. Kilden er placeret i 0◦ og udsender hvid støj. P˚ a figur 9.18b ses et større sidelobe i 180◦ -retningen ved 2500 Hz (niveau p˚ a 0,25) i forhold til figur 9.18a. Ved 4000 Hz ses en opsplitning af mainlobet, mens sidelobet i 180◦ -retningen mindskes (fra 0,6 til 0,2), og der opst˚ ar sidelobes i andre retninger. Opsplitningen kan evt. skyldes destruktiv interferens mellem det reflekterede signal fra finerpladen og kildesignalet. P˚ a figur 9.18c er finerpladen rykket tættere p˚ a array’et (23,5 cm afstand fra drejebordets centrum), og det kan ogs˚ a ses p˚ a de resulterende beampatterns. Her fejlestimerer array’et lydkildens retning ved 1000 Hz til 90◦ eller 270◦ . M˚ alingen for 2500 Hz har f˚ aet et endnu større sidelobe i 180◦ -retningen (niveau p˚ a 0,8). Ved 4000 Hz er det, der var et 180◦ sidelobe, nu blevet til mainlobet, og beamformeren kan ikke skelne mellem kilden selv og refleksionerne fra finerpladen. Kort sagt har beamformeren store vanskeligheder med at lokalisere kilden fejlfrit, n˚ ar der indføres reflekterende overflader. I de næste m˚ alinger er kilden flyttet til 315◦ . Figur 9.19b viser beampatterns, hvor finerpladen er 64,5 cm fra drejebordets centrum i 180◦ -retningen, mens den er placeret 23,5 cm fra drejebordets centrum i samme retning p˚ a figur 9.19c. 75 Undersøgelse af array’ets beampattern og følsomhed (a) Simuleret uden refleksioner. (b) M˚ alt i lyddødt rum. En reflekterende plade er placeret i 180◦ med en afstand p˚ a 64,5 cm til drejebordets centrum. (c) M˚ alt i lyddødt rum. En reflekterende plade er placeret i 180◦ med en afstand p˚ a 23,5 cm til drejebordets centrum. Figur 9.19: Beampatterns for 1×4 array med indbyrdes mikrofonafstand p˚ a 3,9 cm. Kilden er placeret i 315◦ og udsender hvid støj. Figur 9.19a viser en simulering af det anvendte array, men uden at tage højde for refleksioner. Her ses en spøgelseskilde i 45◦ , hvilket skyldes, at array’et best˚ ar af en enkelt række mikrofoner, som det er beskrevet i afsnit 9.1. Med finerpladen placeret 64,5 cm fra drejebordets centrum, er array’ets beampattern præget af stor usikkerhed og tilfældighed. Dette forværres kun, n˚ ar finerpladen placeres tættere (23,5 cm) p˚ a array’et, som det forventes fra figur 9.18. Se resultaterne p˚ a hhv. figur 9.19b og 9.19c. Det undersøges nu, om der sker nogle betydelige refleksioner, hvis kildesignalet tilnærmelsesvis udbredes parallelt med den reflekterende plade. Af geometriske ˚ arsaer forventes det, at refleksioner nu vil spille en mindre rolle end tidligere forsøg. Kilden er placeret i 77◦ . Figur 9.20 viser beampatterns for denne situation, og figur 9.20a viser simulerede beampatterns for denne opstilling uden den reflekterende plade. 76 Undersøgelse af array’ets beampattern og følsomhed (a) Simuleret uden refleksioner. (b) M˚ alt i lyddødt rum. En reflekterende plade er placeret i 180◦ med en afstand p˚ a 64,5 cm til drejebordets centrum. (c) M˚ alt i lyddødt rum. En reflekterende plade er placeret i 180◦ med en afstand p˚ a 23,5 cm til drejebordets centrum. Figur 9.20: Beampatterns for 1×4 array med indbyrdes mikrofonafstand p˚ a 3,9 cm. Kilden er placeret i 77◦ og udsender hvid støj. Generelt opfører array’et sig p˚ a samme m˚ ade p˚ a figur 9.20b og 9.20c set i forhold til de simulerede beampatterns p˚ a figur 9.20a. Der optræder synlige effekter af den reflekterende finerplade, men som forventet har den reflekterende plade den mindste indflydelse p˚ a array’ets beampatterns, n˚ ar kildesignalet næsten spilles parallelt med pladen, og den største indflydelse n˚ ar det spilles vinkelret ind p˚ a pladen. 9.5 Undersøgelse af lavfrekvent respons Indtil nu har alle undersøgelser af beampatterns fokuseret p˚ a frekvensomr˚ adet 1000 Hz - 4000 Hz, da dette er et vigtigt omr˚ ade for taleforst˚ aelsen jf. kapitel 5. I afsnittet fremg˚ ar det dog, at frekvenser ned til 300 Hz er relevante for vokaldannelsen, og et lavere frekvensomr˚ ade vil derfor blive undersøgt. Det cirkulære array med 16 mikrofoner, fordelt i fire cirkler og radius r = 15, 5 cm, undersøges i frekvensomr˚ adet 300 Hz - 1000 Hz. Beampatterns for dette array vises p˚ a figur 9.21, hvor kilden er placeret i 0◦ . 77 Undersøgelse af array’ets beampattern og følsomhed (a) Simuleret. (b) M˚ alt i lyddødt rum. Figur 9.21: Beampatterns for cirkulært array med 16 mikrofoner i fire cirkler og radius r = 15, 5 cm. Kilden er placeret i 0◦ og udsender hvid støj. Ogs˚ a her er de m˚ alte og simulerede beampatterns næsten identiske, og som forventet bliver mainlobet for henholdsvis 500 Hz og 300 Hz bredere end ved 1000 Hz, se tabel 9.3. Cirkulært array 16 mikrofoner, fire cirkler, r = 15, 5 cm 1000 Hz 2500 Hz 4000 Hz 150◦ 85◦ 43◦ Tabel 9.3: Mainlobe-bredde for cirkulært array med 16 mikrofoner i fire cirkler, r = 15, 5 cm. Ved 300 Hz er array’ets beampattern dog ikke opdelt i et mainlobe og sidelobes, men er mere omnidirektionelt. Det lokaliserer stadig kilden til at være i 0◦ , som ved de andre frekvenser, da det største udsving findes i den retning. Hvis det er vigtigt at f˚ a lokaliseret de lave frekvenser ved f.eks. 300 Hz mere præcist, skal et andet array benyttes - evt. et array med større radius. 9.6 Undersøgelse af array’ets beampattern i mødelokale Indtil nu er alle praktiske m˚ alinger og undersøgelser foreg˚ aet i et lyddødt rum, og mikrofonarray’ets beampattern vil nu blive undersøgt i et lokale, der kan repræsentere et mødelokale. I et mødelokale kan der opst˚ a refleksioner og diffraktioner, som ikke forekommer i et lyddødt rum, og disse fænomener kan p˚ avirke array’ets beampattern. Lokalet, der anvendes til disse m˚ alinger, er et klasselokale med dimensionerne 11,85 m × 7,5 m × 3,43 m. Rummets efterklangstid fremg˚ ar af figur 9.22. 78 Undersøgelse af array’ets beampattern og følsomhed Figur 9.22: M˚ alt efterklangstid for klasselokale p˚ a Teknisk Fakultet, SDU. Venligst l˚ ant af Peter Møller Juhl. I lokalet er der inventar som træborde og -stole, og ´en væg er delvist dækket af kridttavler. Den modsatte væg er næsten fyldt med vinduer, og de resterende to vægge best˚ ar delvist af lydabsorberende materiale, hvis akustiske egenskaber er ukendte. Et rektangulært og et cirkulært array er blevet testet, og der er blevet ændret p˚ a kildens retning. Til alle m˚ alinger i klasselokalet anvendes hvid støj som kildesignal. Figur 9.23 viser simulerede og m˚ alte beampatterns for et 1×4 array med indbyrdes mikrofonafstand p˚ a 3,9 cm, og figur 9.24 viser beampatterns for et cirkulært array med 24 mikrofoner fordelt i fire cirkler, hvor array’et radius er r = 15, 5 cm. I begge tilfælde er kilden placeret i 120◦ . (a) Simuleret. (b) M˚ alt i klasselokale. Figur 9.23: Beampatterns for 1×4 array med indbyrdes mikrofonafstand p˚ a 3,9 cm. Kilden er placeret i 120◦ og udsender hvid støj. 79 Undersøgelse af array’ets beampattern og følsomhed (a) Simuleret. (b) M˚ alt i klasselokale. Figur 9.24: Beampatterns for cirkulært array med 24 mikrofoner i fire cirkler og radius r = 15, 5 cm. Kilden er placeret i 120◦ og udsender hvid støj. For begge arrays ses det tydeligt, at det ikke har haft nogen nævneværdig negativ indflydelse at forlade det lyddøde rum. Der opst˚ ar sm˚ a sidelobes (niveau p˚ a 0,2) for det rektangulære array ved 4000 Hz. Ved de to forrige m˚ alinger er kilden drejet, s˚ a den udsender lyd direkte mod array’et. I det lyddøde rum ses det, at det ikke har nogen betydning, hvis kilden vendes væk fra array’et. Det undersøges, om dette ogs˚ a gælder i klasselokalet. Det forventes, at rummets efterklangsegenskaber vil inducere større og flere fejlestimeringer i array’ets beampattern. Det rektangulære 1×4 array er blevet testet under disse omstændigheder ved at kilden er drejet, s˚ a den udsender lyden henholdsvis 90◦ og 180◦ væk fra array’et, hvilket kan ses p˚ a ◦ figur 9.25. Figur 9.25c viser beampatterns, n˚ ar kilden er drejet 90 i forhold til array’et og peger op mod loftet. 80 Undersøgelse af array’ets beampattern og følsomhed (a) Kilde er drejet 90◦ væk fra array’et. (b) Kilde er drejet 180◦ væk fra array’et. (c) Kilde er drejet 90◦ væk fra array’et og peger op mod loftet. Figur 9.25: Beampatterns for 1×4 array med indbyrdes mikrofonafstand p˚ a 3,9 cm. Kilden er placeret i 120◦ og udsender hvid støj. M˚ alingerne er foretaget i et klasselokale. N˚ ar kilden drejes væk fra array’et har det svært ved at lokalisere kilden ved alle undersøgte frekvenser. Det kan skyldes, at array’et nu ikke modtager meget af kildens direkte lyd, men nærmere en masse korrelerede refleksioner, der kan ankomme fra vidt forskellige retninger. I afsnit 9.4 kunne det konkluderes, at refleksioner har stor indflydelse p˚ a array’ets evne til at lokalisere kilden, hvilket understreges af figur 9.25a og 9.25b. N˚ ar kilden peger direkte mod array’et vil der ogs˚ a opst˚ a refleksioner i lokalet, men styrken af disse refleksioner vil være væsentligt mindre end lydstyrken fra kildens direkte signal. Array’et beampattern p˚ a figur 9.25c udviser en korrekt AOAE for 2500 Hz og 4000 Hz, mens resultatet for 1000 Hz fejlestimerer kildens retning. Det viser sig at være bedre for array’ets lokaliseringsevne, at kilden peger op mod loftet frem for hen mod vægge eller vinduer. Forklaringen kan ligge i den akustiske dæmpning, der er højere for loftmaterialet end for de resterende overflader i rummet. Dette er imidlertid ikke væsentligt for konferenceapplikationen. Det undersøges ogs˚ a, om det cirkulære array generes af, at kilden drejes, og figur 9.26 viser dets beampatterns, n˚ ar kilden peger 180◦ væk fra array’et. 81 Undersøgelse af array’ets beampattern og følsomhed Figur 9.26: Beampatterns for cirkulært array med 24 mikrofoner i fire cirkler og radius r = 15, 5 cm. Kilden er placeret i 120◦ og er drejet 180◦ væk fra array’et, og den udsender hvid støj. M˚ alingerne er foretaget i et klasselokale. Ved 2500 Hz lokaliseres kilden næsten korrekt, men ved 1000 Hz og 4000 Hz fejlestimerer array’et lydkildens retning. Det cirkulære array kommer alts˚ a i lige s˚ a store problemer som det rektangulære array, n˚ ar der opst˚ ar refleksioner med en styrke, der er sammenlignelig med kildens direkte signal. 9.7 Undersøgelse af array’ets følsomhed Indtil nu har m˚ alet været at lokalisere en lydkilde s˚ a nøjagtigt som muligt. N˚ ar dette er fuldført er det relevant at undersøge, hvor følsomt array’et er i forskellige retninger, n˚ ar ´en styringsretning fastholdes. Indtil nu er der blevet styret i 360 forskellige retninger for at lokalisere kilden. Ved at fastholde ´en retning, tilføres der kun komplekse faser for netop den retning til hvert af mikrofonsignalerne. Det forventes derfor, at lyd, der kommer fra styringsretningen, vil blive forstærket, mens lyd fra andre retninger vil blive undertrykt. For at teste array’ets følsomhed foretages m˚ alinger, hvor kilden er placeret i styringsretningen, og hvor den er placeret i en retning forskellig fra styringsretningen. Amplituden af output-signalet fra beamformeren sammenlignes med amplituden af et mikrofonsignal. For at gøre denne sammenligning nemmere er output-signalerne normerede ift. de ubehandlede mikrofonsignaler. Figur 9.27 viser et normeret mikrofonsignal i frekvensdomænet for ´en af mikrofonerne i et 1×4 array med en indbyrdes mikrofonafstand p˚ a 3,9 cm. Kildesignalet er en tone p˚ a 2500 Hz. Figur 9.27: Mikrofonsignal i frekvensdomænet for ´en mikrofon i et 1×4 array med en indbyrdes mikrofonafstand p˚ a 3,9 cm. Signalet er normeret i forhold til maksimalt mikrofonsignal, og kildesignalet er en tone med frekvensen 2500 Hz. Figur 9.28 viser beamformerens output-signal, og ved denne m˚ aling er kilden placeret i styringsretningen (0◦ ), hvor det forventes, at signalet forstærkes. 82 Undersøgelse af array’ets beampattern og følsomhed Figur 9.28: Beamformerens output-signal i frekvensdomænet for et 1×4 array med en indbyrdes mikrofonafstand p˚ a 3,9 cm. Signalet er normeret i forhold til maksimalt mikrofonsignal. Kilden er placeret i styringsretningen, som her er 0◦ , og den udsender en tone med frekvensen 2500 Hz. Ved at sammenligne de to figurer ovenfor ses det, at signalet forstærkes ca. med en faktor 4 (fra 0,7 til 2,7). N˚ ar kilden flyttes fra styringsretningen, forventes det, at output-signalets amplitude bliver mindre, da de tilførte faser til hvert enkelt mikrofonsignal sandsynligvis ikke passer med det modtagne signal fra kilden. Figur 9.29 viser output-signalet, n˚ ar kilden er placeret 90◦ forskudt i forhold til styringsretningen. Figur 9.29: Beamformerens output-signal i frekvensdomænet for et 1×4 array med en indbyrdes mikrofonafstand p˚ a 3,9 cm. Signalet er normeret i forhold til maksimalt mikrofonsignal. Kilden er placeret 90◦ forskudt i forhold til styringsretningen, og den udsender en tone med frekvensen 2500 Hz. Her ses det, at beamformerens output-signal dæmpes ca. med en faktor 4, og array’et undertrykker dermed en væsentlig mængde af lyden fra den retning. Kilden forskydes nu 180◦ i forhold til styringsretningen, og beamformerens output-signal kan ses p˚ a figur 9.30. Figur 9.30: Beamformerens output-signal i frekvensdomænet for et 1×4 array med en indbyrdes mikrofonafstand p˚ a 3,9 cm. Signalet er normeret i forhold til maksimalt mikrofonsignal. Kilden er placeret 180◦ forskudt i forhold til styringsretningen, og den udsender en tone med frekvensen 2500 Hz. I denne retning er kildesignalet dæmpet fra 0,7 til 0,5, og amplituden er sammenlignelig med de modtagne mikrofonsignaler. Amplituden for denne retning er imidlertid over 5 gange 83 Undersøgelse af array’ets beampattern og følsomhed mindre end, n˚ ar kilden er placeret i styringsretningen, hvilket klart viser, at følsomheden er størst i styringsretningen. Resultaterne for de relative forstærkninger er opsummeret i tabel 9.4. Lignende fænomener ses for et cirkulært array med 16 mikrofoner fordelt i fire cirkler og en radius p˚ a r = 15, 5 cm. Der forekommer størst forstærkning, n˚ ar kilden befinder sig i styringsretningen, og væsentligt mindre forstærkning, n˚ ar kilden befinder sig i andre retninger. Resultaterne for de relative forstærkninger for dette array ses ligeledes i tabel 9.4. Array Rektangulært 1×4 array, indbyrdes mikrofonafstand 3,9 cm Cirkulært array, 16 mikrofoner, fire cirkler, r = 15, 5 cm Kildeposition 0◦ 90◦ 180◦ 4 0,25 0,7 13,5 0,95 5,5 Tabel 9.4: Forstærkning af mikrofonsignaler ved forskellige kildepositioner. Styringsretningen er 0◦ . Resultater ses for et rektangulært 1×4 array med indbyrdes mikrofonafstand p˚ a 3,9 cm og for et cirkulært array med 16 mikrofoner i fire cirkler og radius r = 15, 5 cm. Forskellen p˚ a forstærkningsniveauerne for det rektangulære og det cirkulære array skyldes antallet af mikrofoner, der anvendes. I det cirkulære array anvendes 4 gange flere mikrofoner end i det rektangulære, og der er derfor flere mikrofonsignaler, der kan skabe konstruktiv interferens. Dette giver i sidste ende en højere amplitude i output-signalet. Følsomhed for flere arrays og for flere forskellige retninger kan evt. undersøges i fremtidigt arbejde. 9.8 Delkonklusion Rektangulære og cirkulære array-geometrier er blevet undersøgt med henblik p˚ a at vurdere deres evne til at lokalisere en lydkilde i form af et beampattern. Der er benyttet to typer rektangulære arrays; et 1×4 array og et 2×4 array, og forskellige cirkulære arrays er blevet testet. Her er der b˚ ade ændret p˚ a antallet af mikrofoner, antallet af cirkler og cirklernes radier. Generelt ligner alle m˚ alte beampatterns til forveksling de simulerede beampatterns, s˚ a længe der ikke forekommer refleksioner eller højdeforskelle mellem kilden og array’et, som simuleringen ikke tager højde for. N˚ ar kildesignalet spilles vinkelret ind p˚ a mikrofonaksen af 1×4 array’et opst˚ ar der spøgelseskilder, som betyder, at array’et ikke kan skelne mellem de to sider af mikrofonrækken. Ved at indføre en mikrofonrække mere ses det p˚ a 2×4 array’et, at nogle af spøgelseskilderne kan elimineres. De cirkulære arrays er blevet undersøgt med b˚ ade ´en og flere koncentriske cirkler, og der opn˚ as smallere mainlobes, n˚ ar array’ets radius øges. Antallet af mikrofoner ikke har betydning for mainlobet. Størrelsen p˚ a sidelobes afhænger derimod mere af antallet af mikrofoner og deres indbyrdes placering og ikke nødvendigvis af radius. Generelt bliver sidelobes mindre, n˚ ar der anvendes flere mikrofoner i en enkelt cirkel. Hvis der tilføjes flere cirkler sker der ikke nogle væsentlige ændringer, s˚ a længe radius fastholdes. Ved m˚ alinger foretaget i lyddødt rum sker der ikke nævneværdige ændringer i array’ets beampattern, n˚ ar lydkildens udstr˚ alingsretning ændres. N˚ ar der m˚ ales i et klasselokale, mindskes array’ets lokaliseringsnøjagtighed, da der opst˚ ar refleksioner med sammenlignelige amplituder ift. det direkte signal. Generelt har array’et svært ved at lokalisere kilden, n˚ ar m˚ alingerne foretages i omgivelser, hvor der opst˚ ar refleksioner. Kildens afstand til array’et har betydning for 1×4 array’ets beampattern, n˚ ar kilden er placeret p˚ a samme akse som mikrofonerne. Her sker en opsplitning af mainlobet ved 4000 Hz, 84 Undersøgelse af array’ets beampattern og følsomhed og dette kan skyldes, at kildens diskantenhed er placeret højere end bas-/mellemtone-enheden og højere end kildepositionen, der er angivet i simuleringen. Det giver generelt anledning til fejl (opsplitning af mainlobe), n˚ ar kilden flyttes væk fra array’ets plan, eftersom beamformerens styringsretning er begrænset til denne plan. Array’ets følsomhed over for indfaldende lyd fra forskellige retninger er blevet undersøgt. Dette er gjort ved at fastholde ´en styringsretning, og n˚ ar en lydkilde placeres i styringsretningen, forstærkes beamformerens output-signal pga. konstruktiv interferens mellem de enkelte mikrofonsignaler. N˚ ar lydkilden placeres 90◦ og 180◦ forskudt i forhold til styringsretningen, undertrykker array’et signalet fra kilden. Afhængigt af array’ets geometri bliver beamformerens output-signal enten dæmpet eller forstærket væsentligt mindre end tilfældet med kilden i styringsretningen. 85 Vurdering af resultater og forslag til fremtidigt arbejde 10 Vurdering af resultater og forslag til fremtidigt arbejde Generelt er der meget stor lighed mellem b˚ ade det analytisk udledte, det simulerede og det m˚ alte beampattern for et 1×4 array. Kvantitativt har det analytiske og det simulerede beampattern identiske mainlobe-bredder, sidelobe-niveauer og AOAE, mens det m˚ alte har mindre afvigelser ved høje frekvenser (4 kHz), navnlig en sidelobe-ændring p˚ a ca. 0,1 ift. mainlobe-niveau. I analysen er der kun undersøgt ULAs (linje-arrays), hvorfor cirkulære geometrier ifm. simulering og m˚ aling ikke kan sammenlignes med denne. Cirkulære og øvrige rektangulære (mere end ´en række) geometrier er simuleret og m˚ alt i praksis, og her ses ligeledes meget stor overensstemmelse mellem deres beampatterns. Der opst˚ ar forventelige afvigelser fra simuleringen, n˚ ar beamformingen udføres under ikke-ideelle omstændigheder, dvs. ikke i et lyddødt rum. Det analytiske beampattern er udledt p˚ a baggrund af en række antagelser, heriblandt at mikrofon-array’et befinder sig i lydgiverens fjernfelt, selvom dette ikke altid er tilfældet i hverken simuleringer eller m˚ alinger, hvilket er medvirkende til afvigelser. Dette skyldes ikke nødvendigvis lydkildens bølgeform, som vil være sfærisk i nærfeltet, men snarere de akustiske interferensfænomener, der opst˚ ar tæt p˚ a en dipol eller et array af lydgivere. B˚ ade i simuleringer og m˚ alinger antages lydgiveren at være en monopol, hvilket i praksis er ukorrekt og derfor kan give anledning til omtalte effekter. Beamformeren udregner kun komplekse faser svarende til retninger i array’ets plan. Dvs., n˚ ar der eksisterer en højdeforskel mellem array’et og lydgiveren, tillægges opsamlede mikrofonsignaler en fejlbehæftet fase, og s˚ aledes f˚ as et fejlbehæftet beampattern. For at tage hensyn til en s˚ adan højdeforskel kan beamformeren optimeres, s˚ a den kan styres i samtlige polære koordinater (3D). I tilknytning hertil kan det ogs˚ a være af interesse at undersøge tredimensionelle arrays, f.eks. sfæriske eller kubiske. Ifm. med praktiske m˚ alinger, hvor der er menneskelig indblanding, er der hæftet en række usikkerheder, herunder f.eks. placering af mikrofoner, konstruktion af drejebordet, rotation af drejebordet under m˚ alinger og tilstedeværelsen af forsøgsdeltagere under m˚ alinger. Udover disse skal ogs˚ a indtænkes eventuelle fejl i de anvendte komponenter, f.eks. mikrofoner og USB-modulet. Hvad ang˚ ar selve repræsentationen af arrays med et stort antal mikrofoner, anvendes de samme fire mikrofoner flere gange i løbet af ´en m˚ aling. Dette indfører kun fire forskellige fasefejl i beamformeren, mens et virkeligt array vil have lige s˚ a mange fasefejl, som der er mikrofoner. At der kun eksisterer op til fire forskellige fasefejl i det m˚ alte beampattern, svarer ikke nødvendigvis til at have det faktiske antal selvstændige mikrofoner, og den skadelige effekt af fasefejl kan s˚ aledes være anderledes. I praksis vil der f.eks. med 32 mikrofoner være op til 32 forskellige fasefejl, men til gengæld er alle mikrofoner placeret med minimal usikkerhed. I m˚ alingerne foretaget med drejebord eksisterer der kun op til fire fasefejl, men til gengæld er der usikkerhed forbundet med hver eneste rotation og dermed med hver eneste mikrofons position. Hvis teknologien skal implementeres i et konferencesystem, skal beamformingen først og fremmest kunne afvikles i realtid. Denne funktionalitet er ikke undersøgt i dette projekt, og anbefales til fremtidige studier. Konferencesystemet vil ogs˚ a typisk blive placeret i et mødelokale med akustiske egenskaber, der giver anledning til efterklang (refleksioner). Dette betyder, at der skal foreg˚ a signalbehandling inden beamformingen, der kompenserer for disse fænomener, f.eks. ekkoeliminering. Som kvalitetsbedømmelse p˚ a de resulterende beampatterns, er der igennem afhandlingen benyttet størrelser som mainlobe-bredde, sidelobe-niveau, AOAE, SNR, lokaliseringsnøjagtighed og støjreduktion. Der kan evt. i fremtidige studier undersøges alternative kvalitetsparametre s˚ asom speech distortion index, directivity, white noise gain og gratinglobe-niveauer[7]. 86 Konklusion 11 Konklusion I løbet af afhandlingen er det vist, hvorledes akustisk delay-and-sum beamforming kan implementeres i MATLAB til lokalisering af en lydkilde ved brug af forskellige mikrofon-arrays. Beamformerens robusthed overfor støj og refleksioner er undersøgt i b˚ ade lyddødt og ikkelyddødt rum, s˚ avel som ved simulering og i praksis. Det viser sig, at beamformeren har ringere lokaliseringsnøjagtighed n˚ ar den befinder sig i omgivelser med korreleret støj, f.eks. refleksioner, mens ikke-korreleret støj har lav til ingen indflydelse. Mikrofonernes iboende fasefejl er undersøgt i simuleringer, og - som forventet - er indflydelsen størst ved høje frekvenser. Fasefejl kan ogs˚ a introduceres via fejlplaceringer af mikrofonerne i array’et. Sammenhængen mellem et givet arrays lokaliseringsnøjagtighed - ofte omtalt som den m˚ albare parameter mainlobe-bredde - og dets antal af mikrofoner, mikrofonernes indbyrdes afstand, osv. er undersøgt. Simuleringer viser, at lokaliseringsnøjagtigheden i høj grad er afhængig af mikrofonernes indbyrdes position, efter en nærmest eksponentiel sammenhæng, hvor lokaliseringsnøjagtigheden er lav for en lille indbyrdes afstand og stor for en stor indbyrdes afstand - dog med forbehold; ved særligt store afstande optræder ogs˚ a relativt store sidelobes. Overordnet m˚ a det konkluderes, at der er en sammenhæng mellem signalets bølgelængde og den indbyrdes mikrofonafstand mht. mainlobe-bredden. Som forventet er lokaliseringsnøjagtigheden ogs˚ a lavere ved lave frekvenser og højere ved høje frekvenser. I øvrigt er beamformerens tolerance overfor fasefejl og mikrofonplaceringsusikkerheder afhængig af frekvens: med stigende frekvens stiger følsomheden overfor disse. Antallet af mikrofoner har ikke nævneværdig indflydelse p˚ a beamformerens beampattern, bortset fra hvad ang˚ ar sidelobe-niveauer. Med et stigende antal mikrofoner er der generelt tendens til, at det maksimale sidelobe-niveau falder, men ved enkelte mikrofonsepareringer, array-geometrier og frekvenser opst˚ ar der undtagelsesvist store sidelobes. Mainlobe-bredden er dog ofte up˚ avirket, n˚ ar array-størrelsen fastholdes. Blandt de forskellige cirkulære geometrier, der er behandlet i dette projekt, herunder ´encirkel-arrays, flercirkel-arrays, logaritmisk cirkulære arrays, tilfældige arrays og ækvidistant cirkulære arrays, er der ikke fundet tegn p˚ a nævneværdige afvigelser. Ved et konstant antal mikrofoner udviser alle typer cirkulære geometrier tilnærmelsesvist samme beampattern. Tilfældige arrays kan imidlertid have fordelene af en stor b˚ andbredde, men dog med stor usikkerhed fra simulering til simulering pga. genereringen af tilfældige tal. Et linje-array (ULA) er efterstræbelsesværdigt ifm. den analytiske udledning af beampatterns og i visse praktiske m˚ alinger pga. dets simple konstruktion. Dette er dog p˚ a bekostning af et beampattern, der genererer store 180◦ -sidelobes (spøgelseskilder) ved bestemte kildepositioner. Alene ved at indføre flere rækker eller kolonner i array’et, kan spøgelseskilder elimineres. Det mindste realiserbare array af denne type er et 2×2 array. I praksis er betydningen af lydkildens afstand til array’et undersøgt, og den eneste synlige effekt er en opsplitning af mainlobet efterh˚ anden som lydkilden nærmer sig array’et. Dette er højst sandsynligt pga. en højdeforskel mellem array’ets plan og lydgiveren. Dette tages der ikke hensyn til af beamformeren, fordi dens styringsretning udelukkende opererer i array’ets plan. Undersøgelse af følsomhedskarakteristikker for simple arrays p˚ aviser beamformerens evne til at foretage rumlig filtrering. Det er endvidere vist i praksis, at input-signalet forstærkes, n˚ ar lydkilden er placeret i styringsretningen, mens det undertrykkes i andre retninger i større eller mindre grad. 87 Ordforklaring 12 Ordforklaring • Ord Abcisse • • Akustiske billeder Aliasing • • • AOAE Array Array acoustics • • • Array-mønster Array processing algorithms Arrays b˚ andbredde • • Arrays selektivitet At beame • • At sample At stacke • • Beamformer Beamforming • Beampattern • • • Bl.a. BNC-stik Constant beamformer • • • Crossover -frekvens Delay Delay-and-sum • • • • • • • • • Diffraktion Diffuse field Drejebord DSP Etc. Evt. F.eks. FIR filter Flercirkel-array • • Free field Følsomhedskarakteristik • Hhv. Forklaring Betegner normalt et koordinatsystems x-akse eller førsteakse. Virtuelle“ lydkilder, der opst˚ ar ved refleksioner ” Signalforvrængning af frekvenser større end samplingfrekvensen fork., Angle Of Arrival Estimation Geometrisk fordeling af transducere Et disciplin inden for akustik, der beskæftiger sig med akustiske udstr˚ aling eller m˚ aling med flere simultane transducere. Retningskarakteristik for array Array-behandlingsalgoritmer Angiver størrelsen af det frekvensspektrum, hvor array’et er i stand til at lokalisere lydkilden Et m˚ al for lokaliseringsnøjagtigheden for et array At udstr˚ ale med stor retningsbestemthed, f.eks. som en lommelygte At diskretisere et (kontinuert) tidssignal (sampling) At bringe mikrofonsignaler i fase, s˚ a de adderer konstruktivt, se stacking Et system, der laver beamforming Signalbehandlingsprincip til lokalisering og rumlig filtrering af signaler Retningskarakteristik for beamformer med variabel styringsretning fork., Blandt andet Bayonet Neill–Concelman koaksialt kabelstik En beamformer, der søger at opretholde et fladt frekvensspektrum Overgangsfrekvens i et delefilter (crossover network) Forsinkelse Beamforming-metode, der gør brug af tidsforskelle mellem transducere i et array Brydningsfænomen inden for bølgeteori Et mættet lydfelt med uniform akustisk energifordeling Mekanisk anordning, der kan rotere Digital Signal Processing fork., Etcetera fork., Eventuelt fork., For eksempel Finite impulse response filter Cirkulært array best˚ aende af to eller flere koncentriske cirkler Lydfelt uden refleksionsbidrag Retningskarakteristik for beamformer med fastholdt styringsretning (sensitivity) fork., Henholdsvis 88 Ordforklaring • Hvid Gaussisk støj • • • • • • • • • • • • • • • • • • • • • • • • Højtaler-rack Ifm. Ift. Ikke-korrelerede Immanent Inkl. Jf. Klæbemasse Korrelerede Logaritmisk cirkulært array Lokaliseringsnøjagtighed Lyddødt rum Mainlobe MDF Mht. Mind-set Mismatch M.m. Nr. Omnidirektionel Ordinat Pass-by støjlokalisering Pga. Phase-matching • Pressure field • • Pseudotilfældigt Retningskarakteristik • Retningsstyring • Rumlig (spatial) filtrering • • • Rumlig sampling Script Sensitivity • Sidelobe • • • SMB-stik SNR Spøgelseskilde • • • Stacking Systemrespons Transducer • ULA Støjsignal med uniformt energispektrum i frekvensdomænet Række eller søjle af højtalere fork., I forbindelse med fork., I forhold til Ikke sammenhængende signaler Iboende egenskab fork., Inklusiv fork., Jævnfør Elefantsnot“ ” Sammenhængende signaler Cirkulært array med logaritmisk fordelt radial akse Et m˚ al for arrays evne til at lokalisere lydkilde Rum, der tilnærmelsesvis genskaber et free field Den retning, hvor array’et har størst følsomhed Medium-Density Fiberboard fork., Med hensyn til Tilgang, mentalitet N˚ ar styrings- og kilderetning er forskellige fork., Med mere fork., Nummer Uniform polær retningskarakteristik Betegner ofte et koordinatsystems y-akse eller andenakse. Lokalisering af støj fra kilder, der bevæger sig, f.eks. toge fork., P˚ a grund af Kalibrering af indre fasefejl blandt en række af mikrofoner Lydfelt med ens amplitude og fase i enhver position i feltet Ikke helt tilfældigt, men tilnærmet En funktion, der beskriver et arrays følsomhed som funktion af retning En enhedsvektor, som angiver beamformerens søgeretning Lyd fra andre retninger end styringsretningen undertrykkes En rumlig kvantisering af lydfeltet Et program Retningskarakteristik for beamformer med fastholdt styringsretning (følsomhedskarakteristik) Lokale maksima i retningskarakteristikken, der er mindre end mainlobe SubMiniature version B koaksialt kabelstik Signal-to-noise ratio Et sidelobe, der typisk opst˚ ar som en slags spejling af mainlobet i en symmetriakse N˚ ar styrings- og kilderetning er ens. Signalerne er i fase Et arrays beampattern En komponent, der omdanner ´en energiform til en anden, sensor Uniformt Lineært Array 89 Ordforklaring • • Vha. Ækvidistant cirkulært array fork., Ved hjælp af Cirkulært array, hvor alle indbyrdes transducerafstande er ens 90 Symboler 13 Symboler • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • Symbol ~r0 p(t) M ~rm pm (t) pm (ω) ∆m wm z(t) t e j ω z(ω) ~k κ ~u c ~k0 ps W ~ K pss Rm ∇2 Φ k r A, B π ur p ρ ra u0 2h A1, A2 r1, r2 P S S0 ϕ • • • • • m, n f R(f ) λ Φres Forklaring Lydkilde position Tidsvarierende signal Antal mikrofoner Den m’te mikrofonplacering Lydsignal i tidsdomæne for den m’te mikrofon Fouriertransformation af pm (t) for den m’te mikrofon Tidsforsinkelse for den m’te mikrofon Amplitudevægtning for den m’te mikrofon Delay-and-sum beamforming resultat i tidsdomænet Tid Eulers tal ≈ 2,72 Det imaginære tal Vinkelfrekvens Delay-and-sum beamforming resultat i frekvensdomænet Bølgevektor Akustisk konstant Arbitrær enhedsvektor eller styringsretning Lydens hastighed Arbitrær bølgevektor Lydtryksamplitude Array-mønster Differens mellem bølgevektorer Lydtryksamplitude for sfæriske bølger Afstand mellem lydkilde og den m’te mikrofon Laplaceoperator Hastighedspotential (lydfelt) Bølgetal Afstand fra monopol Arbitrær konstant i løsning til bølgeligningen Pi ≈ 3,14 Partikelhastighed Lydtryk Densitet Monopolradius Amplitudekonstant Monopolafstand (dipollængde) Monopoludstr˚ alingsstyrke Afstand fra monopoler til punkt P Position af lydmodtager Position af monopol Position af refleksion af S i væg Vinkel mellem dipols længdeakse og vektor fra dipols centrum til punkt P Heltalstællevariable Frekvens Retningskarakteristik Bølgelængde Resulterende hastighedspotential i punkt P 91 Symboler • • Φi ϕ0i • • • • • ϕi Rres (f ) Φ0 N a • θ • • • T β θ0 • m, n • • • • • • • • • • • • • • • • • l b sm sn ~i S ~ri ti ~rs po pi ∆i ta,b da,b te ϕe dx tri • dri • p0 (d) • • • • • • • • • • • • d τ η θi O Ss rmax α w Sp SNRi SNRo Hastighedspotential produceret af den i’te lydgiver Indbyrdes faseforskel mellem den i’te lydgivere og referencelydgiver (i = 1) Den i’te fasedrejning mellem hver lydgiver og -modtager Resulterende retningskarakteristik for ULA Arbitrær hastighedspotential Antal lydgivere (monopoler) Indbyrdes afstand mellem den i’te og den (i + 1)’te monopol i et ULA Vinkel mellem lydfeltets indfaldsvinkel p˚ a ULA og normalen til ULAs længdeakse Periodetid Substitutionskoefficient Effektiv lydindfaldsvinkel med indbyrdes monopolfaseforskel Dimensionerne p˚ a den rektangulære mikrofonmatrice (række/kolonne) Længde af rektangulært array Bredde af rektangulært array Indbyrdes mikrofonafstand i rækkeniveau Indbyrdes mikrofonafstand i kolonneniveau Absolut mikrofonplaceringsmatrice Relativ mikrofonplaceringsmatrice = (rix , riy , riz ) Tidsforsinkelse mellem lydkilde og den i’te mikrofon Lydkildens position = (rsx , rsy , rsz ) Beamforming-output Det i’te mikrofonsignal Den i’te tidsforsinkelse til det i’te signal Tidsforsinkelse mellem mikrofon a og b Afstand mellem mikrofon a og b Effektiv tidsforskydning for˚ arsaget af fasefejl Fasefejl for˚ arsaget af positionsusikkerhed Positionsusikkerhed Tidsforsinkelse mellem den egentlige lydkilde og det i’te refleksionsbillede Afstand mellem den egentlige lydkilde og det i’te refleksionsbillede Lydfeltets amplitude efter lyden har propageret en afstand d Propageret afstand Newtonsk dæmpningsrate Dynamisk viskositet Lydfelts indfaldsvinkel fra taler til array Koordinat for array’ets midtpunkt Koordinat for lydkildens position Maksimal cirkulær radius Absorptionskoefficient i forbindelse med efterklang Styringsretning til beamformer Den primære lydkilde Input signal-to-noise ratio Output signal-to-noise ratio 92 Symboler • • • r C AdB Radius af cirkulært array Antal koncentriske cirkler i cirkulære geometrier Beamformerens støjreduktion i dB. 93 14 Figurer 3.1 3.2 4.1 4.2 5.1 6.1 6.2 6.3 6.4 6.5 7.1 7.2 7.3 7.4 7.5 7.6 7.7 7.8 7.9 7.10 7.11 7.12 7.13 7.14 7.15 7.16 7.17 Signalteknisk diagram for delay-and-sum beamforming. Illustration venligst l˚ ant af Dr. Andrew Greensted[17]. . . . . . . . . . . . . . . . . . . . . . . . . . . 6 Mainlobe i retningen 90◦ og sidelobe i retningen 270◦ . . . . . . . . . . . . . . . 7 Indfaldsvinkel p˚ a en mikrofons membran. Figur venligst l˚ ant fra [2]. . . . . . . 9 Følsomhedskarakteristik for en pressure field-mikrofon som funktion af indfaldsvinkel.[2] 10 Frekvensindhold i sætningen I can see you“. Billede er venligst l˚ ant af Brian ” Moore - An Introduction to the Psychology of Hearing[15] . . . . . . . . . . . 11 ” Konfigurationer af ´en eller to monopoler kan effektivt forst˚ as som dipoler. Illustrationer venligst l˚ ant fra Knud Rasmussen - Lydfelter“ [5] . . . . . . . . . . 13 ” Dipol-retningskarakteristik for forskellige 2h/λ-forhold ved f = 1000 Hz. . . . . 14 N monopoler p˚ a række med styringsretning θ i forhold til normal p˚ a ULA’ets længdeakse. Illustration venligst l˚ ant fra Knud Rasmussen - Lydfelter“ [5] . . . 15 ” Analytisk beampattern for ULA med N = 4 monopoler, a = 3, 9 cm og θ0 = π/2. 16 Analytisk beampattern for ULA med N = 4 monopoler, a = 3, 9 cm og θ0 = 0. 16 Eksempler p˚ a array-geometrier simuleret i MATLAB. . . . . . . . . . . . . . . 20 Afbildning af relative vektorer simuleret i MATLAB. . . . . . . . . . . . . . . . 20 Eksempel p˚ a tidsforsinkelse mellem nærmeste og fjerneste mikrofon i forhold til lydkilden. f = 4000 Hz. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21 Eksempel p˚ a polær plot af beampattern for frekvenser 1000 Hz, 2500 Hz og 4000 Hz. Lydkilden er placeret i ~rs = (x, y, z) = (−2, 2, 1) m, dvs. 135◦ . Eksemplet tager udgangspunkt i et 10 × 10 rektangulært array, sm = sn = 5 cm. . . . . . . 22 Eksempel p˚ a 3D afbildning af beampattern som funktion af xy-vinkel og frekvens (fra 1000 Hz til 4000 Hz). Eksemplet tager udgangspunkt i et 10 × 10 rektangulært array, sm = sn = 5 cm. Lydkilde placeret i 135◦ . . . . . . . . . . . 23 Eksempel p˚ a 2D repræsentation af 3D afbildning af beampattern som funktion af xy-vinkel og frekvens (fra 1000 Hz til 4000 Hz). Eksemplet tager udgangspunkt i et 10 × 10 rektangulært array, sm = sn = 5 cm. Lydkilde placeret i 135◦ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23 Eksempel p˚ a 100 mikrofoner hver med en fasefejl, der er uniformt fordelt med 0 og 2π rad. Lydkilden er placeret i retning 135◦ . . . . . . . . . . . . . . . . . . 25 Resulterende fasefejl for forskellige positionsusikkerheder, dx. . . . . . . . . . . 26 Eksempel p˚ a simulering af rektangulært rum med dimensionerne (l × b × h) = (6 × 4 × 3) m og lydkildeposition = (−2, 0, 1) m. . . . . . . . . . . . . . . . . . 27 Eksempel p˚ a 3 dB mainlobe-bredde m˚ alt i grader samt sidelobe-niveau. . . . . 28 Illustration af situation, hvor lydkilde (taler) er siddende foran mikrofonsystemet. 29 Installation set oppefra. Ss er lydkildens position mens O er array’ets midtpunkt 30 Beampattern for 1 × 1 array for frekvenserne 1000, 2500 og 4000 Hz. Beampattern ligger langs med periferien af det polære plot. . . . . . . . . . . . . . . . . 30 Beampattern for 2 × 1 array for frekvenserne 1000, 2500 og 4000 Hz. Mikrofonafstand sm = 5 cm. Lydkilden er placeret i 90◦ . . . . . . . . . . . . . . . . . . 30 Beampattern for 2 × 1 array for frekvenserne 1000, 2500 og 4000 Hz. Mikrofonafstand sm = 10 cm. Lydkilden er placeret i 90◦ . . . . . . . . . . . . . . . . . . 31 Beampattern for 2 × 2 array for frekvenserne 1000, 2500 og 4000 Hz, Mikrofonafstande sm = 10 cm og sn = 5 cm. Lydkilden er placeret i 90◦ . . . . . . . . . 31 Beampatterns for forskellige array-konfigurationer. Mikrofonafstande sm = sn = 5 cm. Lydkilden er placeret i 90◦ . . . . . . . . . . . . . . . . . . . . . . . . . . . 32 94 7.18 Optimeret 4×6 rektangulært array med mikrofonafstande sm = 6 cm og sn = 4 cm. Lydkilden er placeret i 90◦ . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7.19 10 × 10 rektangulært array med mikrofonafstande sm = 5 cm og sn = 5 cm. Lydkilden er placeret i 90◦ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7.20 Cirkulært array med 4 og 8 mikrofoner og radius r = 10 cm. . . . . . . . . . . . 7.21 Beampatterns for 24 mikrofoner med forskellige antal cirkler. Array-radius er 12 cm. Lydkilden er placeret i 90◦ . . . . . . . . . . . . . . . . . . . . . . . . . . 7.22 3D afbildning af beampattern (dB) for cirkulært array med 24 mikrofoner placeret i 3 cirkler med størst radius r = 12 cm. Lydkilden er placeret i 90◦ . . . . . 7.23 Effekt af at placere ´en mikrofon i midten af array’et som erstatning for den inderste ring. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7.24 Sammenligningen mellem ordinært og logaritmisk cirkulær geometri med rmax = 12 cm. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7.25 Konturplot (frekvensrespons) for 1×4-array med varierende indbyrdes mikrofonafstande. Lydkilde placeret i retning 0◦ , 2 meter væk i samme plan som array’et. Abcissen angiver frekvens i Hz, mens ordinaten angiver retning i grader. 7.26 Konturplot (frekvensrespons) for 1×4-array med varierende indbyrdes mikrofonafstande. Lydkilde placeret i retning 0◦ , 2 meter væk i samme plan som array’et. Abcissen angiver frekvens i Hz, mens ordinaten angiver retning i grader. 7.27 Mainlobe-bredde som funktion af indbyrdes mikrofonafstand for 1 × 4-array. . . 7.28 1000 Hz: Forskellige geometriers mainlobe-bredde som funktion af antal mikrofoner i systemet. Rektangulært array simuleret som enkeltrække, cirkulære arrays har radius N/100, hvor N er antal mikrofoner, s˚ a de indbyrdes afstande er identiske igennem simuleringerne. Lydkilde placeret i 0◦ . . . . . . . . . . . . 7.29 2500 Hz: Forskellige geometriers mainlobe-bredde som funktion af antal mikrofoner i systemet. Rektangulært array simuleret som enkeltrække, cirkulære arrays har radius N/100, hvor N er antal mikrofoner, s˚ a de indbyrdes afstande er identiske igennem simuleringerne. Lydkilde placeret i 0◦ . . . . . . . . . . . . 7.30 4000 Hz: Forskellige geometriers mainlobe-bredde som funktion af antal mikrofoner i systemet. Rektangulært array simuleret som enkeltrække, cirkulære arrays har radius N/100, hvor N er antal mikrofoner, s˚ a de indbyrdes afstande er identiske igennem simuleringerne. Lydkilde placeret i 0◦ . . . . . . . . . . . . 7.31 1000 Hz: Effekten af forskellige antal koncentriske cirkler i de ordinært cirkulære geometrier. De indbyrdes mikrofonafstande holdes konstant. Lydkilde placeret i 0◦ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7.32 2500 Hz: Effekten af forskellige antal koncentriske cirkler i de ordinært cirkulære geometrier. De indbyrdes mikrofonafstande holdes konstant. Lydkilde placeret i 0◦ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7.33 4000 Hz: Effekten af forskellige antal koncentriske cirkler i de ordinært cirkulære geometrier. De indbyrdes mikrofonafstande holdes konstant. Lydkilde placeret i 0◦ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7.34 1000 Hz: Sidelobe-niveau som funktion af antallet af mikrofoner for forskellige geometrier. De indbyrdes mikrofonafstande holdes konstant. Lydkilde placeret i 0◦ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7.35 2500 Hz: Sidelobe-niveau som funktion af antallet af mikrofoner for forskellige geometrier. De indbyrdes mikrofonafstande holdes konstant. Lydkilde placeret i 0◦ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7.36 4000 Hz: Sidelobe-niveau som funktion af antallet af mikrofoner for forskellige geometrier. De indbyrdes mikrofonafstande holdes konstant. Lydkilde placeret i 0◦ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7.37 Punktkilder placeret i hhv. (1) z = 0 og (2) z > 0. . . . . . . . . . . . . . . . . 95 33 34 35 36 37 38 39 40 41 42 43 43 44 44 45 45 46 46 47 48 7.38 Simulering af effekt ved at ændre lydkildens højde. . . . . . . . . . . . . . . . . 7.39 Undersøgelse af effekten af mikrofonernes fasefejl. . . . . . . . . . . . . . . . . . 7.40 Visualisering af 4×1 rektangulært mikrofon-array (rød), lydkilde (bl˚ a) og refleksionskilder (grøn). Rummet har dimensionerne l×b×h = 6 m×6 m×2.5 m. Gennemsigtige bl˚ a overflader indikerer rummets vægge. . . . . . . . . . . . . . 7.41 Beampattern for 4×1 rektangulært array med indbyrdes mikrofonafstand 3,9 cm hhv. med og uden refleksioner, α = 0. Kilde placeret i retning 0◦ . . . . . . . 7.42 Beampattern for 4×1 rektangulært array med indbyrdes mikrofonafstand 3,9 cm hhv. med og uden refleksioner, α = 0. Kilde placeret i retning 30◦ . . . . . . 7.43 Undersøgelse af effekten af refleksioner i et rum med forskellige absorptionskoefficienter α. Kilden er placeret i 30◦ . 4×1 rektangulært array med indbyrdes mikrofonafstande 3,9 cm. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7.44 Visualisering af lydkildesignal (f = 1000 Hz) i hhv. tids- og frekvensdomæne. . 7.45 Beamforming-output i tids- og frekvensdomæne med styringsretning w= 0◦ . Primær lydkilde (f = 1000 Hz) placeret i 0◦ . . . . . . . . . . . . . . . . . . . . 7.46 Beamforming-output i tids- og frekvensdomæne med styringsretning w= 180◦ . Primær lydkilde (f = 1000 Hz) placeret i 0◦ . . . . . . . . . . . . . . . . . . . . 7.47 Modtagede mikrofonsignaler n˚ ar b˚ ade primær lydkilde (1 kHz-sinustone) og støjkilde er til stede for mikrofon #1 og #4. Støjkilde: 2,5 kHz-sinustone. Lydkilde placeret i 0◦ , støjkilde placeret i 250◦ . . . . . . . . . . . . . . . . . . . . . 7.48 Beamforming-output i tids- og frekvensdomæne med styringsretning w= 0◦ . Primær lydkilde (1 kHz) placeret i 0◦ , støjkilde (2,5 kHz) placeret i 250◦ . . . . 7.49 Beamforming-output i tids- og frekvensdomæne med styringsretning w= 0◦ . Primær lydkilde (1 kHz) placeret i 0◦ , støjkilde (2,5 kHz) placeret i 20◦ . . . . . 7.50 Beamforming-output i tids- og frekvensdomæne med styringsretning w= 0◦ . Primær lydkilde placeret i 0◦ , støjkilde (2,5 kHz) placeret i 20◦ . Primær lydkilde: 4 kHz-sinustone. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8.1 Træplade, der repræsenterer et mødebord, med et drejebord, hvor mikrofonerne placeres. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8.2 Opstilling i et lyddødt rum med bordplade, drejebord, mikrofoner og lydkilde. . 8.3 Montering af mikrofoner med klæbemasse p˚ a undersiden af drejebordet. Her ses ogs˚ a en fastmonteret aksel, der fastholder drejebordets centrum under rotation. 8.4 Mikrofoner monteret i drejebord, s˚ a deres membraner og beskyttelsesgitre er synlige p˚ a oversiden. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9.1 Beampatterns for 1×4 array med indbyrdes mikrofonafstand p˚ a 3,9 cm. Kilden ◦ er placeret i 0 og udsender hvid støj. . . . . . . . . . . . . . . . . . . . . . . . 9.2 Beampatterns for 1×4 array med indbyrdes mikrofonafstand p˚ a 3,9 cm. Kilden er placeret i 0◦ og udsender en tone p˚ a 1000 Hz. M˚ alingerne er foretaget i lyddødt rum. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9.3 Beampatterns for 1×4 array med indbyrdes mikrofonafstand p˚ a 3,9 cm. Kilden er placeret i 267◦ og udsender hvid støj. . . . . . . . . . . . . . . . . . . . . . . 9.4 Beampatterns for 2×4 array med kolonneafstand p˚ a 3,9 cm og en rækkeafstand p˚ a 10 cm. Kilden er placeret i 270◦ og udsender hvid støj. . . . . . . . . . . . . 9.5 Beampatterns for 2×4 array med indbyrdes mikrofonafstand i hver række p˚ a 3,9 cm og afstand mellem rækkerne p˚ a 10 cm. Kilden er placeret i 45◦ og udsender hvid støj. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9.6 Beampatterns for cirkulært array med 8 mikrofoner i ´en cirkel og radius r = 3, 9 cm. Kilden er placeret i 0◦ og udsender hvid støj. . . . . . . . . . . . . . . . . . 9.7 Beampatterns for cirkulært array med 16 mikrofoner i ´en cirkel og radius r = 15, 5 cm. Kilden er placeret i 0◦ og udsender hvid støj. . . . . . . . . . . . . . . 96 48 49 50 50 51 52 53 54 54 55 56 56 57 60 61 62 62 63 64 64 65 66 66 67 9.8 9.9 9.10 9.11 9.12 9.13 9.14 9.15 9.16 9.17 9.18 9.19 9.20 9.21 9.22 9.23 9.24 9.25 9.26 9.27 9.28 Beampatterns for cirkulært array med 16 mikrofoner i to cirkler og radius r = 15, 5 cm. Kilden er placeret i 0◦ og udsender hvid støj. . . . . . . . . . . . . Beampatterns for cirkulært array med 16 mikrofoner i to cirkler og radius r = 7, 8 cm. Kilden er placeret i 0◦ og udsender hvid støj. . . . . . . . . . . . . Beampatterns for cirkulært array med 16 mikrofoner i fire cirkler og radius r = 15, 5 cm. Kilden er placeret i 0◦ og udsender hvid støj. . . . . . . . . . . . . Beampatterns for cirkulært array med 24 mikrofoner i fire cirkler og radius r = 15, 5 cm. Kilden er placeret i 0◦ og udsender hvid støj. . . . . . . . . . . . . Mainlobe-bredde og sidelobe-niveau som funktion af antal mikrofoner. M˚ alingerne er foretaget for fire forskellige cirkler med radius r = 3, 9 cm, r = 7, 8 cm, r = 11, 7 cm og r = 15, 5 cm. . . . . . . . . . . . . . . . . . . . . . . . . . . . . Beampatterns for 1×4 array med indbyrdes mikrofonafstand p˚ a 3,9 cm. Kilden ◦ er placeret 26 cm fra drejebordets centrum ved vinkel 0 og udsender hvid støj. Beampatterns for 1×4 array med indbyrdes mikrofonafstand p˚ a 3,9 cm. Kilden er placeret 76 cm fra drejebordets centrum ved vinkel 0◦ og udsender hvid støj. Beampatterns for cirkulært array med 12 mikrofoner i tre cirkler og radius r = 12, 4 cm. Kilden er placeret i 0◦ og udsender hvid støj, og m˚ alingerne er foretaget i lyddødt rum. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Illustration af forsøgsopstilling, hvor højtaleren er drejet 90◦ væk fra array’et p˚ a drejebordet. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Illustration af forsøgsopstilling med en reflekterende finerplade p˚ a to forskellige positioner, som er vinkelrette p˚ a kildesignalets indfaldsvinkel. . . . . . . . . . . Beampatterns for 1×4 array med indbyrdes mikrofonafstand p˚ a 3,9 cm. Kilden ◦ er placeret i 0 og udsender hvid støj. . . . . . . . . . . . . . . . . . . . . . . . Beampatterns for 1×4 array med indbyrdes mikrofonafstand p˚ a 3,9 cm. Kilden ◦ er placeret i 315 og udsender hvid støj. . . . . . . . . . . . . . . . . . . . . . . Beampatterns for 1×4 array med indbyrdes mikrofonafstand p˚ a 3,9 cm. Kilden er placeret i 77◦ og udsender hvid støj. . . . . . . . . . . . . . . . . . . . . . . . Beampatterns for cirkulært array med 16 mikrofoner i fire cirkler og radius r = 15, 5 cm. Kilden er placeret i 0◦ og udsender hvid støj. . . . . . . . . . . . . M˚ alt efterklangstid for klasselokale p˚ a Teknisk Fakultet, SDU. Venligst l˚ ant af Peter Møller Juhl. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Beampatterns for 1×4 array med indbyrdes mikrofonafstand p˚ a 3,9 cm. Kilden ◦ er placeret i 120 og udsender hvid støj. . . . . . . . . . . . . . . . . . . . . . . Beampatterns for cirkulært array med 24 mikrofoner i fire cirkler og radius r = 15, 5 cm. Kilden er placeret i 120◦ og udsender hvid støj. . . . . . . . . . . Beampatterns for 1×4 array med indbyrdes mikrofonafstand p˚ a 3,9 cm. Kilden er placeret i 120◦ og udsender hvid støj. M˚ alingerne er foretaget i et klasselokale. Beampatterns for cirkulært array med 24 mikrofoner i fire cirkler og radius r = 15, 5 cm. Kilden er placeret i 120◦ og er drejet 180◦ væk fra array’et, og den udsender hvid støj. M˚ alingerne er foretaget i et klasselokale. . . . . . . . . Mikrofonsignal i frekvensdomænet for ´en mikrofon i et 1×4 array med en indbyrdes mikrofonafstand p˚ a 3,9 cm. Signalet er normeret i forhold til maksimalt mikrofonsignal, og kildesignalet er en tone med frekvensen 2500 Hz. . . . . . . Beamformerens output-signal i frekvensdomænet for et 1×4 array med en indbyrdes mikrofonafstand p˚ a 3,9 cm. Signalet er normeret i forhold til maksimalt mikrofonsignal. Kilden er placeret i styringsretningen, som her er 0◦ , og den udsender en tone med frekvensen 2500 Hz. . . . . . . . . . . . . . . . . . . . . . 97 68 68 69 69 70 71 72 73 74 74 75 76 77 78 79 79 80 81 82 82 83 9.29 Beamformerens output-signal i frekvensdomænet for et 1×4 array med en indbyrdes mikrofonafstand p˚ a 3,9 cm. Signalet er normeret i forhold til maksimalt mikrofonsignal. Kilden er placeret 90◦ forskudt i forhold til styringsretningen, og den udsender en tone med frekvensen 2500 Hz. . . . . . . . . . . . . . . . . 83 9.30 Beamformerens output-signal i frekvensdomænet for et 1×4 array med en indbyrdes mikrofonafstand p˚ a 3,9 cm. Signalet er normeret i forhold til maksimalt mikrofonsignal. Kilden er placeret 180◦ forskudt i forhold til styringsretningen, og den udsender en tone med frekvensen 2500 Hz. . . . . . . . . . . . . . . . . 83 98 15 Tabeller 7.1 7.2 7.3 9.1 9.2 9.3 9.4 Oversigt over indbyggede geometrier i ArrayConfiguration.m“. . . . . . . . . ” Oversigt over indstillingsmuligheder i ArrayConfiguration.m“ og Beamform” ” ing FFT.m“. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . SNR-resultater for 1×4-array. . . . . . . . . . . . . . . . . . . . . . . . . . . . Mainlobe-bredder for hhv. 1 × 4- og 2 × 4-array n˚ ar lydkilde er placeret i 0◦ . Mainlobe-bredder for cirkulære arrays med ´en cirkel og hhv. 8 mikrofoner (r = 3, 9 cm) og 16 mikrofoner (r = 15, 5 cm). Lydkilde er placeret i 0◦ . . . . . . . Mainlobe-bredde for cirkulært array med 16 mikrofoner i fire cirkler, r = 15, 5 cm. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Forstærkning af mikrofonsignaler ved forskellige kildepositioner. Styringsretningen er 0◦ . Resultater ses for et rektangulært 1×4 array med indbyrdes mikrofonafstand p˚ a 3,9 cm og for et cirkulært array med 16 mikrofoner i fire cirkler og radius r = 15, 5 cm. . . . . . . . . . . . . . . . . . . . . . . . . . . . 99 . 18 . 19 . 57 . 65 . 67 . 78 . 84 16 Kode 1 2 Beregning af komplekse faser. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22 Mikrofonsignalerne dataFFT multipliceres med de tilhørende, komplekse faser. Resultatet konverteres til effekt. . . . . . . . . . . . . . . . . . . . . . . . . . . . 22 100 Litteratur 17 Litteraturliste [1] Hesse, Ulrik, Danskerne bliver højere og tungere“, ” http://www.si-folkesundhed.dk/Ugens%20tal%20for%20folkesundhed/ Ugens%20tal48 2007.aspx SDU, 2007. [2] Br¨ uel & Kjær, Microphone Handbook“, ” Br¨ uel & Kjær A/S, Februar 1995. [3] Br¨ uel & Kjær, 4958 - 20 kHz precision array microphone“, ” http://www.bksv.dk/Products/transducers/acoustic/microphones/microphonepreamplifier-combinations/4958, 29-04-2014 [4] National Instruments, NI USB-4431“, ” http://sine.ni.com/nips/cds/view/p/lang/da/nid/206676 29-04-2014 [5] Knud Rasmussen, Lydfelter“, ” Institut for Akustisk Teknologi, DTU, 1996, Note 2107 [6] Johnson, Don H.; Dudgeon, Dan E., Array Signal Processing - Concepts And Techniques“, ” Prentice Hall, 1993, ISBN 0-13-048513-6 [7] Bai, Mingsian R.; Ih, Jeong-Guon; Benesty, Jacob, Acoustic Array Systems - Theory, Implementation, and Application“, ” Wiley, 2013, ISBN 978-0-470-82723-9 [8] Brandstein, M.; Ward, D., Microphone Arrays - Signal Processing Techniques and Applications“, ” Springer, 2001, ISBN 3-540-41953-5 [9] Dmochowski, Jacek; Benesty, Jacob; Aff`es, Sofi`ene, On Spatial Aliasing in Microphone Arrays“, ” http://www.researchgate.net/publication/224355184 On Spatial Aliasing in Microphone Arrays/file/e0b4951a8d4de28459.pdf, IEEE Transactions on signal processing, Vol. 57, No.4, April 2009 [10] Hald, Jørgen, Beamforming and Wavenumber Processing“, ” Br¨ uel & Kjær A/S, Nærum [11] Forside for Acoustic Camera, http://www.acoustic-camera.com/en.html, 12-05-2014 101 Litteratur [12] Forside for Br¨ uel & Kjær, http://www.bksv.dk/, 12-05-2014 [13] Forside for ClearOne, http://www.clearone.com/, 12-05-2014 [14] Bhullar, Singh Pushpinder, Sensitivity Analysis of a Beamforming Technique for Acoustic Measurements“, ” Punjab Technical University, India, 2004 [15] Moore, Brian C. J., An Introduction to the Psychology of Hearing“, ” Brill, 2013, ISBN 978-90-04-25242-4 [16] Jacobsen, Finn; Poulsen, Torben; Rindel, Jens Holger; Gade, Anders Christian; Ohlrich, Mogens, Fundamentals of Acoustics and Noise Control“, ” DTU, November 2011 [17] Greensted, Dr. Andrew, Delay Sum Beamforming“, ” http://www.labbookpages.co.uk/audio/beamforming/delaySum.html, The Lab Book Pages, Oktober 2012 102
© Copyright 2025