Jak działają mikrofony wielokapsułowe?
1. Jak działają mikrofony wielokapsułowe?
Mikrofony tego typu pozwalają na regulację kierunkowości w szerokim zakresie (niedawno zaprezentowany model Sony ECM-M1 ma aż 8 różnych ustawień jeśli chodzi o charakterystykę kierunkową), a jest to możliwe właśnie dzięki zastosowaniu większej liczby kapsuł, czyli pojedynczych mikrofonów wchodzących w skład danego produktu. W poniższym tekście spróbujemy wyjaśnić, jak to dokładnie działa.
![]() Charakterystykę kierunkową mikrofonu Sony ECM-M1 możemy szybko i wygodnie zmienić za pomocą pokrętła. |
By zrozumieć, jak działa układ kilku mikrofonów, wyobraźmy sobie jego najprostszą wersję — dwa mikrofony rozsunięte o pewną odległość X. Załóżmy też, że sygnał audio docierający do obu tych mikrofonów jest sumowany przed wysłaniem do aparatu czy kamery. Sam sygnał także na początek uprościmy do poziomu zwykłej sinusoidy, tak by łatwo było zrozumieć matematykę stojącą za całą omawianą koncepcją.
Zaczniemy od sytuacji, w której sygnał audio pada prostopadle do naszego układu mikrofonów. Umownie ustalmy, że dźwięk w tym przypadku pada „z przodu”. Tak prezentuje się omawiany scenariusz:
![]() |
Jak łatwo zauważyć, do obu mikrofonów w tym samym momencie dociera ten sam sygnał, więc jeśli te dwie sinusoidy zsumujemy, otrzymamy po prostu „mocniejszą” sinusoidę o większej amplitudzie.
Spójrzmy teraz, co stanie się, gdy nasze źródło dźwięku przesuniemy o 90 stopni względem mikrofonów, czyli w tym przypadku, umownie, umieścimy je „z boku”. Oto stosowna grafika:
![]() |
W tym przypadku, gdy do jednego z mikrofonów dociera maksimum fali, do drugiego dociera w tym samym czasie jej minimum. Jeśli zatem zsumujemy to, co zarejestrowały oba mikrofony, to okaże się, że… nie zarejestrowaliśmy nic, bo obie fale wzajemnie się wyzerowały. W tym bardzo uproszczonym przykładzie stworzyliśmy zatem coś, co nazywa się właśnie charakterystyką kierunkową mikrofonu (jako całości, czyli w tym przypadku sumy sygnałów z dwóch kapsuł). Dźwięk padający z przodu jest przez ten układ wzmacniany, a dźwięk padający z boku tłumiony.
Oczywiście w sytuacji pośredniej (dźwięk padający „z ukosa”) rezultat też będzie gdzieś pomiędzy wzmocnieniem się obu sygnałów, a ich wyzerowaniem. Warto również zauważyć, że gdybyśmy sygnały z obu mikrofonów odjęli od siebie zamiast sumować, efekt byłby odwrotny — to dźwięk padający z przodu byłby wyciszony, a ten padający z boku — wzmocniony.
W ten właśnie prosty sposób, zmieniając znak z plusa na minus, zmieniamy charakterystykę mikrofonu. I w analogiczny sposób robią to omawiane tu mikrofony wielokapsułowe, gdy przełączymy przełącznik lub, jak w przypadku modelu ECM-M1, obrócimy tarczę.
![]() Przełącznik regulacji charakterystyki kierunkowej w mikrofonie Sony ECM-B10. |
Oczywiście powyższy przykład to ogromne uproszczenie, mające jedynie na celu zilustrowanie ogólnej zasady działania. Został on sprytnie dobrany w taki sposób, by odległość między mikrofonami („X” na grafikach) była równa połowie długości fali naszej sinusoidy i tylko dlatego możliwe było jej idealne wyzerowanie się dla jednego z kierunków padania. W praktyce dźwięk, jaki nagrywamy, nigdy nie jest idealną sinusoidą i zawsze składa się z wielu częstotliwości. Typowo zakłada się, że pasmo akustyczne to od 20 Hz do 20 kHz, co przekłada się na długości fali od ok. 17 metrów do niecałych 2 cm.
To znacząco komplikuje sytuację, ale z drugiej strony algorytmy mieszania dźwięku zarejestrowanego przez poszczególne kapsuły też nie są prostym dodawaniem czy odejmowaniem. Znajdujący się w mikrofonie procesor jest w stanie na przykład rozbić sobie dźwięk na kilka zakresów częstotliwości i dla każdego z nich przeprowadzić inną operację matematyczną. Pomaga także zwiększenie liczby kapsuł, stąd też mikrofony ECM-B10 i ECM-M1 mają ich po cztery, a bardziej kierunkowy model ECM-B1M – aż osiem.
Tak prezentują się rzeczywiste (zmierzone) charakterystyki kierunkowe tego ostatniego:
![]() Rzeczywiste charakterystyki kierunkowe Sony ECM-B1M. Źródło: Sony |
Odległość od środka koła oznacza w tym przypadku siłę sygnału — im bliżej środka, tym dany kierunek jest bardziej tłumiony. W przypadku wersji wszechkierunkowej charakterystyka jest, zgodnie z oczekiwaniami, bliska idealnego okręgu. W pozostałych przypadkach dźwięk docierający z boku czy z tyłu jest w mniejszym lub większym stopniu tłumiony.
Przy okazji powyższe wykresy ilustrują to, czego uważny czytelnik mógł się już domyślić — mianowicie, że najtrudniej jest uzyskać charakterystykę kierunkową dla niskich częstotliwości. Wynika to wprost z naszego uproszczonego przykładu z dwiema sinusoidami — dla dźwięku o częstotliwości 20 Hz (czyli najniższego słyszalnego dla ludzi), odległość X między kapsułami pozwalająca na jego wyzerowanie musiałaby wynieść około 8.5 metra. Nie jest to fizycznie wykonalne — nikt nie zamocowałby 8-metrowego mikrofonu na swoim aparacie czy kamerze. Częściowo da się to oczywiście skompensować operacjami matematycznymi wykorzystującymi sygnał z wielu kapsuł czy też konstrukcją samych kapsuł i obudowy mikrofonu, ale w którymś momencie oszukanie fizyki staje się po prostu niemożliwe.
Efektem różnic między uproszczonym modelem matematycznym a niedoskonałą fizyczną rzeczywistością są też tak zwane „listki boczne” charakterystyk kierunkowych dobrze widoczne na przykład dla częstotliwości 5 kHz i charakterystyki superkierunkowej, gdzie wykres przypomina patisona czy ośmiornicę. Kształt tych charakterystyk da się matematycznie wyprowadzić, jednak jest to matematyka o kilka rzędów bardziej skomplikowana, niż proste sumowanie czy odejmowanie sygnałów i nie będziemy w niniejszym tekście prezentować tak zaawansowanych obliczeń.
Co prawda niniejszy tekst ma mieć raczej teoretyczny charakter, ale możemy też zaprezentować kilka fragmentów ujęć nagranych mikrofonem Sony ECM-M1 (na korpusie A7 IV). Nie były one tworzone z myślą o demonstrowaniu możliwości mikrofonu, mają stricte użytkowy charakter.
W drugim z zaprezentowanych ujęć wyraźnie słychać, jak inaczej zbierany jest głos zza kamery i sprzed kamery przy najbardziej kierunkowym ustawieniu, jakie ECM-M1 oferuje. Oba głosy mają podobny poziom mimo znaczącej różnicy odległości od aparatu (osoba nagrywająca ma usta tuż przy mikrofonie, osoba nagrywana stoi 2 metry dalej), słychać też, że najlepiej wycinana z niepożądanych kierunków jest górna część pasma.
Ciekawie prezentuje się też porównanie dwóch ostatnich nagrań. W pierwszym zastosowana była szersza charakterystyka, więc przy zmianie kadru na publiczność, brzmienie muzyki ze sceny nie uległo dużym zmianom. Z kolei w drugim przypadku różnica po zmianie kadru jest wyraźnie słyszalna.
![]() Układ kapsuł w mikrofonie Sony ECM-M1. |
Na koniec poruszymy jeszcze kilka luźniej związanych z tematem kwestii i odpowiemy na kilka pytań, które przy okazji mogły się nasunąć dociekliwym czytelnikom.
Po pierwsze — beamforming (tak fachowo nazywa się odpowiednie łączenie sygnału z wielu kapsuł mikrofonu) nie jest jedynie domeną urządzeń audio. Technologia ta stosowana jest powszechnie na przykład w sonarach. A ponieważ tam nie ma takich restrykcji jeśli chodzi o gabaryty, to wieloelementowe mocno kierunkowe sonary potrafią mieć długość kilkuset metrów i często mają postać długiej „liny” ciągniętej za statkiem.
Po drugie — układy wielokapsułowe nie są oczywiście jedyną metodą kształtowania charakterystyki kierunkowej. Można to też robić na przykład przez odpowiednie ukształtowanie obudowy mikrofonu. Z technologii tej korzystają na przykład mikrofony interferencyjne (tzw. mikrofony typu shotgun), w których odpowiedni kształt charakterystycznej podłużnej obudowy z nacięciami w pewnym stopniu spełnia tę samą funkcję co układ wielu kapsuł.
Po trzecie — dlaczego właściwie mikrofony wielokapsułowe są robione akurat przez Sony i korzystają ze złącza Multi Interface? Tu odpowiedź jest prosta – ponieważ korzystanie z tej technologii wymaga obecności procesora w mikrofonie, a ten ostatni musi być jakoś zasilany, co nie jest możliwe przez tradycyjnie stosowane złącze mini jack. Przy okazji, dzięki złączu MI, obrobiony przez procesor cyfrowy dźwięk może trafić prosto do aparatu, z pominięciem jego wbudowanych przedwzmacniaczy czy konwerterów analogowo-cyfrowych, co także pomaga zachować wysoką jakość dźwięku. Brak dodatkowych kabli między mikrofonem a aparatem jest też po prostu zwyczajnie wygodny.
![]() Gotowy do pracy mikrofon na złączu Multi Interface. Żadnych kabli zahaczających o rozkładany do boku ekran aparatu. |
Artykuł powstał na zlecenie polskiego oddziału firmy Sony.