thomas wegner

sounddesign und klangregie

Immersive audio in live sound

Im Rahmen eines Stipendiums des Ministerium für Kunst, Kultur und Medien sowie für eine Masterclass an dem Royal Conservatory in Den Haag, verglich ich in einem Testaufbau SPAT Revolution, L-ISA, d&b Soundscape und outboard Timax miteinander. Des weiteren untersuchte ich in einem kleinen Empirischen Aufbau die Unterschiede im Klangeindruck.

Bildschirmfoto 2021-12-28 um 12.32.55
Ich wollte herausfinden ob sich messtechnisch Unterschiede finden lassen. Ausserdem habe ich in einem kleinen Blindtest Student*innen des Royal Conservatory in Den Haag, Musikbeispiele hören und bewerten lassen. Sie sollten dabei auf einer Skala von -5 bis +5 Qualitäten z.B. der Tiefenstaffelung oder des Panoramas beurteilen.
Der Aufbau für die Messung war aus praktischen Gründen auf 16 Inputs in jede Software und 8 Outputs aus jeder Software beschränkt. Die Outputs habe ich auf ein einfaches 8.0 Setup matriziert, wobei die Lautsprecher 1-5 eine frontale Linie bilden. Ich habe mich für dieses Setup entschieden da es zum einen in L-ISA die Vorgabe gibt, das mindestens eine 5 kanalige frontale Linie zu installieren sei, zum anderen ich in den allermeisten Fällen auf ebendiese Lautsprecherkonfiguration zurückgreife. Es hat sich für meine Anwendungen im Musiktheater als sehr guter Startpunkt für immersives Audio bzw. erweiterten Sweetspot, etabliert.
Die Inputs und Outputs habe ich über eine M32 und einen Multiverter der Firma Appsys gestaltet, so konnte ich sowohl den AES50 Stream des Mischpults sowie den DANTE Stream des DS100 (Soundscape) abgreifen und in MADI optisch/coaxial konvertieren und auf alle nötigen I/Os verteilen. Die Outputs wurden auf die Lautsprecher dann matriziert. Zugespielt wurde aus Logic Pro X in die M32 hinein und über direct outs an die verschiedenen Applikationen verteilt.

…….

Messung

In SMAART habe ich die 5 Outputs der jeweiligen Maschine (die Surround/Rear Lautsprecher habe ich ausgenommen) in der Transfermessmethode vergleichsgemessen.
Vorher habe ich- soweit das ging- einen Levelmatch vorgenommen. Voraussetzung für einen Vergleich waren ähnliche Parameter zur Level und Delaymatrizierung in jeder Software.
Die Ergebnisse waren für die meisten Maschinen sehr ähnlich, weder in SPAT, noch in Soundscape oder Timax waren Auffälligkeiten zu entdecken, ich bekam mit den angepassten Spread Faktoren (SPAT Panning Type: KNN), Spread in Soundscape und manueller Berechnung in Timax, ein ähnliches Bild wie im Video:




Hier ist Beispielhaft die Bewegung eines Audio Objekts von links nach rechts in Timax zu sehen, der unterschiedliche Fokus auf den jeweils nächsten Lautsprecher, sowie eine gleichmäßige Verteilung auf alle fünf Lautsprecher wenn das Objekt sich in der Mitte der Anordnung befindet.

Sehr ähnlich sieht es in SPAT aus mit einem etwas geringerem Spread. Da SPAT keine Inputdelays berechnet fehlen diese Werte.





Ganz anders sieht der selbe Aufbau in L-ISA Studio aus:




Sie erinnert an A/B System Konzepte von Martin Levan, bei denen System A den phaseninversen Kammfilter von B bekommt. Interessanterweise ist das Phänomen im Hörtest nicht wahrnehmbar, zumindest nicht als Kammfilter.

………..

Empirische Untersuchung

Der Masterclass wurde ein kleiner Katalog mit Fragen vorgelegt und dann das selbe Audiomaterial nacheinander blind durch die jeweiligen System spatialisiert. Die Bewertungen waren im Detail sehr unterschiedlich, so kam es vor das mancher die Wiedergabe ganz hervorragend, mancher als sehr schlecht empfunden hat. Natürlich ist die Frage bei einer Skale wie +5/-5 wo setzt ich meine erste Beurteilung an? Wird es noch sehr viel besser oder schlechter? Es brauchte eine Normalisierung der Ergebnisse, ich habe dies mit einer einfachen Quersumme gelöst, die interessante Ergebnisse zu Tage brachte:




Bildschirmfoto 2021-12-29 um 17.47.46

In der Tabelle lässt sich die große Spanne der Einzelbewertungen ablesen, aber gleichzeitig erkennt man eine Tendenz. So ist für das System A eine durchweg negativere Beurteilung abzuschließen lesen, für System B eine weitaus positivere, so weit gehend, das die geringste Bewertung von -14 in System A (Transients) in System B um etwa 11 Zähler übertroffen wird. Nun lässt sich nicht ausschließen das es einen psychologischen Effekt gibt, der das zweite Beispiel immer als besser bewertet, das liess sich aber im weiteren Verlauf der Tests nicht bestätigen.

Aus den vorliegenden Summen habe ich dann für das jeweilige Beispiel eine Tabelle erstellt die die Ergebnisse der Qualitäten der einzelnen Applikationen abbildet. Hier für das Beispiel 1, zu hören war eine zeitgenössische Jazz Komposition.

Bildschirmfoto 2021-12-29 um 17.47.57


Zum Schluss dann die Gesamtbewertung aller Hörbeispiele im Diagramm.



Bildschirmfoto 2021-12-29 um 17.48.20


Auch wenn die Gruppe recht klein - nur 12 Personen haben teilgenommen - und der Versuchsaufbau sicher nicht wissenschaftlichen Maßstäben standhalten kann, lässt sich doch durchaus eine Tendenz ablesen. Nach den Blindtest, habe ich die Beispiele noch mal vorgestellt und schnell umgeschaltet, immer offenbarend welches zu hören war. Auch daraufhin hat die mehrheitlich Meinung zu den beiden blind am besten bewerteten Systemen, tendiert.