• Blut-Tetralogie   Dark Space

dieVERdener

Mitglied
wenn es denn überhaupt die richtige Begrifflichkeit dafür ist!

Guten Morgen,

Schwimmbad. Auf der Liegewiese streiten sich zwei Kinder. In ca 10 m Entfernung ruft der Vater, sie sollen aufhören und ca. 50 m entfernt hört man den Bademeister lautstark über Megaphone die Beckenrandspringer anpampen.

Ambiente, Atmosphäre, Sounds - kein großes Problem.

Nur wie bekomme ich die Tiefe hin? Will mir einfach nicht so gelingen, dass es mich zufrieden stellt.
 

Spoony

Mitglied
Sprechprobe
Link
Wie immer gibt es viele Wege, eine räumliche Darstellung von Stimmen zu erreichen.

Die Grundsätzliche Herangehensweise hängt aber in erster Linie davon ab, in was für einer Umgebung ( Raum ) du
die räumliche Tiefe, also die Entfernung, einer Stimme anpassen möchtest. Also z.B. draußen auf einem Sportplatz, in einer Wohnung,
in einer Kirche oder in einer Schwimmhalle.
Jede Umgebung hat unterschiedliche Raumhall-Eigenschaften.

Je weiter weg eine Person spricht, um so leiser wird sie und es kommen weniger tiefe und hohe Frequenzen beim Zuhörer an.
Je näher dran eine Person ist, um lauter ist sie und es kommen auch mehr tiefe und hohe Frequenzen an.
Auch der Hall verändert sich in Abhängigkeit der Entfernung zur Person.
Auf einem Sportplatz ist nahezu keinen Hall vorhanden, in einer Kirche um so mehr.
In einem kleineren geschlossen Raum sind tiefe Frequenzen, gerade bei einer tiefen Männerstimme,
um so mehr zu hören. Draußen bedeutend weniger.

Hall und Raumtiefe kann man z.B. mit Reverb- und EQ-Plugins erzeugen.
Es gibt auch Reverb-Plugins, die sich speziell auf die akustische Darstellung von ( kleinen ) Räumen konzentrieren.

Wenn du dir also im Klaren darüber bist, wie deine Umgebung aussieht bzw. wie sie sich anhören soll,
kannst du mit etwas Herumprobieren an den Reglern der Plugins die Stimme entsprechend im Raum positionieren.
Das Bedarf manchmal schon etwas Geduld.

Habe hier gerade nur ein 0815-Headset zur Verfügung. Die Qualität meiner Aufnahme ist also nicht so dolle.
Aber hier ist mal ein eben schnell zusammengebasteltes Sound-Beispiel.

Schwimmhallen-Ambiente
 
Zuletzt bearbeitet:

Nightblack

Meinhard Schulte
Sprechprobe
Link
Tja , und dann gibt es noch das Thema "Impulseantworten" (engl.: Impulse Responses). Ist das hier schon bekannt?
Ganz kurze Geräusche wie z.B. ein einfaches in die Hände klatschen oder Pistolenschuss werden in der entsprechenden Umgebung aufgenommen, ergeben dann je nach Länge des Nachhalls unterschiedlich lange Wave-Dateien und können in einer entsprechenden Reverb-App als eine Art "Vorlage" für den Raumhall genutzt werden.
Hier ein Beispiel vom Raumsimulator "FlStudio-Convolver" bei FLStudio:
 

jam

Absolut
Sprechprobe
Link
Möglicherweise hat sich das Thema ja schon erledigt, aber ich schreibe trotzdem kurz, was mir dazu einfällt.
Wichtig ist nicht nur die Lautstärke sondern natürlich auch das Klangspektrum. Wenn ich laut rufe, klingt das völlig anders als die Sprechlautstärke. Das ist meist schon die Filterung, die man braucht. Die Höhen abzusenken ist aber bestimmt hilfreich.
Die Lautstärke kann man ganz grob mit Schallenergie/Entfernung in Metern berechnen. (eigentlich Energie/(Entfernung * Entfernung) aber das ist meist zu leise). Die Schallenergie würde sich also danach mit doppelter Entfernung jeweils halbieren (ca. 6dB leiser).
Draußen würden vermutlich wenige längere Echos erklingen, z.B. vom Boden und Hauswänden oder anderen Objekten, wie etwa Bäume oder Autos oder so. Die Verzögerungszeit könnte man über die Entfernung berechnen (Schallgeschwindigkeit am Boden ca. 343,3 Meter pro Sekunde). Die Echos müßten dann aber auch separat gefiltert werden, weil unterschiedliche Materialien Schall unterschiedlich (stark) reflektieren. Daraus ergibt sich ein durch die Entfernung gefilterter Direktschall mit nachfolgenden zusätzlich gefilterten Echos.
Solche Effekte gibt es bestimmt auch als Impulsantworten, aber die setzen sich dann letzlich ähnlich zusammen wie hier beschrieben. Je später die Echos, desto weiter weg wirkt die Geräuschquelle. Das muß ja nicht alles so exakt sein, aber wenn man einen Startpunkt für die Experimente hat, hilft es vielleicht.;)
 

uburoi

Mitglied
ich hätte mal recht laienhaft vermutet, man kriegt das mit einer Mischung aus Panning, Gain, Anteil des Send auf den Faltungshall und EQ hin. Dazu auch das hier:
Also die Stimmen vorne kriegen einen geringen Send auf den Raumhall, hohes Gain, Pan eher mittig.
Die Stimmen mittelntfernt (also der Vater) kriegt geringes Gain, einen größeren Send-Anteil in den Hall und eine Reduktion der Höhen. Und ganz hinten dann noch extremer.
Muss ich gleich heute mal ausprobieren.
 

Nightblack

Meinhard Schulte
Sprechprobe
Link
Also die Stimmen vorne kriegen einen geringen Send auf den Raumhall,
Sehe ich als ebenso Laie etwas anders. Ich ändere den Raumeffekt ungefähr so:
Eine Person kommt durch eine entfernte Tür in die Tiefgarage nähert sich dann in großen Schritten dem Hörer:
Bei der Person ändere ich meist nur den Dry-Effekt / Anteil und lasse den "Wet-Anteil" des Raumsimulator ungefähr gleich, da sich ja der Raum eigentlich nicht ändert. Eigentlich eine sehr versimpelte Vorgehendsweise, die aber den Effekt schon gut rüber bringt.
 

Spirit328

Everything - STOP!
Teammitglied
Nun, da schon etwas Senf auf dem Teller ist, hier noch meiner: :)

Also, wenn ich das richtig verstehe, dann spielt die Situation im Freibad, also draussen.
Da ist Hall bzw. Reflektionen sicherlich möglich, aber ich würde das mal "wegrunden", weil der normale Hintergrundlärm eines Freibads das sicherlich übertönt. (Geschrei, Bauchplatscher, Gespräche, Rauschen der Außenduschen, usw. ....)
Nehmen wir also der Einfachheit halber an, es gibt keine (hörbaren) Reflektionen von dem Rufen des Vaters; sprich, Nix-Hall. :D

Es ist so, dass für das menschliche Ohr die Höhen wesentlich stärker "bedämpt" bzw. weniger laut hörbar sind wenn man etwas weiter weg ist, weil sie weniger Energie haben und deswegen schneller unter die Hörschwelle fallen.
Ihr kennt das von Stadtfesten oder Open-Air Konzerten: Was hört man als Erstes, wenn man sich nähert? - Richtig. Die Bässe. Ergo, die Höhen werden weniger weit übertragen bzw. sind nicht so weit zu hören, wie die Bässe.
Wer es GAAAANZ GENAU wissen will: Sengpiel: Schall und Abstand
Aber Vorsicht! Das ist alles in aller Breite ganz genau bis wirklich ins letzte Detail erklärt! :)

Zurück zum Beispiel:
Wo steht die hörende Person? Direkt neben den Kindern? Okay!
Dann hört man den Vater mit einer erhobenen Stimme rufen. Er muss ja nicht nur die 10 m Luft überbrücken, sondern auch gegen den Hintergrundlärm (s.o.) ankommen!
Dazu würde ich die Höhen mit ein "Tiefpassfilter" mit einer Eckfrequenz von ca. 2 kHz mit 1-2 dB /Oktave bedämpfen. Das kann schon zu viel sein. Aber so Pi mal Daumen, als Anfangswert :)

Die Tiefe erzeugt man auch durch den Unterschied einer bewußten Wahrnehmung zwischen "nah" und weiter weg". Es muss also Geräusche geben, die nah sind und auch so klingen. "Nah" heißt, es gibt keine (hörbare) Bedämpfung der Höhen und auch keine Verzögerung. Diese Stimmen bzw. Geräusche sind sehr detailliert und treten aus dem Hintergrundlärm klar erkennbar hervor.
Dann würde ich einen "Mittel-Layer" einziehen, also die Geräusche mit 3-8 m Entfernung (Pi mal Daumen). Also eine leichte Bedämfung der Höhen und bei Bedarf eine Ahnung einer winzigen Prise Hall. Das schafft die Illusion von "Raum". Dabei an "Salz" denken. Die richtige Dosis davon macht aus einer faden, eine leckere Suppe. Zuviel davon ... nun ;)

Die Stimme des Bademeisters in einem Megafon würde ich entsprechend verändern: Alles unter und oberhalb von 1-1,5 kHz gnadenlos wegfiltern. Eventuell sogar die 1-1,5 kHz anheben. ("Salz!")
Durch seine Bauart bedingt werden die Schallwellen weit übertragen. Und hier würde ich sogar ein kleine Echo einsetzen. Ordentliche "Pre-Delay" Zeiten, eine starke Bedämpfung und wenig "Diffusion" (Auch hier wieder "Salz"!) Also maximal 4 hörbare Reflektionen, die aber schnell und deutlich wahrnehmbar leiser werden.
Faustregel für die Laufzeiten: Schallausbreitungsgeschwindigkeit (20°, trockene Luft, normaler Luftdruck, ...) 343 m/s. Einen Meter also in 2,915 ms.
Hierbei muss man bedenken, dass es alleine schon ~146 ms dauert, bis der Schall bei der hörenden Person ist, dann noch die Strecke bis zur reflektierenden Fläche zurücklegen muss und von da wieder zu hörenden Person zurück.
Nehmen wir an die hörende Person steht 25 m von der nächsten Wand entfernt, dann ergibt sich: 50 m vom Megafon zur hörenden Person (Direktschall) und dann 25 m bis zur nächsten Wand und von dort wieder zurück, also wieder 50 m.
Also wäre die Delayzeit? .... ~ 146 ms! Der Unterschied der Laufzeiten zwischen Direktschall und Reflektionen ergibt die Wahrnehmung von Tiefe bzw. Entfernung.
Nun, das kann man beliebig komplex gestalten, etwa in dem die hörende Person "nur" die zweite, dritte und vielleicht noch eine vierte Reflektion hört .... :)

Auch hier würde ich mir die Mühe machen, eine Staffelung der Geräusche zwischen dem Bademeister und der Hörenden Person im Hörspiel gestalten.
Die Zauberformel heißt: Nicht zwingend realistisch, sondern "plausibel".
Wenn das Ohr "abwinkt" und sagt: Ach so! Kenne ich! Schwimmbad mit pampenden Bademeister! Dann wird die Analyse eingestellt und mit einer Hörgewohnheit verknüpft - Fertig! :D

Das ist alles kein Patent-Rezept für "Onkel-Ben's-Leim", sondern eine Orientierungshilfe.

Das Wichtige ist, dass es "plausibel" klingt. Was IMMER sehr viel weniger Aufwand bedeutet als "realistisch".

Wenn Du möchtest, kannst Du gerne auch mal einen Ausschnitt hier reinstellen und wir besprechen die Veränderungen gerne gemeinsam; wenn Du magst. :D
 
Zuletzt bearbeitet:

pio

Autor, Audio Engineer (BA), Sprecher und Musiker
Sprechprobe
Link
Sehr wichtiger Punkt!

"Das Wichtige ist, dass es "plausibel" klingt. Was IMMER sehr viel weniger Aufwand bedeutet als "realistisch"."
 

soundjob

Tontüte & Hörspielfrisör
Sprechprobe
Link
Im Tiefenstaffeleintopf rühre ich natürlich sehr sehr gerne mit, wenngleich hier schon vieles dargelegt wurde, dem ich mich nur vollkommen zustimmend anschließen kann. (y)

Für meine Herangehensweise der Tiefenstaffelung, ganz gleich ob Hörspiel oder Musik, ist das Aufräumen, bzw. Platz-schaffen im Frequenzbereich durch EQing, das primäre A und O.

Wie bereits schon gleich im ersten Post erwähnt wurde, gibt es in Abhängig der Entfernung einer Signalquelle zum Zuhörer dominante Frequenzbereiche, die mit der Entfernung abnehmen, bzw. sich verlagern und daraus zunächst der räumliche Eindruck eines "Vorn" und "Hinten" ergibt- ganz unabhängig davon, ob es sich um einen staubtrockenen Raum oder äußerliche Umgebung handelt.

Zudem sorgt ein optimierter Frequenzbereich für Durchsetzungsfähigkeit im Zusammenspiel von Sprache, bzw. mehrerer Stimmen und Geräusche (Spuren) und sich nicht zu sehr in einer diffusen Suppe überlagern, sprich gegenseitig "maskieren".

Der Einsatz von Delays und Reverbs ist dann auch einmal das i-Tüpfelchen, um Räumlichkeiten und Positionen sich noch abzeichnender herauszuarbeiten.
 

dieVERdener

Mitglied
nach leider längerer Krankheit kann ich mich zurück melden und mich ganz herzlich für die für mich doch mal wieder sehr hilfreichen Kommentare bedanken!!
Bin jetzt gerade schon am Probieren, wie ich da für mich was brauchbares draus machen kann. Wie so oft: try and error - aber "try" ist jetzt durch eure Hinweise angereichert und unterfüttert.
 

sychron

Mitglied
Das meiste wurde ja schon gesagt, aber eine Kleinigkeit möchte ich noch hinzufügen: Je näher eine Schallquelle ist, desto dynamischer nehmen wir diese wahr. Für die Tiefenstaffelung bedeutet dass, das ein Kompressor Wunder wirken kann für die Darstellung.

Eine gute Fausregel ohne viel rechnen ist: Je weiter etwas weg ist, desto stärker wird es komprimiert, und desto höher der Anteil an Early Reflections gegenüber dem Nutzsignal.
Was direkt vor Deinem Gesicht passiert, hat also fast keine Kompression und keine Early Reflections, was weit hinten passiert wird stark komprimiert und hat fast so viel Early Reflections wie Nutzsignal.
Und nur der Vollständigkeit halber: Wenn Du Sachen hinter den Hörer bekommen möchtest, gilt quasi das gleiche, nur dass du zusätzlich mit einem Equalizer die Höhen beschneiden musst.
 

Erdie

Der düstere Herrscher
Sprechprobe
Link
Habt Ihr mal darüber nachgedacht, dass es im Freien praktisch keinen Hall gibt? Ausnahme: Wald, Gebirge etc.
Aber das von dem Threadersteller beschriebene Szenario enthält, würde ich so einschätzen, gar keinen Hall. Da kann man also mit irgendwelchen Raumeinflüssen gar nichts machen. Da gibt es im Wesentlichen nur 2 Parameter: Lautstärke und Klangspektrum und vieleicht noch Reflexionen an glatten Wänden wie z. B. eine Hauswand d. h . also Echos. Dass die Luft hohe Frequenzen stärker dämpft, wurde schon gesagt. Den Punkt mit der Kompression wage ich mal anzuzweifeln. Es gibt keinen physikalischen Grund, warum das so sein sollte. Ich habe auch noch nicht davon gehört.
Ich würde hier in erster Linie mit dem Pegel und Equalizer spielen.
 

sychron

Mitglied
Habt Ihr mal darüber nachgedacht, dass es im Freien praktisch keinen Hall gibt? Ausnahme: Wald, Gebirge etc.
Aber das von dem Threadersteller beschriebene Szenario enthält, würde ich so einschätzen, gar keinen Hall. Da kann man also mit irgendwelchen Raumeinflüssen gar nichts machen. Da gibt es im Wesentlichen nur 2 Parameter: Lautstärke und Klangspektrum und vieleicht noch Reflexionen an glatten Wänden wie z. B. eine Hauswand d. h . also Echos. Dass die Luft hohe Frequenzen stärker dämpft, wurde schon gesagt. Den Punkt mit der Kompression wage ich mal anzuzweifeln. Es gibt keinen physikalischen Grund, warum das so sein sollte. Ich habe auch noch nicht davon gehört.
Ich würde hier in erster Linie mit dem Pegel und Equalizer spielen.
Kommt drauf an, wo man im Freien ist. Hall besteht ja aus zwei Komponenten: Der Hallfahne und den Erstreflexionen. Draußen hat man wenig bis keine Hallfahne, aber durchaus je nach Umgebung halt Erstreflexionen.
In dem beschriebenen Szenario hat man sogar recht viele Erstreflexionen, deren Intensität von der ursprünglichen Lautstärke abhängt. Das wird beispielsweise bei dem Megaphon interessant, weil das weit weg ist, also leise, dessen hohe Lautstärke aber mit einigen Erstreflexionen an Gebäuden etc. einhergehen kann.
Was man auch niemals außer acht lassen sollte: Wir bauen hier Soundkulissen, wir bilden nicht komplett die Realität ab. In echt wäre in einem Freibad ein undurchdringliches Gewirr aus Rufen, Schreien, Hintergrundgerede etc. Das wäre für den Hörer maximal verwirrend und nicht zielführend. Deshalb verändern wir solche Szenen ja schon im Vergleich zur Realität. Und da unsere Gehirne halt auf das simple Muster "Mehr Reflexionen = weiter weg" trainiert sind, können wir diesen Effekt an der Stelle auch über die Grenzen der Realität hinaus zu unserem Vorteil nutzen. Was zählt, ist, dass die Personen, die das ganze am Ende hören, mit der Szene etwas anfangen können, also grob verstehen, wo etwas stattfindet, ohne mit dem Realismus dieser Szene überrannt zu werden.
Das ist in etwa der gleiche Grund, warum besagtes Hintergrundgerede als Atmo wahrscheinlich deutlich leiser bis fast unhörbar eingeblendet wird, statt in realistischer Lautstärke.
 

Erdie

Der düstere Herrscher
Sprechprobe
Link
Das mit dem "Wir bilden nicht die Realität ab" kann ich voll unterschreiben. Das gilt überigens auch bei musikalischen CD Aufnahmen. Da hat sich herausgestellt, dass die Hörer das als nicht gut/ästhetisch bewerten, wenn es realistisch klingt beispielsweise was die Lautstärke von Solisten betrifft (ich meine jetzt klassische Musik)
Und mit den Reflexionen meinte ich das fast so wie du es beschreibst. Wobei ich da jetzt der Meinung bin, dass in einem Schwimmbad nicht so viele Reflexionen zu hören sind in der Realität, man hat es in erster Linie mit dämpfenden Elementen zu tun: Menschen, Rasen etc. das klingt schon maximal trocken. Bei solchen Szenarien ist es besonders wichtig, dass die Stimmen absolut Akustik - frei aufgenommen worden sind.
 

Spirit328

Everything - STOP!
Teammitglied
Bei einem Vortrag habe ich gelernt, dass wenn man etwas "plausibel" gestaltet, dass dies in vielen Fällen ein Optimum zwischen Aufwand und "Nutzen".

Plausibel heißt zum Beispiel, dass man eine Halle mit einem Hall mit ca. 3 s RT 60 macht. Dass da eventuell noch Säulen darin stehen, die natürlich auch zusätzliche Reflektionen und Verwürfelungen einbringen ...
Oder man eine Atmosphäre in einer Taverne auch mit "nur" drei verschiedenen Atmo-Streifen machen, kann, die leicht verstetzt und/oder überlagernd zusammengemischt und die Lautstärke der einzelnen Passagen automatisiert werden.
Man könnte ja auch den Aufwand treiben und 20-30 Personen in einen Raum bringen, Mikrofone in die Mitte und "Push the button, baby!".
Das steht und fällt natürlich mit dem Anspruch und den Möglichkeiten.
 

sychron

Mitglied
Ich bin in vielen Fällen ganz froh, dass ich mir vor einiger Zeit "Cinematic Rooms" zugelegt habe. Da sind Hall und Reflexionen ziemlich gut konfigurierbar, und, was wirklich nützlich ist: Es gibt Presets für Spaces "draußen", die ein guter Startpunkt sind und schon die "best pratice" der Foly- und ADR-Industrie in Betracht ziehen. Ich nehme Hallräume fast exakt wie im Preset, aber diese Außerhalb-Ambience-Einstellungen sind schon ziemlich gut abgestimmt -- nicht realistisch, aber glaubhaft und "wie gewohnt". Allerdings auf Film ausgelegt, für Hörspiel muss man dann immer nochmal etwas anpassen - Film neigt dazu, Stimmen im Center zu lassen und unr Effekte im Raum zu bewegen, während beim Hörspiel auch die Stimmen leichtes Panning erfahren, und diese Sonderbehandlung des Centers muss man ein wenig "rausdrehen".
 
Oben