Welche technischen Spezifikationen sollten für Musik festgelegt werden?


11

Ich schreibe die Musik für ein Videospiel. Irgendwann muss ich mit den Programmierern zusammenarbeiten, um die technischen Spezifikationen für die Audiodateien zu ermitteln, die ich ihnen übergeben werde. Über welche Details müssen wir sprechen?

Zum Beispiel sind einige Fragen, die wir möglicherweise klären müssen:

  • In welchem ​​Format sollten die Audiodateien vorliegen?
    • Unkomprimiert? Verlustfrei? Komprimiert?
    • Wie ist das Gleichgewicht zwischen hoher Audioqualität und kleinen Dateien?
  • Wie laut sollte die Musik sein?
    • Wie hoch sollte die durchschnittliche Lautstärke jedes Tracks sein?
    • Was sollte die lauteste Lautstärke sein?
  • Wie soll die Häufigkeitsverteilung sein?
    • Sollte ich zum Beispiel darauf achten, Musik zu schreiben, die nicht viel Bass hat, damit tiefes Geräusch leicht zu hören ist?

Sind die Fragen, die ich mir überlegt habe, wichtig? Gibt es noch andere Fragen, die wir diskutieren sollten?


Dies scheint sehr breit ...

5
Ich denke, es ist eine großartige Frage, da sie eine nützliche Ressource für andere darstellen würde.
Ingenieur

2
Ein Punkt, der mir in den Sinn kommt, ist die Priorität der Klänge. Dies ist ziemlich offensichtlich in einem Spiel wie Diablo, in dem Sie viele Effekte haben, die alle gleichzeitig Ihre Lautsprecher bombardieren. Um zu vermeiden, dass es bei viel Action zu Geräuschen wird, müssen Sie einige der weniger wichtigen Geräusche wie Schritte und Umgebungsgeräusche leiser stellen, um wichtige Geräusche wie Schlüsselzauber zu erzeugen, auf die der Spieler reagieren muss Volumen von ihnen, sobald ein Kampf ziemlich gesunken ist. Es hängt auch von den Hardwarefunktionen ab, wie viele Kanäle Sie verwenden können.
ScrambledRK

Antworten:


6

Wenn ich das richtig verstehe, haben Sie hier zwei verschiedene Fragen:

  1. Welche technischen (wie bei der Programmierung) Überlegungen sollten dargelegt werden?

  2. Welche technischen (wie in der Audiotechnik) Überlegungen sollten dargelegt werden?

Bei beiden Fragen wenden Sie sich am besten an die verantwortliche Person. Für den ersten könnte es der leitende Audioprogrammierer sein, während es für den zweiten der Audiodirektor sein könnte.

Nun, ich nehme an, da Sie dies hier fragen, sind Sie in einem kleinen Team ohne solche Rollen, und Ihr Programmierer weiß wahrscheinlich nicht, wovon Sie sprechen, also werde ich mit einem General antworten Richtlinien, die für die meisten Projekte funktionieren könnten. Aber auf jeden Fall würde ich nicht empfehlen, selbst Entscheidungen zu treffen. Besprechen Sie mit Ihren anderen Teammitgliedern, um eine Schlussfolgerung zu ziehen.

Lassen Sie uns zunächst über einige technische (Programmier-) Überlegungen sprechen.

  • Normalerweise wird das Format, in dem Ihre Audiodateien verteilt werden, bereits von der von Ihnen verwendeten Plattform oder Game Engine bestimmt. Wenn Sie plattformübergreifend arbeiten, ist es wahrscheinlich, dass jede Plattform über völlig unabhängige Ressourcenverzeichnisse verfügt und die Eigenschaften von Audiodateien für jede Plattform unterschiedlich sein können.

    Beispielsweise müssen Sie möglicherweise Ogg Vorbis-Dateien für Android, MP3 oder AAC für iOS und WMA für Windows einreichen.

    Manchmal hängt sogar das Format vom Zweck jeder Datei ab. Während iOS mit MP3- und AAC-Dateien für jeden Zweck gut funktioniert, benötigt PlayStation Mobile MP3 für Hintergrundmusik, unterstützt jedoch nur unkomprimiertes PCM oder Microsoft ADPCM.

    Fragen Sie Ihren Programmierer, in welchem ​​Format die Dateien vorliegen müssen.

  • In den meisten Fällen sind die grundlegenden Spezifikationen für die Dateien bereits definiert. Fragen Sie daher Ihren Programmierer danach. Zum Beispiel werden BGM-Dateien normalerweise in Stereo verteilt, während SFX- und Sprachdateien normalerweise in Mono verteilt werden (so dass sie leicht im Spiel positioniert werden können).

  • Bei Bitraten und anderen Parametern sind sie wiederum normalerweise von der Engine oder Plattform abhängig. Wenn Sie hier etwas Freiheit haben, denken Sie daran, dass Sounddaten normalerweise die größte Komponente eines Spiels sind. Wenn das Spiel über digitale Downloads verbreitet werden soll, wird Ihr Programmierer (und Ihre Kunden) Ihnen danken, wenn Sie die Dateien so klein wie möglich machen wie möglich.

    Wenn Sie auf physischen Medien verteilen, ist die maximale Verteilungsgröße vorgegeben, und Sie müssen ernsthafte Verhandlungen mit dem Rest des Teams zur Erstellung von Inhalten führen.

  • Bei einigen Spielen müssen Ihre Sounds (meistens BGM) wiederholbar sein. Bei anderen Spielen müssen Ihre Sounds strengen zeitlichen Einschränkungen unterliegen (z. B. bei Rhythmus-Spielen). Die meisten verlustbehafteten Komprimierungsschemata sorgen am Anfang und am Ende des Tracks für Polsterstille, wodurch Schleifen und striktes Timing unterbrochen werden können. Besprechen Sie diese Probleme mit Ihrem Programmierer.

Es gibt zu viele Möglichkeiten, Audio zu komprimieren. Ich empfehle daher, eine Master-Version jeder Sounddatei in unkomprimiertem PCM mit 44,1 kHz 16-Bit-Stereo auszugeben und diese Datei dann zu verwenden, um die tatsächlichen Dateien für jede Plattform zu erstellen. (Optimalerweise können Sie ein Transformationsskript erstellen, das auf jede Datei angewendet werden kann, sodass Sie nicht jede Datei jedes Mal neu konvertieren müssen, wenn Sie eine kleine Änderung an der Masterdatei vornehmen.)

In technischer Hinsicht (wie in der Audiotechnik) wird es Ihrem Programmierer höchstwahrscheinlich egal sein, sodass Sie in diesem Bereich mehr Freiheit haben. Es gibt jedoch einige Dinge, die Sie tun können, um Ihrem Programmierer das Leben zu erleichtern:

  • Alle Sounds im Spiel sollten eine normalisierte Lautstärke haben. Zumindest sollten alle BGM-Dateien untereinander die gleiche Lautstärke haben, und alle SFX-Dateien sollten untereinander die gleiche Lautstärke haben. Lassen Sie Ihren Programmierer nicht die Volumes im Code optimieren.

  • Der Wiedergabecode ist sehr begrenzt und kann normalerweise nur linear verstärkt werden. Aus diesem Grund kann zwischen hoher und niedriger Lautstärke eine hohe Lautstärke bevorzugt werden, da eine Reduzierung der Lautstärke während der Wiedergabe normalerweise zu besseren Ergebnissen führt als eine Verstärkung. Es ist schwierig zu sagen, wie hoch die genaue Lautstärke sein soll, aber als Faustregel gilt: Je größer die Gesamtamplitude von Spitze zu Spitze ist, desto besser nutzen Sie den Abtastbereich.

    Möglicherweise möchten Sie andere Spiele laden und deren Sounds mit maximaler Lautstärke spielen und Ihre Sounds mit denen vergleichen.

  • In Bezug auf den Ausgleich muss ich sagen, dass dies wirklich davon abhängt, welche anderen Sounds Ihr Spiel haben wird. Abgesehen davon, dass Sie dies mit dem Sound Director besprechen, möchten Sie möglicherweise auch die Wiedergabehardware berücksichtigen, die Sie verwenden werden: Während Desktop-Computer möglicherweise über eine große Auswahl an Wiedergabehardware verfügen, verfügen Handheld-Geräte normalerweise über sehr kleine Lautsprecher, und Sie möchten dies möglicherweise kompensieren Sie das. Arcade-Automaten haben normalerweise auch sehr unterschiedliche Anforderungen.


Eine Sache, auf die ich hinweisen muss, für SFX hasse ich Stereodateien. Ich muss sie in der Engine zu Mono kombinieren, damit ich sie richtig in die 3D-Sound-Engine einfügen kann. Infolgedessen können alle originalen SFX, zum Beispiel Foley-Sounds, mono sein.
Rioki

2

Ich unterscheide zwischen zwei Situationen, was ich während der Entwicklung und später (Lagerung) behalte und was ich in die endgültige Lieferung stecke.

Für die Speicherung verwende ich die höchstmögliche Qualität, dh für Audio ein verlustfreies Format. Solange die Komprimierung verlustfrei ist, spielt es keine Rolle. WAV oder FLAC reichen aus. Grundsätzlich bin ich mit einer 44,1-kHz / 16-Bit-Aufnahme einverstanden und die Lautstärke sollte so "natürlich" wie möglich sein, also im Grunde genommen eine Originalaufnahme mit minimaler Verstärkung, falls erforderlich. (Wenn Sie wirklich wollen, können Sie mit 96-kHz- oder 192-kHz-Aufnahmen arbeiten.) Die Größe spielt keine Rolle, Festplatten sind nicht so teuer und Sie können immer mehr auf dieses Problem werfen. Das Hauptprinzip ist, dass Sie immer aus verlustfreiem Format in ein verlustbehaftetes Format komprimieren können. Wenn Sie jedoch nur verlustbehaftete Dateien haben, können Sie niemals zu einer höheren Qualität wechseln.

Für die Lieferung ist das eine ganz andere Geschichte. Hier müssen Sie einige schwierige Entscheidungen bezüglich Qualität vs. Raum vs. Geschwindigkeit treffen. Für kleine SFX verwende ich WAV-Dateien, weil sie am schnellsten geladen werden. Musik hingegen spielt eine Rolle, daher verwende ich normalerweise MP3 mit variabler Bitrate. Sie können mit 64-Kbit / s-Dateien davonkommen, aber das ist Geschmackssache. Die Klänge sollten grundsätzlich ihre natürliche Lautstärke haben, obwohl sie gegeneinander ausgeglichen sind. Die Spiel-Engine nimmt dann nach Bedarf Anpassungen vor, insbesondere wenn Sie so etwas wie 3D-Sound machen.


Sie wissen, dass unkomprimiertes PCM bei 16,1-Bit-Stereo mit 44,1 kHz ungefähr 1300 kbit / s erreicht, oder? 320 kbps unkomprimiertes Audio klingen abscheulich.
Panda Pyjama

Es stimmt, ich bezog mich hauptsächlich auf komprimiertes Audio. 128kbps FLAC klingen ganz gut.
Rioki

"kbps" als Encodereinstellung macht für FLAC oder andere verlustfreie Encoder keinen Sinn. Größe gegen (Ton-) Qualität ist nur bei verlustbehafteter Komprimierung sinnvoll. Sind Sie sicher, dass es sich um FLAC handelt?
Panda Pyjama

Sie haben Recht, das ist der Programmierer, der spricht. Die "Bitrate" basiert auf der Originalaufnahme. Was ich normalerweise mit 44 kHz machen würde, was in Ordnung ist. Sie könnten anal werden und 96-kHz- oder 192-kHz-Aufnahmen machen. Ich werde ändern, was ich wirklich meinte ...
Rioki

1
44 kHz, 96 kHz und 192 kHz sind "Abtastraten", keine "Bitraten". Es ist keine gute Idee, sie durcheinander zu bringen, weil sampling rate * sample size * channel count = bitrate. Aus diesem Grund beträgt die Bitrate für 44,1 kHz 16-Bit-Stereo genau 1411200 Bit / s. 320 kbps 16-Bit-Stereoklang müssten mit 10 kHz abgetastet werden, und daher meine Bemerkung "wird schrecklich klingen".
Panda Pyjama
Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.