Mostrar mensagens com a etiqueta Sound Basics. Mostrar todas as mensagens
Mostrar mensagens com a etiqueta Sound Basics. Mostrar todas as mensagens

terça-feira, 17 de dezembro de 2013

THE LOUDNESS WAR


Dynamic range, in simple terms, is the maximum difference in volume between the loudest and the lowest sound recorded in a specific media.

On an early 78 rpm phonograph disc, it was around 40 dB, then, a cassette tape could go until 60 dB and, later, a professional Ampex magnetic tape would allow for 90 dB.

The CD offers a 120 dB psychoacoustic dynamic range.

That’s a lot! Taking in account that our hearing dynamic range is just 140 dB.

So, when, digital audio made its appearance, everybody was thrilled about the enormous dynamic range it could handle.

As this is the difference between the lowest and the loudest sound, one could expect modern music to take advantage of this feature and create great sounding dynamic mixes with lots of power and transients between the soft's and the loud's. As the digital cinema, cleverly, did.

Well, this happened in classical music and some jazz but, in Pop…we couldn't be more wrong!

Pop music labels, producers and artists didn’t want all this dynamics, they hated it and they have been doing everything to reduce it to the 40dB’s of the old phonograph 78 rpm discs.

Two Metallica songs 20 years apart: all the peaks in "End of the Line" waveform are gone

Old remastered songs are also squeezed into the giant press of "modern" mastering.


Notice the remastered track ABBA's of "One of Us". Nice work! :-(

This is called the Loudness War.

Mastering engineers are requested to push the compression to limits beyond the digital scale, adding so much compression and distortion, so that everything will sound as loud as possible. And even beyond that.

Loud is the the word. Louder means "better".

As the hits have to fight each other in radio, the louder song will prevail over the others. Forget dynamics and sound quality, just make it very loud, all the way through the song!

According to Bob Katz, one of the most brilliant mastering engineers of the World, “Many clients think that Mastering is the process of “making it loud”.

Bob Katz

 This video by Matt Mayfield gives an excellent explanation of what is happening:


A GUERRA DO LOUDNESS


A amplitude dinânimca, em termos simples, é a máxima diferença permitida entre o som mais baixo e o mais alto que conseguimos gravar num determinado suporte.

Nos antigos discos de 78 rotações, era à volta de 40dB, depois, a Cassette conseguia até 60 dB e, mais tarde, uma fita Ampex profissional permitia 90dB.

O CD oferece, em termos psicoacústicos, 120 db de amplitude dinâmica.

É muito! A amplitude dinâmica do nosso ouvido só vai até aos 140 dB.

Por isso, quando o audio digital apareceu, toda a gente ficou muito excitada com a enorme amplitude dinâmica que oferecia.

Como isto significa a diferença entre o som mais alto e mais baixo, poderíamos esperar que a música moderna usasse esta vantagem para criar gravações com um som fantástico com grande impacto dinâmico e imensos transientes entre os níveis baixos e os altos. Tal como o cinema, inteligentemente, fez.

Bem, aconteceu na música clássica e nalgum Jazz, mas na Pop…não podíamos estar mais enganados!

As editoras, produtores e artistas Pop não querem esta dinâmica, pelo contrário, têm horror a ela. Estão a fazer tudo o que podem para a reduzir aos mesmos 40dB da antiga grafonola.

Duas canções dos Metallica, com 20 anos de intervalo. Os picos em "End of the Line" desapareceram

Os êxitos antigos são remasterizados e também esmagados por esta gigantesca prensa do mastering "moderno".

Repare na imagem rmasterizada de "One of Us" dos ABBA. Belo trabalho! :-(



É a guerra do Loudness.

Os engenheiros de masterização são obrigados a levar a compressão e o volume a níveis para além da escala digital, comprimindo e distorcendo o sinal para que o conteúdo soe alto. 

Alto é a palavra de ordem. Mais alto significa melhor.

Como os hit-singles têm de competir uns com os outros na rádio, a canção mais alta sobressai em relação às outras. Esqueçam a dinâmica e a qualidade de som, limitem-se a pôr alto, muito alto, do princípio ao fim da canção!

Como diz Bob Katz, um dos mais brilhantes engenheiros de masterização do Mundo, “Muitos clientes pensam que a Masterização é o processo de pôr a música  alto”

Bob Katz

Este vídeo de Matt Mayfield explica melhor que ninguém o que está a acontecer:




terça-feira, 19 de novembro de 2013

DIGITAL AUDIO 

44.1 Khz / 16 bit. What is this?




Staying away from the difficult terrain of Fourier analysis, we just have to know that sound waves are complex, although they can be represented by a sum of simple sine waves of different frequencies.


One sine wave cycle

When we are young and healthy, we can hear from 20 Hertz to 20.000 Hertz. One Hertz means one cycle per second.

This vibrations are transformed into electric waves by a microphone, and then converted to digital by an Analog-to-Digital Converter, ADC.

As in digital photo, a digital recording of a sound is a series of zeros and ones that represent that sound. The perfection of this recording depends on a lot of factors. Two are more important: Sample Rate and Bit Depth.

First, what is a sample? In simple words is a measure, like a snapshot, taken at a certain time. But sound is movement, so we need a lot of snapshots. The air, stressed by a sound wave, is vibrating very quickly, up to 20.000 times in every second, so is the electric current produced by the microphone.

Harry Nyquist, a swedish scientist born in 1889, explained that we need at least two samples per cycle to be certain of the position of a sine wave.
So, to record up to 20.000 vibrations per second, we will need at least 40.000 samples in every second.

44.100 samples is the rate proposed by Philips in 1979 and used by the Audio CD Industry.
The CD size and playback length was agreed with Sony, in 1980, so that one Audio CD could contain the whole Beethoven's 9th Symphony.
The video industry, led by Sony, uses a slightly higher sample rate, 48.000 Hz.

A rough digital sample (in grey) of an analog sine wave (in red)

So, this is the sample rate. The number of measurements per second.

Now, let’s talk about the accuracy of those measurements.
An analogy: How tall are you? Let’s measure it with different rulers, of different precisions:

Ruler 1 ( less precise )  5,9 feet.
Ruler 2 (medium)          5,906 feet.
Ruler 3 ( more precise)  5,905724379 feet.

The accuracy of those measurements need space in binary numbers, zeros and ones.
If we just use 4 bit words for that storage, our scale only allows for 16 different values. Quite rough.


                             

The effect of a high and low resolution in a picture 

With 8 bit word, we can go up to 256 values. But with 16 bit, we reach 65.536. And having a 24 bit word, we can have a 16.777.216 scale, which is 256 times more precise and accurate than the 16 bit scale!

So, when you’ll see that a recording is made in 48KHz/24 bit, you will immediately know that it was done with 48.000 samples per second and a precision of 24 bits.
In an Audio CD it will be 44.1KHz at 16 bits. Quite good, I'd say.
Some audio formats go up to 192 KHz / 32 bits. I bet our dogs will love it!

AUDIO DIGITAL

44.1KHZ / 16 BIT. O que é isto?




Sem termos de entrar no território difícil da análise de Fourier, basta-nos saber que as ondas sonoras são complexas, embora possam ser representadas por uma soma de simples ondas sinusoidais de diferentes frequências. 


Um ciclo de uma sinusóide

Quando somos jovens e saudáveis, conseguimos ouvir sons entre os 20 Hertz e os 20.000 Hertz. 
Um Hertz é um ciclo por segundo.

Estas vibrações são transformadas em ondas eléctricas por meio de um microfone e, depois, convertidas em números binários através de um Conversor Analógico Digital, CAD.

Tal como numa foto digital, uma amostra digital é uma série de zeros e uns que representam esse som. A precisão dessa representação depende de uma série de factores. Dois são os mais importantes: Frequência de Amostragem e Número de Bits.

Primeiro, o que é um sample ou amostra? É como se tirássemos uma fotografia, num determinado momento. Mas o som é movimento, por isso, precisamos de muitas fotografias. As ondas sonoras vibram a frequências audíveis até 20.000 ciclos, assim como a corrente produzida pelo microfone.

Harry Nyquist, um cientista sueco nascido em 1889, explicou que são necessárias pelo menos duas amostras por ciclo para conhecermos a posição de um impulso sinusoidal. Assim, para frequências de 20.000 ciclos precisaremos de 40.000 amostras.

A Philips, quando criou o Audio CD em 1979, propôs uma frequência de amostragem de 44.100 Hz. A sua dimensão e capacidade do CD foram calculados em 1980 num acordo com a Sony de forma a permitir incluir a totalidade da 9ª Sinfonia de Beethoven.
A indústria de vídeo usa um pouco mais, 48KHz.

Uma amostragem digital ( a cinza) de uma sinusóide analógica ( a vermelho)

Portanto, isto é a frequência de amostragem. O número de amostras por segundo.

Agora falemos da precisão dessas amostras.

Uma analogia: Qual é a sua altura? Vamos medi-la com réguas de diferente precisão.

Régua 1 ( mais grosseira )  1,8 metros
Régua 2 ( média)               1,8346 metros
Régua 3 ( mais rigorosa )   1,83469875252 metros

A precisão destes valores precisa de espaço em linguagem binária de zeros e uns.
Se tivermos palavras de 4 bits, só temos 16 diferentes valores da escala. Muito grosseiro!


O efeito de alta e baixa resolução numa imagem

Se aumentarmos para 8 bits, teremos 256, bastante melhor.
Com 16 bits temos 65.536 valores e com 24 bits 16.777.216 possibilidades, ou seja, 256 mais rigoroso que a medição com 16 bits.

Assim, quando vir que uma gravação é 48KHz/24 bit já sabe que foram tomadas 48.000 amostras por segundo e que a precisão de medida é de 1/ 16.777.216 da escala.
Num CD Audio será de 44.1KHz a 16 bits. Bem bom, na minha opinião.
Alguns formatos vão até aos 192 KHZ / 32 bits, os nosso cães devem adorar!


segunda-feira, 11 de novembro de 2013

BINAURAL AND HOLOPHONICS

Beyond Stereo


Stereo is the most common sound format and must not be confused with Binaural Recording.

In simple terms, on a binaural recording, two omnidirectional microphones are used, but they are generally mounted in a dummy-head to simulate the effect of sound waves traveling inside our brain. An HRTF (Head-Related Transfer Function) model is used with the purpose of generating a 3D sound recording.

Dummy-Head Neumann KU100

In 1981, Hugo Zucarelli was the creator of an impressive technology, Holophonics, the sound equivalent to the visual hologram. He was born in Argentina and is one of the greatest sound geniuses of our times.
He claims that our brain generates sound waves and then, interprets the interference pattern between its own generated sound waves and the ones entering our ears.

Hugo Zucarelli

There is, however, some controversy about the existence of sound waves emitted by our brain, as in Zucarelli's theory. In fact, this has never been proved. Some also say that there's no big difference between Holophonic and Binaural recordings.

But one thing is for sure: Holophonic recordings are amazing!


Just listen to his recording "The Virtual Barber Shop". Holophonic effect is only possible with headphones. Close you eyes and enjoy!


BINAURAL E HOLOFONIA

Para além do Stereo


Stereo é o formato de audio mais comum e não deve ser confundido com gravação Binaural.

Em termos simples, na gravação Binaural usam-se dois microfones omnidirecionais, que estão geralmente montados numa dummy-head para simular o efeito das ondas sonoras propagando-se dentro do nosso cérebro.
É usado um modelo HRTF (Head-Related Transfer Function) com o objectivo de gerar uma gravação 3D.

Dummy-Head Neumann KU100

Hugo Zucarelli, foi, em 1981, o criador de uma tecnologia impressionante, a Holofonia, o equivalente sonoro do holograma. Nasceu na Argentina e tornou-se num dos mais brilhantes génios sonoros dos nosso dias.
A Holofonia baseia-se na teoria de que o nosso cérebro emite ondas sonoras e que, depois, interpreta os padrões de interferência entre essas ondas e as que chegam aos nossos ouvidos, conseguindo, assim, determinar a direcção destas. 

Hugo Zucarelli

Há, no entanto, alguma controvérsia a respeito desta teoria que nunca chegou a ser comprovada. Alguns também afirmam que não há grandes diferenças entre os resultados da gravação binaural e holofónica.

Mas uma coisa é certa: O som holofónico é impressionante!

Oiça a gravação de Zucarelli "The Virtual Barber Shop". O efeito holofónico só é possível com auscultadores. Feche os olhos e divirta-se!


sábado, 9 de novembro de 2013

MONO AND STEREO

There's more to it than it seems


Edison invented the Phonograph in 1887. The first recordings were, of course, in Mono.
But, did you know that the first stereophonic transmission was made, six years earlier, in 1881?
It was performed by Clemént Ader, french inventor better known for his flying ideas.


It was the Théatrophone, where people could listen to stereo content with headphones.

In the early 30’s, Stereophonic recording was finally patented by EMI.

The way our brain perceives the direction of sound is quite complex. First, there is a delay on the sound wave arriving at each ear that can be sensed by our brain as a difference in phase between the two signals.


But there is also a sound transmission through our head and reaching the inner ear. And besides that, the auditory nerves supply some information from one auditory cortex to the other.
Finally, Hugo Zucarelli, the father of Holophonics, states that our brain is also a sound emitter and uses the interferences with the incoming sound to detect its direction.

The most important factor is the difference in phase, and, because of that, it's very difficult for us to know the direction of a bass sound. Its wavelength is much bigger so the phase difference is hardly noticed by our brain. This is the reason why we cannot easily understand where the sound of a thunder comes from.
Because of this, most warning sounds are high pitched ones, like the whistle of a policeman or the siren of a firetruck, so that we can immediately know where the danger is coming from.



Immersed in water, we have great difficulty to perceive the direction of sounds because sound in water travels around 4 times faster than in the air. The delays are, thus, 4 times smaller and we are not used to them. Sounds seem to come from everywhere.



A good application of this phenomenon is the Sub-Wooffer speaker. Usually only one, we can place it almost everywhere in the room. The bass component of the sound will seem to come from where the treble speakers are.


                                              MONO E STEREO                                                                 Mais complicado do que parece

Edison inventou o fonógrafo em 1887. As primeiras gravações foram, claro, em Mono.
Mas sabia que, seis anos antes, em 1881, foi feita a primeira transmissão em Stereo?
Foi realizada por Clément Ader, inventor francês mais conhecido pelas suas invenções no domínio da aviação.
Chamou-se Théatrophone e as pessoas podiam ouvir conteúdos Stereo com um par de auscultadores.
Nos anos 30, a gravação Stereo foi finalmente patenteada pela EMI.

A forma como o nosso cérebro se apercebe da direcção do som é relativamente complexa.
Em primeiro lugar, há um atraso no som que chega a cada um dos ouvidos o que origina uma diferença de fase entre os dois sinais.
Mas também há uma transmissão de som através da nossa cabeça e que é sentida pelo nosso ouvido interno. Para além disso, os nossos nervos auditivos partilham informação entre os dois córtexes auditivos, esquerdo e direito.
Por fim, Hugo Zucarelli, pai da Holofonia, afirma que o nosso cérebro é um emissor de som e que usa a interferência entre o som emitido e recebido para encontrar a localização da fonte sonora. 


O factor mais importante é a diferença de fase, por isso é muito difícil para nós apercebermo-nos da direcção de um som grave. O seu comprimento de onda é muito maior e o nosso cérebro tem muito mais dificuldade em se aperceber dessa diferença. Por esta razão, um trovão não parece ter direcção. Parece estar à nossa volta. 
Por causa disso, a maioria dos sinais de aviso são agudos, como o apito do polícia ou a sirene dos bombeiros, para que nós nos apercebamos imediatamente de onde vem o perigo.

Imersos na água, temos enorme dificuldade em perceber de onde vêm os sons, porque a velocidade do som dentro de água é aproximadamente 4 vezes maior que no ar. As diferenças de fase são, por isso, 4 vezes mais pequenas. Os sons parecem vir de todo o lado.

Uma boa aplicação deste fenómeno são os Sub-Wooffers das aparelhagens sonoras, normalmente só um, e que se podem colocar em quase qualquer ponto da sala. A componente grave do som é percebida pelo nosso cérebro como vindo do mesmo sítio de onde vêm os agudos.

sábado, 2 de novembro de 2013

THE DECIBELS



When we speak about sound, we often talk about Decibels.

Decibel is the tenth of a Bel, in honour to Alexander G. Bell.

It is used in electronics as a gain unit and also in sound as a volume unit.

There are two measurements that most interest us: SPL, or Sound Pressure Level, objective and physical, the actual sound intensity, and Loudness, subjective and perceptual, which represents the volume that we feel.

The proportion between the minimum and maximum sound we can hear is around 1 trillion to 1, so the scale is logarithmic in order to help us manage the data more easily.

Although 3dB more mean the double of power, 6dB represent the double in SPL, but only a difference of 10dB will cause the double of Loudness perception. This is due to the fact that our ears also work in a logarithmic way.

So keep in mind that 10dB more mean the double of Loudness perception.

As our hearing system is more sensible to some frequencies, having a special appetite around the 3KHz, a new and more balanced scale was created to measure Loudness, weighted by the, so called, A curve (in blue, in the picture). It’s A weighted, or dBA.



Having said that, 15 dBA  is a drop of water falling from 1 centimeter, one meter away.

30 dBA are measured in a quiet bedroom at night.

40 dBA is a whisper.

50 dBA is the average sound of an calm office.

70 dBA is the interior of a moving car.

80 dBA, intense traffic at 10 meters.

85 dBA lies the border of sound that can damage your ears.

100 dBA  A house stereo at maximum power.

120- 130 dBA  The front row of a rock concert.

135 dBA  Large train horn.

140 dBA  All frequencies are painful.

147 dBA  Formula 1 car.

And so on, until the 320 dBA , the strongest sound ever, the eruption of Karakatoa in Java at 1 meter.  You don't want to be there. Sound alone would  instantly kill you.

Ref: Julian Treasure, “The Sound Business”, pages 30, 31 e 32



OS DECIBÉIS

Quando se fala de volume de som, quase sempre vêm à baila os decibéis.

O Decibel é a décima parte de um Bel, uma unidade em memória de Alexander G. Bell.

É uma unidade usada em electrónica como unidade de ganho, mas também em som como unidade de volume.

Interessam-nos, basicamente, duas grandezas: uma é objectiva, física e que é definida por SPL, Sound Pressure Level. A outra é subjectiva e depende do funcionamento do nosso ouvido, é chamada Loudness e representa a nossa percepção de volume.

A proporção entre o menor som e o maior que conseguimos ouvir é cerca de 1 trilião para 1, por isso recorremos a uma escala logarítmica para analisar os valores de uma forma prática.

Assim, uma diferença de 3 dB significa o dobro da potência, uma diferença de 6dB representa o dobro da SPL, mas só uma diferença de 10 dB equivale à percepção do dobro do volume. Isto deve-se ao facto de o nosso ouvido também ter um funcionamento logarítmico.

O que interessa reter é que cada 10dB a mais quer dizer o dobro da percepção de volume, ou Loudness.

Como o nosso ouvido é mais sensível a algumas frequências do que a outras, tendo um apetite especial para as frequências à volta dos 3 KHz, foi criada uma forma de medir o Loudness já ajustada à curva do nosso ouvido. Chama-se A Weighted, ou seja, ponderada pela curva A (a azul, na imagem). Medimos, então  Loudness em dBA.

Posto isto, por exemplo 15dBA é uma gota de água a cair de 1 centímetro de altura, ouvido a 1 metro de distância.

30dBA são medidos um bom quarto de dormir, à noite.

40 dBA é um sussurro.

50 dBA é o som médio de um escritório calmo.

70 dBA, o interior de um carro em movimento.

80 dBA, tráfego intenso a 10 metros.

85 dBA, fronteira que marca o nível que pode afectar, definitivamente, a saúde dos nossos ouvidos.

100 dBA, aparelhagem de som caseira, no máximo.

120 a 130dBA, primeira fila de um concerto de rock.

135dBA, buzina de comboio.

140dBA, todas as frequências provocam dor intensa.

147dBA, carro Formula 1.

E por aí fora até aos 320dBA, que supõe ser o mais alto som produzido no planeta, a erupção do Karakatoa em Java. A um metro, só o som chegava para nos matar.

Ref: Julian Treasure, “The Sound Business”, pags 30, 31 e 32