Mostrar mensagens com a etiqueta Sound Basics. Mostrar todas as mensagens
Mostrar mensagens com a etiqueta Sound Basics. Mostrar todas as mensagens

sexta-feira, 18 de abril de 2014

AUDIO COMPRESSION

A quick look at compressor basics




Imagine you are listening to a classical piece of music in your car while driving through a busy town.
The soft parts of the piece will be masked by the street noise so, naturally, you take the volume up a little. Then, suddenly, comes a fortissimo with the full orchestra! You grab the volume knob and take it down. While you're doing this, your driving gets more dangerous because of the constant distractions, so you might start to wish that this could be done automatically.

It can. It's called Compression. Although the word is the same, it has nothing to do with data compression, like Mp3 or Flac files. It's only happening in the audio domain.

The gear that does this for us is called a compressor and it's a very important, despite dangerous, piece of equipment.

The compressor automatically rises the lows and lowers the highs, thus reducing the dynamic range of the program. If you don'y fully understand how it works, don't use it, because it can ruin the emotional feel of your work.

A typical compressor usually comes with a lot of controls so let's take a closer look.



Comparing to the car situation, what volume will be to loud for me? It depends on the person, so it has to be adjustable. This volume, at which we want the compressor to start doing his job, is called Threshold and is measured in dB's.
How hard do we want it to react? Should it take this high volume difference to a half, a third or more? This will be called Ratio and will be 2:1, 3:1 and so on.



Then, how fast will it react? Again in you car analogy, if someone is doing the volume thing in the passenger seat and reacts too fast, the effect will be very noticeable and you might want it a little more soft. We call this Attack. On the same token, how fast will it recover the original volume once the strong part is over? It's the Release. They are measured in milliseconds.


Notice in the above drawing, that a longer attack lets the first peak pass, while a long release maintains the volume down for too long.

In the analog tape days, compression was very important. During a solo voice recording, for example, the soft parts, if they get too soft and we want to raise them up in the mix, we will also raising the tape hiss and deteriorate the recording. So, most voice recordings, as they have a big dynamic range, use a compressor in the middle. It has to be very well adjusted in order not to be heard. But there are many more uses for the compressor. We'll get back at this later.

Over compressing ruins any recording. Imagine you're watching a football game in TV. You hear the roar of the crowd in the stadium. A goal is scored and 50.000 people shout "Gooooooaaaaalllll!" but the volume stays the same. Where's the emotion? Gone.

Too much compression. The same feeling of a too low ceiling*
* Frame from "Being John Malkovich"

COMPRESSÃO AUDIO

Um olhar rápido aos rudimentos da compressão




Imaginem que estão a ouvir uma peça clássica dentro do vosso carro, enquanto atravessam uma cidade ruidosa .
As partes mais suaves da peça serão mascaradas pelo ruído das ruas e, naturalmente, vocês sobem um pouco o volume. Então, de repente, vem um fortissimo com toda a orquestra! Vocês atiram-se ao botão de volume e baixam o som. Enquanto fazem isto, a vossa condução torna-se mais perigosa devido às constante distrações, por isso é natural que comecem a desejar que algo fizesse isto automaticamente.

E faz. Chama-se Compressão. Apesar da palavra ser a mesma, não tem nada a ver com a compressão de dados, como os ficheiros  Mp3 ou Flac. Esta compressão só acontece no domínio do audio.

O equipamento que faz isto chama-se Compressor e é um aparelho muito importante, apesar de perigoso.

O Compressor desce automaticamente o volume dos picos, enquanto aumenta o dos sons mais baixos, reduzindo, assim, a dinâmica do programa. Se vocês não estão familiarizados com ele, não o usem, porque ele pode dar cabo de toda a componente emocional do vosso trabalho.

Um Compressor típico, costuma vir com alguns botões de controlo. Vejamos mais de perto.



Comparando com a situação do carro, qual é o volume que é demasiado alto para mim? Depende da pessoa, por isso é ajustável. Este volume, em que o compressor começa a trabalhar, chama-se Threshold, limiar, em Português e é medido em dB.

E que quantidade de volume retiramos a partir desse limiar? Reduzimos este excedente a metade, ou a um terço, um quarto? Ou mais? A este parâmetro chamamos taxa de redução ou Ratio, en Inglês e será 2:1, 3:1 e por aí fora.



Agora, quão depressa vai reagir? Voltando o exemplo do nosso carro, imaginem que vai alguém no assento do passageiro e que está a mexer no volume, se a reação for muito brusca, o efeito é audível e pode ser desagradável. Talvez lhe digamos para o fazer com mais calma. Chamamos a isto ataque, ou Attack
Pela mesma ordem de ideias, de que forma é que se recupera o volume inicial depois da parte forte? É o chamado Release ou recuperação. São ambos medidos em mili-segundos.

Attack e release

Reparem, na figura acima, que um ataque longo deixa passar o primeiro pico e um release longo obriga a que o corte de volume se mantenha mais tempo.

Nos tempos da fita analógica, a compressão era muito importante. Durante uma gravação de uma voz solo, por exemplo, as partes mais suaves, se fossem gravadas demasiado baixas e as quiséssemos subir na mistura, trariam também com elas o ruído de fundo da fita e estragariam a gravação. Assim, na maioria das gravações de vozes, devido à sua grande amplitude dinâmica, usa-se um compressor entre o pré-amplificador e a fita. Terá de ser muito bem ajustado para o efeito não ser ouvido. Mas há muitas mais utilizações para o compressor. Voltaremos a este assunto mais tarde.

Compressão em excesso arruina qualquer gravação. Imaginem que estão a ver um jogo de futebol na televisão. Ouvimos distintamente o ruído da multidão no estádio. Alguém marca um golo e 50.000 pessoas gritam"Gooooooloooooo!", mas o volume fica na mesma. Onde está a emoção? Foi-se.

Compressão a mais. O mesmo sentimento de ter o tecto demasiado baixo*
* Imagem de "Being John Malkovich"

sábado, 5 de abril de 2014

ECHO AND REVERBERATION

“This cathedral has an awesome echo!”

 
Chartes cathedral, France


I’ve heard this phrase several times and it’s not correct.

There’s a difference between echo and reverberation. Echo is a single, isolated reflection of sound. Like when we shout on a mountain top and hear our voice back a few seconds afterwards.

When we are inside a room and a sound is produced, it sound bounces on the walls, floor and ceiling and gets back to us in the from of a “soup” of reflections that fade away with time. This is called reverberation. Or reverb. It’s a sum of echoes, embedded in each other.


Some arrive at our ears first, and they are quite distinguishable. Those are called early reflections. The time it takes to hear back the first early reflection is called pre-delay.


Every room has a reverb time that is not the same for all frequencies. It’s longer on low frequencies because they carry more energy and thus take more time to fade away.

We call reverb time, or RT, or RT60, the time it takes for the power of a sound to fade until it’s a million times smaller than the original one (-60dB). Or for the SPL to get a thousand times smaller. The same thing.

The reverb times will depend on the dimensions and shape of the space, the materials it's built of of and its content. It's one of the greatest concerns of acousticians and the reason for their frequent fights with architects.

A good talking room will have a RT under 1 second, so that every word will be perfectly perceptible by everyone.
A nice concert hall will have RT’s between 1 and over 2 seconds.

When you listen to a Beethoven concert in open air, something seems to be missing. In a great concert hall, the reverb will embelish and link the notes adding magic to the music.


Boston Symphony Hall
The same goes to choral music which is usually sung in churches or cathedrals. The same choir in open air seems to have lost all its charm and musicality.

But we’ll talk about this later…

( to be continued)

ECO E REVERBERAÇÃO

“Esta catedral tem um eco fantástico!”


A catedral de Chartes, em França

Já ouvi esta frase várias vezes e não é correcta.

Há uma diferença entre eco e reverberação. Eco é uma reflexão única, isolada, do som inicial. Como quando gritamos do alto de uma montanha e ouvimos o  retorno da nossa voz poucos segundos depois.

Quando estamos dentro de uma sala e um som é produzido, ele bate na paredes, chão e tecto e regressa aos nossos ouvidos sob a forma de uma “sopa” de reflexões que diminuem com o tempo. A isto chamamos reverberação. Ou reverb. É uma soma de ecos, embebidos uns nos outros.


Alguns chegam aos nossos ouvidos primeiro e conseguimos distingui-los. Estes chamam-se early reflections, porque correspondem às primeiras reflexões. O tempo que demora até ouvirmos a primeira reflexão chama-se Pre-Delay.


Toda a sala tem um tempo de reverberação que não é igual para todas as frequências. É maior nas frequências baixas porque estas carregam mais energia e demoram mais a dissipar.

Chamamos tempo de reverberação, ou RT, ou até RT60, o tempo que leva a potência sonora a tornar-se um milhão de vezes mais pequena que a original (-60dB). Ou para a SPL se tornar mil vezes menor. O que é a mesma coisa.

Os tempos de reverberação dependem do tamanho da sala, da sua forma, dos seus materiais e dos seus conteúdos e essa gestão é a grande preocupação dos engenheiros acústicos e, muitas vezes a razão das suas lutas com os arquitectos.

Uma boa sala para transmissão da palavra tem menos de 1 segundo de RT, de forma a que cada palavra seja perfeitamente percebida por toda a gente.
Uma sala de concertos terá entre 1 e mais de 2 segundos de RT.

Quando ouvimos um concerto de Beethoven ao ar livre, parece que nos falta qualquer coisa. Numa boa sala de concertos, a reverberação vai embelezar e ligar as notas musicais adicionando magia à música.

Boston Symphony Hall


O mesmo se aplica à música coral e de órgão que se ouve habitualmente em igrejas e catedrais. Um coro ao ar livre parece ter perdido toda a sua musicalidade e encanto.

Mas isso fica para depois…


(continua)

domingo, 30 de março de 2014

FLAC, the digital audio Rolls-Royce?

The Pono revolution



Having explained what an Mp3 file is, I promised to talk about FLAC.

FLAC stands for Free Lossless Audio Codec and was born in 2001, along with other lossless formats like WAV. It's also an open source format.
What does lossless mean? It's quite simple, while other audio formats compress the audio file, taking out information that, one could argue, is not necessary, the file actually looses quality and this can be heard. So it's called a lossy compression. In psychoacoustic terms, for certain types of music, this loss is worth it, compared to the space and mobility gain.
Lossless is more like a Zip file: it occupies less space, about half of a similar Wav file, but all the information is there.

So,  can you have a FLAC copy of a CD and play it in your computer? Yes, but you can go far beyond that!

Until now, although higher resolution recordings existed already, like PCM 24bit/192 KHz, it was not practical or accessible to everybody.

However, with FLAC, we can download and play those files to our ears' delight and experience the best sounding recordings ever.

This was a tiny group privilege, with a bunch of sites we can download HD music from.

But Neil Young and a group of friends are changing it all! "We are not changing the music, we are letting music change you".

Neil Young holding a Pono player


Musicians have been complaining about the commercial barriers to good sounding music: the loudness war, we talked about already, the lossy formats that hide the nuances of what we actually recorded and basically, the lack of truth compared to what we created in the studio.

Neil Young is gathering the music community, not to complain, but to solve this problem! This time, the solutions will not come from the industry but from the musicians themselves.

Pono players


The Pono project is born! It's born out of crowdfunding, with more than 14k backers and has already raised more than 5 million dollars in only 16 days!

With this portable device, everyone of us will be able to listen to music magic, wherever we are.

Let's join the Pono revolution!


FLAC, o  Rolls-Royce do audio digital?

A revolução do Pono



Depois de ter explicado o que é o Mp3, prometi falar do FLAC.

FLAC quer dizer Free Lossless Audio Codec e nasceu em 2001, ao lado de outros formatos lossless, como o  WAV. É também um formato open source.
Que quer dizer Lossless? É relativamente simples, enquanto outros formatos de audio comprimem o ficheiro original, retirando informação que, para alguns, é desnecessária, o ficheiro perde qualidade isso é audível. Por isso, chamamos uma compressão lossy
Em termos psicoacústicos, e para determinados tipos de música, essa perda vale a pena com o que se ganha em espaço e transportabilidade.
Lossless é mais como um ficheiro Zip: no caso do FLAC a 16bits/44.1kHz, ocupa menos espaço que um CD, aproximadamente metade, mas contém toda a informação.


Portanto,  podemos ter uma cópia de um CD em FLAC e tocá-la no nosso computador? Claro, mas podemos ir muito mais além!

Até agora, embora existissem gravações de alta resolução, como o PCM 24bit/192 KHz, não eram práticas nem acessíveis a toda a gente.

Contudo, com o FLAC, podemos descarregar e ouvir essas gravações para delícia dos nosso ouvidos, e experimentar as melhores gravações jamais feitas.

Este foi um privilégio de um pequeno grupo, com uma série de sites de onde podíamos descarregar música em HD.

Mas o Neil Young e um grupo de amigos estão a mudar isto tudo! "We are not changing the music, we are letting music change you".

Os músicos têm-se queixado das barreiras impostas pela indústria ao bom som das suas gravações: a conhecida guerra do loudness, de que já falámos, os formatos Lossy que escondem as nuances daquilo que efectivamente gravámos e, basicamente, a falta de verdade do resultado final, comparado como o que fizemos em estúdio.

O Neil Young está a juntar a comunidade musical, não para protestar, mas para resolver o problema! esta vez, as soluções não vêm da indústria mas sim dos próprios músicos.

Neil Young e um leitor Pono


O Pono project nasceu! Nasceu em crowdfunding, com mais de 14 mil apoiantes e já juntou, em apenas16 dias, mais de 5 milhões de dólares!

Leitores Pono


Com este dispositivo portátil, cada um de nós pode ouvir a magia da música,  onde quer que estejamos.

Juntemo-nos à revolução Pono!

sábado, 22 de março de 2014

PSYCHOACOUSTICS AND MP3


Digital audio came into our lives for good. Even the most faithful analog lovers had to adapt to digital.

Digital audio has evolved a lot, too: better A/D and D/A converters, increased sample rate, greater bit depth, but all these innovations also added weight to the music files. And there's a lot of pressure from society to make music more accessible.

So, how can we have digital audio files that are light and  easy to share without sacrificing too much the quality of the recording?

That's where psychoacoustics came into play.

We already talked about sound masking. During a thunderstorm it's impossible to hear a bee flying around. So, we don't need to encode its sound. This is called Perceptual Coding. If most people won't hear a sound, it doesn't need to be included in the encoded file. 

In 1991, the Motion Pictures Experts Group created the MPEG-1, a digital video protocol that included audio in its layer 3. It was called MPEG 1- Layer 3, or Mp3, its popular name.

Mp3 is a type of lossy compression. There are types of lossless compression which don't deteriorate the audio program, like he FLAC compression, but the Mp3 is, by far, the most popular audio file.

Before we attack Mp3 with all our rage we have to realize that, for certain types of popular music, it's, by far, the best adapted format to today's reality. Mobile music is made possible by light Mp3 files, and sharing and uploading songs is quite difficult in Wave or AIIF formats. So, again, quality is sacrificed for economy and easiness of use. 



There are different Mp3 files according to their bit rate. Mp3 at 64 bits per second (bps) sounds quite bad and is only good for a very high compression use like call centers or elevators, while Mp3 at 320 bps is heavier but it's difficult to distinguish from a Wave file. When iTunes started, it offered Mp3 files at 128 bps, which were 11 times lighter than an uncompressed file. A 320 bps Mp3 file is around 1/4 of the original one.

Frequency loss of Mp3 at 128 bps and 320 bps

We'll talk later about newer compression formats, like the AAC and FLAC.


PSICOACÚSTICA E MP3



O audio digital entrou nas nossas vida de vez. Mesmo os mais fiéis seguidores do audio analógico tiveram de se adaptar aos formatos do audio digital.

O audio digital também evoluiu muito: melhores conversores A/D e D/A, maior frequência de amostragem, mais bits por palavra, mas todas estas inovações adicionaram peso aos ficheiros de audio. E há cada vez mais pressão da sociedade para tornar a música mais acessível.

Então, como podemos ter ficheiros de audio que são leves e fáceis de usar sem sacrificar demasiado a qualidade sonora?

É aqui que entra a psicoacústica.

Já falámos de sound masking. Durante um trovão, é impossível ouvirmos o som de uma abelha a voar. Por isso, podemos dispensar codificar este som. Chama-se a isto Perceptual Coding. Se a maior parte das pessoas não ouve um determinado som, ele não precisa de ser incluído na codificação da gravação. 

Em 1991, a Motion Pictures Experts Group criou o MPEG-1, um protocolo de video digital que incluía o som na sua camada 3. Foi chamado o MPEG 1- Layer 3, ou Mp3, o seu nome mais popular.

Mp3 é um tipo de compressão com perda, ou Lossy Compression. Há tipos de compressão sem perdas ou Lossless Compression, que não deterioram o programa sonoro, como a compressão FLAC, mas o Mp3 é, de longe, o formato mais popular.

Antes de atacarmos o Mp3 com toda a nossa raiva temos de nos aperceber que, para certos tipos de música popular, é, de todos, o mais adaptado à realidade de hoje. A música móvel só se tornou possível com o uso dos ficheiros leves de Mp3, e partilhar e carregar canções na Net é bastante difícil no formato Wave ou AIIF. Por isso, de novo, a qualidade é sacrificada à economia de espaço facilidade de uso. 



Há diferentes tipos de ficheiros de Mp3, de acordo com a sua velocidade de processamento. Um Mp3 a 64 bits por segundo (bps) soa bastante mal e é apenas usado para um uso de grande compressão como centrais telefónicas e elevadores, enquanto que o  Mp3 a 320 bps é mais pesado mas difícil de distinguir de um ficheiro não comprimido. Quando o iTunes começou, oferecia ficheiros Mp3 a 128 bps, que eram 11 vezes mais leves do que os respectivos ficheiros não comprimidos. Um Mp3 a 320 bps é aproximadamente 1/4 do ficheiro original.

Perdas em frequência deMp3 a 128 bps e 320 bps


Falaremos mais tarde de outros formatos mais modernos como o AAC e o FLAC.

quinta-feira, 23 de janeiro de 2014

IS THERE SOUND AT ALL?



There is no color. According to Isaac Newton, the light has no color, it’s our retina that separates the impression of the various wavelengths into colous, so that we can perceive them better. An apple is red, but here are no red properties in its atoms.

There is only taste in a pudding when we savour it inside our mouths.

The same happens with sound. According to George Berkeley, the first philosopher who raised this question, sound doesn’t exists. It’s only a brain image created by the vibration of molecules.

The Karakatoa volcano eruption is known to have produced the loudest sound known to mankind, over 300dBA, but the sound only existed where there was any animal or human present to transduce the molecules vibration into sound impressions.




What destroyed a lot of experimental planes was not the famous sound barrier, which doesn't exist, but the overwhelming accumulation of air molecules' vibration, around the aircraft at close to Mach 1 speed.




Height, timbre, intensity are just psychoacoustic qualities of vibration waves that reach our ears and, therefore, our brain.

Wow! What am I writing about, then? :-)

Ref: "This is your Brain on Music" Daniel J. Levitin, page 30



SERÁ QUE O SOM EXISTE?



Não há cores. Segundo Isaac Newton, a luz não tem cor, é a retina que separa a impressão dos vários comprimentos de onda em cores, para que nos apercebamos deles melhor.
Uma maçã é vermelha, mas não há propriedades vermelhas nos seus átomos.

Só existe sabor num pudim, no momento em que ele entra nas nossas bocas.

O mesmo acontece com o som. Segundo George Berkeley, o primeiro filósofo que levantou esta questão, o som não existe. É apenas uma imagem mental criada pela vibração das moléculas do ar.

A erupção do vulcão Karakatoa é conhecida por ter produzido o som de maior intensidade conhecido pela humanidade, mais de 300dBA, mas esse som só existiu onde houve um animal ou ser humano presente para traduzir a vibração das moléculas em sensações sonoras.




Aquilo que destruiu um série de aviões experimentais não foi a famosa barreira do som, que não existe, mas um fenómeno de acumulação de vibrações das moléculas de ar, próximo da velocidade de Mach 1.




A altura, timbre e intensidade são apenas qualidades psicoacústicas da vibração das ondas que chegam aos nosso ouvidos e, portanto, ao nosso cérebro.


Uau! Então, escrevo sobre quê? :-)

Ref: "This is your Brain on Music" Daniel J. Levitin, pag. 30