In un precedente articolo ho esposto informazioni di massima per potersi orientare con le specifiche tecniche delle cuffie. Adesso vorrei parlare degli aspetti tecnici da valutare per una corretta scelta delle cuffie, e in particolare per orientarsi nel mondo della musica digitale ad alta qualità: negli ultimi anni il mondo della “musica liquida” ha compiuto enormi passi avanti, e credo sia utile conoscere gli aspetti tecnici del campionamento digitale dell’audio analogico.

Pagina aggiornata il 13/09/20: refresh del testo e link Amazon, e aggiunta “Sezione degli Acquisti”

Questo articolo è il primo di un gruppo di tre post che trattano il tema della compressione audio digitale. Dopo aver letto questo post, potrete passare al secondo e al terzo.

Di cosa parleremo

Temi trattati: caompionamento, frequenze, compressioni lossless Ho già accennato ai due concetti di “risposta in frequenza” e di “impedenza” ; il primo parametro non può essere apprezzato fino in fondo se non si parla anche di formati e risoluzioni adottati per la musica digitale. L’impedenza invece deve essere affiancata da maggiori informazioni dal punti di vista dell’amplificatore con cui si vorrà usare le cuffie. 

Faremo anche una rapida carrellata dei due elementi che hanno una importanza fondamentale nella filiera audio di qualità, cioè l’amplificatore ed il DAC, in modo da avere un quadro (quasi) completo.

I temi sono troppi per un singolo post quindi saranno spezzati in più puntate trattando un mattoncino alla volta, da usare per costruire la visione di insieme.

Cominciamo.

La musica “liquida”: il campionamento digitale dell’audio analogico

In origine fu l’MP3.
Non è vero: in origine fu il telefono o, più in generale, la comunicazione vocale. Per la trasmissione della voce, già fin dagli anni ’70 del secolo scorso sono stati creati standard di digitalizzazione che permettessero di trasformare un segnale audio analogico in un segnale digitale. Senza entrare troppo nel dettaglio, sappiate che si affermò l’uso del metodo PCM “pulse-code modulation”: il segnale audio analogico viene “campionato” con “parole” di bit e ad una frequenza tale da poter ricostruire il segnale originale con fedeltà sufficiente.

In origine fu il telefono, dicevamo: si voleva ricostruire un segnale vocale considerando “sufficiente” un risultato che permettesse di riconoscere la persona dalla voce anche dopo la ricodifica in digitale; dato che la nostra specie è particolarmente brava a riconoscere le voci, per ottenere questo risultato furono sufficienti valori che oggi consideriamo inapplicabili per la musica. Adesso vediamo perché.

Per prima cosa è opportuno spiegare come avviene questo “campionamento”.
Attenzione: il ragionamento seguente non deve essere inteso come spiegazione fedele del campionamento digitale, ma solo come strumento logico per comprenderne le caratteristiche principali senza fare uso di formule matematiche.

Un segnale audio analogico…

Accettando una comoda semplificazione, considerate il segnale audio come una curva che si alza e si abbassa nel tempo:

Campionamento digitale dell'audio analogico: il segnale di partenza

L’asse orizzontale rappresenta il tempo che passa; sull’asse verticale è rappresentata l’altezza dell’onda sonora.

… diventa un segnale digitale!

Immaginiamo adesso di dividere l’asse orizzontale in tante parti uguali, per esempio 100: ad ogni passo si incrocia la curva ad un certo valore quindi si individuano 100 punti (100 valori) che rappresentano la curva iniziale. Questi punti rappresentano il “campionamento” della nostra curva iniziale, quindi il campionamento digitale dell’audio analogico.

Campionamento del segnale audio analogico

Adesso proviamo a disegnare solo i punti. Come vedete si può intuire la forma della curva che li ha generati:

Punti del campionamento digitale del segnale anlaogico

Ma alcuni sono più uguali degli altri

Se i punti sono stati scelti molto distanti tra di loro l’approssimazione è poco fedele: possiamo disegnare infinite curve che passano da tutti i punti ma che hanno forme diverse tra di loro:

Campionamento digitale dell'audio analogico: esempio di campionamento troppo rado

Se invece i punti sono molto ravvicinati diventa più facile avere idea della curva iniziale: esistono ancora molte curve con forma diversa e che toccano tutti i punti del campionamento, ma intuitivamente ce ne sono “meno di prima” (sappiate che se parliamo di musica suonata con strumenti non elettronici ci sono dei limiti fisici che impediscono variazioni estreme di quel valore per brevi unità di tempo, ma questo è un altro discorso):

campionamento digitale dell'audio analogico: esempio di campionamento fitto

Potete facilmente intuire che tanto più fitti sono i punti, tanto più fedelmente potremo ricostruire la curva iniziale: questo parametro di “fittanza” (termine che ho appena inventato, non cercatelo sui libri) rappresenta la frequenza del campionamento. Effettuare un campionamento a 10Hz (Hertz) significa individuare 10 punti su una linea lunga “un secondo”, quindi: 10 valori al secondo. Se il nostro disegno iniziale rappresentava un’onda sonora di 1s, avendo raccolto 100 punti abbiamo fatto un campionamento a 100Hz.
Per quanto intuito precedentemente, aumentare la frequenza di campionamento digitale dell’audio analogico permette di ricostruire il segnale iniziale con maggiore fedeltà.

Una questione di profondità (di campionamento)

Adesso devo introdurre un altro parametro importante: la “profondità” del campionamento. Stavolta il paragone è meno intuitivo ma proviamoci ugualmente.

Torniamo all’esempio precedente, dove abbiamo individuato 100 punti quindi cento “valori”. Se vogliamo trasmettere l’informazione della curva dovremo trasmettere i valori ; per semplicità diamo per assodato che i punti sono tutti equidistanti tra di loro, cioè stiamo facendo un campionamento “a frequenza costante”, e che questa distanza è nota al ricevitore.

Il problema allora si trasforma nel come rappresentare questi valori. Immaginiamo di avere un alfabeto limitato per rappresentare i valori originali, ad esempio 256 valori possibili: ognuno dei punti (valori) iniziali sarà quindi rappresentato con il punto (valore) più vicino tra i 256 disponibili. Se vi sembra strano, considerate che nella vita quotidiana questo avviene di continuo: nessuno vi dirà che è alto 1m e 75,8773874876876387648186718cm, preferendo dirvi che è alto 1m e 75cm (beato lui). Per chi è abituato ad usare software di modellazione come AutoCAD: è come quando viene usato lo snap che permette solo spostamenti “quantizzati” degli oggetti.

Torniamo al nostro esempio: è facile intuire che tanto più ampio è l’insieme dei valori che possiamo usare, tanto minore sarà l’approssimazione dei valori da trasmettere quindi, nuovamente, tanto più “fedele” sarà la trasmissione. Per rappresentare questi valori si usa una “parola” lunga N bit: nell’esempio precedente abbiamo scelto una profondità di campionamento a 8bit (va inteso in questo modo: un numero binario di 8 bit può rappresentare 256 valori, dato che 2exp8 = 256). Riassumendo, anche aumentare la profondità del campionamento digitale dell’audio analogico permette di ricostruire il segnale iniziale con maggiore fedeltà.

E’ altrettanto facile intuire che per una rappresentazione fedele del segnale, entrambe frequenza e profondità devono essere “sufficientemente” elevate.
Per simmetria con il mondo video la frequenza di campionamento unitamente alla profondità è generalmente indicata come “risoluzione” audio: quindi se sentite parlare di audio digitale “ad alta risoluzione” si intende audio digitale ottenuto con elevate frequenza e profondità di campionamento.

Che campionamento digitale ci serve?

Una volta capito cosa sono frequenza e profondità di campionamento, vediamo di che numeri stiamo parlando.
Come detto inizialmente il campionamento fu usato per trasmettere la voce; il segnale audio che rappresenta la voce è enormemente più semplice di quello che rappresenta la musica: in un singolo segnale sono contenute le informazioni di tutti gli strumenti musicali di una band o di una orchestra, ed ogni strumento ha la propria timbrica e relativo range di frequenze caratteristiche con estensione molto più ampia della voce umana.
Per ricostruire fedelmente una voce umana si è considerato sufficiente un range di frequenza di circa 4000-8000Hz, che indicheremo come 4kHz-8kHz (in questo scenario k = 1000). Per la profondità poteva essere sufficiente una “parola” da 8bit.

Poi arrivò il CD audio, e tutto si fece più complicato: la musica, come detto, è enormemente più complicata da rappresentare rispetto alla semplice voce umana quindi fu necessario usare frequenze di campionamento molto più elevate: il campionamento usato per i CD audio, considerato oggi la qualità “standard”, viene realizzato con frequenza 44.1kHz e profondità di 16bit. Notate che tra 8bit e 16bit la differenza è enorme, dato che si parla di numeri esponenziali: si passa infatti da 256 a 65.536 valori.

I’m feeling High

La qualità CD è definita standard (SD, standard definition), quindi i campionamenti ottenuti a frequenza/profondità minori sono definiti “low definition” (LD) mentre quelli con valori maggiori sono definiti “high definition” (HD). Nel mondo della musica digitale ad alta definizione, nella fascia HD si usano tipicamente valori da 24bit/96kHz in su, fino a 24/192 o valori ancora più stratosferici.

Come riportato sopra, l’esempio che ho usato per spiegare il campionamento digitale dell’audio analogico non corrisponde rigorosamente a quello che avviene in realtà. Per comprendere meglio i prossimi argomenti è necessario un approfondimento.

In origine era una chitarra

(…) pensavo è bello che dove finiscono le mie dita
debba in qualche modo incominciare una chitarra.

Amico fragile – F. De André

In origine, l’audio è analogico: l’orecchio umano percepisce segnali analogici, cioè “micro-variazioni nella densità dell’aria” (cit.). Queste micro-variazioni di pressione vengono percepite dal timpano, che è una sottilissima membrana che vibra in risposta alle variazioni di pressione, e questa vibrazione produce a sua volta un segnale che arriva fino al cervello, dove risiede il nostro “EAC biologico” (Environmental to Analogue Converter: non cercate nemmeno questo nei libri, non lo troverete).

campionamento digitale dell'audio analogico: ascolto diretto del suono

La registrazione analogica dei suoni usa un meccanismo simile: stavolta a vibrare non è il timpano ma una membrana, che vibrando produce un segnale elettrico a sua volta registrato su un supporto fisico (magnetico, vinile, o altro). Il percorso inverso prevede che questo segnale elettrico sia “estratto” dal supporto e usato per fare vibrare una differente membrana: quella del diffusore audio (la cassa, ad esempio) che quindi ricrea nell’aria le stesse micro-variazioni di densità allo scopo di spararle verso l’orecchio dell’ascoltatore.

campionamento digitale dell'audio analogico: riproduzione dei suoni

La digitalizzazione del segnale richiede un meccanismo per passare dal regno analogico (il segnale elettrico di cui sopra) al regno digitale, quindi rappresentando la curva con una lunga sequenza di 0 e 1. Questa magia avviene in accordo ad un bellissimo teorema matematico dal nome “teorema del campionamento di Nyquist-Shannon”.

Qui non si butta via niente

Abbiamo capito che è necessario che il campionamento sia “abbastanza stretto”: la magia del teorema di Nyquist-Shannon sta nel garantirci che possiamo campionare il segnale senza perdita di informazione purché il campionamento avvenga ad una frequenza almeno doppia rispetto alla frequenza massima che si vuole preservare. Poiché l’orecchio umano non percepisce frequenze superiori ai 20kHz (in realtà molte di meno: 16-18kHz sono già una buona performance, e i valori si riducono con l’età: un minuto di silenzio per le decine di cellule ciliate che ci abbandonano ogni anno) se vogliamo preservare tutte le frequenze entro i 20kHz basterà fare un campionamento ad almeno 40kHz. Abbiamo inventato il campionamento “lossless” cioè, appunto, “senza perdita”.

Qui si potrebbe aprire un discorso infinito: è veramente senza perdita di dati utili? Ne parlerò meglio in un’altra occasione, ma accontentiamoci di dire che superando i 40kHz garantiamo la presenza di tutta o quasi l’informazione utile per l’orecchio umano. E’ il motivo per cui si scelse di usare per i CD un formato PCM a 44,1kHz a 16 bit, in modo da “non perdere niente di utile”.

Un paio di fun facts: il 16 si scelse perché al tempo erano comuni le CPU a 16bit; il 44.1 invece si dice che sia stato scelto al posto del più sensato 48kHz (per le frequenze si è soliti usare potenze di 2) perché altrimenti lo spazio disponibile sui supporti del tempo (i CD, ancora non esistevano i DVD o i Blu-Ray) non sarebbe stato sufficiente per contenere determinate registrazioni; in particolare non ci sarebbe entrata la 9a sinfonia di Beethoven (notoriamente una delle sinfonie più lunghe) e questo avrebbe causato l’opposizione di Herbert von Karajan: la Philips preferì accontentarlo. Quindi ho un altro motivo per avere von Karajan in antipatia. La leggenda potrebbe anche essere vera: il primo CD prodotto sul mercato è uscito nell’agosto 1982, ed era la Sinfonia delle Alpi di R. Strauss, eseguita dalla Berliner Philharmoniler diretta da un certo H. von Karajan.

Per concludere

L’audio ad alta risoluzione adotta frequenze di campionamento molto maggiori di quelle standard, in modo da contenere un range esteso dell’informazione audio originale. Se da questo ne consegue un reale beneficio o meno, è tema che affronterò altrove. Inoltre oggi difficilmente si usa un formato PCM “puro”, ma quasi esclusivamente dei formati di compressione che, nel caso della musica HD, sono sempre lossless; il discorso delle frequenze però si applica allo stesso identico modo.

Di recente si sta affermando l’uso del formato DSD, che è una alternativa rispetto al PCM e consente valori molto elevati di risoluzione: il formato è utile solo se la registrazione avviene già ad alta risoluzione, possibilmente già in formato DSD. Questo formato è supportato ad oggi solo da dispositivi (player e DAC) di livello medio alto, anche se ormai la diffusione è in rapida crescita.

Ma questa è un’altra storia.

Angolo degli acquisti

Nell’articolo sono presenti link a prodotti in vendita sulla piattaforma Amazon: senza nessun costo aggiuntivo per voi, se sceglierete di usarli per i vostri acquisti (qualsiasi prodotto, non soltanto i miei consigli) ci regalerete un piccolo incentivo per scrivere nuovi articoli.

Amazon Music HD

Amazon Music HD – 90 giorni d’uso gratuito con streaming in qualità HD

 

Telefono a disco (link to Amazon)

Telefono a disco (link to Amazon)

TELEFONO VINTAGE

Hai mai provato l’emozione di inserire il ditino nel disco, ruotare, e lasciarlo trasportare indietro con quel rrrrrrrr amorevole di accompagnamento? E regolarmente fermarti al penultimo numero e ricominciare da capo perché sei certo di aver sbagliato qualcosa. Il secondo tentativo andrà sicuramente meglio.

Beh, se non lo hai mai provato allora non sai cosa ti sei perso.

Vocabolario minimo delle parole inventate

Vocabolario minimo delle parole inventate (link to Amazon)

LE PAROLE INVENTATE

Ammettilo, hai sempre nutrito profonda invidia di quel bambino fortunato che con “petaloso” ha conquistato il web. Chissà quanti super-petalosi hai inventato senza per questo pavoneggiarti in giro sull’Internet.

Beh, è venuto il momento di tirarli fuori e partecipare alla prossima edizione del libro: dove gli scrittori possono creare un intero mondo attorno alle loro parole inventate, e finire sulla bocca di tutti sul web.

La scimmia nuda

La scimmia nuda (link to Amazon)

LA SCIMMIA NUDA (Desmond Morris)

Un meraviglioso libro di antropologia evoluzionistica, che vi costringerà ad ammettere che in fondo, alla fin fine, non potremo mai rinnegare la nostra origine animale: pensavate che lo spulciarsi a vicenda fosse una prerogativa dei nostri cugini pelosi? E se vi dicessi che certe convenzioni sociali a cui siamo abituati, hanno un’insospettabile corrispondenza anche tra gli animali?

Fidatevi e leggetelo: dopo, guardarvi allo specchio non sarà mai più come prima. E mi raccomando, la prossima volta che fate visita ad uno zoo: non vorrete mica presentarvi a mani vuote? 

Amico fragile - Volume 8

Volume 8 (link to Amazon)

COME TI SENTI AMICO, AMICO FRAGILE

Se vuoi potrò occuparmi un’ora al mese di te, ascoltando Volume 8: un album che ha inanellato alcune delle perle più intimistiche di Faber, e che ha lanciato un giovane De Gregori nell’olimpo del cantautorato italiano. Lo stile del co-autore emerge come mai era avvenuto nei precedenti lavori di De André.

Amico fragile chiude un album meraviglioso, e lo fa in maniera degna offrendo alcune tra le confessioni più criptiche di Faber. Inoltre la versione originale non sfigura per nulla accanto alla sua più famosa versione con arrangiamenti PFM. 

Alien anthology

Alien Anthology (link to Amazon)

ALIEN – ANTOLOGIA COMPLETA

A quel tempo i film si guardavano la sera su Italia 1. E certi film li annunciavano con parecchi giorni di anticipo, e tu per parecchi giorni stavi in attesa e finalmente arriva quella sera e con l’ansia alle stelle, il cuore che pulsa a 1000 inizi a guardare quel capolavoro di “Aliens – Scontro finale”: ore passate a parlarne con l’amico del cuore, a ripetersi certe scene fino allo sfinimento, decine di monetine spese in sala giochi su quel cabinet che solo la musica di avvio del gioco era sufficiente a procurarti fibrillazione.

Rivisto dopo tanti anni beh, non era poi quel gran capolavoro che ricordavo. Ma rimane un mito intoccabile.

Alien (il primo) invece era, è e sarà sempre un capolavoro insuperato. Anche oggi.

A torto o a ragione (taking sides)

A torto o a ragione (link to Amazon)

A CHI HAI DETTO SECONDO VIOLINO?

Un film toccante ambientato in un momento storico particolare: la “dissezione” della Germania nazista dopo la guerra, con le grandi potenze vincitrici che pasteggiano sui suoi resti.  Un grandioso Harvey Keitel nella parte di un maggiore USA con i prodromi della “esportazione forzata dei valori americani”, che si scontra con un eccellente Stellan Skarsgard nei panni di un infranto ma mai domo Furtwangler.

Il film racconta un confronto tra due uomini, ma come allegoria della staffetta tra due civiltà: la decaduta cultura europea travolta dalla rampante (in)cultura statunitense.

A mio parere, un meraviglioso complemento alla trilogia tarantiniana di Inglorious Bastards, Django e C’era una volta a… Holliwood.

Eine Alpen Sinfonie

Eine Alpen Sinfonie (link to Amazon)

R. STRAUSS – EIN ALPEN SINFONIE

Stando ad alcune ricostruzioni, questo dovrebbe essere il primo CD della storia. Fosse solo per questo andrebbe recuperato, sai mai un giorno diventasse raro?

Poi stiamo parlando di Richard, mica di quei melensi  Johan e Johan.

 

Se non disponete già di Amazon Prime vi consiglio caldamente di farlo. I vantaggi sono notevoli: bastano pochi acquisti senza spese di spedizione per compensare il canone annuo, e si hanno a disposizione tantissimi servizi aggiuntivi.