Wetenschap, zaterdag 26 april 2003 (NRC-Handelsblad)
De afstand tussen Händel en Hendrix
AMSTERDAMSE WISKUNDIGEN MAKEN VAN ELKE COMPUTER EEN MUZIEKKENNER
Rob van den Berg
Met een doodgewoon compressieprogramma, dat standaard op elke PC aanwezig is, kan een computer voortaan onderscheid maken tussen klassieke muziek en pop, en ook het werk van verschillende componisten uit elkaar houden. Het idee om muziek automatisch te classificeren is afkomstig van drie Amsterdamse wiskundigen: Rudi Cilibrasi, Paul Vitanyi en Ronald de Wolf. Hun methode is ook toebasbaar bij het toeschrijven van anonieme muziekstukken.
Vorig jaar lukte het drie Italiaanse wiskundigen om op soortgelijke wijze onbekende teksten te analyseren en toe te schrijven aan een bepaalde auteur, of automatisch de taal te detecteren waarin ze geschreven zijn. Volgens Ronald de Wolf van het Centrum voor Wiskunde en Informatica gebruiken de Italianen inderdaad ongeveer dezelfde methoden. De Wolf: ``Als twee teksten iets met elkaar gemeen hebben, bijvoorbeeld dat ze in dezelfde taal geschreven zijn, is het mogelijk de tweede tekst efficiënter te comprimeren als je dat bij de eerste al gedaan hebt. Wanneer je echter een Engelse tekst aan een Italiaanse vastplakt en de combinatie comprimeert, dan zal dat minder efficiënt gaan dan wanneer je die Engelse tekst aan een andere Engelse tekst zou hebben vastgeplakt.''
De Amsterdammers doen het iets anders door meer wiskundig te werk te gaan. De Wolf: ``Er zijn vele manieren waarop twee muziekstukken of teksten op elkaar kunnen lijken. Voor elk van die overeenkomsten kun je een bepaalde maat definiëren die de afstand tussen beide aangeeft. Wij hebben een universele afstandsmaat gevonden die alle mogelijke manieren waarop twee stukken op elkaar lijken in zich verenigt.''
Die universele maat is gebaseerd op de Kolmogorov-complexiteit van de twee stukken: de lengte van het kortste computerprogramma dat de desbetreffende tekst of muziekstuk in zijn geheel weergeeft. De Wolf: ``Helaas bestaat er geen computer die de Kolmogorov-complexiteit van een willekeurig stuk kan uitrekenen. Daarom proberen we de universele maat voor de afstand tussen twee stukken in de praktijk te benaderen met behulp van een standaard compressieprogramma, te weten Bzip2.''
Om hun methode te testen haalden De Wolf en zijn collega's zo'n honderdtwintig muziekstukken in MIDI-format van het web, van Beethoven via Miles Davis tot Jimi Hendrix. De Wolf: ``Voor alle instrumenten zijn de noten weergegeven en verder staat er informatie op over de maker, titel, componist, etc. Dat alles hebben we eerst weggehaald, waarna er een soort digitale notenbalk overbleef in de vorm van een reeks enen en nullen. Die klinkt overigens nog steeds als het origineel.''
boomstructuur
In een eerste test moest de computer twaalf stukken klassieke muziek onderscheiden van evenveel stukken jazz of rock. Voor elke combinatie van steeds twee stukken werd, met behulp van datacompressie, de onderlinge afstand berekend. Gegeven die afstanden werd een boomstructuur bepaald, een visualisatie van de mate waarin de stukken op elkaar lijken. Dat pakte heel aardig uit: de computer onderscheidde de stukken in de drie verschillende genres, al waren er een paar opvallende afwijkingen. Zoals een combinatie van een prelude uit het Wohltemperierte Klavier van Bach met Summertime van George Gershwin. Dit lijkt verkeerd maar, met wat Amsterdamse branie, speculeren De Wolf en zijn collega's dat een analyse door een musicoloog misschien wel onvermoede overeenkomsten tussen de twee aan het licht zou kunnen brengen. In een verdere, uitgebreidere test met twee-en-dertig klassieke pianostukken werd elke componist keurig in een apart cluster gerangschikt, al waren ook hier een paar afwijkingen: helemaal volmaakt is de methode dus nog niet.
franz süssmayr
De Wolf en zijn collega's zien mogelijkheden om via hun aanpak een onbekende componist van een muziekstuk te achterhalen. Zo kregen ze de suggestie van een Engelse musicoloog eens te kijken naar het Requiem van Mozart, dat na diens dood is afgemaakt door de componist Franz Süssmayr. Het is tot nu toe onbekend in hoeverre hij zich heeft gehouden aan de aanwijzingen van Mozart. Het programma van De Wolf en zijn collega's zou wat dat betreft uitkomst kunnen bieden door te analyseren of de tweede helft van het requiem inderdaad past in het werk van Mozart, of eerder als een Süssmayr-compositie moet worden beschouwd. De Wolf: ``Helaas is de hoeveelheid beschikbare muziek in MIDI-format beperkt. De twee kleine stukken van Süssmayr die we hebben weten te achterhalen zijn onvoldoende om uitsluitsel te bieden. En andere digitale muziekformaten, zoals MP3, zijn weer minder geschikt voor het soort compressie dat wij toepassen.''
Copyright: Berg, R. van den