Het Native Instruments Stems-formaat werd in 2015 op het Amsterdam Dance Event gelanceerd met een persbericht, een handvol partnerlabels en een Traktor-update waar niemand buiten de DJ-pers veel aandacht aan schonk. De pitch was echt slim: lever een track en zijn vier stems als een enkel bestand dat overal blijft afspelen. Een paar jaar lang leek het misschien wel de manier te worden waarop stems werden gekocht en verkocht.

Dat werd het niet. Het formaat bereikte nooit de mainstream, de stores die Stems-bestanden verkochten zijn er grotendeels mee gestopt, en de premisse waarop het was gebouwd wordt ingehaald door on-device stem-scheiding. Dit is het verhaal van een goed idee dat tegen een probleem aanliep dat geen enkel bestandsformaat kon oplossen.

De boog van het .stem.mp4-formaat is een nuttige casestudy in waarom "lever stems als bestanden" telkens blijft steken, hoe goed het bestand ook is ontworpen.

Wat het formaat eigenlijk is

Op bestandsniveau is het Native Instruments Stems-formaat een MP4-container met een specifieke structuur. De MP4-specificatie ondersteunde al meerdere audiotracks. Native Instruments schreef daar een conventie bovenop.

  • Track 1: de originele stereo-mastermix, precies zoals je die uit een gewone MP4 zou horen. Speelt af in elke mediaspeler. Achterwaarts compatibel.
  • Tracks 2 tot 5: vier afzonderlijk decodeerbare stems, elk in stereo, die samen weer optellen tot de master.
  • Metadata: stemnamen per track ("Drums", "Bass", "Vocals", "Melody", of wat de engineer ook koos), kleurcodes voor visuele codering in DJ-software, en de gebruikelijke MP4-metadatavelden (artiest, titel, BPM, toonsoort).

Het resultaat was een bestand dat correct afspeelt in elke standaard-MP4-speler, DJ's en remixers volledige stem-toegang geeft in software die het formaat begrijpt, en voor een typische track onder de vijftig megabyte blijft.

Een van de slimste beslissingen die Native Instruments nam: ze brachten het formaat uit als een open specificatie en probeerden het niet te licentiëren. Elke softwareleverancier was vrij om .stem.mp4-bestanden te lezen en te schrijven. Elk label was vrij om zijn catalogus te coderen zonder NI te betalen. Die beslissing is de reden dat de afspeelondersteuning van het formaat zijn commerciële momentum overleefde.

De lancering van 2015 en de trage start

Traktor 2.10, dat samen met het formaat verscheen, ondersteunde Stems vanaf het begin. NI tekende lanceringspartnerlabels (Spinnin', Monstercat en verschillende andere) om catalogustracks in het nieuwe formaat te coderen, en stores waaronder Beatport en Traxsource begonnen Stems-bestanden aan te bieden. De initiële catalogus telde een paar duizend tracks, voornamelijk EDM.

De eerste twee jaar waren rustig. DJ-software van derden (Serato, rekordbox, Virtual DJ) was traag met het toevoegen van ondersteuning. DJ's die niet op Traktor zaten hadden geen reden om er iets om te geven, en in het begin had je ook NI-hardware nodig om er het meeste uit te halen. Producers hadden geen echt workflow-voordeel bij het leveren van Stems-gecodeerde bestanden ten opzichte van het gewoon leveren van ruwe stems aan hun label. De catalogi van de majorlabels bleven volledig buiten het formaat.

Er waren ook reële productiekosten. Een track netjes als .stem.mp4 coderen vereiste van de engineer dat hij vier gebalanceerde stems renderde die samen weer optelden tot de originele master. Voor de meeste labelcatalogi betekende dat teruggaan naar de multitracksessie, het werk doen en opnieuw masteren. Voor oudere catalogus, waar de multitracks ontbraken of onbruikbaar waren, was het onmogelijk.

De tractie die nooit doorbrak

Een tijdje, rond 2017 tot 2019, leek het erop dat het formaat zou kunnen doorbreken. Serato voegde Stems-weergave toe in 2019, waarmee NI's formaat eindelijk in de meestgebruikte DJ-software ter wereld terechtkwam. De vier-stems-in-een-bestand-truc was echt nuttig voor performance, doordat een DJ de drums kon muten tijdens een overgang zonder enige remix-ambitie. Stores verkochten Stems-bestanden, en er werd langzaam een catalogus opgebouwd.

Maar het kantelde nooit naar de mainstream. De koperskring bleef niche, de catalogus bleef voornamelijk EDM, en de majorlabels kwamen nooit. Een stems-bestand verkopen vroeg DJ's ook om muziek die ze al bezaten opnieuw te kopen, alleen om de stem-versie te krijgen, en dat was een moeilijke verkoop. Tegen het begin van de jaren 2020 werd het formaat breed omschreven als vastgelopen. Native Instruments stopte met het actief pushen ervan, en Traktor leverde later een conversietool zodat gebruikers zelf Stems-bestanden konden maken, een teken dat het kopen ervan was opgedroogd.

Waar het in 2026 staat

De afspeelkant van het formaat is beter verouderd dan de commerciële kant. Stems-bestanden spelen nog steeds af in de meeste grote DJ-software:

  • Traktor Pro (het origineel, nog steeds onderhouden)
  • Serato DJ Pro (ondersteuning toegevoegd in 2019)
  • rekordbox (Pioneer DJ)
  • Engine DJ (Denon DJ, het InMusic-ecosysteem)
  • Algoriddim djay Pro
  • Virtual DJ
  • Mixxx (de open-source DJ-software)

Wat grotendeels verdwenen is, is het kopen. De stores die vooraf gecodeerde Stems-bestanden verkochten zijn grotendeels overgestapt op iets anders, en er is geen gezonde commerciële catalogus meer om in te winkelen. De conventie overleeft als iets dat DJ-software kan lezen; de marktplaats eromheen niet. Veelzeggend is dat de meeste DJ-software nu leunt op ingebouwde realtime stem-scheiding, die elke geladen track on the fly in delen splitst in plaats van te vertrouwen op een vooraf gecodeerd bestand.

Wat het formaat goed deed

Drie beslissingen zien er achteraf nog steeds slim uit, en ze zijn het waard om te bewaren ook al verdween het commerciële formaat.

Achterwaartse compatibiliteit. Een .stem.mp4 speelt af als een normaal muziekbestand in elke standaardspeler. De stem-tracks zijn additief. Een DJ die geen Stems-ondersteuning heeft, krijgt nog steeds een bruikbaar bestand. Dat verwijderde een van de adoptiebarrières waaraan de meeste nieuwe formaten sterven.

Open specificatie. Geen royalty, geen licentie, geen NI-veto op adoptie door derden. Iedereen kon het zonder toestemming implementeren, en daarom is afspeelondersteuning nog steeds overal, lang nadat de hype voorbij was.

Standaardcontainer. MP4 is overal. De tools van elke audio-engineer ondersteunen het. Elke audio-decoderbibliotheek verwerkt het. Het formaat vroeg niemand om een nieuwe container uit te vinden. Het legde gewoon een conventie bovenop een container die al bestond.

Waar stems-als-bestanden eindigen

Wat het Stems-formaat niet oplost, en ook nooit zou gaan oplossen, is het catalogusprobleem.

Om een track netjes als .stem.mp4 te coderen, heb je de originele multitracksessie nodig, een engineer om gebalanceerde stems te renderen, een masteringronde en een afgewerkt bestand. Dat zijn productiekosten per track. Voor nieuwe releases is het een beheersbare post. Voor de back-catalogus, elk nummer dat ooit is opgenomen, is het prohibitief.

Het catalogusprobleem is wat de afgelopen vijftien jaar elk "lever stems als bestanden"-businessmodel heeft doen vastlopen. Er zijn niet genoeg tracks. Er zullen nooit genoeg tracks zijn. Het universum aan muziek dat een luisteraar wil remixen, zal altijd groter zijn dan het universum dat een label heeft gerenderd en uitgeleverd in een stems-formaat.

De verschuiving die sinds 2022 versnelt is de voor de hand liggende. Stems on demand genereren, op het apparaat van de gebruiker, uit elke audio waar hij de rechten op heeft. Demucs, BS-Roformer, AudioShake's commerciële modellen en Apples stem splitter in Logic Pro hebben allemaal de kwaliteitsdrempel overschreden waar on-device stem-extractie vergelijkbaar is met een netjes geproduceerde .stem.mp4, voor een substantieel deel van de opgenomen muziek.

Zodra een luisteraar schone stems kan extraheren uit elke track die hij geautoriseerd is te gebruiken, verdampt de waarde van vooraf gerenderde Stems-bestanden grotendeels. Dat is, meer dan wat ook, waarom de markt voor vooraf gecodeerde Stems nooit uitgroeide tot de standaard die het had kunnen zijn.

Wat het achterlaat

Het Stems-formaat zal herinnerd worden als een slimme, eerlijke poging die de grenzen van zijn eigen model bewees. Twee delen ervan verdienen het om het te overleven: het idee dat een stem-bestand achterwaarts compatibel moet zijn en op een standaardcontainer gebouwd, en de open, royaltyvrije specificatie die iedereen het liet implementeren.

Onze inschatting bij Remix.me is dat de toekomst geen beter stems-bestand is. Het zijn stems die geproduceerd worden wanneer ze nodig zijn, uit muziek waar mensen al het recht op hebben om te gebruiken, met de inkomsten die terugvloeien naar wie de track ook bezit. Vooraf gerenderde formaten zoals Stems waren de brug tussen "stems zijn een studio-asset" en "stems zijn iets dat je kunt oproepen". Een goede brug. Alleen niet de bestemming.

Niet slecht voor een ADE-lancering uit 2015 waar niemand buiten de DJ-pers aandacht aan schonk.