Music &amp; Audio Generation AI Tools

Audio generation framework by Meta including MusicGen for text-to-music.

Open SourceSelf HostedOfflineGPU 8GB+

Intermediate

0.0 (0)

Featured

Demucs

State-of-the-art music source separation model by Meta for splitting tracks.

Open SourceSelf HostedOffline

Easy

0.0 (0)

Amphion

Open-source toolkit for audio, music, and speech generation research.

Open SourceSelf HostedOfflineGPU 8GB+

Advanced

0.0 (0)

AudioLDM

Original latent diffusion model for text-to-audio generation.

Open SourceSelf HostedOfflineGPU 8GB+

Intermediate

0.0 (0)

EnCodec

High-fidelity neural audio codec by Meta for audio compression and tokenization.

Open SourceSelf HostedOffline

Intermediate

0.0 (0)

MoÃ»sai

Text-to-music generation model using cascaded latent diffusion.

Open SourceSelf HostedOfflineGPU 8GB+

Advanced

0.0 (0)

AudioLDM 2

Latent diffusion model for text-to-audio, music, and speech generation.

Open SourceSelf HostedOfflineGPU 8GB+

Intermediate

0.0 (0)

Riffusion

Real-time music generation using Stable Diffusion on spectrograms.

Open SourceSelf HostedOfflineGPU 6GB+

Intermediate

0.0 (0)

Stable Audio Open

Open-weight audio generation model by Stability AI for sound effects and production elements.

Open SourceSelf HostedOfflineGPU 8GB+

Intermediate

0.0 (0)

DiffRhythm

Full-length song generation model using diffusion with lyrics and style conditioning.

Open SourceSelf HostedOfflineGPU 12GB+

Advanced

0.0 (0)

YuE

Open-source music generation model for creating full songs with vocals and accompaniment.

Open SourceSelf HostedOfflineGPU 16GB+

Advanced

0.0 (0)

AudioSR

Audio super-resolution model for upsampling audio to higher sample rates.

Open SourceSelf HostedOfflineGPU 6GB+

Intermediate

0.0 (0)

DAC (Descript Audio Codec)

High-fidelity universal neural audio codec by Descript for compression.

Open SourceSelf HostedOffline

Intermediate

0.0 (0)

VampNet

Music generation model using masked acoustic token modeling.

Open SourceSelf HostedOfflineGPU 8GB+

Advanced

0.0 (0)

Dance Diffusion

Audio diffusion model by Harmonai for generating music samples.

Open SourceSelf HostedOfflineGPU 8GB+

Advanced

0.0 (0)

Bark (Audio Effects)

Transformer-based text-to-audio model by Suno supporting speech, music, and sound effects.

Open SourceSelf HostedOfflineGPU 6GB+

Easy

0.0 (0)

Whisper Audio (Transcription+)

Audio processing toolkit building on Whisper for diarization and subtitling.

Open SourceSelf HostedOfflineGPU 4GB+

Easy

0.0 (0)

AudioCraft

PyTorch library for deep learning research on audio generation including MusicGen and AudioGen.

Open SourceSelf HostedOfflineGPU

Intermediate

0.0 (0)

GitHub

ACE-Step 1.5

Updated music generation model with improved quality and longer generation.

Open SourceSelf HostedOfflineGPU 8GB+

Intermediate

0.0 (0)

Stable Audio Open

Stability AI training and inference code for generative audio models including diffusion and LMs.

Open SourceSelf HostedOfflineGPU

Advanced

0.0 (0)

GitHub

ACE-Step

Fast music generation model producing full songs with lyrics in seconds.

Open SourceSelf HostedOfflineGPU 8GB+

Intermediate

0.0 (0)