Tools/Music & Audio Generation/MoÃ»sai

MoÃ»sai

Text-to-music generation model using cascaded latent diffusion.

Open SourceSelf HostedOffline CapableGPU Required (8GB+ VRAM)

0.0 (0)

Visit Website View on GitHub

About

Mousai is a research text-to-music model that uses cascaded latent diffusion to generate long-form stereo music at 48 kHz from text descriptions. It is built on the audio-diffusion-pytorch library, a customizable waveform-based diffusion toolkit covering unconditional and text-conditional generation, diffusion autoencoding, upsampling, and vocoding. The library is provided for PyTorch; pretrained weights follow the paper's configuration. Open-source research release.

Reviews (0)

Leave a Review

No reviews yet. Be the first to review!

Details

Category: Music & Audio Generation
Price: Free
Platform: Local/Desktop
Difficulty: Advanced (4/5)
Minimum VRAM: 8 GB
Added: Apr 3, 2026

Tags

music text-to-music diffusion cascaded 48khz

Related Tools

Featured

AudioCraft / MusicGen

Music & Audio Generation

Audio generation framework by Meta including MusicGen for text-to-music.

Open SourceSelf HostedOfflineGPU 8GB+

Intermediate

0.0 (0)

AudioLDM 2

Music & Audio Generation

Latent diffusion model for text-to-audio, music, and speech generation.

Open SourceSelf HostedOfflineGPU 8GB+

Intermediate

0.0 (0)

AudioSR

Music & Audio Generation

Audio super-resolution model for upsampling audio to higher sample rates.

Open SourceSelf HostedOfflineGPU 6GB+

Intermediate

0.0 (0)

Featured

Demucs

Music & Audio Generation

State-of-the-art music source separation model by Meta for splitting tracks.

Open SourceSelf HostedOffline

Easy

0.0 (0)

ACE-Step

Music & Audio Generation

Fast music generation model producing full songs with lyrics in seconds.

Open SourceSelf HostedOfflineGPU 8GB+

Intermediate

0.0 (0)

AudioCraft

Music & Audio Generation

PyTorch library for deep learning research on audio generation including MusicGen and AudioGen.

Open SourceSelf HostedOfflineGPU

Intermediate

0.0 (0)

Browse all Music & Audio Generation tools