Tools/Music & Audio Generation/Whisper Audio (Transcription+)

Whisper Audio (Transcription+)

Audio processing toolkit building on Whisper for diarization and subtitling.

Open SourceSelf HostedOffline CapableGPU Required (4GB+ VRAM)

0.0 (0)

Visit Website View on GitHub

About

Stable-ts extends OpenAI Whisper to produce more reliable word and segment timestamps and adds tools for transcription workflows. It refines Whisper's native timing, supports regrouping and editing of segments, suppresses silent-region hallucinations, and can output subtitle formats. It works with any Whisper model size on CPU or GPU and is useful for subtitling, captioning, and audio editing. Open-source Python package.

Reviews (0)

Leave a Review

No reviews yet. Be the first to review!

Details

Category: Music & Audio Generation
Price: Free
Platform: Local/Desktop
Difficulty: Easy (2/5)
License: MIT
Minimum VRAM: 4 GB
Added: Apr 3, 2026

Tags

audio transcription diarization subtitles whisper processing

Related Tools

Featured

AudioCraft / MusicGen

Music & Audio Generation

Audio generation framework by Meta including MusicGen for text-to-music.

Open SourceSelf HostedOfflineGPU 8GB+

Intermediate

0.0 (0)

AudioLDM 2

Music & Audio Generation

Latent diffusion model for text-to-audio, music, and speech generation.

Open SourceSelf HostedOfflineGPU 8GB+

Intermediate

0.0 (0)

AudioSR

Music & Audio Generation

Audio super-resolution model for upsampling audio to higher sample rates.

Open SourceSelf HostedOfflineGPU 6GB+

Intermediate

0.0 (0)

Featured

Demucs

Music & Audio Generation

State-of-the-art music source separation model by Meta for splitting tracks.

Open SourceSelf HostedOffline

Easy

0.0 (0)

ACE-Step

Music & Audio Generation

Fast music generation model producing full songs with lyrics in seconds.

Open SourceSelf HostedOfflineGPU 8GB+

Intermediate

0.0 (0)

AudioCraft

Music & Audio Generation

PyTorch library for deep learning research on audio generation including MusicGen and AudioGen.

Open SourceSelf HostedOfflineGPU

Intermediate

0.0 (0)

Browse all Music & Audio Generation tools