SoundType AI

SoundType AI 是音频和视频转文字工具,可将录音、会议、课程、访谈、播客和视频素材转换成可编辑文本,并辅助摘要和复核,适合内容整理、字幕草稿和知识沉淀等团队协作管理场景。

Soundwise.ai

Soundwise.ai 是免费的 AI 音视频转写工具,可在浏览器中把音频、视频和线上素材转换成文字,并支持多语言识别,适合会议记录、课程整理、访谈、播客和短视频内容复核等场景。

Speakoala

Speakoala 是面向浏览器阅读的 AI 语音朗读工具,可把网页、邮件、文章和本地文档转换成多语言自然语音,适合学习、通勤阅读、资料整理和低视觉疲劳阅读场景使用,减少长时间盯屏成本。

SpeakShift AI

SpeakShift AI 是实时语音翻译与声音保留工具,可把说话内容转换为多语言语音,并尽量保留原声线、语气和个性,适合会议、旅行、视频消息和全球内容沟通场景使用及跨语言协作等。

SpeechGen.io

SpeechGen.io 是 AI 文本转语音和配音生成工具,可把脚本文本转换为 mp3 或 wav 音频,支持多语言声音、语速情绪调节和语音克隆入口,适合旁白、课程与导览配音制作。

Speechly

Speechly 是面向桌面办公的 AI 语音转文字与听写工具,可将语音快速转换为邮件、消息、提示词和待办内容,支持多语言输入和可搜索记录,适合高频办公写作、记录和沟通场景使用等。

SpeechPulse

SpeechPulse 是面向桌面办公的 AI 语音识别与听写工具,可在本地转写语音、跨应用输入文字,并用 AI 模板完成纠错、摘要和邮件格式化,适合高频语音输入与隐私敏感办公场景。

SpotScribe

SpotScribe 是面向播客和音视频内容的 AI 转写工具,可提取 Spotify 节目文字稿、生成摘要并支持围绕单集问答,适合把长音频整理成可检索、可下载和可复用的内容资料。

AI Voiceover for Video

AI Voiceover for Video 是视频 AI 配音工具,可上传已有视频、编辑脚本、选择自然语音并导出同步旁白视频,适合教程、演示、培训和营销内容制作流程管理工作流等。

Telelingo

Telelingo 是面向电话沟通的 AI 音频翻译工具,可在通话中实时翻译 80 多种语言,并支持移动应用、演示场景和企业入站出站方案,帮助跨语言电话沟通更顺畅稳定和服务质量保障。

SubtitlesDog

SubtitlesDog 是面向字幕翻译和视频本地化的 AI 音频工具,可上传字幕或视频相关文件并快速翻译成目标语言,适合创作者和字幕团队制作多语言字幕草稿并继续校对发布,提升本地化效率。

SubtitleBee

SubtitleBee 是面向视频字幕和社媒内容处理的 AI 音频工具,可自动生成字幕、翻译字幕、编辑样式、裁剪视频并导出字幕文件或带字幕视频,适合创作者和社媒运营团队完成日常字幕发布。

SubEasy

SubEasy 是面向转写、字幕、翻译和配音的 AI 音频工具,可处理音频、视频和链接内容,并生成字幕、译文、配音、摘要和笔记,适合内容团队提高整理效率和复用质量,支持后续编辑流程。

SyncWords

SyncWords 是面向直播、广播和录播媒体的 AI 音频字幕平台,可提供实时字幕、实时翻译字幕和 AI 配音,适合赛事、新闻、教育和大型活动扩展多语言受众与无障碍体验。支持复杂直播。

Text to Speech.im

Text to Speech.im 是在线 AI 文本转语音工具,可选择多语言和不同声音风格,把文字生成可试听和下载的语音文件,适合课程、短视频和有声内容制作流程与旁白草稿使用场景。

TikTok Voice Generator

TikTok Voice Generator 是面向短视频配音的 AI 语音生成工具,可将文字转换为多语言、多风格声音,适合创作者快速测试旁白、角色音色和社媒剪辑草稿,并下载音频。

Sanas

Sanas 是面向企业通话和实时语音场景的 AI 音频平台,提供语音增强、降噪、口音和语言相关能力,帮助客服、医疗和企业沟通团队提升通话清晰度与信任感,并适配低延迟企业通信流程部署。

ToneShift

ToneShift 是面向声音克隆、人声转换和音乐创作的 AI 音频工具,可替换演唱声音、创建自定义声音风格并与社区分享,适合测试多种人声效果、音乐草稿方向和角色音色方案创作流程。

TopMediai

TopMediai 是一站式 AI 多媒体创作平台,覆盖视频、音乐和配音生成,适合创作者快速制作旁白、声音素材、音乐片段和短视频内容,并统一管理多种创作任务与发布前素材准备流程工作。

Transcri

Transcri 是面向音频、视频和字幕工作的 AI 转写平台,可自动生成文字稿、字幕、翻译和摘要,并支持团队协作与文件问答,适合企业和内容团队处理会议、课程和视频资料项目协作流程。

TranscribeGo

TranscribeGo 是面向音频、视频和链接内容的 AI 转写工具,可生成文字稿、摘要、字幕、关键观点和文章初稿,适合记者、学生、创作者和专业团队整理资料并转化内容资产库素材。

transcribethis.io

transcribethis.io 是面向音频转写的 AI 工具,可把录音快速转换成文字,并默认支持说话人识别,适合会议、采访、播客和课程内容整理,帮助团队形成可搜索资料库内容记录。

Translingo

Translingo 是面向活动和会议的 AI 实时翻译工具,支持多语言现场或线上场景,无需参会者额外安装应用,适合讲座、培训、发布会和跨国协作活动,帮助主办方降低语言门槛成本投入。

TTS4Free

TTS4Free 是免费在线文字转语音工具,支持多语言自然朗读,无需注册即可快速把文本转换为语音,适合学习材料、短视频旁白和演示配音草稿制作,并用于课程素材、学习音频和短视频声音预览。

ttsMP3.com

ttsMP3.com 是在线文字转语音工具,可把文本转换成多语言朗读并下载 MP3 文件,适合制作课程旁白、听力材料、演示配音和临时音频素材,并用于语言学习、课程制作和视频发布前的声音预览。

Unmixr

Unmixr 是一套围绕语音合成、录音转写和多语言配音展开的 AI 音频工具,可把文案生成自然旁白、把音频整理成文本,并帮助创作者提高音频内容生产效率,支持从脚本到声音素材的连续制作流程。

Utell AI

Utell AI 是面向跨语言会议和通话的实时语音增强工具,提供口音转换、降噪、实时翻译、会议助手和转写能力,帮助学生、销售、客服和跨国团队提升英语沟通清晰度、听感、会议效率和协作体验。

Transkriptor

Transkriptor 是 AI 语音转文字和会议转写工具,可处理录音、视频、会议和访谈内容,适合生成文字稿与纪要初稿;多人对话、低音质、说话人、时间轴、敏感资料和专业术语要复核。

Uberduck

Uberduck 是 AI 语音生成与声音克隆平台,可用于配音、音乐人声和创意语音素材制作,适合开发者与内容团队实验声音方案,但真人声音、音乐版权、接口成本、使用边界和商用授权必须确认。

UniScribe

UniScribe 是音视频转文字和摘要工具,可把会议、课程、播客或视频整理成文字稿与重点摘要,适合内容复用和学习整理;专业术语、说话人、时间轴、隐私材料和摘要遗漏仍需人工检查处理。

Vapify

Vapify 是面向代理商的白标语音 AI 服务平台,可围绕 Vapi、Retell 等语音能力搭建自有品牌方案,适合交付语音机器人业务,但客户数据、录音授权和通话合规需严格管理。

Vatis Tech

Vatis Tech 是音频和视频转写平台,支持多语言语音识别、字幕和团队转录流程,适合会议、媒体和内容运营使用;专业名词、说话人、时间轴、隐私内容、导出格式和翻译结果仍要复核确认。

Video Transcriber AI

Video Transcriber AI 是面向视频转文字的在线工具,可把上传视频整理成可编辑转录稿,适合会议、课程和创作者复盘素材,但噪声、口音、多人对话和专业名词仍需人工校对。

VideoToTextAI

VideoToTextAI 是视频与音频转文字工具,可把短视频、播客和会议录音整理成文字稿,适合字幕制作和内容复用;涉及专业术语、多人说话、低音质、时间轴或隐私资料时仍需要人工校对。

Voco Speech

Voco Speech 是 Mac 和 Windows 上的 AI 语音生成与声音克隆工具,主打本地私有工作流、免费额度和一次性 Pro 升级,适合制作旁白、教程和配音素材内容使用。

Deepgram

Deepgram 是 AI 音频工具,覆盖语音转文字、AI语音合成等能力,适合音频内容制作、转写整理和团队工作流,商用前需复核音质、文本和授权,并保留人工审听、授权核查和后期处理空间。

AssemblyAI

AssemblyAI 是 AI 音频工具,覆盖语音转文字、语音转写等能力,适合音频内容制作、转写整理和团队工作流,商用前需复核音质、文本和授权,并保留人工审听、授权核查和后期处理空间。

LOVO AI

LOVO AI 是 AI 音频工具,覆盖AI语音合成、AI配音等能力,适合音频内容制作、转写整理和团队工作流,商用前需复核音质、文本和授权,并保留人工审听、授权核查和后期处理空间。

Speechify

Speechify 是 AI 音频工具,覆盖AI语音合成、AI有声书等能力,适合音频内容制作、转写整理和团队工作流,商用前需复核音质、文本和授权,并保留人工审听、授权核查和后期处理空间。

Alitu

Alitu 是 AI 音频工具,覆盖AI播客工具、AI音频编辑等能力,适合音频内容制作、转写整理和团队工作流,商用前需复核音质、文本和授权,并保留人工审听、授权核查和后期处理空间。