NaviAI - AI工具导航 | 发现最好用的AI工具

搜索 “语音合成”，找到 24 个工具

Translate.video图像设计

Translate.video 是一款面向视频内容的 AI 翻译工具，支持视频翻译、字幕翻译、配音、AI 语音转换、录音和文本生成，帮助多语言传播视频内容。

AI Voice Detector音频视频

AI Voice Detector 是一款音频真实性检测工具，用于识别语音是否由 AI 生成。用户可上传音频文件进行验证，适合涉及证据核查、媒体判断和客户沟通真实性分析的场景。

AITWO.CO：由AI驱动的全能设计平台图像设计

AITWO.CO 是一款 AI 建筑与空间设计工具，支持多种建筑类型的方案生成，并可自定义风格、色彩、灯光、构图和细节等视觉参数。

HeyGen音频视频

HeyGen是一款在线AI视频生成工具，支持创建会说话的头像视频，并提供可定制头像和配音功能，适用于培训、教学、讲解和营销等内容制作场景。

Novels AI音频视频

Novels AI 是一款生成个性化音频冒险故事的工具，用户可自定义角色与剧情选择，以有声书形式体验由 AI 驱动的沉浸式故事内容。

NarrationBox音频视频

NarrationBox 是一款 AI 语音生成工具，提供 700 多种 AI 叙述员声音，可用于制作播客、有声读物、配音等音频内容。

Revocalize AI音频视频

Revocalize AI 是一款 AI 语音合成工具，支持声音克隆、语音保护和声音创作，提供多语言语音选项，适合音频内容制作与个性化语音应用。

Voiceful音频视频

Voiceful 提供游戏角色声音生成与语音合成演示，并支持通过 SDK 集成到 Unity 中，适合需要角色语音能力的开发与测试场景。

免费文字转语音生成器音频视频

免费文字转语音生成器是一款在线 TTS 工具，支持多语言、多方言和中英文混读，可将文本转换为语音并导出 MP3 文件。

LALAL.AI音频视频

LALAL.AI 是一款音频分离工具，可从歌曲中提取人声或多种乐器音轨，支持高质量音频处理，适合音乐编辑、练习和素材制作。

IBM Watson文字转语音音频视频

IBM Watson文字转语音

讯飞智作音频视频

讯飞智作是科大讯飞推出的一站式AIGC内容创作平台，基于人工智能技术提供文字转语音、虚拟数字人视频制作等服务。用户可以轻松实现音视频内容的快速生成，无需专业技能即可创作出高质量的媒体作品。

Uberduck音频视频

Uberduck是一个开源的AI语音生成和合成的社区，该平台提供了超过5000多种声音帮助用户制作AI配音和语音，甚至你还可以使用自己的自定义语音克隆进行合成。

魔音工坊音频视频

魔音工坊是一款专业的AI配音工具，拥有800多款声音和1000多种风格，满足从视频配音到有声书的广泛需求。魔音工坊提供丰富的功能，包括语速调整、多音字选择、停顿控制等，确保文字转语音的效果逼真自然。用户可以轻松下载无损音频文件，享受便捷的配音体验。

ElevenLabs音频视频

ElevenLabs 是AI文字转语音平台，为开发者、创作者和企业提供逼真的语音合成解决方案。核心产品包括文本转语音（支持包括中文在内的 29+ 语言、10,000+ 声音）、AI 配音、语音克隆、音乐生成等功能。

紫东太初聊天助手

紫东太初是由中科院自动化所和武汉人工智能研究院联合推出的一个全模态大模型，它是在千亿参数多模态大模型“紫东太初1.0”基础上升级打造的2.0版本。紫东太初大模型支持多轮问答、文本创作、图像生成、3D理解、信号分析等全面问答任务，具有强大的认知、理解、创作能力，能够带来全新的互动体验。

Deepgram音频视频

Deepgram是一个提供先进的AI语音识别和自然语言处理技术的平台，核心产品是强大的语音到文本（Speech-to-Text）和文本到语音（Text-to-Speech）API，让开发者能够快速将语音转录和理解功能集成到他们自己的应用程序和服务中。

琅琅配音音频视频

琅琅配音是一款智能文本转语音工具，提供语音合成服务。支持中文、英语、德语、法语等30多种语言，以及高兴、悲伤、兴奋等10多种情感风格。平台功能丰富，操作简单，支持SSML标签，实现多音字、多人配音等高级功能。

阿贝智能图像设计

阿贝智能是一站式AI绘本创作平台，专为儿童教育设计。用户通过简单三步：故事创作、图片生成、智能配音，即可快速生成个性化绘本。阿贝智能鼓励亲子互动，培养孩子的创造力、情感表达和语言能力，同时融入科学、道德教育和身体活动，激发孩子们对科技的兴趣，让孩子们在智能时代中茁壮成长。

SoundView音频视频

SoundView（声动视界）是AI视频本地化工具，支持视频配音和视频翻译。SoundView集成多语种翻译、语音合成、语音识别和大模型技术，简化、加速产品营销视频的创作。SoundView支持100种语言的配音和字幕编辑，让视频制作效率提升10倍，视频翻译成本降低90%。

SiliconFlow开发编程

SiliconFlow（硅基流动）是生成式AI计算基础设施平台。SiliconFlow提供包括SiliconLLM大模型推理引擎、OneDiff高性能文生图/视频加速库，及SiliconCloud模型云服务平台等产品，降低AI模型部署和推理成本，提升用户体验。

JoyPix音频视频

JoyPix 是专注于数字人和语音合成的AI创作工具。用户可以通过上传照片创建个性化的虚拟形象，支持与虚拟形象进行语音对话。

无阶未来开发编程

无阶未来是AI应用与弹性算网平台，专注于为用户提供强大的算力支持和丰富的AI应用服务。无阶未来提供多种类型的显卡资源，用户可以根据需求选择合适的资源进行AI应用的训练和部署

魔珐星云音频视频

魔珐星云是魔珐科技推出的具身智能3D数字人开放平台，致力于让AI从“有大脑”升级到“有身体”，实现自然表达和交互。魔珐星云基于文本输入，能实时生成3D数字人的语音、表情、动作，支持多模态生成、低成本运行、低延时交互及多终端适配。