音频视频
AI音乐、语音合成、视频生成与编辑工具
万兴喵影2023是一款易上手、功能强大的国产视频剪辑软件,支持一键导入SRT字幕,界面简洁时尚,拥有灵活的时间轴剪辑功能和丰富的资源特效。
MyVocal.ai 是一个提供语音同步与语音克隆功能的工具,用户可将自己的声音与热门音乐同步,并在较短时间内完成语音克隆。
Pod Genie 是一款 AI 播客工具,可将 RSS 订阅源转换为个性化播客内容,并提供定制新闻播报、新闻通讯和摘要服务,方便用户按兴趣获取音频信息。
Lovo 是一款 AI 语音生成与文字转语音工具,支持将文本转换为自然语音,适合用于音频内容制作、配音和多种创作场景,以减少人工录制成本与时间投入。
YouWhisper是一款基于机器学习的视频制作与编辑工具,面向需要快速处理视频素材的用户,提供多种编辑选项,帮助完成更高质量的视频内容创作。
Mubert是一款AI音乐生成工具,为内容创作者和应用开发者提供免版税音轨,可按风格、情绪、用途和时长生成音乐。
Muse.ai 是一个无广告视频托管平台,提供 4K 播放、嵌入式播放器、视频分析和 AI 搜索等功能,适合视频发布、管理与内容检索。
Koe Recast是一款AI语音转换工具,可将用户声音转换为不同风格,适用于语音聊天、虚拟社交和实时互动等场景。
Ad Auris是一个让你在Spotify、Apple Podcasts和Google Podcasts上创建文章播放列表的工具
imajinn.ai 提供基于 AI 的情侣画像生成服务,用户上传双方照片后,可生成浪漫风格的人像作品,并可用于画布或海报制作。
Genmo AI 是一款基于人工智能的视频生成工具,侧重于将创意快速转化为具有视觉表现力的内容,也提供社区生成作品供浏览和参考。
AI Voice Detector 是一款音频真实性检测工具,用于识别语音是否由 AI 生成。用户可上传音频文件进行验证,适合涉及证据核查、媒体判断和客户沟通真实性分析的场景。
MusicLM 是谷歌研究团队提出的音乐生成模型,可根据文本描述生成高保真音乐。它主要用于展示文本到音乐生成的研究能力与生成效果示例。
Soundful是一个AI音乐生成器平台,使内容创作者和音乐艺术家能够创建无限数量的曲目并赚取钱。
Lemonaid Music 是一款为音乐人提供创作灵感的 AI 工具,可生成旋律、和弦、鼓点等 MIDI 音乐元素,帮助用户快速开启编曲和创作流程。
2short.ai 是一款面向 YouTube 内容创作者的短视频生成工具,可从长视频中提取精彩片段并转换为 Shorts,同时支持自动字幕导出。
Article.Audio 是一项将文章内容转换为语音播放的在线服务,支持把文本文章变成可收听的音频,方便在阅读不便时获取信息。
Reachout.ai 是一款 AI 视频触达工具,帮助企业家和销售团队制作个性化讲话视频,用于邮件外联和潜在客户沟通,并支持视频效果跟踪与分析。
Vidon.ai 涵盖 AI 视频生成与视频分析两类能力。一方面可将博客内容转成视频,另一方面可用于访客统计、队列监测、VIP 识别及人群年龄性别估计等分析场景。
AnthemScore 是一款自动音乐转录软件,可利用 AI 将 MP3 和 WAV 音频文件转换为乐谱或吉他谱,支持 Windows、macOS 和 Linux 使用。
Transkribieren 是一款音频转录工具,支持多种音频格式上传,提供较便捷的语音转文字服务,并扩展到移动端、浏览器和会议场景中使用。
Visla的AI视频生成器是一款面向演示与叙事内容创作的视频工具,可借助AI快速生成并编辑视频,并提供转录、素材建议等功能,帮助用户完成专业化表达。
HeyGen是一款在线AI视频生成工具,支持创建会说话的头像视频,并提供可定制头像和配音功能,适用于培训、教学、讲解和营销等内容制作场景。
Adobe Speech Enhancer 是一款用于提升语音录音质量的 AI 音频增强工具,能够减少背景噪声、突出人声,让普通口语录音听起来更清晰、更接近录音棚效果。
Playlistable 是一个 AI 播放列表生成工具,可根据心情、场合和音乐偏好创建个性化歌单,并支持与 Spotify 集成进行收听。
Nuro.video 是一款 AI 视频编辑工具,可将长时间的原始视频素材自动转录、分析并整理为包含标题、过渡和动画的成片。
Hit'n'Mix是一个音频处理工具,可以用于去除人声,创建音轨,混音和修复音频。试用21天,立即下载。
Inksprout Video 是一款利用 AI 将博客内容转换为社交视频的工具,可自动生成字幕,并结合图片、音乐等元素制作更适合社交媒体传播的视频内容。
Magenta Studio 是一组基于 Magenta 开源模型构建的音乐创作插件,主要用于借助 AI 生成、补全和变换 MIDI 音乐片段,帮助用户探索旋律与节奏创意。
Novels AI 是一款生成个性化音频冒险故事的工具,用户可自定义角色与剧情选择,以有声书形式体验由 AI 驱动的沉浸式故事内容。
Brain.fm 是一款以提升专注、冥想和睡眠体验为目标的 AI 音乐应用,通过带有节奏脉冲的背景音乐帮助用户维持注意力或放松状态。
Fathom.fm 是一款 AI 播客播放器,支持智能推荐、片段分享、播客内容搜索、转录阅读和章节导航,方便用户更高效地收听与检索播客内容。
Podsqueeze 是一款面向播客创作者的 AI 内容再利用工具,可围绕播客音频生成节目说明、时间戳和新闻简报等辅助内容,帮助提升后期整理效率。
Murf AI 是一款 AI 语音生成工具,可将文本转换为自然逼真的人声,适合制作播客、视频配音、演示解说等多种音频内容。
NarrationBox 是一款 AI 语音生成工具,提供 700 多种 AI 叙述员声音,可用于制作播客、有声读物、配音等音频内容。
Latte是一个视频剪辑工具,可以剪辑视频到短视频平台所需的格式。
Revocalize AI 是一款 AI 语音合成工具,支持声音克隆、语音保护和声音创作,提供多语言语音选项,适合音频内容制作与个性化语音应用。
Krisp 是一款基于 AI 的降噪应用,主要用于提升在线会议和语音沟通质量。它支持 Mac 和 Windows,并提供语音效率相关功能与免费版本。
Moises App是一款AI音乐工具,支持调整歌曲音调与速度、分离人声和乐器,并提供母带处理与音频提取等功能。
Hify是一个提供视频消息服务的网站,可以帮助销售人员通过几十种个性化模板从浏览器中创建漂亮的销售视频。Hify还提供自动化、交付和CTA服务。网站上有一个帮助台,提供有关视频制作、潜在客户生成和入门的文章。Hify还被列为DoMore.ai上功能强大的销售视频工具,适用于各种规模的公司。
Groot Music 是一款运行在 Discord 上的音乐机器人,支持多语言使用,并提供包含 AI 工具在内的高级功能,适合社区中的语音互动与音乐播放需求。
Voiceful 提供游戏角色声音生成与语音合成演示,并支持通过 SDK 集成到 Unity 中,适合需要角色语音能力的开发与测试场景。
FineShare FineVoice 是一款 AI 实时变声工具,支持在会议、直播、聊天和游戏过程中对声音进行即时调整与个性化处理。
Songmastr 是一款基于 AI 的在线音乐母带处理工具,可将用户上传的歌曲按照参考曲目的响度、频谱特征、峰值幅度和立体声宽度进行匹配处理,支持 MP3 和 WAV 格式。
Steve AI 是一款 AI 视频制作工具,面向社交媒体运营和内容营销场景,能够将脚本、博客或文本快速转化为短视频与动画内容。
Genmo 是一款利用 AI 根据文本生成视频的工具,用户输入文字内容后,可结合风格和音乐选项,快速制作视频,降低了视频创作对专业技能的要求。
Harmonai 是一个社区驱动的开源生成音频项目,致力于提供可用于音乐创作的 AI 工具,让更多人能够参与声音与音乐生成实践。
Doctor Mix AI Synth 是一款面向 AX73 合成器的软件工具,被介绍为由 AI 编写的合成器软件,并提供相关功能说明、下载入口和使用教程。
Listener.fm 是一款面向播客创作者的 AI 辅助编辑工具,可自动生成播客标题、内容描述和节目笔记,帮助简化后期整理与发布流程。
Replica Studios 是一款面向创意项目的 AI 语音生成工具,提供带有情感表达的虚拟配音演员,可用于生成更自然的语音表演内容。
免费文字转语音生成器是一款在线 TTS 工具,支持多语言、多方言和中英文混读,可将文本转换为语音并导出 MP3 文件。
Flowjin 是一款将长音频内容自动转换为短视频剪辑的 AI 工具,适合把访谈、播客或 Spaces 内容整理成可分享的短内容,并支持维护在线主页与个人资料信息。
FolkTalk 是一款 AI 视频配音平台,支持多语言配音,帮助创作者和组织将视频内容传播到不同语言受众,同时尽量保留原有表达风格。
Omniverse Audio2Face 是 NVIDIA 推出的 AI 面部动画工具,可根据音频自动生成匹配的角色面部表情与口型动画,适用于实时和传统角色制作流程。
LALAL.AI 是一款音频分离工具,可从歌曲中提取人声或多种乐器音轨,支持高质量音频处理,适合音乐编辑、练习和素材制作。
Splashmusic是一个让每个人都能享受音乐创作乐趣的项目。它提供易于使用的音乐制作工具,让用户可以轻松地创作、录制和分享自己的音乐作品。无论你是音乐爱好者还是专业音乐人,Splashmusic都能满足你的需求。
Summarize Tech 是一款基于 AI 的视频摘要工具,主要用于为长视频生成简洁的文字总结,帮助用户快速了解视频重点内容,减少完整观看所需时间。
Tapesearch是一个通过人工智能快速搜索播客转录的搜索引擎。今天下载您最喜欢的播客的转录。
Taption 是一款视频与音频转录工具,支持自动生成字幕和翻译,覆盖 40 多种语言,并提供内置编辑功能用于整理转录内容。
Voicemod是一个提供实时语音转换和自定义声音效果的网站,可为Discord、ZOOM、Google Meet、Minecraft等桌面应用程序和游戏提供服务。
Koolio.ai 是一款基于网页的 AI 播客制作与协作工具,帮助用户从构思到编辑快速完成播客内容。它支持音频转录、协作编辑、自动匹配音效或音乐,以及常用音频处理操作。
Natural Language Playlist是一款通过自然语言生成音乐播放列表的AI工具,用户只需输入一句描述,即可获得对应风格或情绪的歌单推荐。
NaturalReader是一款提供AI文字转语音服务的工具,支持在线使用、移动应用、商业授权和教育场景,适合将文本内容转换为语音收听。
Sonify 是一家专注于音频与数据结合的工具与解决方案提供方,核心方向是将数据转化为声音,帮助用户通过听觉更直观地理解、分析和体验信息。
SpeechEasy提供高品质的文字转语音服务
VEED是一个在线视频编辑工具。它提供了字幕、编辑、编码、库存库以及音乐和声波等功能。该工具提供了一个功能齐全、用户友好的体验,无需复杂的培训。VEED还提供视频录制、存储和共享功能,集成在一个地方。该工具适用于各种用户,如营销团队、人力资源专业人士和内容创作者。VEED易于使用,能够进行一键编辑,而且无需注册即可试用。
Gling是一款专为视频内容创作者打造的AI工具,它的AI技术可以自动剪辑掉视频中的沉默和失误,让你专注于制作优质的YouTube视频。使用Gling,你可以省去繁琐的后期制作,更加轻松地创作出高质量的视频内容。
Nonoisy是一款音频后期处理工具,主要用于去除背景噪音、优化音频质量和调节音量,也可用于提升视频中的音频表现。
Riffusion 是一个基于文本提示生成音乐的 AI 项目,使用 Stable Diffusion 模型思路将文字输入转化为音频内容,帮助用户快速尝试音乐创作。
这是一个提供人工智能快速创作短视频的网站,但是目前还没有任何内容。
Voicera 是一款文章转语音工具,可自动识别内容并生成可播放的音频版本,支持多种语言和声音选择,方便用户以收听方式获取信息。
Timebolt 静态过滤器是一款自动剪辑视频的工具,能够识别并删除沉默和停顿片段,并支持快速编辑场景或字词,适合长视频后期整理。
Tavus 是一款面向产品、营销和销售团队的 AI 个性化视频生成工具,可基于模板为不同观众批量制作定制视频,并通过语音变量实现更贴合对象的沟通内容。
Musico 是一款 AI 音乐生成引擎,可自动创作多种风格的免版税音乐,并能根据手势、动作、代码或其他声音输入作出实时反应。
Audioshake 是一款音频分离与处理工具,可提取节奏、和声、旋律等音轨元素,便于进行重混、采样、修复和再创作,适合音乐制作与版权相关工作流程。
Podium是一款面向播客内容整理的工具,可生成文字稿、章节、展示笔记和内容片段,并通过简洁的拖拽操作提升播客后期处理与分发效率。
Pop2Piano 是一个根据音频输入生成流行歌曲钢琴版本的研究项目,提供论文、演示视频和样本数据,可用于了解音乐生成与自动钢琴编配方向的成果。
Soundraw是专为创作者打造的AI音乐生成器,能根据用户设置的参数(如流派、情绪、乐器、时长等)快速生成背景音乐。用户可以通过简单的操作,选择音乐风格(如流行、嘻哈、古典等),调整节奏、音量、乐器组合等,生成符合需求的音乐片段。
转录和理解语音的AI模型
IBM Watson文字转语音
好莱坞也在用的AI视频颜色分级工具
AI一键视频背景移除
AI自动移除视频背景
讯飞智作是科大讯飞推出的一站式AIGC内容创作平台,基于人工智能技术提供文字转语音、虚拟数字人视频制作等服务。用户可以轻松实现音视频内容的快速生成,无需专业技能即可创作出高质量的媒体作品。
AI文本到语音生成工具
AI实时变声工具
AI真人口播视频生成工具
万兴播爆是由万兴科技推出的一款AI数字人口播视频营销工具,专注于为视频创作者跨境电商从业人员提供全链路的AIGC创作体验。该软件利用先进的AI技术,允许用户通过简单的文本输入或语音文件,快速生成包含数字人角色、动态场景和精准背景的高清视频。
秒创(原一帧秒创)是基于秒创AIGC引擎的智能AI内容生成平台,为创作者和机构提供AI生成服务,包括文字续写、文字转语音、文生图、图文转视频等创作服务,一帧秒创通过对文案、素材、AI语音、字幕等进行智能分析,快速成片,零门槛创作视频
Uberduck是一个开源的AI语音生成和合成的社区,该平台提供了超过5000多种声音帮助用户制作AI配音和语音,甚至你还可以使用自己的自定义语音克隆进行合成。
魔音工坊是一款专业的AI配音工具,拥有800多款声音和1000多种风格,满足从视频配音到有声书的广泛需求。魔音工坊提供丰富的功能,包括语速调整、多音字选择、停顿控制等,确保文字转语音的效果逼真自然。用户可以轻松下载无损音频文件,享受便捷的配音体验。
奇妙元是出门问问推出的AI数字人短视频和直播解决方案,借助该数字形象创作及直播平台,用户可以创建自己的数字形象,并通过这些数字形象进行直播活动。奇妙元平台目前拥有超过100款数字人和超过1000款3D数字资产,可以为用户提供丰富的选择。
beatoven.ai是AI音乐生成平台,旨在为视频、播客和游戏制作者提供版权免费的背景音乐。用户只需输入音乐想法,能快速生成超过250种风格的音乐。平台支持个性化定制,包括音乐长度、风格、情绪和乐器选择,满足不同创作需求。
ElevenLabs 是AI文字转语音平台,为开发者、创作者和企业提供逼真的语音合成解决方案。核心产品包括文本转语音(支持包括中文在内的 29+ 语言、10,000+ 声音)、AI 配音、语音克隆、音乐生成等功能。
Pika是近期热门的人工智能初创公司Pika Labs推出的AI视频生成和编辑工具,该工具可以将任何创意转化为视频,用户只需输入文字或图像,即可快速生成3D动画、动漫、卡通、电影等风格的视频。
Sora是由OpenAI研发的AI视频生成模型,具备将文本描述转化为视频的能力,能够创造出既逼真又富有想象力的视频场景。该模型专注于模拟物理世界的运动,旨在帮助人们解决需要现实世界互动的问题。Sora 能够生成长达一分钟的视频,同时保持视觉质量和对用户输入的高度还原。
Deepgram是一个提供先进的AI语音识别和自然语言处理技术的平台,核心产品是强大的语音到文本(Speech-to-Text)和文本到语音(Text-to-Speech)API,让开发者能够快速将语音转录和理解功能集成到他们自己的应用程序和服务中。
有言是由魔珐科技推出的一个一站式AIGC视频创作和3D数字人生成平台,通过提供海量超写实3D虚拟人角色,帮助用户无需真人出镜即可制作视频。
Spikes Studio是一款基于人工智能技术的视频自动剪辑工具,能够自动分析并总结长视频,提取关键片段,生成多个短视频,旨在简化视频内容创作者的剪辑流程,非常适合快节奏的社交媒体平台。
蝉镜是营销数据分析平台蝉妈妈旗下推出的一款AI数字人短视频与直播平台,通过极速克隆技术和高效的内容生产流程,使用户能够快速创建并发布数字人短视频。
曦灵数字人是百度智能云推出的基于人工智能技术的数字人平台,为企业和个人开发者提供高性能、易集成和多样化的数字人组件能力。平台支持数字人形象定制、视频合成、交互对话、直播等多场景应用,满足不同行业的需求。
讯飞绘镜(原星火绘镜)是科大讯飞推出的AI短视频创作平台,能够将用户输入的文本描述自动转换成视频内容(如短剧、预告片、MV),包括生成视频剧本、分镜,最终形成完整的短视频。
KreadoAI是一个AIGC数字营销视频创作平台,专注于利用人工智能技术简化和优化视频内容的创作流程。用户只需输入文本或关键词,Kreado AI便能创作出真实或虚拟人物的视频内容。
Wondercraft是一款多功能的AI音频内容创作平台,通过生成式AI语音技术,允许用户将文本内容迅速转化为播客、有声书、广告等多种音频形式。
白日梦AI是光魔科技推出的AI视频创作平台,通过自然语言处理技术,允许用户输入文本内容,快速生成视频,最长可生成6分钟的视频。该平台支持文生视频、动态画面、AI角色生成等功能,并能保持人物和场景的一致性。
琅琅配音是一款智能文本转语音工具,提供语音合成服务。支持中文、英语、德语、法语等30多种语言,以及高兴、悲伤、兴奋等10多种情感风格。平台功能丰富,操作简单,支持SSML标签,实现多音字、多人配音等高级功能。
巨日禄是一站式AI动漫视频创作平台,基于自然语言处理技术和图像生成技术,支持用户将文本转化为情节连贯的漫画视频和短视频。巨日禄支持从文案到视频的一站式制作,提供多种画风选择和配音配乐服务,适合各类创作者使用。
SoundView(声动视界)是AI视频本地化工具,支持视频配音和视频翻译。SoundView集成多语种翻译、语音合成、语音识别和大模型技术,简化、加速产品营销视频的创作。SoundView支持100种语言的配音和字幕编辑,让视频制作效率提升10倍,视频翻译成本降低90%。
JoyPix 是专注于数字人和语音合成的AI创作工具。用户可以通过上传照片创建个性化的虚拟形象,支持与虚拟形象进行语音对话。
Pollo AI 是一站式 AI 图像与视频创作平台。平台集成多种先进的 AI 模型,如 Pollo 2.5、Veo 3 等,支持从文本生成视频、图片转视频、视频风格转换等多种功能。
Keevx是AI数字人视频创作工具,帮助用户快速生成多语言、高质量的视频内容。Keevx提供丰富的功能,包括爆款视频裂变、URL 转视频、视频翻译、AI 脚本生成、PPT/PDF 转视频等。用户可以用 210+ 海外原生数字人形象和 40+ 视频模板,结合 70+ 种语言和 180+ 口音,轻松制作出符合需求的视频。
魔珐星云是魔珐科技推出的具身智能3D数字人开放平台,致力于让AI从“有大脑”升级到“有身体”,实现自然表达和交互。魔珐星云基于文本输入,能实时生成3D数字人的语音、表情、动作,支持多模态生成、低成本运行、低延时交互及多终端适配。
云幕同声是新一代原声级专业AI视频翻译工具,适合短剧出海、跨境电商等领域。98%还原音色的AI声音克隆、精准的音画同步算法以及AI人声分离模型,能完整保留背景音乐和情感细节,让翻译后的视频与原版一样自然。
Vemus未音是腾讯音乐旗下首款一站式AI音乐创作工具,零门槛多模态音乐创作,人人都能玩音乐。把“写歌”压缩成三步:输入一句话、一张图或一段哼唱,AI在几秒内自动完成作词、作曲、编曲、演唱,支持流行、国风、电子等任意风格秒切换。