CosyVoice是一款由阿里巴巴通义实验室开发并开源的多语言语音生成模型,专注于自然语音生成、音色克隆和情感控制。
Whisper 是 OpenAI 开发的一款强大的语音识别模型,具有多语言支持、语音翻译和语言识别等多功能能力。
Goku视频生成模型是由中国香港大学与字节跳动联合推出的一款AI视频生成工具,能够实现文本到视频、图像到视频以及文本到图像等多种生成方式。
DDColor 是一种由阿里巴巴达摩院研发的先进图像上色技术,旨在通过深度学习技术将黑白或灰度图像转换为逼真且生动的彩色图像。
AnchorCrafter 是由中国科学院与腾讯联合推出的一项创新技术,旨在通过人工智能生成高保真度的产品推广视频。
零代码搭建企业知识库平台,智能AI问答机器人。
专注AGI底层创新的前沿研究机构,基于全栈自研体系实现大模型技术突破,构建从16B到671B参数的全尺度模型矩阵,覆盖通用对话、代码生成、逻辑推理等核心场景。
科大讯飞研发的第三代认知智能引擎,基于国产算力实现跨模态理解与复杂任务执行,支持自然语言交互下的逻辑推理、代码生成及多模态数据处理。
FaceChain 是一个基于深度学习技术的个性化数字形象生成工具,利用生成对抗网络(GANs)和 Stable Diffusion 模型,通过少量照片生成高度个性化的数字形象。