17 个模型符合条件
OmniGen-2
革命性的"全能型"生图引擎:无需复杂插件,一句话搞定所有视觉任务。
Hunyuan3D-2-mini
腾讯出品:高精度文/图生 3D 模型,支持工业级网格拓扑。
Framepack
专业级 AI 视频帧处理工具,打造丝滑连贯的 AI 视频创作流。
FireRedTTS-2
小红书开源:基于大模型的超自然语音合成,复现网红级配音质感。
DeepSeek OCR
下一代 AI 视觉引擎,支持超高精度文字识别与深度文档理解。
Fish-Speech
基于大模型范式的革命性语音合成,实现电影级音色克隆。
UniPic-2
一站式 AI 图像生成与智能编辑,像对话一样自由创作与修图。
SenseVoiceSmall
阿里通义出品:全能语音识别,支持 50+ 语言及情感标签识别。
Qwen3-32b (vLLM)
Qwen3 是 Qwen 系列中的最新一代大型语言模型,提供了一系列密集型和混合专家(MoE)模型。基于在训练数据、模型架构和优化技术方面的广泛进步,基于 vLLM 实现毫秒级极速响应。
GPT-SoVITS
强大的少样本语音克隆工具,完美复刻音色、情感与语调。
FaceFusion 热门
下一代专业级 AI 换脸与人像高清增强工具。
vllm-qwen3-8b 热门
阿里通义千问 Qwen3 轻量版,基于 vLLM 实现毫秒级极速响应。
vllm-qwen3-0.6b 热门
阿里通义千问 Qwen3 轻量版,基于 vLLM 实现毫秒级极速响应
Index-TTS 2 热门
哔哩哔哩出品:拥有超强方言演绎力与情感张力的大模型语音合成。
CosyVoice2
阿里通义出品:支持毫秒级响应与超真实情感的情感语音合成。
Wan-2.2 热门
阿里万相出品:新一代视频生成大模型,打造好莱坞级动态视觉大片。
DreamO 热门
字节跳动出品:支持人物 ID 保持、虚拟试穿与多条件图像定制的全能框架。

