text-to-imageimage-to-imageimage-to-video

Kling O1 (Omni One)

Kling Omni Image O1 是快手的多模态图像生成模型，支持最多 10 张参考图保持特征一致性，并提供精细编辑（增/删/改）、风格控制与系列内容创作。适合 IP 角色设计、漫画分镜与品牌衍生品。即用型 REST API，最佳性能，无冷启动，价格友好。

View model

Featured Model

Kling O1 (Omni One)

text-to-image · image-to-image · image-to-video

text-to-imageimage-to-image

Google / Nano Banana Pro

Nano Banana Pro 是基于 Gemini 3 / Gemini 3.0 Pro 的新一代专业级图像生成与编辑模型，较上一代更高质量、更强控制与更优秀的文字表现。

View model

Featured Model

Google / Nano Banana Pro

text-to-image · image-to-image

image-to-video

Google / Veo 3.1

Google Veo 3.1 原生支持 1080p 分辨率，提供更高画质与更灵活的创作能力。

View model

Featured Model

Google / Veo 3.1

image-to-video

text-to-video

OpenAI / Sora 2

OpenAI 的 Sora 2 为新一代视频与音频生成模型，在物理真实性、音频同步、可控性与风格覆盖上大幅提升。

View model

Featured Model

OpenAI / Sora 2

text-to-video

text-to-imagetext-to-videoimage-to-video

Wan 2.5

阿里 Wan 团队打造的下一代视频模型：多语言、电影质感、原生音频同步。

View model

Featured Model

Wan 2.5

text-to-image · text-to-video · image-to-video

text-to-image

Seedream v4

Seedream 4.0 将生成与编辑统一为一体，强化知识/推理/参考一致任务，速度更快，最高支持 4K。

View model

Featured Model

Seedream v4

text-to-image

image-to-image

Google / Nano Banana / Edit

Google 最新图像生成与编辑模型。

View model

Featured Model

Google / Nano Banana / Edit

image-to-image

image-to-video

Bytedance / Seedance-v1-pro-i2v-480p

ByteDance Seedance 在多镜头一致性与复杂提示跟随上表现出色，可生成稳定流畅的高质量视频。

View model

Featured Model

Bytedance / Seedance-v1-pro-i2v-480p

image-to-video

text-to-video

Minimax / Hailuo-02 / i2v-standard

Hailuo 02 基于 MiniMax 新框架，支持超清 1080P 与更强物理一致性，适合高要求视频创作。

View model

Featured Model

Minimax / Hailuo-02 / i2v-standard

text-to-video

text-to-image

NovaStack AI / Qwen image / Text To Image

Qwen-Image——20B MMDiT 文生图模型。

View model

Featured Model

NovaStack AI / Qwen image / Text To Image

text-to-image

Bytedance / Seedream-v3.1

Seedream V3.1 强化画面美感、风格准确性与细节丰富度，同时保持文本响应能力。

View model

Featured Model

Bytedance / Seedream-v3.1

text-to-image

image-to-video

NovaStack AI / Wan-2.2 / i2v-720p

使用 Wan 2.2 A14B 图生视频模型生成不限量视频。

View model

Featured Model

NovaStack AI / Wan-2.2 / i2v-720p

image-to-video

查看全部模型

精选模型

alibaba

wan-2.6/image-to-video-flash

Alibaba WAN 2.6 Flash 将图像转为视频（720p/1080p），可选音频，速度与成本优化。即用型 REST 推理 API，最佳性能，无冷启动，价格友好。

wavespeed-ai

flux-2-klein-4b/edit-lora

FLUX.2 [klein] 4B Edit（LoRA）支持自然语言精确图像编辑、多参考与 LoRA 定制。即用型 REST 推理 API，最佳性能，无冷启动，价格友好。

wavespeed-ai

flux-2-klein-4b/text-to-image-lora

FLUX.2 [klein] 4B（LoRA）为紧凑型 40 亿参数文生图模型，生成快且质量稳定，并支持 LoRA 定制。即用型 REST 推理 API，最佳性能，无冷启动，价格友好。

wavespeed-ai

flux-2-klein-9b/text-to-image-lora

FLUX.2 [klein] 9B（LoRA）为高质量文生图模型，9B 参数带来更强真实感与更清晰的文字生成，并支持 LoRA 快速定制。即用型 REST 推理 API，最佳性能，无冷启动，价格友好。

wavespeed-ai

flux-2-klein-9b/edit-lora

FLUX.2 [klein] 9B Edit（LoRA）提供高质量图像编辑能力，支持自然语言精准修改与个性化 LoRA 风格。即用型 REST 推理 API，最佳性能，无冷启动，价格友好。

wavespeed-ai

flux-2-klein-4b/edit

FLUX.2 [klein] 4B Edit 支持自然语言精确图像编辑与多参考输入。即用型 REST 推理 API，最佳性能，无冷启动，价格友好。

wavespeed-ai

flux-2-klein-9b/edit

FLUX.2 [klein] 9B Edit 为高质量图像编辑模型，支持自然语言精准修改。即用型 REST 推理 API，最佳性能，无冷启动，价格友好。

wavespeed-ai

flux-2-klein-9b/text-to-image

FLUX.2 [klein] 9B 是高质量文生图模型，增强真实感与更清晰的文字生成。即用型 REST 推理 API，最佳性能，无冷启动，价格友好。

wavespeed-ai

flux-2-klein-4b/text-to-image

FLUX.2 [klein] 4B 为紧凑型 40 亿参数文生图模型，生成速度快且质量稳定。即用型 REST 推理 API，最佳性能，无冷启动，价格友好。

wavespeed-ai

ltx-2-19b/image-to-video-lora

LTX-2 19b Image-to-Video LoRA 是首个基于 DiT 的音视频基础模型，支持音画同步生成。该 LoRA 版本支持自定义风格适配器，便于个性化生成。即用型 REST 推理 API，最佳性能，无冷启动，价格友好。

wavespeed-ai

ltx-2-19b/text-to-video-lora

LTX-2 19b Text-to-Video LoRA 是首个基于 DiT 的音视频基础模型，支持音画同步生成。该 LoRA 版本支持自定义风格适配器，便于个性化生成。即用型 REST 推理 API，最佳性能，无冷启动，价格友好。

wavespeed-ai

ltx-2-19b/text-to-video

LTX-2 19b 是首个基于 DiT 的音视频基础模型，支持音画同步、高保真、多性能模式与生产级输出。即用型 REST 推理 API，最佳性能，无冷启动，价格友好。

wavespeed-ai

ltx-2-19b/image-to-video

LTX-2 19b 是首个基于 DiT 的音视频基础模型，支持音画同步、高保真、多性能模式与生产级输出。即用型 REST 推理 API，最佳性能，无冷启动，价格友好。

wavespeed-ai

qwen-image/edit-2511-lora

Qwen Image Edit 2511 LoRA 为增强版本，支持自定义 LoRA 风格，具备更强的编辑一致性、多人物身份/姿态一致性、工业/产品设计能力与结构推理能力。生产级可用，提供即用型 REST API，无冷启动，价格友好。

z-ai

glm-image/text-to-image

Z-AI GLM Image 可从文本提示生成高质量图像，增强对用户描述的理解，使结果更准确、更个性化。即用型 REST 推理 API，最佳性能，无冷启动，价格友好。

wavespeed-ai

qwen-image/text-to-image-2512-lora

Qwen-Image-2512 LoRA 为增强版 20B MMDiT 文生图模型，支持 LoRA 快速定制与更精细的图像生成。即用型 REST 推理 API，最佳性能，无冷启动，价格友好。

模型分组

Seedance 1.5 Pro Models

ByteDance Seedance 的最新专业级 AI 视频生成与创意工具。

Wan 2.6 Models

Wan 2.6 在一次生成中统一文本、图像与参考视频流程，并原生支持同步音频，带来更清晰细节、更顺滑的电影级运动与更一致的镜头语言。

Kling O1 Models

Kling Omni1 一步完成音视频统一生成，细节更丰富、运动更流畅、叙事更沉浸。

OpenAI Models

OpenAI 的先进 AI 模型，覆盖文本、图像与多模态应用，Sora2 即将推出

Wan 2.5 Models

Wan 2.5 一步完成音视频同步生成，带来更丰富细节、更顺滑运动与更沉浸的叙事体验。

Seedream AI Models

Seedream 将图像生成与图像编辑能力整合为统一架构。

Wan 2.2 Models

WAN 2.2 由 NovaStack AI 优化，提供更快速度与更高质量的内容生成。

Dreamina AI Models

ByteDance Dreamina 的先进图像与视频生成技术。

Seedance Video Models

ByteDance Seedance 提供专业级 AI 视频生成与创意工具。

Flux Image Tools

Black Forest 的 Flux 由 NovaStack AI 优化，提供高速且风格可控的图像生成能力。

Minmax Hailuo Models

Minimax Hailuo 2.3 提供专业视频生成，兼具语音合成模型。

Kling Models

快手 Kling 带来先进的 AI 视频生成能力与更高真实感。

Google Models

Google 的前沿 AI 模型提供高性能图像与视频能力。

Flux Kontext Models

Black Forest Labs 的 FLUX.1 Kontext 提供上下文感知的高精度图像编辑能力。

Runwayml AI Models

AI 驱动的画面魔法——从图像生成视频，适合故事与社交内容。

Wan 2.1 Video Models

Alibaba 的 WAN 2.1 由 NovaStack AI 优化，提供实时性能与先进内容生成能力。

Hunyuan Video Models

腾讯混元提供具备 3D 感知与时序一致性的视频生成能力。

Vidu Models

生数 Vidu 提供多种专用模型与精准创作控制的完整视频生成解决方案。

你想要的工具都在这里

探索我们强大的 AI 图像与视频工具套件，轻松放大、精修与编辑视觉内容，并生成专用的 AI 图像与视频，全面提升创作效率。

目标检测与分割

使用 NovaStack AI 模型检测、识别并分割图像与视频中的物体

wavespeed-ai/sam3-image-rlewavespeed-ai/sam3-imagewavespeed-ai/sam3-video-rle还有 5 个

内容检测模型

检测物体、人脸、姿态、文字、深度等内容的强大模型合集

wavespeed-ai/molmo2/video-content-moderatorwavespeed-ai/molmo2/image-content-moderatorwavespeed-ai/molmo2/text-content-moderator还有 8 个

运动控制模型

控制 AI 生成内容中的姿态、镜头与物体轨迹

wavespeed-ai/ltx-2-19b/controlkwaivgi/kling-v2.6-std/motion-controlwavespeed-ai/scail还有 4 个

Best Open Source Video Models

用 NovaStack AI 更快完成视频与图像的头脑风暴、生成、编辑与迭代。

wavespeed-ai/ltx-2-19b/image-to-video-lorawavespeed-ai/ltx-2-19b/controlwavespeed-ai/ltx-2-19b/video-upscaler还有 30 个

Best Open Source Image Models

用 NovaStack AI 为营销、电商与产品视觉打造安全可用的生产级素材。

wavespeed-ai/qwen-image/edit-2511-lorawavespeed-ai/qwen-image/edit-multiple-anglesz-ai/glm-image/text-to-image还有 22 个

Swap Anything

一键替换人脸、头部、服装与物体，覆盖图像与视频。

google/nano-banana-pro/editelevenlabs/voice-changerwavespeed-ai/infinite-you还有 13 个

Audio for Video

为视频添加音乐、配音与音效。

elevenlabs/dubbingkwaivgi/kling-video-to-audiowavespeed-ai/hunyuan-video-foley还有 3 个

Video Edit

使用 AI 工具编辑、增强与延展视频内容。

bytedance/seedance-v1.5-pro/video-extend-fastwavespeed-ai/scailalibaba/wan-2.5/video-extend还有 14 个

Ultra Selection

为重度生产负载优化的高速低成本热门模型合集。

kwaivgi/kling-video-o1/video-edit-fastalibaba/wan-2.5/video-extend-fastalibaba/wan-2.5/text-to-video-fast还有 30 个

AI Generation Assist Tools

识别、分析与质检你的 AI 生成结果。

wavespeed-ai/molmo2/video-understandingwavespeed-ai/molmo2/prompt-optimizerwavespeed-ai/molmo2/text-content-moderator还有 17 个

LoRA Generation

部署自定义 LoRA 模型，实现低成本风格与角色控制。

wavespeed-ai/qwen-image/edit-plus-lorawavespeed-ai/z-image/turbo-lorawavespeed-ai/wan-2.1/i2v-720p-lora-ultra-fast还有 38 个

Generate Music

生成录音棚级音乐，并支持 AI 音乐编辑。

minimax/music-02wavespeed-ai/ace-step/audio-outpaintwavespeed-ai/ace-step/audio-inpaint还有 4 个

First and Last Frame Video

用高端工具合集提升并生成视频内容。

wavespeed-ai/wan-flf2vgoogle/veo3.1-fast/image-to-videokwaivgi/kling-v2.5-turbo-pro/image-to-video还有 25 个

Best Video Tool

仅凭首帧与末帧图像生成视频的精选工具合集。

wavespeed-ai/kandinsky5-pro/image-to-videowavespeed-ai/wan-2.1/mochawavespeed-ai/kandinsky5-pro/text-to-video还有 30 个

Remove Anything

精准移除图像与视频中的背景与物体。

wavespeed-ai/video-background-removeralibaba/wan-2.5/image-editwavespeed-ai/image-eraser还有 24 个

Best Image Tool

顶级图像生成模型精选合集。

wavespeed-ai/z-image/turbowavespeed-ai/ultimate-image-upscalerwavespeed-ai/infinite-you还有 13 个

3D Creation

将图像与文本转化为精细 3D 资产。

wavespeed-ai/meshy6/text-to-3dwavespeed-ai/meshy6/image-to-3dhyper3d/rodin-v2/image-to-3d还有 13 个

Avatar Lipsync Models

NovaStack AI 的虚拟人具备高级唇形同步与真实表情。

wavespeed-ai/longcat-avatarwavespeed-ai/infinitetalkwavespeed-ai/wan-2.1/mocha还有 29 个

Training Tools

更快训练自定义 AI 模型，覆盖角色生成与目标识别等应用。

wavespeed-ai/z-image-lora-trainerwavespeed-ai/wan-2.2-image-lora-trainerwavespeed-ai/wan-2.1-14b-lora-trainer还有 6 个

Enhance Videos

将低清视频升级为高分辨率作品。

wavespeed-ai/video-upscaler-prowavespeed-ai/flashvsrwavespeed-ai/video-watermark-remover还有 6 个

Image Editing

使用 AI 轻松移除物体、应用风格、添加文字并生成变体。

alibaba/wan-2.5/image-editwavespeed-ai/qwen-image/edit-plus-loragoogle/nano-banana-pro/edit-ultra还有 34 个

Upscale Image

用先进模型将低分辨率图像提升为清晰高质作品。

wavespeed-ai/ultimate-image-upscalerwavespeed-ai/image-upscalerwavespeed-ai/seedvr2/image还有 11 个

Speech Generation

将文本转化为富有表现力的语音

minimax/speech-02-hdminimax/speech-02-turbominimax/music-02还有 24 个