text-to-imageimage-to-imageimage-to-video

Kling O1 (Omni One)

Kling Omni Image O1 是快手的多模态图像生成模型,支持最多 10 张参考图保持特征一致性,并提供精细编辑(增/删/改)、风格控制与系列内容创作。适合 IP 角色设计、漫画分镜与品牌衍生品。即用型 REST API,最佳性能,无冷启动,价格友好。

View model

Featured Model

Kling O1 (Omni One)

text-to-image · image-to-image · image-to-video

text-to-imageimage-to-image

Google / Nano Banana Pro

Nano Banana Pro 是基于 Gemini 3 / Gemini 3.0 Pro 的新一代专业级图像生成与编辑模型,较上一代更高质量、更强控制与更优秀的文字表现。

View model

Featured Model

Google / Nano Banana Pro

text-to-image · image-to-image

image-to-video

Google / Veo 3.1

Google Veo 3.1 原生支持 1080p 分辨率,提供更高画质与更灵活的创作能力。

View model

Featured Model

Google / Veo 3.1

image-to-video

text-to-video

OpenAI / Sora 2

OpenAI 的 Sora 2 为新一代视频与音频生成模型,在物理真实性、音频同步、可控性与风格覆盖上大幅提升。

View model

Featured Model

OpenAI / Sora 2

text-to-video

text-to-imagetext-to-videoimage-to-video

Wan 2.5

阿里 Wan 团队打造的下一代视频模型:多语言、电影质感、原生音频同步。

View model

Featured Model

Wan 2.5

text-to-image · text-to-video · image-to-video

text-to-image

Seedream v4

Seedream 4.0 将生成与编辑统一为一体,强化知识/推理/参考一致任务,速度更快,最高支持 4K。

View model

Featured Model

Seedream v4

text-to-image

image-to-image

Google / Nano Banana / Edit

Google 最新图像生成与编辑模型。

View model

Featured Model

Google / Nano Banana / Edit

image-to-image

image-to-video

Bytedance / Seedance-v1-pro-i2v-480p

ByteDance Seedance 在多镜头一致性与复杂提示跟随上表现出色,可生成稳定流畅的高质量视频。

View model

Featured Model

Bytedance / Seedance-v1-pro-i2v-480p

image-to-video

text-to-video

Minimax / Hailuo-02 / i2v-standard

Hailuo 02 基于 MiniMax 新框架,支持超清 1080P 与更强物理一致性,适合高要求视频创作。

View model

Featured Model

Minimax / Hailuo-02 / i2v-standard

text-to-video

text-to-image

NovaStack AI / Qwen image / Text To Image

Qwen-Image——20B MMDiT 文生图模型。

View model

Featured Model

NovaStack AI / Qwen image / Text To Image

text-to-image

text-to-image

Bytedance / Seedream-v3.1

Seedream V3.1 强化画面美感、风格准确性与细节丰富度,同时保持文本响应能力。

View model

Featured Model

Bytedance / Seedream-v3.1

text-to-image

image-to-video

NovaStack AI / Wan-2.2 / i2v-720p

使用 Wan 2.2 A14B 图生视频模型生成不限量视频。

View model

Featured Model

NovaStack AI / Wan-2.2 / i2v-720p

image-to-video

精选模型

alibaba

wan-2.6/image-to-video-flash

Alibaba WAN 2.6 Flash 将图像转为视频(720p/1080p),可选音频,速度与成本优化。即用型 REST 推理 API,最佳性能,无冷启动,价格友好。

flux-2-klein-4b/edit-lora

wavespeed-ai

flux-2-klein-4b/edit-lora

FLUX.2 [klein] 4B Edit(LoRA)支持自然语言精确图像编辑、多参考与 LoRA 定制。即用型 REST 推理 API,最佳性能,无冷启动,价格友好。

flux-2-klein-4b/text-to-image-lora

wavespeed-ai

flux-2-klein-4b/text-to-image-lora

FLUX.2 [klein] 4B(LoRA)为紧凑型 40 亿参数文生图模型,生成快且质量稳定,并支持 LoRA 定制。即用型 REST 推理 API,最佳性能,无冷启动,价格友好。

flux-2-klein-9b/text-to-image-lora

wavespeed-ai

flux-2-klein-9b/text-to-image-lora

FLUX.2 [klein] 9B(LoRA)为高质量文生图模型,9B 参数带来更强真实感与更清晰的文字生成,并支持 LoRA 快速定制。即用型 REST 推理 API,最佳性能,无冷启动,价格友好。

flux-2-klein-9b/edit-lora

wavespeed-ai

flux-2-klein-9b/edit-lora

FLUX.2 [klein] 9B Edit(LoRA)提供高质量图像编辑能力,支持自然语言精准修改与个性化 LoRA 风格。即用型 REST 推理 API,最佳性能,无冷启动,价格友好。

flux-2-klein-4b/edit

wavespeed-ai

flux-2-klein-4b/edit

FLUX.2 [klein] 4B Edit 支持自然语言精确图像编辑与多参考输入。即用型 REST 推理 API,最佳性能,无冷启动,价格友好。

flux-2-klein-9b/edit

wavespeed-ai

flux-2-klein-9b/edit

FLUX.2 [klein] 9B Edit 为高质量图像编辑模型,支持自然语言精准修改。即用型 REST 推理 API,最佳性能,无冷启动,价格友好。

flux-2-klein-9b/text-to-image

wavespeed-ai

flux-2-klein-9b/text-to-image

FLUX.2 [klein] 9B 是高质量文生图模型,增强真实感与更清晰的文字生成。即用型 REST 推理 API,最佳性能,无冷启动,价格友好。

flux-2-klein-4b/text-to-image

wavespeed-ai

flux-2-klein-4b/text-to-image

FLUX.2 [klein] 4B 为紧凑型 40 亿参数文生图模型,生成速度快且质量稳定。即用型 REST 推理 API,最佳性能,无冷启动,价格友好。

wavespeed-ai

ltx-2-19b/image-to-video-lora

LTX-2 19b Image-to-Video LoRA 是首个基于 DiT 的音视频基础模型,支持音画同步生成。该 LoRA 版本支持自定义风格适配器,便于个性化生成。即用型 REST 推理 API,最佳性能,无冷启动,价格友好。

wavespeed-ai

ltx-2-19b/text-to-video-lora

LTX-2 19b Text-to-Video LoRA 是首个基于 DiT 的音视频基础模型,支持音画同步生成。该 LoRA 版本支持自定义风格适配器,便于个性化生成。即用型 REST 推理 API,最佳性能,无冷启动,价格友好。

wavespeed-ai

ltx-2-19b/text-to-video

LTX-2 19b 是首个基于 DiT 的音视频基础模型,支持音画同步、高保真、多性能模式与生产级输出。即用型 REST 推理 API,最佳性能,无冷启动,价格友好。

wavespeed-ai

ltx-2-19b/image-to-video

LTX-2 19b 是首个基于 DiT 的音视频基础模型,支持音画同步、高保真、多性能模式与生产级输出。即用型 REST 推理 API,最佳性能,无冷启动,价格友好。

qwen-image/edit-2511-lora

wavespeed-ai

qwen-image/edit-2511-lora

Qwen Image Edit 2511 LoRA 为增强版本,支持自定义 LoRA 风格,具备更强的编辑一致性、多人物身份/姿态一致性、工业/产品设计能力与结构推理能力。生产级可用,提供即用型 REST API,无冷启动,价格友好。

glm-image/text-to-image

z-ai

glm-image/text-to-image

Z-AI GLM Image 可从文本提示生成高质量图像,增强对用户描述的理解,使结果更准确、更个性化。即用型 REST 推理 API,最佳性能,无冷启动,价格友好。

qwen-image/text-to-image-2512-lora

wavespeed-ai

qwen-image/text-to-image-2512-lora

Qwen-Image-2512 LoRA 为增强版 20B MMDiT 文生图模型,支持 LoRA 快速定制与更精细的图像生成。即用型 REST 推理 API,最佳性能,无冷启动,价格友好。

模型分组

Seedance 1.5 Pro Models

Seedance 1.5 Pro Models

ByteDance Seedance 的最新专业级 AI 视频生成与创意工具。

Wan 2.6 Models

Wan 2.6 Models

Wan 2.6 在一次生成中统一文本、图像与参考视频流程,并原生支持同步音频,带来更清晰细节、更顺滑的电影级运动与更一致的镜头语言。

Kling O1 Models

Kling O1 Models

Kling Omni1 一步完成音视频统一生成,细节更丰富、运动更流畅、叙事更沉浸。

OpenAI Models

OpenAI Models

OpenAI 的先进 AI 模型,覆盖文本、图像与多模态应用,Sora2 即将推出

Wan 2.5 Models

Wan 2.5 Models

Wan 2.5 一步完成音视频同步生成,带来更丰富细节、更顺滑运动与更沉浸的叙事体验。

Seedream AI Models

Seedream AI Models

Seedream 将图像生成与图像编辑能力整合为统一架构。

Wan 2.2 Models

Wan 2.2 Models

WAN 2.2 由 NovaStack AI 优化,提供更快速度与更高质量的内容生成。

Dreamina AI Models

Dreamina AI Models

ByteDance Dreamina 的先进图像与视频生成技术。

Seedance Video Models

Seedance Video Models

ByteDance Seedance 提供专业级 AI 视频生成与创意工具。

Flux Image Tools

Flux Image Tools

Black Forest 的 Flux 由 NovaStack AI 优化,提供高速且风格可控的图像生成能力。

Minmax Hailuo Models

Minmax Hailuo Models

Minimax Hailuo 2.3 提供专业视频生成,兼具语音合成模型。

Kling Models

Kling Models

快手 Kling 带来先进的 AI 视频生成能力与更高真实感。

Google Models

Google Models

Google 的前沿 AI 模型提供高性能图像与视频能力。

Flux Kontext Models

Flux Kontext Models

Black Forest Labs 的 FLUX.1 Kontext 提供上下文感知的高精度图像编辑能力。

Runwayml AI Models

Runwayml AI Models

AI 驱动的画面魔法——从图像生成视频,适合故事与社交内容。

Wan 2.1 Video Models

Wan 2.1 Video Models

Alibaba 的 WAN 2.1 由 NovaStack AI 优化,提供实时性能与先进内容生成能力。

Hunyuan Video Models

Hunyuan Video Models

腾讯混元提供具备 3D 感知与时序一致性的视频生成能力。

Vidu Models

Vidu Models

生数 Vidu 提供多种专用模型与精准创作控制的完整视频生成解决方案。

你想要的工具都在这里

探索我们强大的 AI 图像与视频工具套件,轻松放大、精修与编辑视觉内容,并生成专用的 AI 图像与视频,全面提升创作效率。

目标检测与分割
目标检测与分割

使用 NovaStack AI 模型检测、识别并分割图像与视频中的物体

wavespeed-ai/sam3-image-rlewavespeed-ai/sam3-imagewavespeed-ai/sam3-video-rle还有 5 个
内容检测模型
内容检测模型

检测物体、人脸、姿态、文字、深度等内容的强大模型合集

wavespeed-ai/molmo2/video-content-moderatorwavespeed-ai/molmo2/image-content-moderatorwavespeed-ai/molmo2/text-content-moderator还有 8 个
运动控制模型
运动控制模型

控制 AI 生成内容中的姿态、镜头与物体轨迹

wavespeed-ai/ltx-2-19b/controlkwaivgi/kling-v2.6-std/motion-controlwavespeed-ai/scail还有 4 个
Best Open Source Video Models
Best Open Source Video Models

用 NovaStack AI 更快完成视频与图像的头脑风暴、生成、编辑与迭代。

wavespeed-ai/ltx-2-19b/image-to-video-lorawavespeed-ai/ltx-2-19b/controlwavespeed-ai/ltx-2-19b/video-upscaler还有 30 个
Best Open Source Image Models
Best Open Source Image Models

用 NovaStack AI 为营销、电商与产品视觉打造安全可用的生产级素材。

wavespeed-ai/qwen-image/edit-2511-lorawavespeed-ai/qwen-image/edit-multiple-anglesz-ai/glm-image/text-to-image还有 22 个
Swap Anything
Swap Anything

一键替换人脸、头部、服装与物体,覆盖图像与视频。

google/nano-banana-pro/editelevenlabs/voice-changerwavespeed-ai/infinite-you还有 13 个
Audio for Video
Audio for Video

为视频添加音乐、配音与音效。

elevenlabs/dubbingkwaivgi/kling-video-to-audiowavespeed-ai/hunyuan-video-foley还有 3 个
Video Edit
Video Edit

使用 AI 工具编辑、增强与延展视频内容。

bytedance/seedance-v1.5-pro/video-extend-fastwavespeed-ai/scailalibaba/wan-2.5/video-extend还有 14 个
Ultra Selection
Ultra Selection

为重度生产负载优化的高速低成本热门模型合集。

kwaivgi/kling-video-o1/video-edit-fastalibaba/wan-2.5/video-extend-fastalibaba/wan-2.5/text-to-video-fast还有 30 个
AI Generation Assist Tools
AI Generation Assist Tools

识别、分析与质检你的 AI 生成结果。

wavespeed-ai/molmo2/video-understandingwavespeed-ai/molmo2/prompt-optimizerwavespeed-ai/molmo2/text-content-moderator还有 17 个
LoRA Generation
LoRA Generation

部署自定义 LoRA 模型,实现低成本风格与角色控制。

wavespeed-ai/qwen-image/edit-plus-lorawavespeed-ai/z-image/turbo-lorawavespeed-ai/wan-2.1/i2v-720p-lora-ultra-fast还有 38 个
Generate Music
Generate Music

生成录音棚级音乐,并支持 AI 音乐编辑。

minimax/music-02wavespeed-ai/ace-step/audio-outpaintwavespeed-ai/ace-step/audio-inpaint还有 4 个
First and Last Frame Video
First and Last Frame Video

用高端工具合集提升并生成视频内容。

wavespeed-ai/wan-flf2vgoogle/veo3.1-fast/image-to-videokwaivgi/kling-v2.5-turbo-pro/image-to-video还有 25 个
Best Video Tool
Best Video Tool

仅凭首帧与末帧图像生成视频的精选工具合集。

wavespeed-ai/kandinsky5-pro/image-to-videowavespeed-ai/wan-2.1/mochawavespeed-ai/kandinsky5-pro/text-to-video还有 30 个
Remove Anything
Remove Anything

精准移除图像与视频中的背景与物体。

wavespeed-ai/video-background-removeralibaba/wan-2.5/image-editwavespeed-ai/image-eraser还有 24 个
Best Image Tool
Best Image Tool

顶级图像生成模型精选合集。

wavespeed-ai/z-image/turbowavespeed-ai/ultimate-image-upscalerwavespeed-ai/infinite-you还有 13 个
3D Creation
3D Creation

将图像与文本转化为精细 3D 资产。

wavespeed-ai/meshy6/text-to-3dwavespeed-ai/meshy6/image-to-3dhyper3d/rodin-v2/image-to-3d还有 13 个
Avatar Lipsync Models
Avatar Lipsync Models

NovaStack AI 的虚拟人具备高级唇形同步与真实表情。

wavespeed-ai/longcat-avatarwavespeed-ai/infinitetalkwavespeed-ai/wan-2.1/mocha还有 29 个
Training Tools
Training Tools

更快训练自定义 AI 模型,覆盖角色生成与目标识别等应用。

wavespeed-ai/z-image-lora-trainerwavespeed-ai/wan-2.2-image-lora-trainerwavespeed-ai/wan-2.1-14b-lora-trainer还有 6 个
Enhance Videos
Enhance Videos

将低清视频升级为高分辨率作品。

wavespeed-ai/video-upscaler-prowavespeed-ai/flashvsrwavespeed-ai/video-watermark-remover还有 6 个
Image Editing
Image Editing

使用 AI 轻松移除物体、应用风格、添加文字并生成变体。

alibaba/wan-2.5/image-editwavespeed-ai/qwen-image/edit-plus-loragoogle/nano-banana-pro/edit-ultra还有 34 个
Upscale Image
Upscale Image

用先进模型将低分辨率图像提升为清晰高质作品。

wavespeed-ai/ultimate-image-upscalerwavespeed-ai/image-upscalerwavespeed-ai/seedvr2/image还有 11 个
Speech Generation
Speech Generation

将文本转化为富有表现力的语音

minimax/speech-02-hdminimax/speech-02-turbominimax/music-02还有 24 个