I2VGen-XL:阿里推出的图生视频模型一个强大的图像到视频的生成模型,它通过创新的方法解决了AI视频合成过程中的语义准确性、清晰度和时空连续性的挑战。用户可以轻松地将静态图像转换为高质量的动态视频,生成的视...01420AI开源项目# ai# 图像到视频生成# 开源模型
Reachout.aiReachout.ai是一个人工智能驱动的视频开发平台,专为忙碌的企业家和销售团队打造,他们希望突破收件箱的噪音,大规模生成个性化视频,并获得更高的电子邮件回复率和更多与理想客户...01420AIGC基础设施AI应用接口API# AI助手# AI应用API# AI应用接口API
BitscaleBitscale是一个强大的AI平台,它通过提供易于使用的电子表格界面,帮助增长团队构建可扩展的工作流,从而简化了市场研究、个性化推广和内容生成的过程。01410Agents开发平台# Agents开发平台
MMMLU重要的多语言、多任务语言理解数据集,它为研究人员和开发者提供了一个标准化的测试基准,用于评估和提升AI模型在不同语言和文化背景下的性能。01400AI开源项目# ai# 国际化业务# 多语言数据集
UberduckUberduck是一个开源的语音AI社区,可以帮助用户在几分钟内通过api创建人工智能生成的音频应用程序。它允许用户使用5000 +富有表现力的声音制作AI画外音,并使用他们的AI生成的说唱...01400AIGC基础设施AI应用接口API# ai# AI应用接口API# AI文转音
Boximator强大的视频合成工具,它通过创新的框约束机制和自跟踪技术,实现了对视频中对象运动的精细控制。这使得它在电影制作、游戏开发、VR/AR内容创作等领域具有广泛的应用潜力。01390AI开源项目# ai# 交互式视频# 人工智能
PDF2Audio通过将PDF文档转换成音频内容,为用户提供了一种新的信息消费方式。无论是教育、播客制作还是无障碍访问,PDF2Audio都能满足多样化的需求。01360AI开源项目# ai# PDF转音频# 信息消费
VectorShift一个端到端的AI自动化平台,它提供了一个集成的框架,包括无代码(No-code)、低代码(Low-code)和现成的生成式AI解决方案,用于构建AI搜索引擎、助手、聊天机器人和自动化流程。01360AI低(无)代码编程# ai
OmniGen创新的统一图像生成模型,它通过简化架构和整合多种图像生成任务,为用户提供了一个强大而灵活的工具。它不仅能够处理文本到图像的生成,还能够执行图像编辑、主题驱动生成和视觉...01350AI开源项目# ai# 多任务图像处理框架# 多模态输入支持
LightAILightAI是一个综合性的AI服务平台,通过提供AI销售和客服功能,帮助企业提升客户接待效率和销售业绩。01350Agents开发平台# Agents开发平台# ai# AI Agent
OpenCodeInterpreter通过结合大型语言模型和代码执行反馈,提供了一个强大的工具,可以帮助开发者在软件开发过程中提高效率和质量。01340AI开源项目# ai# 交互式代码开发# 人工智能编程辅助
ChatMusician通过结合先进的大型语言模型和音乐表示法,为音乐的理解和生成提供了一个强大的工具。它不仅能够创作音乐,还能理解和回答音乐理论问题,为音乐教育和创作提供了新的可能性。01320AI开源项目# ai# 和弦生成# 多模态交互
Lyzr AILyzr AI提供了一个强大的平台,使用户能够快速构建和部署自主的AI Agents。通过AIMS门户,用户可以轻松管理、监控AI Agents的性能,并确保它们的安全性和合规性。01320Agents开发平台# Agents开发平台# ai# Docker
集简云集简云是一个强大的企业自动化工具,它通过提供无代码的可视化操作界面,简化了软件集成的复杂性,使得业务流程自动化变得简单快捷。01320Agents开发平台# Agents开发平台# 业务流程搭建# 支持复杂的业务逻辑
DiffusionGPT一个创新的文本到图像生成系统,它通过结合大语言模型的解析能力和领域专家模型的生成能力,实现了从多样化文本提示到高质量图像的高效转换。01310AI开源项目# ai# 人类反馈优化# 优势数据库
CogVideoX-Fun基于 CogVideoX 结合 EasyAnimate 修改的 AI 视频生成工具,它提供更自由的生成条件,支持从文字、图片到视频的多模态内容生成。01310AI开源项目# ai# AI视频生成# 多模态内容
Gummy创新的语音翻译大模型,它通过端到端的设计和深度学习技术,实现了高质量的实时语音翻译。无论是在国际会议、教育培训、旅游导航还是客户服务和医疗咨询等场景中,Gummy都能提供高...01300AI开源项目# ai
GOT-OCR2.0创新的OCR模型,它通过先进的技术提供了精准、高效的OCR解决方案。无论是文档数字化、场景文本识别还是票据处理等应用场景,GOT-OCR 2.0都能提供强大的支持。01290AI开源项目# ai# 交互式OCR# 光学字符识别
Real-ESRGAN一个强大的图像超分辨率工具,它利用深度学习和生成对抗网络,在没有真实高分辨率图像作为参考的情况下,通过合成退化过程来提升低分辨率图像的质量。01280AI开源项目# ai# GAN技术# U-Net判别器
WordwareWordware是一个强大的AI应用开发工具,它通过自然语言编程简化了AI代理的创建过程,提供了先进的技术能力和用户友好的界面。01280AI低(无)代码编程# ai# AI应用开发# API集成
Follow Your Pose一个创新的文本到视频生成框架,它通过两阶段训练策略实现了高度的姿态控制和时间连贯性。该框架不仅能够根据文本描述生成视频,还能让用户通过姿态序列精确控制视频中角色的动作...01250AI开源项目# ai
CHTMLchtml即code helper tag mark law 代码辅助标记方法,是一款简洁好用的在线的代码命名工具、变量命名工具、变量命名规则库,使用它可以让您轻松摆脱翻译软件的困扰,快速选择合适...01250AI编程工具# ai# AI编程# 代码命名
Lepton AILepton AI是由贾扬清创办的云原生AI平台,提供了一系列工具和服务,降低AI应用开发的门槛,帮助开发者更容易地完成创建、部署和扩展任务。它提供了 Python SDK 和云计算平台。Pyth...01250AI编程工具# ai# GitHub# Hugging Face集成
MotionCtrl强大的视频生成工具,它通过精确控制视频中的相机和物体运动,为视频制作带来了新的可能性。无论是简单的运动场景还是复杂的交互动作,MotionCtrl都能够提供令人满意的解决方案。01240AI开源项目# ai# 人工智能# 动画制作
书生·物华2.0(3DTopia 2.0)采用创新的原语(primitive-based)三维表示方法PrimX,能够高效编码和生成具有物理基础渲染(PBR)特性的高质量三维资产。01230AI开源项目# ai
DiT创新的图像生成模型,它通过结合扩散模型和Transformer架构,实现了在图像生成任务中的高效和高质量输出。其可扩展性和条件生成能力使其在多个领域都有广泛的应用潜力。01220AI开源项目# ai# Transformer架构# 上下文条件
PortraitGenAI人像视频编辑工具,它通过先进的技术实现了对视频中人物的高质量编辑。无论是在影视制作、艺术创作、广告宣传、时尚展示、社交媒体还是游戏开发等领域,PortraitGen都能提供高效...01210AI开源项目# 3D# ai# AI视频编辑
vx.devvx.dev 是一个开源的 AI 代码生成器,v0.dev开源替代品,可以帮助开发者快速生成高质量的 UI 代码。该工具与 GitHub 紧密集成,你可以通过在 GitHub 上提交新的 Issue 来生成 UI ...01210AI代码# ai