碌卡森破
  • 投稿
  • AI汇总
  • blog
  • 排行榜
      • 未登录
        登录后即可体验更多功能
    • 投稿
    • AI汇总
    • blog
    • 排行榜
    未登录
    登录后即可体验更多功能

    AI开源项目

    共 55 篇网址
    AI开源项目
    碌卡森破
    常用推荐社区资讯网盘云储摄影图库网络文学音乐仓库ACGMAC&IOS 软件网站SEO分析便携医疗好玩推荐AI综合学术综合程序开发相关电商相关教育学习相关设计相关办公相关其他推荐写作相关
    AI-recommendAI中文研究机构AI国际工具导航AI海外研究机构AI法律服务AI 大模型AI游戏应用AI音乐创作AI官方活动AI好玩有趣AI中文工具导航AI公益应用AI浏览器插件GIFT IDEASAI跨境电商AI基础设施AI多功能工具AI游戏AI大赛AI域名免费ChatGPTprompt深度学习课程AI 语音音频AI 图像图形AI 视频相关AI 翻译相关AIGCAI 绘画相关AI 开发相关AI 设计相关AI 搜索相关AI 聊天AI写作相关AI办公相关AI运营相关AI 行业相关AI 助手相关AI 健康相关AI 教育相关
    AI开放平台AI开发者社区AI应用接口APIAI编程工具AI低(无)代码编程AI开发课堂AI-SQL数据库Agents开发平台AI开发框架SQLAI dev toolsAI代码AI开发AI开源项目数据集
    排序
    发布更新浏览点赞
    OmniGen

    OmniGen

    创新的统一图像生成模型,它通过简化架构和整合多种图像生成任务,为用户提供了一个强大而灵活的工具。它不仅能够处理文本到图像的生成,还能够执行图像编辑、主题驱动生成和视觉...
    01350
    AI开源项目# ai# 多任务图像处理框架# 多模态输入支持
    UniEdit

    UniEdit

    UniEdit 是一个强大的视频编辑工具,它通过利用预训练的文本到视频生成器,在无需调优的情况下,提供了一种简单而有效的方法来编辑视频的运动和外观。
    01510
    AI开源项目# ai# 文本驱动编辑# 无需调优
    TextDiffuser-2

    TextDiffuser-2

    一个功能强大的图像生成工具,它通过扩散模型技术,根据文本描述生成高质量的图像。这个工具为用户提供了一种创新的方式来探索和实现他们的创意视觉概念。
    01110
    AI开源项目# ai# AI图像生成# 内容创造
    Snap Video

    Snap Video

    强大的文本到视频合成工具,它通过创新的技术架构和高效的深度学习模型,实现了高质量视频内容的生成。这款工具不仅在视频生成领域具有突破性,还为用户提供了一种全新的创作和表...
    01190
    AI开源项目# ai# AI视频合成# Transformer架构
    StarCoder 2

    StarCoder 2

    一个强大的代码生成和理解工具,它通过大规模训练和多样化的模型规模,为开发者提供了一个高性能的编程辅助平台。
    01090
    AI开源项目# ai# AI编程# 代码理解
    EMO

    EMO

    EMO通过其先进的音频驱动视频生成技术,为用户带来了一种创新的方式来创造个性化和富有表现力的视频内容。它不仅能够生成逼真的面部表情,还能根据音频内容自然地驱动头部动作,为...
    0930
    AI开源项目# ai# AI视频生成# 动态帧过渡
    ChatMusician

    ChatMusician

    通过结合先进的大型语言模型和音乐表示法,为音乐的理解和生成提供了一个强大的工具。它不仅能够创作音乐,还能理解和回答音乐理论问题,为音乐教育和创作提供了新的可能性。
    01320
    AI开源项目# ai# 和弦生成# 多模态交互
    OpenCodeInterpreter

    OpenCodeInterpreter

    通过结合大型语言模型和代码执行反馈,提供了一个强大的工具,可以帮助开发者在软件开发过程中提高效率和质量。
    01340
    AI开源项目# ai# 交互式代码开发# 人工智能编程辅助
    GPT-SoVITS

    GPT-SoVITS

    一个强大的语音合成工具,特别适合需要快速生成特定人声的场景。它通过先进的技术实现了高质量的语音克隆和文本到语音转换,支持多种语言,并提供了易于使用的WebUI工具。
    01860
    AI开源项目# ai# 个性化助手# 人工智能
    ScreenAgent

    ScreenAgent

    一个先进的计算机控制智能体,它通过观察屏幕截图和执行鼠标键盘动作来完成复杂的任务。它利用VLM和强化学习环境,可以在真实计算机屏幕上执行多步骤任务。
    01110
    AI开源项目# ai# ScreenAgent# VLM
    ConsiStory

    ConsiStory

    它提供了一种快速、高效且训练无关的方法来生成一致性图像,特别适用于需要保持主题一致性的应用场景。它不仅能够处理单主题场景,还能够应对多主题挑战,并与现有的图像编辑工具...
    01200
    AI开源项目# ai
    VideoPoet

    VideoPoet

    强大的AI视频生成工具,它通过大型语言模型架构和多模态输入处理能力,实现了从文本到视频的转换、图像动画生成、视频风格化、视频编辑和音频生成等多种功能。
    0760
    AI开源项目# ai# AI视频合成# Transformer架构
    DiT

    DiT

    创新的图像生成模型,它通过结合扩散模型和Transformer架构,实现了在图像生成任务中的高效和高质量输出。其可扩展性和条件生成能力使其在多个领域都有广泛的应用潜力。
    01220
    AI开源项目# ai# Transformer架构# 上下文条件
    Boximator

    Boximator

    强大的视频合成工具,它通过创新的框约束机制和自跟踪技术,实现了对视频中对象运动的精细控制。这使得它在电影制作、游戏开发、VR/AR内容创作等领域具有广泛的应用潜力。
    01390
    AI开源项目# ai# 交互式视频# 人工智能
    SFR-RAG

    SFR-RAG

    先进的大型语言模型,它通过强化对上下文的理解,提高了机器在生成文本方面的准确性和可靠性。无论是在客户服务、知识问答、内容创作还是专业咨询领域,SFR-RAG都能提供高质量的文...
    01090
    AI开源项目# ai# 上下文理解# 函数调用
    onewebot2

    onewebot2

    易于使用的微信AI机器人软件包,它通过简化的配置流程和一键运行功能,使得用户能够快速启动和运行微信机器人。无论是个人还是企业,都能通过oneWebot2创建智能助手,实现自动化服务
    01480
    AI开源项目# ai# API集成# 一键运行
    GOT-OCR2.0

    GOT-OCR2.0

    创新的OCR模型,它通过先进的技术提供了精准、高效的OCR解决方案。无论是文档数字化、场景文本识别还是票据处理等应用场景,GOT-OCR 2.0都能提供强大的支持。
    01290
    AI开源项目# ai# 交互式OCR# 光学字符识别
    PortraitGen

    PortraitGen

    AI人像视频编辑工具,它通过先进的技术实现了对视频中人物的高质量编辑。无论是在影视制作、艺术创作、广告宣传、时尚展示、社交媒体还是游戏开发等领域,PortraitGen都能提供高效...
    01210
    AI开源项目# 3D# ai# AI视频编辑
    MMMLU

    MMMLU

    重要的多语言、多任务语言理解数据集,它为研究人员和开发者提供了一个标准化的测试基准,用于评估和提升AI模型在不同语言和文化背景下的性能。
    01400
    AI开源项目# ai# 国际化业务# 多语言数据集
    Llama 3.2

    Llama 3.2

    在图像理解和文本处理任务上展现出卓越的性能,并通过定制化微调和本地部署,推动了AI技术的开放性和可访问性。
    01530
    AI开源项目# ai# AI大模型# 图像理解
    AnimateDiff

    AnimateDiff

    通过预训练的运动建模模块,使得用户能够轻松地创作出丰富多样的动画内容,同时保持了原有模型的风格和特性。它的跨领域应用性和易于集成的特点,极大地扩展了个性化动画的创作空间。
    01140
    AI开源项目# ai# Transformer模型# 个性化内容生成
    MotionCtrl

    MotionCtrl

    强大的视频生成工具,它通过精确控制视频中的相机和物体运动,为视频制作带来了新的可能性。无论是简单的运动场景还是复杂的交互动作,MotionCtrl都能够提供令人满意的解决方案。
    01240
    AI开源项目# ai# 人工智能# 动画制作
    Make-A-Character

    Make-A-Character

    创新的3D角色生成框架,它通过文本描述快速创建逼真的3D角色,具有高度的定制性和逼真度。它结合了最新的人工智能技术,提供了一个直观、灵活且高效的角色创建解决方案,适用于多...
    01690
    AI开源项目# 3D建模# ai# CG技术
    MIMO

    MIMO

    创新的AI框架,它通过空间分解建模技术,提供了一种先进的可控角色视频合成方法。
    0920
    AI开源项目# 3D# ai# AI框架
    美图奇想大模型

    美图奇想大模型

    提升了视频和图像的生成质量,广泛应用于影像美化、视频剪辑、电商设计、口播视频制作、广告营销和游戏设计等多个领域
    01570
    AI开源项目# ai# 图像生成# 广告营销
    SafeEar

    SafeEar

    创新的音频伪造检测工具,它通过先进的AI技术保护用户的语音隐私,同时提供高效的伪造音频检测能力。
    01120
    AI开源项目# ai# 多语言支持# 开源工具
    PDF2Audio

    PDF2Audio

    通过将PDF文档转换成音频内容,为用户提供了一种新的信息消费方式。无论是教育、播客制作还是无障碍访问,PDF2Audio都能满足多样化的需求。
    01360
    AI开源项目# ai# PDF转音频# 信息消费
    MetaGPT

    MetaGPT

    一个创新的多智能体编程框架,它通过模拟人类工作流程和采用标准化操作程序来提高代码生成的质量和效率。该框架特别适合解决复杂的软件开发任务,并为自动化编程和多智能体协作提...
    01110
    AI开源项目# ai# 代码生成# 元编程框架
    DiffusionGPT

    DiffusionGPT

    一个创新的文本到图像生成系统,它通过结合大语言模型的解析能力和领域专家模型的生成能力,实现了从多样化文本提示到高质量图像的高效转换。
    01310
    AI开源项目# ai# 人类反馈优化# 优势数据库
    OLMo

    OLMo

    一个开放的语言模型框架,它为研究人员和开发者提供了一套完整的工具和资源,以促进AI和语言模型的共同进步。
    01280
    AI开源项目# ai# AI研究工具# 开放语言模型
    IP-Adapter

    IP-Adapter

    一个强大的工具,它通过引入图像提示来增强文本到图像扩散模型的能力。它的设计轻量且高效,易于部署和使用,同时支持广泛的应用场景,包括图像生成、转换和修复。通过解耦的交叉...
    01140
    AI开源项目# ai# 图像生成# 图像编码
    Follow Your Pose

    Follow Your Pose

    一个创新的文本到视频生成框架,它通过两阶段训练策略实现了高度的姿态控制和时间连贯性。该框架不仅能够根据文本描述生成视频,还能让用户通过姿态序列精确控制视频中角色的动作...
    01250
    AI开源项目# ai
    abab-music-1

    abab-music-1

    一个强大的AI音乐生成工具,它通过先进的技术,使得音乐创作更加便捷和高效。无论是专业的音乐制作人还是业余爱好者,都能够利用这个模型来创作出高质量的音乐作品。
    01420
    AI开源项目# ai# AI音乐生成# 业余音乐制作
    FineVideo

    FineVideo

    是一个多模态视频数据集,它为AI模型提供了丰富的上下文信息,使其能够更深入地理解视频内容。这个数据集在视频内容分析、情绪分析、故事叙述理解、媒体编辑和多模态学习等领域具...
    01050
    AI开源项目# ai# 元数据标注# 场景分割
    Void

    Void

    它通过集成AI功能,为用户提供了一个高效、智能的编程和文本编辑环境。无论是代码开发还是文本编辑,Void都能提供强大的支持和便捷的操作。
    0450
    AI开源项目# ai# AI集成# VS Code分支
    Vary-toy

    Vary-toy

    一个小型但功能强大的视觉语言模型,它使得资源有限的研究者和开发者也能体验到先进的视觉语言模型功能。
    0480
    AI开源项目# ai# 图像描述# 多模态交互
    Draw an Audio

    Draw an Audio

    创新的视频生成音频系统,它通过先进的AI技术,能够自动分析视频内容并生成与之匹配的声音效果。
    01330
    AI开源项目# ai# 人工智能# 声音设计
    ActAnywhere

    ActAnywhere

    一个强大的视频生成工具,它通过自动化的前景与背景融合技术,极大地简化了视频背景生成的过程。它的应用场景广泛,从电影制作到教育,都能提供高效、创新的解决方案。
    01420
    AI开源项目# ai# 交互式视频编辑# 人工智能
    DemoFusion

    DemoFusion

    强大的高分辨率图像生成框架,它通过渐进式上采样、跳跃残差和扩张采样机制,实现了在不进行额外训练和不产生过高内存需求的情况下,将模糊的低分辨率图像变得更加高清。它易于使...
    01100
    AI开源项目# ai# AI生成# 图像放大
    Ovis1.6

    Ovis1.6

    强大的多模态大模型,它通过创新的架构设计和全面的数据优化,在多模态任务上展现了卓越的性能。
    0960
    AI开源项目# ai
    Gummy

    Gummy

    创新的语音翻译大模型,它通过端到端的设计和深度学习技术,实现了高质量的实时语音翻译。无论是在国际会议、教育培训、旅游导航还是客户服务和医疗咨询等场景中,Gummy都能提供高...
    01300
    AI开源项目# ai
    Real-ESRGAN

    Real-ESRGAN

    一个强大的图像超分辨率工具,它利用深度学习和生成对抗网络,在没有真实高分辨率图像作为参考的情况下,通过合成退化过程来提升低分辨率图像的质量。
    01280
    AI开源项目# ai# GAN技术# U-Net判别器
    DDColor

    DDColor

    用户可以轻松上传黑白图片,快速获得彩色结果,无论是对于修复老照片还是为动漫风景上色,DDColor都能提供令人满意的效果。
    0360
    AI开源项目# ai# 图像修复# 开源框架
    Screenshot to Code

    Screenshot to Code

    无论是在线使用还是本地部署,它都为用户提供了灵活、高效的代码生成解决方案。此外,通过提供编辑功能和代码导出,它满足了用户对代码调整和个性化的需求。
    01450
    AI开源项目# ai# API集成# 人工智能
    cogvlm2-llama3-caption

    cogvlm2-llama3-caption

    强大的视频描述生成工具,通过先进的多模态处理和上下文感知能力,为用户提供了一种快速理解视频内容的方法。它的实时处理能力和定制化描述功能,使其在多种应用场景中都非常有用。
    01460
    AI开源项目# ai
    AnyText

    AnyText

    一个创新的多语言视觉文本生成和编辑工具,利用先进的扩散模型技术,能够准确生成和编辑图像中的文本。它不仅支持多种语言和文本风格,还能在复杂的图像背景中保持文本的清晰度和...
    01130
    AI开源项目# ai# 图像融合# 多语言文本生成
    MagicVideo-V2

    MagicVideo-V2

    一个创新的AI视频生成框架,它通过集成多个模块来生成高质量的视频内容。它不仅提高了视频生成的效率和质量,还确保了视频画面的流畅和逼真,为用户提供了极佳的观看体验。
    0390
    AI开源项目# ai# AI视频生成# 多阶段生成
    I2VGen-XL:阿里推出的图生视频模型

    I2VGen-XL:阿里推出的图生视频模型

    一个强大的图像到视频的生成模型,它通过创新的方法解决了AI视频合成过程中的语义准确性、清晰度和时空连续性的挑战。用户可以轻松地将静态图像转换为高质量的动态视频,生成的视...
    01420
    AI开源项目# ai# 图像到视频生成# 开源模型
    书生·物华2.0(3DTopia 2.0)

    书生·物华2.0(3DTopia 2.0)

    采用创新的原语(primitive-based)三维表示方法PrimX,能够高效编码和生成具有物理基础渲染(PBR)特性的高质量三维资产。
    01230
    AI开源项目# ai
    FaceChain

    FaceChain

    它通过结合Stable Diffusion模型和LoRA风格化模型,为用户提供了一个简单易用的平台来生成个性化的数字形象和写真。无论是用于个人娱乐还是专业需求,FaceChain都能满足用户的多样...
    0980
    AI开源项目# ai# AI图像生成# 个性化定制
    加载更多
    碌卡森破
    碌卡森破集网址、资源、资讯于一体的导航站,欢迎您的体验!
    • 用户协议
    • 隐私政策
    • 关于我们
    Copyright © 2026 碌卡森破 京ICP备2024095535号-1  京公网安备11011402054423号 由 OneNav 强力驱动 
    反馈
    让我们一起共建文明社区!您的反馈至关重要!
    网址
    网址文章软件书籍