投稿
AI汇总
blog
排行榜
未登录
登录后即可体验更多功能
登录
注册
找回密码
投稿
AI汇总
blog
排行榜
未登录
登录后即可体验更多功能
登录
注册
找回密码
luka
fed
文章
4
网址
3965
书籍
6
软件
6
评论
2
已发布
3965
StarCoder 2
一个强大的代码生成和理解工具,它通过大规模训练和多样化的模型规模,为开发者提供了一个高性能的编程辅助平台。
0
109
0
AI开源项目
# ai
# AI编程
# 代码理解
EMO
EMO通过其先进的音频驱动视频生成技术,为用户带来了一种创新的方式来创造个性化和富有表现力的视频内容。它不仅能够生成逼真的面部表情,还能根据音频内容自然地驱动头部动作,为...
0
94
0
AI开源项目
# ai
# AI视频生成
# 动态帧过渡
ChatMusician
通过结合先进的大型语言模型和音乐表示法,为音乐的理解和生成提供了一个强大的工具。它不仅能够创作音乐,还能理解和回答音乐理论问题,为音乐教育和创作提供了新的可能性。
0
132
0
AI开源项目
# ai
# 和弦生成
# 多模态交互
VisionStory
VisionStory 是一款创新的 AI 应用,能够将用户上传的人物图片转换成高清的数字人。只需简单几步操作,即可获得一个能够根据输入的文案或音频进行口播的数字人视频
0
142
0
AIGC视频平台
AI数字人
# ai
# AI 视频
PaperFakeAI写论文
一键AI生成3万字论文,查重率、aigc率双重担保
0
140
0
AIGC写作平台
AI论文写作
# ai
# AI论文
# 论文ai-PaperFake AI写作
OpenCodeInterpreter
通过结合大型语言模型和代码执行反馈,提供了一个强大的工具,可以帮助开发者在软件开发过程中提高效率和质量。
0
135
0
AI开源项目
# ai
# 交互式代码开发
# 人工智能编程辅助
GPT-SoVITS
一个强大的语音合成工具,特别适合需要快速生成特定人声的场景。它通过先进的技术实现了高质量的语音克隆和文本到语音转换,支持多种语言,并提供了易于使用的WebUI工具。
0
187
0
AI开源项目
# ai
# 个性化助手
# 人工智能
ScreenAgent
一个先进的计算机控制智能体,它通过观察屏幕截图和执行鼠标键盘动作来完成复杂的任务。它利用VLM和强化学习环境,可以在真实计算机屏幕上执行多步骤任务。
0
111
0
AI开源项目
# ai
# ScreenAgent
# VLM
ConsiStory
它提供了一种快速、高效且训练无关的方法来生成一致性图像,特别适用于需要保持主题一致性的应用场景。它不仅能够处理单主题场景,还能够应对多主题挑战,并与现有的图像编辑工具...
0
121
0
AI开源项目
# ai
VideoPoet
强大的AI视频生成工具,它通过大型语言模型架构和多模态输入处理能力,实现了从文本到视频的转换、图像动画生成、视频风格化、视频编辑和音频生成等多种功能。
0
77
0
AI开源项目
# ai
# AI视频合成
# Transformer架构
DiT
创新的图像生成模型,它通过结合扩散模型和Transformer架构,实现了在图像生成任务中的高效和高质量输出。其可扩展性和条件生成能力使其在多个领域都有广泛的应用潜力。
0
122
0
AI开源项目
# ai
# Transformer架构
# 上下文条件
Boximator
强大的视频合成工具,它通过创新的框约束机制和自跟踪技术,实现了对视频中对象运动的精细控制。这使得它在电影制作、游戏开发、VR/AR内容创作等领域具有广泛的应用潜力。
0
139
0
AI开源项目
# ai
# 交互式视频
# 人工智能
加载更多
网址
网址
文章
软件
书籍