投递
blog
AIGC
热门资讯
网站排行榜
未登录
登录后即可体验更多功能
登录
注册
找回密码
投递
blog
AIGC
热门资讯
网站排行榜
未登录
登录后即可体验更多功能
登录
注册
找回密码
luka
fed
文章
3
网址
4255
书籍
6
软件
6
评论
2
已发布
4255
OpenCodeInterpreter
通过结合大型语言模型和代码执行反馈,提供了一个强大的工具,可以帮助开发者在软件开发过程中提高效率和质量。
0
100
0
AI开源项目
# ai
# 交互式代码开发
# 人工智能编程辅助
GPT-SoVITS
一个强大的语音合成工具,特别适合需要快速生成特定人声的场景。它通过先进的技术实现了高质量的语音克隆和文本到语音转换,支持多种语言,并提供了易于使用的WebUI工具。
0
137
0
AI开源项目
# ai
# 个性化助手
# 人工智能
ScreenAgent
一个先进的计算机控制智能体,它通过观察屏幕截图和执行鼠标键盘动作来完成复杂的任务。它利用VLM和强化学习环境,可以在真实计算机屏幕上执行多步骤任务。
0
97
0
AI开源项目
# ai
# ScreenAgent
# VLM
ConsiStory
它提供了一种快速、高效且训练无关的方法来生成一致性图像,特别适用于需要保持主题一致性的应用场景。它不仅能够处理单主题场景,还能够应对多主题挑战,并与现有的图像编辑工具...
0
94
0
AI开源项目
# ai
VideoPoet
强大的AI视频生成工具,它通过大型语言模型架构和多模态输入处理能力,实现了从文本到视频的转换、图像动画生成、视频风格化、视频编辑和音频生成等多种功能。
0
63
0
AI开源项目
# ai
# AI视频合成
# Transformer架构
DiT
创新的图像生成模型,它通过结合扩散模型和Transformer架构,实现了在图像生成任务中的高效和高质量输出。其可扩展性和条件生成能力使其在多个领域都有广泛的应用潜力。
0
99
0
AI开源项目
# ai
# Transformer架构
# 上下文条件
Boximator
强大的视频合成工具,它通过创新的框约束机制和自跟踪技术,实现了对视频中对象运动的精细控制。这使得它在电影制作、游戏开发、VR/AR内容创作等领域具有广泛的应用潜力。
0
116
0
AI开源项目
# ai
# 交互式视频
# 人工智能
SFR-RAG
先进的大型语言模型,它通过强化对上下文的理解,提高了机器在生成文本方面的准确性和可靠性。无论是在客户服务、知识问答、内容创作还是专业咨询领域,SFR-RAG都能提供高质量的文...
0
84
0
AI开源项目
# ai
# 上下文理解
# 函数调用
onewebot2
易于使用的微信AI机器人软件包,它通过简化的配置流程和一键运行功能,使得用户能够快速启动和运行微信机器人。无论是个人还是企业,都能通过oneWebot2创建智能助手,实现自动化服务
0
113
0
AI开源项目
# ai
# API集成
# 一键运行
GOT-OCR2.0
创新的OCR模型,它通过先进的技术提供了精准、高效的OCR解决方案。无论是文档数字化、场景文本识别还是票据处理等应用场景,GOT-OCR 2.0都能提供强大的支持。
0
105
0
AI开源项目
# ai
# 交互式OCR
# 光学字符识别
PortraitGen
AI人像视频编辑工具,它通过先进的技术实现了对视频中人物的高质量编辑。无论是在影视制作、艺术创作、广告宣传、时尚展示、社交媒体还是游戏开发等领域,PortraitGen都能提供高效...
0
97
0
AI开源项目
# 3D
# ai
# AI视频编辑
MMMLU
重要的多语言、多任务语言理解数据集,它为研究人员和开发者提供了一个标准化的测试基准,用于评估和提升AI模型在不同语言和文化背景下的性能。
0
112
0
AI开源项目
# ai
# 国际化业务
# 多语言数据集
加载更多
网址
网址
文章
软件
书籍