遥遥周刊 第45期
封面图 : 满月下的晴空塔
图片来自于 X@haskap1017
效率工具
1. [AI] Seed-Music:统一音乐生成框架
豆包的音乐生成框架,除了支持常规的曲风和歌词生成歌曲,
1)支持克隆人声生成歌曲,输入人声和参考歌曲,克隆人声来唱参考歌曲。 2)支持保持旋律不变,仅修改歌词。
Reference: X@Gorden_Sun
2. [git] 一个命令行工具,列出本地的所有 git 仓库
Reference: X@golangch
3. 一款自动化剪辑长视频精彩部分并生成短视频的工具
AI Youtube Shorts Generator这款开源工具可以自动化剪辑长视频精彩部分并生成短视频,支持自定义剪辑时长、添加背景音乐等功能。
它能够一键下载视频、使用 Whisper 转录、利用 GPT-4 提取精彩片段、说话人检测、竖屏剪辑,自动生成全新的短视频。
Reference: X@GoJun315
4. [AI] OCR 识别工具
号称 OCR 2.0,580M 参数的端到端 OCR 模型,拿到了 BLEU 0.972 分数。
在线体验 👉 https://huggingface.co/ucaslcl/GOT-OCR2_0 开源地址 https://github.com/Ucas-HaoranWei/GOT-OCR2.0/
Reference: X@tuturetom
技术知识
1. 《大模型应用开发动手做 AI Agent》
这本 2024 年上半年出版的书深入浅出地讲解了 AI Agent 和多智能体系统(MAS)。
作者通过实战项目,帮助读者快速上手 GPT-4、OpenAI API 等前沿技术。