开源项目 GitHub 开源项目
Open-XiaoAI:让小爱音箱听懂你的声音|接入小智AI、自定义唤醒词、MiGPT 与 Gemini Live
Open-XiaoAI 旨在突破传统智能音箱“指令—响应”的局限,让设备真正“听懂”人。项目将小爱音箱的“耳朵”和“嘴巴”交由多模态大模型与 AI Agent 处理,带来更灵活的语音理解与互动体验。……
标签:Gemini Live Open-XiaoAI 小智AI 小爱音箱Open-XiaoAI 旨在突破传统智能音箱“指令—响应”的局限,让设备真正“听懂”人。项目将小爱音箱的“耳朵”和“嘴巴”交由多模态大模型与 AI Agent 处理,带来更灵活的语音理解与互动体验。适配机型为 小爱音箱 Pro(LX06) 与 Xiaomi 智能音箱 Pro(OH2P)。
为什么需要它
市面上热销的音箱多停留在基础问答与播放功能,难以理解情感与上下文。Open-XiaoAI 聚焦可进化的交互能力,让音箱在真实场景中更像“助手”,而不只是“播放器”。
Open-XiaoAI关键能力
- 接入小智 AI:获得更自然的语音对话能力。
- 自定义唤醒词:按个人偏好定义唤醒词,提高可玩性。
- 接入 MiGPT(完美版):延展对话理解与任务处理范围。
- 接入 Gemini Live API:利用多模态实时交互能力,释放硬件潜能。
架构与适配
- Client + Server 双端:项目由客户端补丁与服务端协同组成。
- 机型范围:当前仅支持 LX06 / OH2P,其他型号不建议直接使用。🚨
快速上手(流程总览)
相关导航
Local Deep Research:本地深度研究AI助手 支持文献与网页智能搜索
Local Deep Research 是一款功能卓越的AI科研助手,通过集成主流大模型与网页搜索实现深度迭代式分析,为科研和信息整合提供高效解决方案。该系统既支持在本地运行以确保隐私安全,又能配置云端大模型如Claude和GPT以增强性能。平台具备自动生成跟进问题、精准引用跟踪与来源验证的能力,并能全面提取网页内容,输出详实研究报告和快速摘要。支持灵活调用Ollama等本地模型和各类Langchain模型,满足用户个性化需求。系统还集成了智能搜索引擎,可自动匹配Wikipedia、arXiv、PubMed、DuckDuckGo、SerpAPI、Google可编程搜索及The Guardian等多个数据源,同时提供基于向量嵌入的本地文档检索功能,支持PDF、文本和Markdown格式文档,展示出在多领域整合与验证信息的卓越实力,是科研人员和数据分析师理想的工具选择。
暂无评论...