标签
Vision Agents 是一个开源Python框架,用于构建处理实时视频和音频的多模态AI智能体。它利用MediaPipe使对话智能体能够根据面部表情和目光方向调整语音。
Adala 是一个开源框架,用于构建自主数据标注智能体,这些智能体通过与基准数据集和 LLM 运行时交互,迭代式地学习技能。