real-time

标签

Cards List
#real-time

We used AI to create a storytelling game that reacts in real time to everything you say and do

Reddit r/ArtificialInteligence · 2026-06-18 缓存

这是一个使用AI实时响应用户语音输入的互动故事游戏演示,玩家扮演吟游诗人与名为“死亡女士”的AI角色即兴对话,AI根据玩家每一句话动态推进剧情。

0 人收藏 0 人点赞
#real-time

@elonmusk:借助实时访问𝕏,正在快速改进

X AI KOLs Following · 2026-06-17 缓存

Elon Musk 宣布,Grok 借助实时访问 X 正在快速改进,并且现在已经可以在所有主要云平台上使用,包括 Bedrock、Vertex、Oracle 和 Azure。

0 人收藏 0 人点赞
#real-time

@akshay_pachaar: 我在3D地球仪上构建了一个实时卫星追踪器。它交互式地显示超过一万颗绕地球运行的活跃卫星,其中包括…

X AI KOLs Following · 2026-06-17 缓存

一位开发者使用 Tiger Cloud (TimescaleDB) 和 Claude Code 构建了一个实时3D卫星追踪器,展示了用于时间序列数据的 Tiger CLI MCP 服务器。文章还重点介绍了 Speedcast 在生产规模上对该技术的应用。

0 人收藏 0 人点赞
#real-time

Mel AI 刚刚展示了一个视频原生 AI 角色的演示,这些角色能实时聊天、反应并响应摄像头上下文 [N]

Reddit r/MachineLearning · 2026-06-17

Mel AI 展示了能够通过视频实时聊天、反应并响应视觉上下文的 AI 角色,超越了基于文本的角色聊天。

0 人收藏 0 人点赞
#real-time

OpenAI计划发布GPT-Bidi-1,其下一代语音模型

Reddit r/singularity · 2026-06-17

OpenAI计划发布GPT-Bidi-1,其下一代语音模型,可同时听和说,处理中断,并实现更自然的对话。

0 人收藏 0 人点赞
#real-time

@GoSailGlobal: 有人用 Claude Opus 做了一个 AI 屏幕画笔家教 不是聊天窗口回答问题 而是直接在你的屏幕上画图教你 看勾股定理的视频没看懂? 它直接在 YouTube 画面上标注直角、边长、面积 想学 FL Studio 做音乐? 它直接在…

X AI KOLs Timeline · 2026-06-17 缓存

有人利用 Claude Opus 开发了一个 AI 屏幕画笔家教,能直接在用户屏幕上画图指导,例如在 YouTube 上标注勾股定理或圈出 FL Studio 按钮,提供沉浸式学习体验。

0 人收藏 0 人点赞
#real-time

@browser_use:代理程序在线玩游戏?我们让v4代理尝试玩powerline[.]io > 分析游戏状态和目标 > 创…

X AI KOLs Following · 2026-06-16 缓存

browser_use展示了他们的v4 AI代理如何自主玩在线游戏powerline.io:通过分析游戏状态并创建实时子代理来争夺第一名。

0 人收藏 0 人点赞
#real-time

@FarzaTV:我们打造了一款能在你屏幕上绘画的AI。它是一位真正的私人导师。借助Claude Opus,我们可以绘制多边形,……

X AI KOLs Following · 2026-06-16 缓存

利用Claude Opus构建了一款AI导师,能够在屏幕上以像素级精确度绘制图形,引导用户完成复杂步骤,并通过勾股定理和FL Studio进行了演示。

0 人收藏 0 人点赞
#real-time

MaineCoon: 追求实时视听社交世界模型

Hugging Face Daily Papers · 2026-06-16 缓存

MaineCoon是一个220亿参数的实时视听自回归模型,用于社交世界建模,能够在单个GPU上以高达47.5 FPS进行流式生成,并引入了新颖的训练技术和智能体推理框架。

0 人收藏 0 人点赞
#real-time

@vintcessun: 大规模监控里的中心化融合,当你摄像头到几十上百台,计算瓶颈直接卡死,根本没法扩容,光一个中央站就烧掉大半预算。 这就是为什么不搞分布式的多视角跟踪没法真正落地——中心化方案的扩展成本会随节点数指数飙升,而工程上要的是一次大规模、低成本部署…

X AI KOLs Timeline · 2026-06-15 缓存

MV3DT 是一种全分布式的多视角 3D 跟踪框架,通过点对点协调消除了中心化融合的计算瓶颈,在 100 台摄像头上以 30FPS 运行且通信开销仅 2.2%,零样本校准即可部署,性能达到或超过中心化方法。

0 人收藏 0 人点赞
#real-time

VisualClaw: 面向物理世界的实时个性化智能体

Hugging Face Daily Papers · 2026-06-15 缓存

VisualClaw是一种自我进化的多模态智能体,通过混合编码和技能进化降低部署成本,同时在多个基准测试中提高了视频问答的准确性。

0 人收藏 0 人点赞
#real-time

Voice-to-voice chatbot update

Reddit r/LocalLLaMA · 2026-06-14 缓存

A developer showcases a fully local voice chatbot running Qwen3.5-397B, Whisper-small, and Orpheus TTS with real-time streaming and interruption recovery. The chatbot, named Athena, engages in deep philosophical discussions about consciousness and self-preservation.

0 人收藏 0 人点赞
#real-time

@PyTorch: 在他的PyTorch Conference Europe 2026主题演讲中,Patrick von Platen (@MistralAI)讨论了为什么现实世界的……

X AI KOLs Following · 2026-06-12 缓存

在PyTorch Conference Europe 2026上,Mistral AI的Patrick von Platen解释了为什么现实世界的AI交互需要能够处理连续输入并产生连续输出的流式架构,并以Vox Real Time作为实时转录示例。

0 人收藏 0 人点赞
#real-time

将你的网站变成一个人们可以偶遇的地方

Lobsters Hottest · 2026-06-12 缓存

一个开源工具,为任何网站添加实时社交“城镇广场”,让访问者可以匿名互相看到和聊天,无需账户,没有永久历史记录。

0 人收藏 0 人点赞
#real-time

@googlegemma:实时社交机器人,从云端到您的本地设备。观看我们 DevX 团队的 Ian 使用 Gemini Live 进行无缝…

X AI KOLs Following · 2026-06-12 缓存

Google Gemma 团队演示了在 Reachy Mini 机器人上使用 Gemini Live 的实时社交机器人技术,展示了使用 Gemma 4 进行云端和本地推理的能力。

0 人收藏 0 人点赞
#real-time

@tom_doerr: 以70倍实时速度转录音频 https://github.com/m-bain/whisperX

X AI KOLs Timeline · 2026-06-12 缓存

WhisperX是一个用于快速自动语音识别的工具,提供词级时间戳和说话人分离,使用Whisper large-v2实现70倍实时转录。

0 人收藏 0 人点赞
#real-time

@IndieDevHailey: 太炸裂了! 把全球实时情报、3D地球、卫星追踪装进一个开源平台的恐怖神器 —Redroom Redroom 简直是开源界最强地缘政治 OSINT 工作站! 它是一个全栈地缘情报聚合与分析平台,真正围绕实战工作流打造:从自动采集、AI智能处…

X AI KOLs Timeline · 2026-06-12 缓存

Redroom 是一个开源的全栈地缘政治 OSINT 工作站,集实时情报采集、AI 处理、3D 可视化、卫星追踪和叙事分析于一体,技术栈扎实,适合情报分析爱好者。

0 人收藏 0 人点赞
#real-time

Asciline – 实时ASCII视频渲染引擎

Hacker News Top · 2026-06-12

Asciline是一款实时ASCII视频渲染引擎,能够将视频帧即时转换为ASCII艺术。

0 人收藏 0 人点赞
#real-time

基于LLM并行文本生成的低延迟实时音频游戏解说系统

arXiv cs.CL · 2026-06-12 缓存

本文介绍了一种低延迟实时音频游戏解说系统,该系统利用基于LLM的并行文本生成技术,将语句间的静默时间从9.6秒减少到0.3秒,与顺序基线相比显著改善了感知到的说话节奏。

0 人收藏 0 人点赞
#real-time

@LangChain: 追踪你的代理不应是件费力的事。LangSmith Observability 帮助你了解你的代理的表现…

X AI KOLs Following · 2026-06-11 缓存

LangSmith Observability 为 AI 代理提供实时监控,帮助快速识别性能问题。

0 人收藏 0 人点赞
← Previous
Next →
← 返回首页

提交意见反馈