real-time

#real-time

We used AI to create a storytelling game that reacts in real time to everything you say and do

Reddit r/ArtificialInteligence ↗ · 2026-06-18 缓存

这是一个使用AI实时响应用户语音输入的互动故事游戏演示，玩家扮演吟游诗人与名为“死亡女士”的AI角色即兴对话，AI根据玩家每一句话动态推进剧情。

0 人收藏 0 人点赞

#real-time

@elonmusk：借助实时访问𝕏，正在快速改进

X AI KOLs Following ↗ · 2026-06-17 缓存

Elon Musk 宣布，Grok 借助实时访问 X 正在快速改进，并且现在已经可以在所有主要云平台上使用，包括 Bedrock、Vertex、Oracle 和 Azure。

0 人收藏 0 人点赞

#real-time

@akshay_pachaar: 我在3D地球仪上构建了一个实时卫星追踪器。它交互式地显示超过一万颗绕地球运行的活跃卫星，其中包括…

X AI KOLs Following ↗ · 2026-06-17 缓存

一位开发者使用 Tiger Cloud (TimescaleDB) 和 Claude Code 构建了一个实时3D卫星追踪器，展示了用于时间序列数据的 Tiger CLI MCP 服务器。文章还重点介绍了 Speedcast 在生产规模上对该技术的应用。

0 人收藏 0 人点赞

#real-time

Mel AI 刚刚展示了一个视频原生 AI 角色的演示，这些角色能实时聊天、反应并响应摄像头上下文 [N]

Reddit r/MachineLearning ↗ · 2026-06-17

Mel AI 展示了能够通过视频实时聊天、反应并响应视觉上下文的 AI 角色，超越了基于文本的角色聊天。

0 人收藏 0 人点赞

#real-time

OpenAI计划发布GPT-Bidi-1，其下一代语音模型

Reddit r/singularity ↗ · 2026-06-17

OpenAI计划发布GPT-Bidi-1，其下一代语音模型，可同时听和说，处理中断，并实现更自然的对话。

0 人收藏 0 人点赞

#real-time

@GoSailGlobal: 有人用 Claude Opus 做了一个 AI 屏幕画笔家教不是聊天窗口回答问题而是直接在你的屏幕上画图教你看勾股定理的视频没看懂？它直接在 YouTube 画面上标注直角、边长、面积想学 FL Studio 做音乐？它直接在…

X AI KOLs Timeline ↗ · 2026-06-17 缓存

有人利用 Claude Opus 开发了一个 AI 屏幕画笔家教，能直接在用户屏幕上画图指导，例如在 YouTube 上标注勾股定理或圈出 FL Studio 按钮，提供沉浸式学习体验。

0 人收藏 0 人点赞

#real-time

@browser_use：代理程序在线玩游戏？我们让v4代理尝试玩powerline[.]io > 分析游戏状态和目标 > 创…

X AI KOLs Following ↗ · 2026-06-16 缓存

browser_use展示了他们的v4 AI代理如何自主玩在线游戏powerline.io：通过分析游戏状态并创建实时子代理来争夺第一名。

0 人收藏 0 人点赞

#real-time

@FarzaTV：我们打造了一款能在你屏幕上绘画的AI。它是一位真正的私人导师。借助Claude Opus，我们可以绘制多边形，……

X AI KOLs Following ↗ · 2026-06-16 缓存

利用Claude Opus构建了一款AI导师，能够在屏幕上以像素级精确度绘制图形，引导用户完成复杂步骤，并通过勾股定理和FL Studio进行了演示。

0 人收藏 0 人点赞

#real-time

MaineCoon: 追求实时视听社交世界模型

Hugging Face Daily Papers ↗ · 2026-06-16 缓存

MaineCoon是一个220亿参数的实时视听自回归模型，用于社交世界建模，能够在单个GPU上以高达47.5 FPS进行流式生成，并引入了新颖的训练技术和智能体推理框架。

0 人收藏 0 人点赞

#real-time

@vintcessun: 大规模监控里的中心化融合，当你摄像头到几十上百台，计算瓶颈直接卡死，根本没法扩容，光一个中央站就烧掉大半预算。这就是为什么不搞分布式的多视角跟踪没法真正落地——中心化方案的扩展成本会随节点数指数飙升，而工程上要的是一次大规模、低成本部署…

X AI KOLs Timeline ↗ · 2026-06-15 缓存

MV3DT 是一种全分布式的多视角 3D 跟踪框架，通过点对点协调消除了中心化融合的计算瓶颈，在 100 台摄像头上以 30FPS 运行且通信开销仅 2.2%，零样本校准即可部署，性能达到或超过中心化方法。

0 人收藏 0 人点赞

#real-time

VisualClaw: 面向物理世界的实时个性化智能体

Hugging Face Daily Papers ↗ · 2026-06-15 缓存

VisualClaw是一种自我进化的多模态智能体，通过混合编码和技能进化降低部署成本，同时在多个基准测试中提高了视频问答的准确性。

0 人收藏 0 人点赞

#real-time

A developer showcases a fully local voice chatbot running Qwen3.5-397B, Whisper-small, and Orpheus TTS with real-time streaming and interruption recovery. The chatbot, named Athena, engages in deep philosophical discussions about consciousness and self-preservation.

0 人收藏 0 人点赞

#real-time

@PyTorch: 在他的PyTorch Conference Europe 2026主题演讲中，Patrick von Platen (@MistralAI)讨论了为什么现实世界的……

X AI KOLs Following ↗ · 2026-06-12 缓存

在PyTorch Conference Europe 2026上，Mistral AI的Patrick von Platen解释了为什么现实世界的AI交互需要能够处理连续输入并产生连续输出的流式架构，并以Vox Real Time作为实时转录示例。

0 人收藏 0 人点赞

#real-time

将你的网站变成一个人们可以偶遇的地方

Lobsters Hottest ↗ · 2026-06-12 缓存

一个开源工具，为任何网站添加实时社交“城镇广场”，让访问者可以匿名互相看到和聊天，无需账户，没有永久历史记录。

0 人收藏 0 人点赞

#real-time

@googlegemma：实时社交机器人，从云端到您的本地设备。观看我们 DevX 团队的 Ian 使用 Gemini Live 进行无缝…

X AI KOLs Following ↗ · 2026-06-12 缓存

Google Gemma 团队演示了在 Reachy Mini 机器人上使用 Gemini Live 的实时社交机器人技术，展示了使用 Gemma 4 进行云端和本地推理的能力。

0 人收藏 0 人点赞

#real-time

@tom_doerr: 以70倍实时速度转录音频 https://github.com/m-bain/whisperX

X AI KOLs Timeline ↗ · 2026-06-12 缓存

WhisperX是一个用于快速自动语音识别的工具，提供词级时间戳和说话人分离，使用Whisper large-v2实现70倍实时转录。

0 人收藏 0 人点赞

#real-time

@IndieDevHailey: 太炸裂了！把全球实时情报、3D地球、卫星追踪装进一个开源平台的恐怖神器 —Redroom Redroom 简直是开源界最强地缘政治 OSINT 工作站！它是一个全栈地缘情报聚合与分析平台，真正围绕实战工作流打造：从自动采集、AI智能处…

X AI KOLs Timeline ↗ · 2026-06-12 缓存

Redroom 是一个开源的全栈地缘政治 OSINT 工作站，集实时情报采集、AI 处理、3D 可视化、卫星追踪和叙事分析于一体，技术栈扎实，适合情报分析爱好者。

0 人收藏 0 人点赞

#real-time

Asciline – 实时ASCII视频渲染引擎

Hacker News Top ↗ · 2026-06-12

Asciline是一款实时ASCII视频渲染引擎，能够将视频帧即时转换为ASCII艺术。

0 人收藏 0 人点赞

#real-time

基于LLM并行文本生成的低延迟实时音频游戏解说系统

arXiv cs.CL ↗ · 2026-06-12 缓存

本文介绍了一种低延迟实时音频游戏解说系统，该系统利用基于LLM的并行文本生成技术，将语句间的静默时间从9.6秒减少到0.3秒，与顺序基线相比显著改善了感知到的说话节奏。

0 人收藏 0 人点赞

#real-time

@LangChain: 追踪你的代理不应是件费力的事。LangSmith Observability 帮助你了解你的代理的表现…

X AI KOLs Following ↗ · 2026-06-11 缓存

LangSmith Observability 为 AI 代理提供实时监控，帮助快速识别性能问题。

0 人收藏 0 人点赞

real-time

We used AI to create a storytelling game that reacts in real time to everything you say and do

@elonmusk：借助实时访问𝕏，正在快速改进

@akshay_pachaar: 我在3D地球仪上构建了一个实时卫星追踪器。它交互式地显示超过一万颗绕地球运行的活跃卫星，其中包括…

Mel AI 刚刚展示了一个视频原生 AI 角色的演示，这些角色能实时聊天、反应并响应摄像头上下文 [N]

OpenAI计划发布GPT-Bidi-1，其下一代语音模型

@GoSailGlobal: 有人用 Claude Opus 做了一个 AI 屏幕画笔家教不是聊天窗口回答问题而是直接在你的屏幕上画图教你看勾股定理的视频没看懂？它直接在 YouTube 画面上标注直角、边长、面积想学 FL Studio 做音乐？它直接在…

@browser_use：代理程序在线玩游戏？我们让v4代理尝试玩powerline[.]io > 分析游戏状态和目标 > 创…

@FarzaTV：我们打造了一款能在你屏幕上绘画的AI。它是一位真正的私人导师。借助Claude Opus，我们可以绘制多边形，……

MaineCoon: 追求实时视听社交世界模型

VisualClaw: 面向物理世界的实时个性化智能体

Voice-to-voice chatbot update

@PyTorch: 在他的PyTorch Conference Europe 2026主题演讲中，Patrick von Platen (@MistralAI)讨论了为什么现实世界的……

将你的网站变成一个人们可以偶遇的地方

@googlegemma：实时社交机器人，从云端到您的本地设备。观看我们 DevX 团队的 Ian 使用 Gemini Live 进行无缝…

@tom_doerr: 以70倍实时速度转录音频 https://github.com/m-bain/whisperX

Asciline – 实时ASCII视频渲染引擎

基于LLM并行文本生成的低延迟实时音频游戏解说系统

@LangChain: 追踪你的代理不应是件费力的事。LangSmith Observability 帮助你了解你的代理的表现…

提交意见反馈