semantic-reasoning

#semantic-reasoning

Refine Thought: A Test-Time Inference Method for Embedding Model Reasoning

arXiv cs.CL ↗ · 3d ago Cached

Proposes RT, a test-time inference method that enhances semantic reasoning in text embedding models by running multiple forward passes, improving performance on reasoning tasks while maintaining general semantic understanding.

0 favorites 0 likes

#semantic-reasoning

Automating Geometry-Intensive Compliance Checking in BIM: Graph-Based Semantic Reasoning Framework

arXiv cs.AI ↗ · 2026-06-11 Cached

This paper introduces SGR-BIM, a graph-driven semantic reasoning framework that dynamically aligns regulatory intent with BIM geometry to automate geometry-intensive compliance checks, achieving 84.3% accuracy on fire safety code queries.

0 favorites 0 likes

#semantic-reasoning

Afrispeech Semantics: Evaluating Audio Semantic Reasoning in Spoken Language Models Across Domains and Accents

arXiv cs.CL ↗ · 2026-06-11 Cached

This paper introduces Afrispeech Semantics, a benchmark for evaluating audio language models on semantic reasoning tasks including entailment, consistency, plausibility, accent drift, and accent restraint across diverse domains and accents.

0 favorites 0 likes

#semantic-reasoning

Revisiting a Pain in the Neck: A Semantic Reasoning Benchmark for Language Models

arXiv cs.CL ↗ · 2026-04-21 Cached

Researchers present SemanticQA, a benchmark for evaluating language models on semantic phrase processing tasks including idioms, noun compounds, and verbal constructions, revealing significant performance variation across model architectures and scales on semantic reasoning tasks.

0 favorites 0 likes

semantic-reasoning

Refine Thought: A Test-Time Inference Method for Embedding Model Reasoning

Automating Geometry-Intensive Compliance Checking in BIM: Graph-Based Semantic Reasoning Framework

Afrispeech Semantics: Evaluating Audio Semantic Reasoning in Spoken Language Models Across Domains and Accents

Revisiting a Pain in the Neck: A Semantic Reasoning Benchmark for Language Models

Submit Feedback