risk-dimensions

#risk-dimensions

SciRisk-Bench: A Risk-Dimension-Aware Benchmark for AI4Science Safety

arXiv cs.AI ↗ · 2d ago Cached

This paper introduces SciRisk-Bench, a benchmark for evaluating the safety of large language models in AI4Science contexts, covering 7 disciplines, 31 subdisciplines, and 10 risk dimensions to assess both scientific competence and risk awareness.

0 favorites 0 likes

risk-dimensions

SciRisk-Bench: A Risk-Dimension-Aware Benchmark for AI4Science Safety

Submit Feedback