核物理<bold>AI</bold>研究助手与<bold>arXiv</bold>向量数据库
面对跨学科科学文献的指数级增长与现有检索系统的局限性,本研究基于arXiv平台266万篇论文数据集,创新开发了融合向量语义检索与大型语言模型(Large Language Model,LLM)分析的智能系统。通过构建论文向量数据库实现语义相似性初筛,结合LLM上下文推理优化排序,有效解决了传统关键词搜索的语义鸿沟问题以及LLM的幻觉问题。在核物理领域的应用表明,该系统能精准定位跨学科解决方案,对比特定任务上的关键词检索和向量相似度检索,前10篇文献的查全率从10%跃升到60%,查准率从20%跃升到90%。项目开源提供三大核心模块:1)全量论文向量数据库;2)智能检索优化框架(含查询生成、相关性...
Saved in:
| Main Author: | 庞 龙刚 |
|---|---|
| Format: | Article |
| Language: | zho |
| Published: |
Science Press
2025-05-01
|
| Series: | He jishu |
| Subjects: | |
| Online Access: | https://www.sciengine.com/doi/10.11889/j.0253-3219.2025.hjs.48.250108 |
| Tags: |
Add Tag
No Tags, Be the first to tag this record!
|
Similar Items
<bold>X</bold>射线诱导<bold>lncR-TUG1</bold>的表达刺激心肌成纤维细胞初级纤毛的形成
by: 马 承旭, et al.
Published: (2025-04-01)
by: 马 承旭, et al.
Published: (2025-04-01)
Similar Items
-
深度学习在高能核物理中的前沿进展
by: 张 靖宗, et al.
Published: (2025-05-01) -
基于<bold>KAN</bold>和<bold>MNv4</bold>的中子<bold>/</bold>伽马甄别方法
by: 王 雨龙, et al.
Published: (2025-06-01) -
微秒时间分辨<bold>ED-XAS</bold>快速数据采集与处理系统
by: 吴 晨潇, et al.
Published: (2025-04-01) -
基于目标检测算法的<bold>HEPS-BPIX4 DAQ</bold>实时在线图像压缩研究
by: 肖 鹏飞, et al.
Published: (2025-05-01) -
铅铋<bold>-</bold>水反应实验的<bold>CFD</bold>预计算
by: 邓 畅, et al.
Published: (2025-04-01)