Citation Intelligence · v2.0.0

CitationClaw
论文被引画像分析🦞

Paper Citation Portrait Analysis Agent

让每一次引用都成为可解释的影响力

Turning Every Citation into Explainable Impact

Qihao Yang (杨起豪) · Chunhao Zhang (张春浩) · Yifan Cheng (程依凡) · Ziyang Gong (龚子洋) · Caorui Li (李操瑞) · Zhanghan Xu (许张涵) · Tianyi Zhou (周天一) · Jiawei Lu (陆佳炜) · Ziqian Fan (樊子谦) · Yifan Zhou (周奕帆) · Yue Zhou (周越) · Zhihang Zhong (钟志航) · Xu Yang (杨旭) · Xin Tan (谭鑫) · Xue Yang (杨学)^{Project Leader}

Shanghai Jiao Tong University · East China Normal University · Southeast University

SJTU VisionXLab@RethinkLab · ECNU & SH AI Lab DMCV · SEU PALM Lab

四步完成完整分析

从输入题目到获得报告，全流程自动化，点击左侧步骤查看界面

分析界面：支持直接输入题目，或从 Google Scholar 学者主页批量导入 · 支持同时分析多篇

API 配置区：Search LLM 负责联网核验，轻量模型负责报告生成和引文语境抽取；内置模型预检和服务商快捷填充

服务层级选择：Basic 用于低成本验证，Advanced / Full 开启 PDF-grounded 引文语境提取，按需平衡深度与成本

输出报告：关键词云 · 引用趋势预测 · 国家/机构分布 · 著名学者列表 · 引用原句 · 综合 Insight

Overview · 概览

What is CitationClaw?

CitationClaw 是一款面向科研人员的论文被引画像分析🦞。只需输入论文题目（或从 Google Scholar 学者主页批量导入），系统将自动完成：爬取所有施引文献、通过 OpenAlex / Semantic Scholar / arXiv / Web of Science 采集结构化作者元数据、识别著名学者背景（院士、Fellow、杰青、长江学者等）、从 PDF 中提取引用原句，最终生成一份包含关键词云、引用趋势预测、国家/机构分布、学者画像、引文语境和报告内问答的 HTML 报告——无需服务器，单文件即可分享。

CitationClaw is a paper citation portrait analysis agent for researchers. Given a paper title or Google Scholar profile URL, it crawls citing papers, collects structured metadata from academic APIs, verifies renowned scholars with search-capable LLMs, extracts PDF-grounded citation contexts with lightweight models, and produces a fully self-contained, shareable HTML portrait report with charts and an in-report assistant.

Benchmark · 评测对比

v1 vs v2 Performance

基于人工标注 Ground Truth 的五维定量评测，总分为加权求和

v1 Overall

42.33

v2 Overall

68.98

Improvement

+26.65

Author — 作者姓名匹配 (F1)、机构准确率与覆盖率

+11.51

75.51

87.02

Scholar — 院士 / Fellow 等知名学者识别命中率

+5.02

73.55

78.57

PDF — PDF 成功下载并可解析的比例

+74.43

74.43

Citation — 引文原句与 GT 的语义相似度（LLM 评判）

+32.45

13.81

46.26

Data Source — 元数据完整性与正确性

+4.90

75.92

80.82

Key Takeaways

Citation (+32.45) — v1 输出解释性摘要，v2 从 PDF 正文提取实际引用句，语义匹配度大幅提升
PDF (+74.43) — v1 无 PDF 下载解析能力，v2 新增 12 级下载级联与 ScraperAPI 出版商通道
Author (+11.51) — 结构化 API（OpenAlex / S2 / WOS）替代纯 LLM 提取，配合 PDF 回退补全
Scholar (+5.02) — 规则预过滤 + 缓存复用减少漏识别

⚡

Cost Efficiency — v2 reduces LLM token consumption to approximately 1/5 of v1, while achieving higher scores across all dimensions. · v2 的 LLM Token 消耗量仅为 v1 的约五分之一，同时在所有维度上取得更高分数。

Features · 核心功能

Key Capabilities

从爬取到报告，全流程自动化，专为科研人员设计

🧠

结构化元数据优先

优先使用 OpenAlex、Semantic Scholar、arXiv、Web of Science 等来源采集作者、机构、DOI、年份和开放获取信息，减少完全依赖 LLM 检索的不稳定。

🎓

著名学者自动识别

通过规则预过滤、缓存复用和 Search LLM 联网核验，识别中国科学院/工程院院士、IEEE/ACM/ACL Fellow、国家杰青、长江学者等重量级学者。

📊

多维可视化 HTML 报告

关键词云、引用趋势预测（含 LLM 分析与线性回归）、国家/机构分布、学者画像、引用位置与情感分析——单文件，无需服务器。

🔍

PDF 引文语境提取

复用 Phase 2 已下载 PDF，结合 MinerU / PyMuPDF 解析正文，定位引用原句、参考文献条目、章节位置和态度，并记录 PDF 来源与失败原因。

🔁

断点续爬 · 缓存复用

作者信息、PDF、解析结果和引文描述跨运行缓存；任务中断后可继续抓取，也可基于已有缓存快速重建 HTML 报告。

📈

突破千篇限制

开启年份遍历模式，按年份分段爬取并合并去重，高被引论文（如 Transformer、BERT）同样可获取完整施引数据。

🤖

Search / Light 模型分离

联网核验交给 Search LLM，报告生成和引文语境抽取交给轻量模型；支持 OpenAI 兼容接口、服务商快捷填充和模型预检。

⚙️

三档服务层级

Basic 低成本验证学者影响力，Advanced 面向重要施引论文的语境理解，Full 输出最完整引用画像，按场景平衡深度、时间和成本。

🧩

Skills 模块化运行时

v2 引入 Skills Runtime，将施引文献检索、结构化元数据采集、学者影响力评估、PDF 引文语境提取和报告生成封装为独立 Skill，由 SkillsRuntime 统一调度，每个 Skill 共享配置上下文，支持独立扩展与替换。

💬

双端 AI 智能助手

主界面内置使用助手，分析报告内置基于报告数据的问答助手；当问题需要实时信息时，系统可自动路由到联网搜索模式。

📚

Scholar 主页批量导入

粘贴 Google Scholar 学者主页即可抓取论文列表，勾选后批量加入分析队列；也支持直接输入题目和多篇论文同时分析。

💳

费用与进度追踪

运行中通过 WebSocket 展示阶段进度和实时日志；配置额度查询信息后，可在任务结束时查看 ScraperAPI 与 LLM 消耗摘要。

Pipeline · 使用流程

How It Works

配置 API

填入 ScraperAPI、Search LLM 和轻量模型配置，可选 S2/WOS/MinerU/CDP，点击开始即自动保存。

输入论文

直接粘贴论文题目，或粘贴 Google Scholar 主页 URL 批量导入。

选择层级

在 Basic / Advanced / Full 三档之间选择，按需平衡分析深度与 token 消耗，开始分析。

等待分析

系统自动执行施引检索、结构化元数据采集、学者评估、PDF 引文语境提取和报告生成。

获取报告

下载 paper_dashboard.html，浏览器直接打开，单文件即可分享。

Installation · 安装

Quick Start

需要 Python 3.10+（推荐 3.12）

🚀 方式一：pip 安装（推荐）

# 一行安装，自动打开浏览器  One-line install
pip install citationclaw

# 启动，浏览器自动打开  Launch → http://127.0.0.1:8000
citationclaw

🔧 方式二：从源码运行（适合开发者 / 贡献者）

# 1. 克隆仓库  Clone the repo
git clone https://github.com/VisionXLab/CitationClaw.git
cd CitationClaw

# 2. 安装依赖  Install dependencies
pip install -r requirements.txt

# 3. 启动  Start the web app → http://127.0.0.1:8000
python -m citationclaw

Community · 社区

Stay Connected

加入交流群

扫码加入用户交流群，获取最新动态、交流使用心得。如二维码过期，请添加个人微信邀请进群。

Scan to join. If expired, add personal WeChat to be invited.

交流群 · Group

个人微信 · Personal

Coming Soon

减论平台即将上线

CitationClaw 的更完善版本即将在减论上线，提供更强大的功能与更流畅的使用体验，敬请期待！

🌐 访问减论 reduct.cn

Citation · 引用

Cite This Work

如果本工具对您的研究有所帮助，欢迎引用

@software{citationclaw2026, title = {CitationClaw: Turning Every Citation into Explainable Impact}, author = {Yang, Qihao and Zhang, Chunhao and Cheng, Yifan and Gong, Ziyang and Li, Caorui and Xu, Zhanghan and Zhou, Tianyi and Lu, Jiawei and Fan, Ziqian and Zhou, Yifan and Zhou, Yue and Zhong, Zhihang and Yang, Xu and Tan, Xin and Yang, Xue}, year = {2026}, url = {https://github.com/VisionXLab/CitationClaw}, institution = {Shanghai Jiao Tong University, East China Normal University, Southeast University} }

Acknowledgment — Special thanks to Keyu Chen (陈柯宇) for generously sponsoring the compute and API resources that made this project possible.

CitationClaw论文被引画像分析🦞