Citation Intelligence · v2.0.0

CitationClaw
论文被引画像分析🦞

Paper Citation Portrait Analysis Agent

让每一次引用都成为可解释的影响力
Turning Every Citation into Explainable Impact
Qihao Yang (杨起豪) · Chunhao Zhang (张春浩) · Yifan Cheng (程依凡) · Ziyang Gong (龚子洋) · Caorui Li (李操瑞) · Zhanghan Xu (许张涵) · Tianyi Zhou (周天一) · Jiawei Lu (陆佳炜) · Ziqian Fan (樊子谦) · Yifan Zhou (周奕帆) · Yue Zhou (周越) · Zhihang Zhong (钟志航) · Xu Yang (杨旭) · Xin Tan (谭鑫) · Xue Yang (杨学)Project Leader
Shanghai Jiao Tong University · East China Normal University · Southeast University
SJTU VisionXLab@RethinkLab  ·  ECNU & SH AI Lab DMCV  ·  SEU PALM Lab
Sponsored by Keyu Chen (陈柯宇)
GitHub 📊 报告示例① 📊 报告示例② 📖 使用体验报告 🚀 减论平台 📘 Guidelines

Promo Video — 50 秒了解 CitationClaw v2 全部核心能力

被引画像报告输出示例 — 单 HTML 文件,无需服务器,一键分享

paper_dashboard.html · 被引画像报告
CitationClaw 被引画像报告示例

输入论文题目或 Google Scholar 学者主页,CitationClaw 自动抓取施引文献、采集结构化作者元数据、识别院士 / Fellow 等著名学者并提取 PDF 引文语境,
最终生成一份含关键词云、引用趋势、国家/机构分布、学者画像、引用原句和报告助手的 自包含 HTML 报告

四步完成完整分析

从输入题目到获得报告,全流程自动化,点击左侧步骤查看界面

Step 1 — 输入论文题目界面

分析界面:支持直接输入题目,或从 Google Scholar 学者主页批量导入 · 支持同时分析多篇

Step 2 — API 配置

API 配置区:Search LLM 负责联网核验,轻量模型负责报告生成和引文语境抽取;内置模型预检和服务商快捷填充

Step 3 — 选择分析层级

服务层级选择:Basic 用于低成本验证,Advanced / Full 开启 PDF-grounded 引文语境提取,按需平衡深度与成本

Step 4 — 被引画像报告

输出报告:关键词云 · 引用趋势预测 · 国家/机构分布 · 著名学者列表 · 引用原句 · 综合 Insight

What is CitationClaw?

CitationClaw 是一款面向科研人员的论文被引画像分析🦞。只需输入论文题目(或从 Google Scholar 学者主页批量导入),系统将自动完成:爬取所有施引文献通过 OpenAlex / Semantic Scholar / arXiv / Web of Science 采集结构化作者元数据识别著名学者背景(院士、Fellow、杰青、长江学者等)、从 PDF 中提取引用原句,最终生成一份包含关键词云、引用趋势预测、国家/机构分布、学者画像、引文语境和报告内问答的 HTML 报告——无需服务器,单文件即可分享。

CitationClaw is a paper citation portrait analysis agent for researchers. Given a paper title or Google Scholar profile URL, it crawls citing papers, collects structured metadata from academic APIs, verifies renowned scholars with search-capable LLMs, extracts PDF-grounded citation contexts with lightweight models, and produces a fully self-contained, shareable HTML portrait report with charts and an in-report assistant.

v1 vs v2 Performance

基于人工标注 Ground Truth 的五维定量评测,总分为加权求和

v1 Overall
42.33
v2 Overall
68.98
Improvement
+26.65
Author — 作者姓名匹配 (F1)、机构准确率与覆盖率
+11.51
75.51
87.02
Scholar — 院士 / Fellow 等知名学者识别命中率
+5.02
73.55
78.57
PDF — PDF 成功下载并可解析的比例
+74.43
0
74.43
Citation — 引文原句与 GT 的语义相似度(LLM 评判)
+32.45
13.81
46.26
Data Source — 元数据完整性与正确性
+4.90
75.92
80.82
v1
v2
Key Takeaways
  • Citation (+32.45) — v1 输出解释性摘要,v2 从 PDF 正文提取实际引用句,语义匹配度大幅提升
  • PDF (+74.43) — v1 无 PDF 下载解析能力,v2 新增 12 级下载级联与 ScraperAPI 出版商通道
  • Author (+11.51) — 结构化 API(OpenAlex / S2 / WOS)替代纯 LLM 提取,配合 PDF 回退补全
  • Scholar (+5.02) — 规则预过滤 + 缓存复用减少漏识别

Cost Efficiency — v2 reduces LLM token consumption to approximately 1/5 of v1, while achieving higher scores across all dimensions. · v2 的 LLM Token 消耗量仅为 v1 的约五分之一,同时在所有维度上取得更高分数。

Key Capabilities

从爬取到报告,全流程自动化,专为科研人员设计

🧠
结构化元数据优先
优先使用 OpenAlex、Semantic Scholar、arXiv、Web of Science 等来源采集作者、机构、DOI、年份和开放获取信息,减少完全依赖 LLM 检索的不稳定。
🎓
著名学者自动识别
通过规则预过滤、缓存复用和 Search LLM 联网核验,识别中国科学院/工程院院士、IEEE/ACM/ACL Fellow、国家杰青、长江学者等重量级学者。
📊
多维可视化 HTML 报告
关键词云、引用趋势预测(含 LLM 分析与线性回归)、国家/机构分布、学者画像、引用位置与情感分析——单文件,无需服务器。
🔍
PDF 引文语境提取
复用 Phase 2 已下载 PDF,结合 MinerU / PyMuPDF 解析正文,定位引用原句、参考文献条目、章节位置和态度,并记录 PDF 来源与失败原因。
🔁
断点续爬 · 缓存复用
作者信息、PDF、解析结果和引文描述跨运行缓存;任务中断后可继续抓取,也可基于已有缓存快速重建 HTML 报告。
📈
突破千篇限制
开启年份遍历模式,按年份分段爬取并合并去重,高被引论文(如 Transformer、BERT)同样可获取完整施引数据。
🤖
Search / Light 模型分离
联网核验交给 Search LLM,报告生成和引文语境抽取交给轻量模型;支持 OpenAI 兼容接口、服务商快捷填充和模型预检。
⚙️
三档服务层级
Basic 低成本验证学者影响力,Advanced 面向重要施引论文的语境理解,Full 输出最完整引用画像,按场景平衡深度、时间和成本。
🧩
Skills 模块化运行时
v2 引入 Skills Runtime,将施引文献检索、结构化元数据采集、学者影响力评估、PDF 引文语境提取和报告生成封装为独立 Skill,由 SkillsRuntime 统一调度,每个 Skill 共享配置上下文,支持独立扩展与替换。
💬
双端 AI 智能助手
主界面内置使用助手,分析报告内置基于报告数据的问答助手;当问题需要实时信息时,系统可自动路由到联网搜索模式。
📚
Scholar 主页批量导入
粘贴 Google Scholar 学者主页即可抓取论文列表,勾选后批量加入分析队列;也支持直接输入题目和多篇论文同时分析。
💳
费用与进度追踪
运行中通过 WebSocket 展示阶段进度和实时日志;配置额度查询信息后,可在任务结束时查看 ScraperAPI 与 LLM 消耗摘要。

How It Works

1
配置 API
填入 ScraperAPI、Search LLM 和轻量模型配置,可选 S2/WOS/MinerU/CDP,点击开始即自动保存。
2
输入论文
直接粘贴论文题目,或粘贴 Google Scholar 主页 URL 批量导入。
3
选择层级
在 Basic / Advanced / Full 三档之间选择,按需平衡分析深度与 token 消耗,开始分析。
4
等待分析
系统自动执行施引检索、结构化元数据采集、学者评估、PDF 引文语境提取和报告生成。
5
获取报告
下载 paper_dashboard.html,浏览器直接打开,单文件即可分享。

Live Report Demos

点击卡片在线预览真实论文的完整被引画像报告

Quick Start

需要 Python 3.10+(推荐 3.12)

🚀 方式一:pip 安装(推荐)
# 一行安装,自动打开浏览器 One-line install pip install citationclaw # 启动,浏览器自动打开 Launch → http://127.0.0.1:8000 citationclaw
🔧 方式二:从源码运行(适合开发者 / 贡献者)
# 1. 克隆仓库 Clone the repo git clone https://github.com/VisionXLab/CitationClaw.git cd CitationClaw # 2. 安装依赖 Install dependencies pip install -r requirements.txt # 3. 启动 Start the web app → http://127.0.0.1:8000 python -m citationclaw

Stay Connected

加入交流群

扫码加入用户交流群,获取最新动态、交流使用心得。如二维码过期,请添加个人微信邀请进群。

Scan to join. If expired, add personal WeChat to be invited.

用户交流群二维码

交流群 · Group

个人微信二维码

个人微信 · Personal

Coming Soon

减论平台即将上线

CitationClaw 的更完善版本即将在 减论 上线,提供更强大的功能与更流畅的使用体验,敬请期待!

🌐 访问减论 reduct.cn

Cite This Work

如果本工具对您的研究有所帮助,欢迎引用

@software{citationclaw2026, title = {CitationClaw: Turning Every Citation into Explainable Impact}, author = {Yang, Qihao and Zhang, Chunhao and Cheng, Yifan and Gong, Ziyang and Li, Caorui and Xu, Zhanghan and Zhou, Tianyi and Lu, Jiawei and Fan, Ziqian and Zhou, Yifan and Zhou, Yue and Zhong, Zhihang and Yang, Xu and Tan, Xin and Yang, Xue}, year = {2026}, url = {https://github.com/VisionXLab/CitationClaw}, institution = {Shanghai Jiao Tong University, East China Normal University, Southeast University} }

Acknowledgment — Special thanks to Keyu Chen (陈柯宇) for generously sponsoring the compute and API resources that made this project possible.