📖 关于本站

这是什么

一个为法律研究团队搭建的选题情报工作台,每天自动从 38 个境外信源抓取 网络治理、AI 监管、隐私、平台反垄断相关动态,用 LLM 按 6 维度评分, 挑出最值得写进内部情报简报的选题。

打开网页就能看 3 层抽象的筛选结果:

评分标准

每篇文章由 DeepSeek V3 按 6 个维度打 0-100 分,外加 6 个一票否决项。

6 维度(满分 100)

维度权重含义
A. 主题对齐度30A1 是否属于 5 大治理主题(25 分) + A2 命中关切议题加分(5 分)
B. 议题成熟度20风险冒头期(20) / 讨论立法期(15) / 规则成形期(8) / 落地执行期(3)
C. 信源权威度15S 官方(15) / A 顶律所+顶刊(12) / B 主流(8) / C 行业(5) / D 社媒(2)
D. 议题热度15多源验证:被 N 个独立信源覆盖 → min(N × 3, 15)
E. 产业可借鉴性10海外做法是否值得参考:利好(10) / 中性(5) / 不利(0)
F. 稀缺性10中文世界报道越少分越高(S/A 级英文官方源常得高分)

v1.4 把原"焦虑点命中"从主力评分(30 分)降级为加分项(5 分),主力改为"是否属于五大治理主题"。 这样评分更贴近信源展现的真实主题,而不是机械命中预设关键词。

五大治理主题(A1 判定范围)

任何和这 5 个主题都无关的文章(如通用反垄断、卫星频率、非网络消费者保护等)直接命中 veto #7,不进流水线。

一票否决(命中即 total = 0)

  1. 纯商业新闻(融资 / 收购 / 财报),无监管角度
  2. 学术论文(非监管动态)
  3. 他国政治选举 / 地缘冲突(除非涉及网络治理)
  4. 30 天内已写过同议题(系统按议题指纹判断)
  5. 国内主管部门自身执法动态(主管部门一手信息充足,不必转报)
  6. 产业政策(芯片 / 制裁 / 贸易 / 出口管制)—— 硬黑名单 + LLM 双重过滤
  7. v1.4 新增:主题不相关—— 不属于五大治理主题任何一个(如通用反垄断、监控定价、卫星频率、环境气候医疗等)

v1.1 内容类型二分

每篇文章除 6 维度分数外还会打 1 个"内容类型"标签:

这个标签驱动左右双栏布局:左栏 Top 3 事实(写简报"X 月 X 日,Y 国发布 Z 法"那段), 右栏 Top 3 观点(写简报"国际反应"或"学界质疑"那段)。名额完全独立,互不挤占。

信源

共 38 个 RSS 信源,两条路径接入:

① 直链 RSS(25 个,官方提供 feed)

② 邮件订阅 → Kill the Newsletter! 转 RSS(13 个,绕开付费墙)

有些高价值信源(DataGuidance、MLex、律所 alert、官方 newsletter)只提供邮件订阅、不给 RSS, 通过 Kill the Newsletter! 中转邮箱把邮件转成 RSS 供抓取。

⚠️ KtN 转发的文章,卡片上会有 📧 小标签。点"原文"跳到的是 KtN 的邮件归档页,不是原文网站。 真正的内容在卡片摘要里;如果需要原文,按标题去 Google 搜即可找到。

黑名单兜底

以下内容即使进了 feed 也会被自动过滤:

信源健康度

正在加载…

每次 fetch 后自动更新。🔴 连续失败 ≥ 3 次(建议去 app/config.py 换 URL 或删掉); 🟡 偶发失败或近 7 天成功率 < 70%(观察几天);🟢 正常;❔ 新加的源尚无历史。

信源 最后成功 近 7 天 最近错误
加载中…

版本演进

当前线上运行版本:v1.5(2026-05-07)

v1.5 · CI 可靠性强化(2026-05-07)

v1.4 · 评分引擎大升级(2026-05-07)

v1.3 · Prompt 稳定性强化(2026-05-06)

v1.2 · 用户体验升级(2026-05-06)

v1.1 · 双栏内容分流(2026-05)

v1.0 · 初版骨架(2026-04)

升级原则:历史文章评分默认冻结;只在 prompt 有重大升级时手动触发 rescore_all; 用户收藏的文章永远不 rescore;SCORE_DROP_GUARD 兜底防 LLM 单次波动覆盖高分。

技术架构

每天北京时间 14:00 自动运行:

┌────────────────────────────────────────────────┐
│  GitHub Actions (境外 Ubuntu runner)         │
│                                                │
│  1. fetch.py    抓 38 个 RSS (境外直连)        │
│  2. score.py    DeepSeek V3 按 rubric 评分     │
│  3. cluster.py  议题聚类 + fingerprint 归并    │
│  4. build_today.py   出 today.json             │
│  5. git push    把新数据推回仓库               │
└──────────────────┬─────────────────────────────┘
                   │ webhook 自动触发
                   ↓
┌────────────────────────────────────────────────┐
│  Vercel   检测到新 commit → 重新部署(30s)    │
└──────────────────┬─────────────────────────────┘
                   │
                   ↓
       https://xxx.vercel.app/v2/
          任何设备打开 → 当日新选题
    

关键技术选择

数据流时间线

GitHub 免费账号的 cron 可能延迟 0-15 分钟(流量高峰更多),所以实际是 14:00-14:30 之间跑完。

使用建议

日常工作流(每天 5-10 分钟)

  1. 早上打开 URL,切到你要写的时间窗 Tab(日报用 24h,周报用 120h)
  2. 左栏 Top 3 事实 → 挑 1 条作为简报第一、二段的骨架
  3. 右栏 Top 3 观点 → 挑 1-2 条作为"国际 / 学界反应"那段的引用素材
  4. 议题聚类区 → 如果你挑的事实有对应聚类,点开看相关观点,全套素材一次性拿
  5. 认可的选题点 👍 → 存进"我的收藏",后续复盘用
  6. 质量差的选题点 👎 → 记下来,下次升级 prompt 时参考

什么时候会失败

不建议的使用方式

更多