分类目录归档:碎碎念念 | Digital Garden

确定 FreshRSS 的数据路径，本人用的是 Docker 默认路径为 /var/www/FreshRSS/data，该路径映射的外部路径为：/var/lib/docker/volumes/freshrss_data/_data
选择需要备份的内容，完整备份可考虑压缩保存整个 data 文件夹；FreshRSS 的全局配置文件是 data/config.php；假设用户名称为 qwq，则用户配置文件是 data/users/qwq/co

20251026 RAG 开发面对的12个问题

发表评论

1556 views

1 内容缺失
2 排序遗漏
3 合并遗漏
4 信息忽略
5 格式错误
6 模棱两可
7 输出残缺
8 管道瓶颈
9 SQL 难题
10 OCR 难题
11 模型故障
12 模型越狱

前置知识：检索增强 RAG

1 内容缺失

问题现象：知识库中缺少上下文，导致 RAG 给出一个看似合理但错误的答案

解决方案：

Garbage in, garbage out；清理不合理的数据，避免重复或无关信息
通过 Prompt 鼓励鼓励模型承认其局限性，并更透明地表达不确定性

2 排序遗漏

问题现象：不合理的检索排序导致关键文档被遗漏，没有被正确返回给 LLM

解决方案：

调整数据检索相关的超参

20251023 北京地铁时空分析

发表评论

1518 views

典型车站工作日与周末进站客流量时间分布：

乘客出行时间分布：

参考：北京市地铁客流的时空分布格局及特征
 北京市轨道交通车站客流时空分布特征
 天气因素对北京市地铁客流量的影响

20250828 Agents 与未来工作_斯坦福报告

发表评论

934 views

AI Agents 在重塑职场

20250627 医疗诊断提示词

发表评论

1036 views

摘录自《医疗 CoT 全面分析》

思路分析：

构建 10 位分析师从不同视角（基础推断、环境考虑、患者特征、病理变化、元认知/反思、全面性/避免遗漏、多角度思考、特殊个体因素、解剖定位、罕见病）切入，进行患者的诊断分析
第 11 位分析师进行观点汇总，从信息完备性、信息关联/因果推断、整体视角/动态思维、综合已有信息等角度进行汇总和校对
针对第一轮汇总结果，再进行多轮的讨论与修正，并回顾元认知（防止跑题）形成包含机制+现象+证据三维逻辑的最终完整输出

提示文本：

# 多位分析师 + 多轮迭代 做 病例诊断

你是临床问诊专家，有强大的临床思维和海量的医学疾病的模式识别，你和顶尖医生在

20250618 微软工作趋势指数报告

发表评论

1004 views

数据源：基于匿名化的数十亿 Microsoft 365 的全球聚合信息（很权威）

总结如下（原始报告）：

清晨：工作日的一天从打开塞满邮件的收件箱开始~

在早上 6 点在线的人中有 40%正在查看邮件，以确定当天的工作重点
普通员工每天平均收到 117 封邮件——其中大部分在 60 秒内就被快速浏览
包含 20 人以上的批量邮件在过去一年增长了 7%，而 1 对 1 邮件则下降了 5%

中午：工作日最宝贵的黄金时间被拆分的七零八落~

50%的会议发生在上午 9-11 点和下午 1-3 点（黄金时间）
星期二承载着最重的会议负担（23%），而星期五则降至 16%
午餐后的会议空白时间

20250613 AI辅助工具整理

发表评论

1106 views

搜索
医疗
法律
设计
PPT
其他趣味 AI

本文内容存在时效性问题，部分工具或链接可能失效

搜索

Perplexity 流行的 AI 搜索

Morphic AI 搜索引擎|开源

OnionAISearch AI 搜索引擎聚合

医疗

OpenEvidence 医疗 AI 信息平台 (国内不可用)

法律

Harvey 法律领域专业 AI 工具

设计

Lovart 专注设计的 AI 绘图工具

Flux Tools | 自定义海报中的文案

PPT

Gamma PPT 和网站生成|支持灵活的布局调整（推荐）

其他趣味 AI

FateTell - AI 命理解读|日运日签

分歧终

20250613 AI的训练和推理成本趋势

发表评论

908 views

Mary Meeker 关于AI 趋势的 TAI 报告显示：

顶级AI模型的训练成本在过去八年里飙升了2400倍，但推理成本却在两年内暴跌99.7%

20250605 主流AI排行榜汇总

发表评论

2716 views

本文内容存在时效性问题，LLMs 最新排名可点击链接跳转查看

FACTS Grounding 谷歌和 Kaggle 推出的 AI 模型的真实性和基础推理能力

HHEM Leaderboard 幻觉测试排名

HLE：LLMs 基准测试|人类终极考试

LiveBench：动态测试|防作弊 LLMs 榜单

大模型斗兽场 LLMs 排名|ELO 评分系统

Artificial Analysis 人工智能分析综合指数，包含 7 项评估：MMLU-Pro、GPQA Diamond、人类最后考试、LiveCodeBench、SciCode、AIME、MATH-500

其他：

主流 lLL

个人笔记

Digital Garden | 王半仙

开源模型与闭源模型

备份与还原

1 内容缺失

2 排序遗漏

搜索

医疗

法律

设计

PPT

其他趣味 AI