分类目录归档:碎碎念念

20251207 基于 OpenRouter 数据回顾 AI 2025

OpenRouter 作为流行大模型 API 路由平台

  • 覆盖了 60 多个供应商的 300+多个活跃模型,服务数百万开发者和终端用户
  • 积累了大量 AI 模型的消耗记录,其局限性在于其中超过 50%的使用源自美国境

本文内容主要参考自:基于 OpenRouter 百万亿 token 消耗的 AI 现状研究报告

开源模型与闭源模型

开源模型与闭源模型的绝对市场占比:

  • 深红色表示闭源模型(Closed),橙色表示中国开源模型(Chines

Read more

20251113 FreshRSS 备份与升级

相关资源:FreshRSS 用户手册FreshRSS 官方文档插件汇总

备份与还原

  1. 确定 FreshRSS 的数据路径,本人用的是 Docker 默认路径为 /var/www/FreshRSS/data,该路径映射的外部路径为:/var/lib/docker/volumes/freshrss_data/_data
  2. 选择需要备份的内容,完整备份可考虑压缩保存整个 data 文件夹;FreshRSS 的全局配置文件是 data/config.php;假设用户名称为 qwq,则用户配置文件是 data/users/qwq/co

Read more

20251026 RAG 开发面对的12个问题

前置知识:检索增强 RAG

1 内容缺失

问题现象:知识库中缺少上下文,导致 RAG 给出一个看似合理但错误的答案

解决方案:

  1. Garbage in, garbage out;清理不合理的数据,避免重复或无关信息
  2. 通过 Prompt 鼓励鼓励模型承认其局限性,并更透明地表达不确定性

2 排序遗漏

问题现象:不合理的检索排序导致关键文档被遗漏,没有被正确返回给 LLM

解决方案:

  1. 调整数据检索相关的超参

Read more

20250828 Agents 与未来工作_斯坦福报告

Read more

20250627 医疗诊断提示词

摘录自 《医疗 CoT 全面分析》

思路分析:

  • 构建 10 位分析师从不同视角(基础推断、环境考虑、患者特征、病理变化、元认知/反思、全面性/避免遗漏、多角度思考、特殊个体因素、解剖定位、罕见病)切入,进行患者的诊断分析
  • 第 11 位分析师进行观点汇总,从信息完备性、信息关联/因果推断、整体视角/动态思维、综合已有信息等角度进行汇总和校对
  • 针对第一轮汇总结果,再进行多轮的讨论与修正,并回顾元认知(防止跑题)形成包含机制+现象+证据三维逻辑的最终完整输出

提示文本:

# 多位分析师 + 多轮迭代 做 病例诊断

你是临床问诊专家,有强大的临床思维和海量的医学疾病的模式识别,你和顶尖医生在

Read more

20250618 微软工作趋势指数报告

数据源:基于匿名化的数十亿 Microsoft 365 的全球聚合信息(很权威)

总结如下(原始报告):

清晨:工作日的一天从打开塞满邮件的收件箱开始~

  • 在早上 6 点在线的人中有 40%正在查看邮件,以确定当天的工作重点
  • 普通员工每天平均收到 117 封邮件——其中大部分在 60 秒内就被快速浏览
  • 包含 20 人以上的批量邮件在过去一年增长了 7%,而 1 对 1 邮件则下降了 5%

中午:工作日最宝贵的黄金时间被拆分的七零八落~

  • 50%的会议发生在上午 9-11 点和下午 1-3 点(黄金时间)
  • 星期二承载着最重的会议负担(23%),而星期五则降至 16%
  • 午餐后的会议空白时间

Read more

20250613 AI辅助工具整理

本文内容存在时效性问题,部分工具或链接可能失效

搜索

Perplexity 流行的 AI 搜索

Morphic AI 搜索引擎|开源

OnionAISearch AI 搜索引擎聚合

医疗

OpenEvidence 医疗 AI 信息平台 (国内不可用)

法律

Harvey 法律领域专业 AI 工具

设计

Lovart 专注设计的 AI 绘图工具

Flux Tools | 自定义海报中的文案

PPT

Gamma PPT 和网站生成|支持灵活的布局调整(推荐)

其他趣味 AI

FateTell - AI 命理解读|日运日签

分歧终

Read more

20250605 主流AI排行榜汇总

本文内容存在时效性问题,LLMs 最新排名可点击链接跳转查看

FACTS Grounding 谷歌和 Kaggle 推出的 AI 模型的真实性和基础推理能力

HHEM Leaderboard 幻觉测试排名

HLE:LLMs 基准测试|人类终极考试

LiveBench:动态测试|防作弊 LLMs 榜单

大模型斗兽场 LLMs 排名|ELO 评分系统

Artificial Analysis 人工智能分析综合指数,包含 7 项评估:MMLU-Pro、GPQA Diamond、人类最后考试、LiveCodeBench、SciCode、AIME、MATH-500

其他:

主流 lLL

Read more