前置知识:检索增强 RAG
1 内容缺失
问题现象:知识库中缺少上下文,导致 RAG 给出一个看似合理但错误的答案
解决方案:
- Garbage in, garbage out;清理不合理的数据,避免重复或无关信息
- 通过 Prompt 鼓励鼓励模型承认其局限性,并更透明地表达不确定性
2 排序遗漏
问题现象:不合理的检索排序导致关键文档被遗漏,没有被正确返回给 LLM
解决方案:
- 调整数据检索相关的超参
分类目录归档:碎碎念念
前置知识:检索增强 RAG
问题现象:知识库中缺少上下文,导致 RAG 给出一个看似合理但错误的答案
解决方案:
问题现象:不合理的检索排序导致关键文档被遗漏,没有被正确返回给 LLM
解决方案:
摘录自 《医疗 CoT 全面分析》
思路分析:
提示文本:
# 多位分析师 + 多轮迭代 做 病例诊断
你是临床问诊专家,有强大的临床思维和海量的医学疾病的模式识别,你和顶尖医生在数据源:基于匿名化的数十亿 Microsoft 365 的全球聚合信息(很权威)
总结如下(原始报告):
清晨:工作日的一天从打开塞满邮件的收件箱开始~
中午:工作日最宝贵的黄金时间被拆分的七零八落~

本文内容存在时效性问题,部分工具或链接可能失效
Perplexity 流行的 AI 搜索
Morphic AI 搜索引擎|开源
OnionAISearch AI 搜索引擎聚合
OpenEvidence 医疗 AI 信息平台 (国内不可用)

Harvey 法律领域专业 AI 工具

Lovart 专注设计的 AI 绘图工具

Flux Tools | 自定义海报中的文案

Gamma PPT 和网站生成|支持灵活的布局调整(推荐)

FateTell - AI 命理解读|日运日签
本文内容存在时效性问题,LLMs 最新排名可点击链接跳转查看
FACTS Grounding 谷歌和 Kaggle 推出的 AI 模型的真实性和基础推理能力

HHEM Leaderboard 幻觉测试排名

HLE:LLMs 基准测试|人类终极考试

LiveBench:动态测试|防作弊 LLMs 榜单

大模型斗兽场 LLMs 排名|ELO 评分系统

Artificial Analysis 人工智能分析综合指数,包含 7 项评估:MMLU-Pro、GPQA Diamond、人类最后考试、LiveCodeBench、SciCode、AIME、MATH-500

其他:
手机监听的几种方式:
获取麦克风权限用于窃听的方法,在经济成本和技术能力层面都不现实
根据字节的一篇科普文章可知
本文档成稿于 2025-02-16,随着时间推移内容可能存在时效性问题
STEP1:购买密钥:
sk-xxxxxxxxxxxxxxxx通过该链接可以查询已购