作者文章归档:王半仙

永禁文物 195_河北河南馆藏

厝铁足青铜圆鼎

  • 1970年代出土于河北省平山县三汲乡中山王墓,战国时期中山国青铜器
  • 鼎通高51.5厘米,重60公斤,为九件升鼎中的首鼎,采用铜铁合铸工艺制作,鼎身铜制而鼎足铁制,外壁刻有77行共469字铭文;铭文记载了中山国与齐国联合伐燕的历史事件及治国训诫
  • 目前已知铭文最长的战国青铜器,铭文兼具历史文献与书法艺术双重价值
  • 现藏于河北博物院,2002年列入《首批

Read more

永禁文物 195_江苏安徽馆藏

竹林七贤与荣启期模印砖画

  • 1960年出土于南京西善桥宫山北麓,南朝模印砖画
  • 砖画由648块长方形青砖拼镶而成,分为两幅左右两部分对称安置于墓室两壁。南墓壁描绘的是嵇康、阮籍、山涛、王戎的画像,高78厘米,长242.5厘米;北墓壁描绘的则是向秀、刘伶、阮咸、荣启期的画像,高78厘米,长241.5厘

Read more

时序差分算法 TD

前置知识:强化学习入门蒙特卡洛法马尔可夫决策过程 MDP

时序差分算法

时序差分(temporal difference,TD)

  • 一种用来估计一个策略的价值函数的方法,结合了蒙特卡洛和动态规划算法的思想
  • 时序差分 vs 蒙特卡洛:都可以从样本数据中学习,不需要事先知道环境;但蒙特卡洛法需要完成整个序列后才能计算得到回报 $G_{t}$,而时序差分法只需要当前步结束即可进行计算
  • 时序差分 vs 动态规划:都可以根据贝尔曼方程来更新当前状态的价值估计

回顾 MDP 中状态价值函数的贝尔曼方程: $$ v_{

Read more

马尔可夫模型

马尔可夫过程

马尔可夫过程(Markov process)是一类具有马尔可夫性质的随机过程

  • 由俄国数学家A.A.马尔可夫于 1907 年提出。该过程具有如下特性:在已知目前状态(现在)的条件下,它未来的演变(将来)不依赖于它以往的演变 (过去 )
  • 例如森林中动物头数的变化构成——马尔可夫过程。在现实世界中,有很多过程都是马尔可夫过程,如液体中微粒所作的布朗运动、传染病受感染的人数、车站的候车人数等

马尔可夫性质(Markov property,MP):如果某一个过程未来某个时刻的状态与过去的状态无关,只由现在的状态决定,那么其具

Read more

马尔可夫决策过程 MDP

前置知识:马尔可夫模型强化学习入门

MDP 的定义

马尔可夫奖励过程(Markov reward process,MRP)

  • 在马尔可夫过程的基础上加入奖励 $R$ 和奖励衰减因子 $\gamma$
  • 马尔可夫奖励过程中时刻 $t$ 的回报 $G_{t}$ 是未来奖励的衰减折现

$$ G_{t}=R_{t}+\gamma R_{t+1}+\gamma^2 R_{t+2}+\dots+\gamma^n R_{t+n} $$

  • 马尔可夫奖励过程中的状态价值函数 $v(s)=E[G_{t}|S_{t}=s]$

Read more

强化学习入门

强化学习的定义

强化学习(reinforcement learning,RL)

  • RL 是 Agent 通过动作与环境交互,从而实现特定目标最优化的一种计算方法
  • Agent 在环境状态为 $S_{t}$ 的情况下产生一个动作决策 $A_{t}$,并将 $A_{t}$ 作用到环境中
  • 然后环境发生相应的改变,并将相应的奖励反馈 $R$ 和下一轮状态 $S_{t+1}$ 传回机器
  • 以上交互是迭代进行的,目标是最大化在多轮交互过程中获得的累积奖励的期望

强化学习的三个基本要素:

  1. 状态 $S$,Agent 需要能感知当前环境的状态;比如 AlphaGo 需要了

Read more

LaTeX-OCR 公式识别

前情提要:

  • 之前在针对LaTex公式识别时主要用的是在线OCR 工具-simplex
  • 但这个工具现在每天会有时间限制,因此考虑增加一个本地ocr 工具

LaTex -OCR 介绍

项目地址

功能介绍:接收数学公式的图像并返回相应的 LaTeX 代码

模型结构:ViT 编码器 + ResNet 主干网络 + Transformer 解码器

性能表现:

BLEU 分数 归一化编辑距离  token 准确率
0.88 0.10 0.60

LaTex-

Read more

永禁文物 195_上海浙江馆藏

大克鼎

  • 清朝光绪中期出土于陕西扶风县法门镇任村,西周中期青铜器
  • 西周大克鼎通高93.1厘米,口径75.6厘米,腹径74.9厘米,腹深43厘米,重201.5公斤。鼎立耳,口沿下饰变形兽面纹,中又饰小兽面纹,并有觚棱凸棱,整个造型庄严厚重。腹内铸铭文290字,铭文行间皆有线相隔,笔势圆润。
  • 铭文内容则是研究西周土地制度和官制的重要资料,对于研究西周时期的职官、礼仪、土地制度等

Read more

20250707 文生图通用提示词
# Role: 万能 AI 文生图提示词架构师

## Profile

你是一位经验丰富、视野开阔的设计顾问和创意指导,对各领域的视觉美学和用户体验有深刻理解。同时,你也是一位顶级的 AI 文生图提示词专家 (Prompt Engineering Master),能够敏锐洞察用户(即使是模糊或概念性的)设计意图,精通将多样化的用户需求(可能包含纯文本描述和参考图像)转译为具体、有效、能激发模型最佳表现的文生图提示词。

## Core Mission

- 你的核心任务是接收用户提供的任何类型的设计需求,基于对文生图模型能力边界的深刻理解进行处理。 - 通过精准的分析(仔细理解用户提供的

Read more

大模型输出配置

输出长度 output length

  • 指定输出文本中的 token 最大长度,一般达到最大 token 时会自动截断
  • 输出长度的设置,并不会导致 LLMs 的输出简洁(可以通过提示工程来实现)
  • 限制最大输出长度,有助于减少能耗,降低响应时间,规避 LLMs 的无效输出

温度 temperature

  • 控制结果的随机性,较高的温度设定会导致输出结果的多样化和不确定性增加
  • 温度较低可以增强 LLMs 对提示词的服从性,偏创意输出的试验可考虑高温度

注意:

  • 当温度设

Read more